2025/09/28 (Sun) ~ 30 (Tue) に韓国ソウルで開催された CoRL2025 (Conference on Robot Learning)に参加した感想を今更書く.なお聴講のみ.

CoRL はその名の通り Robot Learning に関する国際学会で,歴史はかなり浅い(2017~) にも関わらず,ICRA や IROS と並ぶロボティクスにおけるトップカンファレンスの1つ,という位置づけらしい. とは言いつつ,IROS 2022 at Kyoto や ICRA 2024 at Yokohama と比較すると,(Robot Learning 限定ということもあり?) 規模は小さい.

Robot Learning の昨今の流行り? としては,ロボットアームなら模倣学習,四足やヒューマノイドなら強化学習による歩容学習という印象だった. ロボットアーム関連の研究は器用さ(タスクの複雑さ) や速度面で実社会への適用はまだ先かなと思ったり,結局ヒューマノイドどこで使うの(脚が脚である必要があるの)とかは思ったりするものの,結構面白いなと思う研究はあった.例えば以下;

  • The Sound of Simulation: Learning Multimodal Sim-to-Real Robot Policies with Generative Audio
    • 動画からの音生成モデルを利用して,ポリシー学習時に音の情報を付加することで,グラスに液体を注ぐといったタスク実行時に,音生成がある方がよりロバストな実行(画像情報が乏しくても音を頼りに液体をグラスから溢れされることなく注ぐ)が可能となる
  • Steering Your Diffusion Policy with Latent Space Reinforcement Learning
    • Diffusion Policy ベースのモデルの weight に直接触ることなく,入力ノイズの生成分布を強化学習によって調整することで,タスク達成までの学習サンプル数を減らす(サンプル効率を上げる)手法.
    • 方策モデルを直接 fine tuning すると学習が不安定になったり,クソデカモデルの学習はコストが高いので直接の fine tuning ではなく追加モジュールの事後学習によってモデル改善を試み
    • 発想としてはありがちに感じが, best paper awards に残っていたのは,まだ diffusion policy 関連の歴史が浅いから?
  • LocoFormer: Generalist Locomotion via Long-context Adaptation
    • 従来は特定の legged robot にフォーカスした歩容獲得のためのモデル (humanoid だけ,quadruped だけで学習したモデル)が多かったのに対して,humanoid, quadruped (車輪付き含む),倒立振子系ロボットなどをまとめてシミュレーション環境に突っ込み学習することで,よりロバスト (quadruped robot が三本脚でもモデル切り替えなしで歩行可能になるなど)な歩容を獲得することが可能になる

    あんまりポスターは見に行かずオーラルのみの聴講した感想としては;

    • ロボットアーム関連はここ最近は模倣学習関連が hot topic 感.正直あまり興味はないが,扱えるタスクの複雑度は推論時の動作速度向上あたりがより発展すれば,実応用の足がかりは見えてきそうだな感.知らんけど.
    • locomotion のセッションはほぼ humanoid に関する発表で,exhibition にあったロボットもほぼ humanoid で,IROS 2022 の時期くらいから? 始まったブームがずっと続いている印象.humanoid robot の価格もかなり安価にはなってきているので,より取り組みやすくはなってきている感.一方で個人的には本当に脚が脚である必要があるのか(車輪でよくね)とも思う.
  • 個人的には robotics in extreme environments みたいな分野が好きなので,その手の発表が(少なくともオーラルでは)あまり見かけなかったのがちょっと残念.ICRA や IROS では見かけた気がするが,これは学会の色(Robot Learning なので,比較的要素技術よりになる)のだろうとも思う

以上