チュートリアル | MIRU2023

MIRU2023 の参加登録者は、MVA2023 のチュートリアル を聴講いただくことができます(また逆に、MVA2023 の参加登録者は、MIRU2023 のチュートリアルを聴講いただくことができます)。

7月25日(火)

13:00-13:10 MIRUチュートリアル x CCC Summer 2023 オープニング

13:10-14:40 チュートリアル講演1

タイトル:ニューラルデジタルヒューマン合成の最先端

講師: Koki Nagano先生, NVIDIA

概要:デジタルヒューマンを使った技術は、ビデオ会議やアバター作成、チャットボットなど、様々な分野での活躍が期待されている。一方で、高精度なデジタルヒューマン作りは、膨大な工数やデータキャプチャのコストなどが長年の課題になってきた。しかし、近年のAI技術の発達によって、かつてはハリウッドスタジオにしか作れなかったような画像やビデオ、リアルな3次元シーン、音声などを誰でも簡単に合成できるようになりつつある。本チュートリアルでは、最先端の生成的AIモデルや、ラベルなしデータ、合成データ、カジュアルな2次元データなどを使ったデジタルヒューマン合成の研究について紹介するとともに、こうしたメディア合成技術の「民主化」の先にある課題について、最新の取り組みを交えて議論したい。

14:40-14:50 休憩

14:50-16:20 チュートリアル講演2

タイトル:大規模言語モデル時代のHuman-in-the-Loop機械学習

講師:馬場 雪乃 先生, 東京大学

概要:Human-in-the-Loop機械学習は、機械学習モデルの学習や推論プロセスにおいて人間を活用する技術である。クラウドソーシングを用いた大規模教師データの作成だけではなく、効率的な学習のための人間のフィードバックの活用、人間と機械による推論の分業など、幅広い研究が行われている。本講演では、Human-in-the-Loop機械学習の近年の動向を解説するとともに、品質やバイアスなどの人間活用における課題や、大規模言語モデルの発展に伴う、人間と機械の協働の将来展望について議論する。

16:20-16:30 休憩

16:30-18:00 cvpaper.challenge企画

概要:MIRU2023 x cvpaper.challenge の連携の一環として、チュートリアル企画の時間の一部を担当する。cvpaper.challenge の中でも恒例となっている国際会議速報の中から「CVPR 2023 速報」、メタサーベイから「大規模言語・視覚モデルを用いたロボティクス基盤モデル」や「NeuralFieldsメタサーベイ」について紹介する。論文サーベイや研究トレンドの紹介はもちろん、多数の研究メンバーによる議論により生まれるメタ分析の紹介も行う。

16:30-17:00 チュートリアル講演3-1
  • Title: CVPR 2023 速報
  • 講師: 福原吉博(早稲田大学/株式会社エクサウィザーズ)
  • 資料: こちら
17:00-17:30 チュートリアル講演3-2
  • Title: 大規模言語・視覚モデルを用いたロボティクス基盤モデル
  • 講師: 牧原昂志(大阪大学/産業技術総合研究所)
  • 資料: こちら
17:30-18:00 チュートリアル講演3-3
  • Title: NeuralFieldsメタサーベイ
  • 講師: 上田樹(筑波大学)
  • 資料: こちら