imagemlの皆様 理研GRPの川西です. 2025年3月18日(火)、19日(水)に滋賀大学彦根キャンパスにて、 PRMU、IBISML、CVIM連催で開催する研究会について参加申し込みのご案内を申し上げます. 皆様のご参加をお待ちしております. 以下,詳細です. =================== 【3月研究会のテーマ】基盤モデルとその応用 基盤モデル構築のためには,データセット構築,モデル構築,学習アルゴリズム,学習理論,マルチモーダル,マルチタスク,ドメイン適応,転移学習,敵対的学習,強化学習,オンライン学習,継続学習,連合学習,表現学習,生成モデル,モデル圧縮,高速化などのさまざまな要素技術の研究が必要です.また,基盤モデルを用いることで画像生成,画像編集,三次元復元,物体認識,画像再構成,Vision&Language,自動制御,創薬,物理シミュレーションなどのさまざまな課題へ応用することができると考えられますが,これらの可能性や限界を明らかにするための研究も継続していく必要があります.研究会において皆様の知恵と知識を結集し活発な議論ができることを楽しみにしております. 開催プログラムの詳細は https://ken.ieice.org/ken/program/index.php?tgs_regid=76c12a3c1a537ba41c6a7e1c66ea38216bfb8629cac14ca308037725ab5a2da1&tgid=IEICE-PRMU と本メールの末尾に一覧を記載しております。 本研究会では、以下の招待講演とチュートリアルを予定しております。 【招待講演】基盤モデルの実ロボット応用 河原塚 健人 様(東大) 【招待講演】大規模視覚言語モデルによる画像の認識と理解 鈴木 哲平 様(SB Intuitions) 【チュートリアル】画像認識における基盤モデル 齋藤 邦章 様(オムロンサイニックエックス) ■ 研究会開催日:2025年3月18日(火)、19日(水) 会場:滋賀大学 彦根キャンパス 住所:〒522-8522 彦根市馬場1丁目1番1号 ■ 交通案内 会場へのアクセスは,https://www.shiga-u.ac.jp/access/access-hikone/ をご参照ください. バスの時刻表: https://www.shiga-u.ac.jp/wp/wp-content/uploads/hikone_bus-timetable.pdf ■ 聴講参加手続きについて 本研究会はハイブリッド開催(オンライン配信は招待講演・チュートリアルのみ、それ以外は現地開催)です。 PRMU、IBSIMLからご参加される方は https://ken.ieice.org/ken/user/index.php?cmd=participation&tgs_regid=76c12a3c1a537ba41c6a7e1c66ea38216bfb8629cac14ca308037725ab5a2da1 の聴講参加費または年間登録費のリンクからお早めにお手続きください。原則として開催の3日前までに参加受付を終了します。 CVIMからご参加される方は、https://www.ipsj.or.jp/kenkyukai/sanka.html をご参照の上、情報処理学会のマイページからお申し込みください。研究会開催1週間程度前から、研究会当日までお申し込みいただけます。 ############################################################### 日時 2025年 3月18日(火) 11:00~17:40 2025年 3月19日(水) 09:30~16:40 会場 滋賀大学 彦根キャンパス(〒522-8522 彦根市馬場1丁目1番1号. https://www.shiga-u.ac.jp/access/access-hikone/ ) 議題 基盤モデルとその応用 −−− 1日目 −−− 3月18日(火) 午前 セッション1A (11:00 - 12:30) (1)/PRMU 11:00-11:15 骨格推定情報の静止画像化を介した手話認識手法の提案, ○依田萌々子・井上真郷(早大) (2)/PRMU 11:15-11:30 一貫性を重視した線画による3D点群編集 ○會澤智大・顧 淳祉・栗山 繁(豊橋技科大) (3)/PRMU 11:30-11:45 部分的に食材が遮蔽された料理画像のためのCLIPを利用したレシピ文ベースの食材状態認識 ○田上鈴奈・平松直人・小林大起・秋月秀一・橋本 学(中京大) (4)/PRMU 11:45-12:00 広域多視点マルチモーダル行動認識のためのセンサ統合手法とMultiSensor-Homeデータセットの提案 ○グエン チュンタイン(名大)・川西康友・ビジェイ ジョン(理研)・駒水孝裕・井手一郎(名大) 12:00-12:30 インタラクティブセッション 3月18日(火) 午前 セッション1B (11:00 - 12:20) (6)/IBISML 11:00-11:20 仮説検定を用いた不確実性を含むクラス分類の手法 ○與倉蕉真・一木輝久(福岡大) (7)/IBISML 11:20-11:40 無関係データを用いたファインチューニングによるEEG分類システム ○飯干拓真・北村拓也(富山高専) (8)/IBISML 11:40-12:00 量子化二値行列分解による行列データの効率的軽量化手法 ○黒木 響・チュ ヴァン ティエム・本村真人・川村一志(科学大) (9)/IBISML 12:00-12:20 選択的推論を用いたFused Lassoのモデル選択 ○田坂理英子・鈴木 讓(阪大) −−− 昼食 ( 90分 ) −−− 3月18日(火) 午後 招待講演 (14:00 - 15:00) (10)/PRMU 14:00 - 15:00 基盤モデルの実ロボット応用 ○河原塚健人(東大) −−− 休憩 ( 10分 ) −−− 3月18日(火) 午後 招待講演 (15:10 - 16:10) (11)/PRMU 15:10 - 16:10 大規模視覚言語モデルによる画像の認識と理解 ○鈴木哲平(SB Intuitions) −−− 休憩 ( 10分 ) −−− 3月18日(火) 午後 セッション2A (16:20 - 17:35) (12)/CVIM 16:20-16:35 [CVIM] 拡散モデルとニューラル場による共焦点画像の高速な奥行補間, ○大橋智哉・藤村友貴・舩冨卓哉・向川康博(奈良先端大)・Nath Sristilekha・奥田覚(金沢大) (13)/CVIM 16:35-16:50 [CVIM] 単眼深度推定モデルのテスト時最適化によるDepth from Focus, ○小橋口純・藤村友貴・北野和哉・舩冨卓哉・向川康博(奈良先端大) (14)/CVIM 16:50-17:05 [CVIM] ランドマーク検出を活用した嚥下4DCTの咽頭領域分割, ○菊地智遥・内田裕也(芝浦工大)・大竹義人・佐藤嘉伸(奈良先端大)・稲本陽子(藤田医科大)・道脇幸博(みちわき研)・上羽瑠美(東大)・井尻敬(芝浦工大) 17:05-17:35 インタラクティブセッション −−− 2日目 −−− 3月18日(火) 午後 セッション2B (16:20 - 17:40) (16)/IBISML 16:20-16:40 連合学習によるfMRIデータを用いたASD診断 ○堀田海智・北村拓也(富山高専) (17)/IBISML 16:40-17:00 General Causal Discovery: Extending LiNGAM via KCI ○Hongming Huang・Joe Suzuki(Osaka Univ.) (18)/IBISML 17:00-17:20 SVD Trainig を用いた連合継続学習の検討と評価 ○松本一則・黒川茂莉・鷄内朋也・橋本慧志・西村仁志(KDDI総研) (19)/IBISML 17:20-17:40 Extensions of Causal Discovery Procedure under Confounding ○Md. Ashraful Islam・Joe Suzuki(Osaka Univ.) 3月19日(水) 午前 セッション3A (9:30 - 11:00) (20)/PRMU 09:30-09:45 SVGEditBench V2: テキストプロンプトに基づくSVG編集モデルの評価ベンチマーク ○仁科久那斗・松井勇佑(東大) (21)/PRMU 09:45-10:00 アクティブ音響センシングによるセマンティックセグメンテーション結果の推定 ○森 太紀・本間純平・米澤祥吾・小玉星弥・入江 豪(東京理科大) (22)/PRMU 10:00-10:15 クラス間で良く分離された説明文を自動生成する大規模視覚言語モデルを用いた対照学習による歩行者年齢層認識 ○尾崎 匠(鳥取大)・栗林英範(グローリー)・井上路子・西山正志(鳥取大) (23)/PRMU 10:15-10:30 Sign-to-text matching space for new sign selection ○Matheus Silva de Lima・Pedro H. V. Valois(ITF)・Erica Kido Shimomoto(AIST)・Nobuko Kato(NTUT)・Kazuhiro Fukui(ITF) 10:30-11:00 インタラクティブセッション 3月19日(水) 午前 セッション3B (09:30 - 11:00) (25)/PRMU 09:30-09:45 Panoptic Liftingにおける破滅的忘却抑制のための可視領域を最大化する視点選択による増分学習法 ○幸壬 晃(滋賀大)・薗頭元春(理研)・飯山将晃(滋賀大)・川西康友(理研) (26)/PRMU 09:45-10:00 Neural Real-Time RGB-D SLAM in Dynamic Environments ○Qinyuan Zhou・Kazuhiko Sumi(Aoyama Gakuin Univ.) (27)/CVIM 10:00-10:15 [CVIM] AI顔識別モデルを利用したペンギンの個体識別の実現性検証, ○三宅惇介(マーブル) (28)/CVIM 10:15-10:30 [CVIM] 衝動性に起因する異常な振舞いの検出, ○寺田和仙・豊浦正広(山梨大学) 10:30-11:00 インタラクティブセッション −−− 休憩 ( 10分 ) −−− 3月19日(水) 午前 セッション4A (11:10 - 12:30) (30)/PRMU 11:10-11:25 大規模言語モデルを用いた卒業アルバムにおけるレイアウト生成に関する提案 ○松田 展・佐野睦夫(阪工大) (31)/PRMU 11:25-11:40 新たな視線動的パラメータを用いた運転シミュレーターにおける視線方向検出モデルの改良 ○リク テツイン・鷲見和彦(青学大) (32)/PRMU 11:40-11:55 拡散モデルのLLMへの埋め込みに基づくText2Motion生成器のファインチューニングに関する研究 ○田中慎一・王 釗・加藤洋一・大谷 淳(早大) 11:55-12:30 インタラクティブセッション 3月19日(水) 午前 セッション4B (11:10 - 12:10) (34)/IBISML 11:10-11:30 Index2Sort: 静的インデックスデータ構造を使用するソートアルゴリズム ○佐藤篤樹・松井勇佑(東大) (35)/IBISML 11:30-11:50 グラフトランスフォーマーにおける強い宝くじの発見 ○伊藤宏朗・嚴 佳樂・大塚光莉・川村一志・本村真人・ティエム ヴァン チュ・藤木大地(科学大) (36)/IBISML 11:50-12:10 推定分散積分の解析解を導入した信頼性上限関数によるガウス過程ベイズ最適化 ○大前佑斗・柿本陽平・佐々木 真・森 雅也(日大) −−− 昼食 ( 90分 ) −−− 3月19日(水) 午後 チュートリアル講演 (14:00 - 15:00) (37)/CVIM 14:00-15:00 [CVIM] 画像認識における基盤モデル ○齋藤邦章(オムロンサイニックエックス) −−− 休憩 ( 10分 ) −−− 3月19日(水) 午後 セッション5A (15:10 - 16:40) (38)/PRMU 15:10-15:25 局所位相損失を用いた画像次元削減のためのVQ-VAEの学習 ○市村直幸(産総研) (39)/PRMU 15:25-15:40 数式駆動型データを用いた知識蒸留の初期評価 藤林文人・○森 稔(神奈川工科大) (40)/PRMU 15:40-15:55 Siamese Network-based Answer Similarity for Automatically Scoring Handwritten Very Short Answers ○Tuan Nam Ly・Hung Tuan Nguyen・Masaki Nakagawa(TUAT) (41) 15:55-16:10 [特別企画] ISS国際会議派遣制度 ECCV2024派遣報告 1件目:田所龍(東北大学) 2件目:篠田理沙(京都大学),塩原楓(東京大学) 16:10-16:40 インタラクティブセッション 一般講演: PRMU/CVIM 発表 15 分(質疑なし,インタラクティブセッションあり) IBISML 発表 20 分(質疑あり) 以上,よろしくお願いします. ################################################ # Yasutomo KAWANISHI # yasutomo.kawanishi@riken.jp # # Team Leader, Multimodal Data Recognition Research Team, # RIKEN Guardian Robot Project # Professor, Multimodal Environmental Recognition Laboratory, NAIST