Загрузка...

【3分解説】Thinking Machines Lab『TML-Interaction-Small』公開──Mira Murati新スタートアップ初の研究プレビュー、200ms単位の対話モデルでGPT

今日のテックニュース: 元OpenAI CTOのMira Murati氏が率いるThinking Machines Labは5月11日、初の公開モデル『TML-Interaction-Small』を研究プレビューとして公開した。音声・映像・テキストを同時に処理する『Interaction Model』というアーキテクチャで、200ms単位のマイクロターンで連続的に知覚しながら応答する。従来の『発話が終わってから応答』というリクエスト/レスポンス型を離れ、相手が話している最中にもうなずく・割り込む・先回りするといった全二重の対話を実現する。モデルは276B MoEで活性パラメータは12B。重い外部エンコーダではなく『encoder-free early fusion』で音声はdMel、画像は40×40パッチを直接Transformerに与え、ゼロから共学習する。応答までのターンテイキング・レイテンシは0.40秒で、Gemini-3.1-flash-liveの0.57秒、GPT-realtime-2.0の1.18秒を上回る。前景のInteraction Modelと、Web検索やツール呼び出しなどの重い推論を裏で進めるBackground Modelを分離する2モデル構成も特徴。現状は限定的な研究プレビューで、フィードバック収集を経て年内に拡大予定。

▼ 出典
- https://thinkingmachines.ai/blog/interaction-models/
- https://venturebeat.com/technology/thinking-machines-shows-off-preview-of-near-realtime-ai-voice-and-video-conversation-with-new-interaction-models
- https://www.unite.ai/thinking-machines-lab-ships-first-model-with-200ms-real-time-interaction/

▼ チャプター
00:01 イントロ
00:13 何が発表されたか
00:43 構造・注目ポイント
01:10 開発者向けアップデート
01:38 モデル / Workspaces
02:00 まとめ
02:28 クロージング

▼ このチャンネルについて
ずんだもんが3分でお届けするテックニュース・ブリーフィング。
国内エンジニア向け、不定期配信。
チャンネル登録 → https://www.youtube.com/@zundamon_tech_3min

▼ 運営
PLAYLAND ( https://playland.co.jp/ )
お問い合わせ: contact@playland.co.jp

#ずんだもん #ずんだもん解説 #テックニュース #エンジニア #AI #LLM #クラウド #開発者 #プログラミング #IT

Видео 【3分解説】Thinking Machines Lab『TML-Interaction-Small』公開──Mira Murati新スタートアップ初の研究プレビュー、200ms単位の対話モデルでGPT канала ずんだもんのテックニュース3分
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять