
Smart Answers AI によって生成された概要
要約すれば:
- PCWorld の報道によると、元 OpenAI ディレクターのミラ・モラッティ氏が設立した Thinking Machines が、割り込みや視覚的合図認識を伴うリアルタイム会話を可能にする新しい AI 音声インタラクション モデルを開発したとのこと。
- このテクノロジーは、マルチストリームとマイクロローテーションのアプローチを使用して、高速インタラクション モデルと複雑なタスク用のバックグラウンド モデルを備えたデュアル AI システムを使用します。
- この技術はまだ研究段階にあるが、こうした進歩により、AI ボイスチャットが現在の CB ラジオ風の転換から人間のような自然な会話に変わる可能性がある。
今日の AI との音声チャットは、会話中に交代を強いられる昔ながらの CB ラジオ ハブと同じくらい不自然に感じることがあります。
「ねえ、ChatGPT、映画について話しましょう! 終わりました。」
「そうだね、息子よ、どんな映画について話したいの?もう終わったよ。」
ChatGPT や Gemini との音声チャット中に実際に「オーバー」や「アウト」と言う必要はありませんが、基本的には舞台裏で起こっていることです。
ある意味、AI 音声モードは CB ラジオ チャットよりもさらに制限されています。 AI は、ユーザーが話している間待機する必要があるだけでなく、時間の経過も含め、ユーザーが話している間に何かが起こっていることを認識しません。同様に、AI が話しているときは、独自の応答を作成するのに忙しすぎて、他のことを「考える」ことができません。つまり、AI音声モードは標準的なAIテキストチャットに音声を付加したものになります。ということで、ほとんど使いません。
この状況は、実際に会話の盛衰を追跡し、リアルタイムであなたの話を聞きながら中断することもできる新世代の「インタラクション」AI モデルのおかげで変わる可能性があります。
元 OpenAI ディレクターのミラ・モラッティ氏が設立した AI スタートアップである Thinking Machines によって開発されたこれらの「インタラクション」モデルは、今日のシングルスレッド AI モデルとは異なり、話を聞きながら考えることも、話しながら応答することもできません。代わりに、これらの新しいモデルは、「マルチストリーム、マイクロローテーション」構成を使用しており、ユーザーの話を聞きながら、視覚や音声を含む入力の処理を継続でき、ユーザーの発言に基づいて中断することもできます。
一連のデモリールで、Thinking Machines はそのモデル (まだ研究プレビュー段階) が、ビデオチャット中に人間の参加者にリアルタイムで反応し、参加者が持っている製品を認識し、人間のユーザーが話し続けるときに「動物」の単語 (「鹿」や「羊」など) を追跡する様子を示しています。また、Thinking Machines モデルは、人間のパートナーが文章の途中でコーヒーを飲んでいる間、飛び込むのではなく辛抱強く待って、さらなる対話中に印象的な自制心を示します。
別のデモンストレーションでは、モデル やってる (指示に従って)中断し、人間の話者が「アサイー」という単語を言い間違えたときにリアルタイムで修正し、アサイーボウルがアルゼンチン発祥であるという意図的に不正確な発言を修正します。確かに、煩わしく聞こえるかもしれませんが、このデモでは、Thinking Machine の AI は順番を待っている間に動けなくなるのではなく、聞きながら応答できるという点が強調されています。
では、思考機械のトリックとは何でしょうか?同社は実際に 2 つの AI モデルを採用しています。つまり、ユーザーと常に「存在」し、入力と出力を 200 ミリ秒の短い単位で処理する「インタラクション」モデルと、より複雑なタスクの重労働を行う 2 番目の「バックグラウンド」モデルで、準備ができたときに結果をより高速なインタラクション モデルに渡します。
Thinking Machine の新しいインタラクティブ AI モデルはまだ開発中です (実際に動作しているのを見たり聞いたりしたことはありません)。このスタートアップは、そのモデルが「非常に長い」会話に苦労していること、および適切に機能するためには「信頼性の高い接続」に依存していることを認めています。同社の現在の「インタラクション」モデルも小規模なもので、大きなモデルは「この環境で提供するには遅すぎる」からだ。
それでも、Thinking Machine の新しい「全二重」パラダイムは、AI ボイス チャットに変革をもたらす可能性があり、緊張するのではなくスムーズで自然な感じになります。 スモーキーと盗賊―往復時代。