OpenAI、次世代音声モデル「GPT-Bidi-1」を近くリリースか

OpenAI、次世代音声モデル「GPT-Bidi-1」を近くリリースか

OpenAIがChatGPTの音声機能向けに、次世代モデル「GPT-Bidi-1」のリリース準備を進めていることが分かった。公式発表ではなく、DevMode Discordサーバーで共有されたスクリーンショットから存在が明るみに出たもので、SNSを中心に話題を集めている。

「Bidi」とは双方向(Bidirectional)を意味し、その名の通り話しながら同時に聞けるアーキテクチャが特徴だ。ユーザーが会話に割り込んできても処理が止まらず、文脈を維持したまま応答を調整できる。従来の「話し終えるのを待つ」ターン制モデルからの大きな転換となる。

機能面では、処理速度と推論の深さを用途に合わせて選べる「High」「Medium」「Instant」の3段階が導入される見通し。既存の「Advanced Voice Mode」との共存も想定されており、ユーザーは用途に応じてモードを選択できるようになるとみられる。

テキストモデルがGPT-5.5世代まで進化した一方、音声モデルは旧来のスタックが続いていた。GPT-Bidi-1はその格差を埋める位置づけだ。

WebおよびモバイルのフレームワークにGPT-Bidi-1に関連するコードが確認されており、公開が近いことを示唆している。ただし、正式なリリース時期やモデル名は未確定で、OpenAIからの公式アナウンスはまだない。