ChatGPTの開発者であるOpenAIは火曜日、技術的な問題により、「音声モード」機能のリリースが1か月遅れて7月になると発表しました。
同社は当初、現実的な音声対話体験を提供するこの機能を6月末に一部のChatGPT Plusユーザーに提供する予定でしたが、リリース基準を達成するためにより多くの時間が必要であるため、延期を決定しました。
OpenAIは、ソーシャルメディアプラットフォームXの投稿で、「例えば、私たちはモデルの検出能力を改善し、特定のコンテンツの拒否能力を向上させています。さらに、ユーザー体験を向上させ、リアルタイムの応答を維持しながら数百万ユーザーへと拡大するためのインフラを整えています」と述べました。
この機能はまず一部のユーザーにリリースされ、フィードバックを収集した後、秋には安全性と信頼性のチェックを通過してからすべてのPlusユーザーに公開される予定です。
OpenAIはまた、新しいビデオおよび画面共有機能のリリースにも取り組んでいます。
5月、OpenAIはGPT-4oという新しいAIモデルをリリースすることを発表しました。このモデルは現実的な音声対話を行い、テキストと画像間での対話が可能です。これは、新興のAI技術分野での競争においてリードを保つための最新の取り組みです。
新しい音声機能により、ユーザーはChatGPTとリアルタイムで対話し、即座に応答を得ることができ、さらにChatGPTが話している間に割り込むことも可能です。これらはすべて、リアルな対話を実現するためにAI音声アシスタントが直面する課題です。