ChatGPT의 개발자 OpenAI는 화요일 기술적인 문제로 인해 “음성 모드” 기능의 출시를 7월로 한 달 연기한다고 발표했습니다.
회사는 원래 6월 말에 소수의 ChatGPT Plus 사용자에게 이 실감나는 음성 대화 경험을 제공할 계획이었지만, 출시 기준에 도달하기 위해 더 많은 시간이 필요하다고 판단하여 연기를 결정했습니다.
OpenAI는 소셜 미디어 플랫폼 X에 게시한 글에서 “예를 들어, 우리는 모델의 감지 및 특정 콘텐츠를 거부하는 능력을 개선하고 있습니다. 또한 사용자 경험을 향상시키고, 실시간 응답을 유지하면서 수백만 명의 사용자에게 확장할 수 있는 인프라를 준비하고 있습니다.”라고 전했습니다.
이 기능은 우선 소수의 사용자에게 배포되어 피드백을 수집한 후, 가을에 안전성과 신뢰성 검사를 통과한 후 모든 Plus 사용자에게 개방될 예정입니다.
OpenAI는 또한 새로운 비디오 및 화면 공유 기능 출시를 위해 노력하고 있습니다.
5월에 OpenAI는 GPT-4o라는 새로운 AI 모델을 출시할 것이라고 발표했는데, 이 모델은 실감나는 음성 대화를 할 수 있으며 텍스트와 이미지 간 상호작용이 가능하여 경쟁이 치열한 신흥 AI 기술 분야에서 앞서 나가려는 최신 조치입니다.
새로운 오디오 기능은 사용자가 ChatGPT와 실시간으로 대화하고 즉각적인 응답을 받을 수 있게 하며, ChatGPT가 말하는 동안에도 끊임없이 중단할 수 있어 AI 음성 비서가 실감나는 대화를 구현하는 데 직면하는 도전 과제를 극복할 수 있습니다.