Nhà phát triển ChatGPT, OpenAI, đã thông báo vào thứ Ba rằng do vấn đề kỹ thuật, tính năng “Chế độ giọng nói” sẽ bị hoãn phát hành một tháng, cho đến tháng Bảy.
Công ty dự định ban đầu sẽ ra mắt trải nghiệm đối thoại bằng giọng nói sống động này cho một nhóm nhỏ người dùng ChatGPT Plus vào cuối tháng Sáu, nhưng do cần thêm thời gian để đạt tiêu chuẩn phát hành, họ đã quyết định hoãn lại.
OpenAI cho biết trong một bài đăng trên mạng xã hội X: “Chẳng hạn, chúng tôi đang cải thiện khả năng phát hiện và từ chối một số nội dung của mô hình. Chúng tôi cũng đang nâng cao trải nghiệm người dùng và chuẩn bị cơ sở hạ tầng để mở rộng đến hàng triệu người dùng, đồng thời giữ nguyên khả năng phản hồi theo thời gian thực.”
Tính năng này sẽ được phát hành cho một nhóm nhỏ người dùng trước để thu thập phản hồi, và sẽ được mở rộng cho tất cả người dùng Plus vào mùa thu sau khi vượt qua các kiểm tra về an toàn và độ tin cậy.
OpenAI cũng đang nỗ lực ra mắt các tính năng mới về video và chia sẻ màn hình.
Vào tháng Năm, OpenAI đã công bố sẽ ra mắt một mô hình AI mới tên là GPT-4o, mô hình này có khả năng đối thoại bằng giọng nói sống động và có thể tương tác qua văn bản và hình ảnh, đây là bước đi mới nhất để duy trì vị thế dẫn đầu trong lĩnh vực công nghệ AI đầy cạnh tranh.
Tính năng âm thanh mới sẽ cho phép người dùng trò chuyện trực tiếp với ChatGPT và nhận phản hồi tức thì, cùng với khả năng ngắt lời ChatGPT khi nó đang nói—đây là những thách thức mà trợ lý giọng nói AI gặp phải khi thực hiện cuộc đối thoại sống động.