ChatGPT научили слышать, видеть и говорить: ИИ сможет общаться почти как человек

ChatGPT, чат-бот
Фото: Getty | С чат-ботом можно общаться голосом и показывать ему фото

OpenAI объявила о крупных обновлениях своего популярного приложения ChatGPT на основе искусственного интеллекта.

Чат-бот ChatGPT от компании OpenAI вскоре получит функции, благодаря которым с нейросетью можно будет взаимодействовать с помощью голоса и камеры. Об этом сообщает Euronews.

Воспользоваться двусторонней связью с чат-ботом смогут платные пользователи, которым станут доступны функции диалога с нейросетью голосом, а так же возможность с использованием камеры смартфона отправлять нейросети изображения для анализа или в качестве запросов. Голосовая функция будет доступна в приложениях для iOS и Android, где пользователи смогут выбирать из пяти разных голосов, правда пока только на английском языке. Пять голосов, смесь мужского и женского пола с американским акцентом, называются Джунипер, Скай, Коув, Эмбер и Бриз.

Обновленный ChatGPT построен на новой модели преобразования текста в речь, разработанной компанией, а также будет включать в себя инструмент Whisper AI — систему распознавания речи, которая может транскрибировать произносимые слова в текст. OpenAI предполагает, что голоса можно использовать для чего угодно: от чтения сказок на ночь своим детям до разрешения споров за обеденным столом. Генеральный директор OpenAI Сэм Альтман утверждает, что OpenAI протестировала модель в таких областях, как экстремизм и научная компетентность, чтобы защитить нейросеть от подобных запросов.

OpenAI уже поделился новым функционалом с несколькими другими компаниями, включая Spotify. Там заявили, что используют одну и ту же технологию синтетического голоса для перевода подкастов о знаменитостях. Способность ChatGPT распознавать изображения уже опробована компанией Be My Eyes, которая создает приложение для людей с ослабленным зрением. Пользователи могут загрузить фотографию того, что находится перед ними, и попросить добровольцев рассказать им, что это такое. В партнерстве с OpenAI Be My Eyes дает своим пользователям возможность вместо этого задать вопрос чат-боту.

Ранее Фокус рассказывал, что New York Times хочет засудить создателей ChatGPT. Издание обсуждает с юристами возможность получить от OpenAI компенсацию за использование репортажей в обучении искусственного интеллекта без разрешения.