По задумке компании, людям не нужно будет погружаться в VR с головой. Вместо этого, виртуальные элементы наполнят нашу реальность.
9 ноября компания Nvidia анонсировала платформу под названием Omniverse Avatar, которая призвана улучшить реальный мир с помощью виртуальных "агентов". Подробности опубликованы на официальном сайте.
По словам разработчиков, новая платформа объединяет в себе различные технологии Nvidia, включая искусственный интеллект для распознавания речи, компьютерное зрение и трехмерное моделирование. С ее помощью пользователи смогут создавать аватаров — интерактивных 3D-персонажей, которые смогут различать людей, вести с ними беседы на разные темы и понимать устные команды.
Nvidia утверждает, что виртуальные помощники будут легко настраиваться практически для любой современной отрасли и могут помочь с рутинными операциями при работе с клиентами: с заказами в ресторанах, банковскими консультациями, назначением встреч, бронированием и пр.
"Настала заря интеллектуальных виртуальных помощников", — подчеркнул гендиректор компании Дженсен Хуанг.
На конференции NVIDIA GTC Хуанг рассказал о нескольких перспективных применениях Omniverse Avatar:
- Project Tokkio для поддержки клиентов,
- NVIDIA DRIVE Concierge для "умного" транспорта,
- Project Maxine для видеоконференций.
В первом случае гендиректор представил аватар в виде "мультяшной" копии себя, которая смогла самостоятельно поговорить с его коллегами на научные темы.
После этого Дженсен Хуанг описал возможности виртуального аватара в качестве бизнес-помощника для рестораторов. Маленький белый робот появился на экране, чтобы помочь клиентам заказать блюда. "Умные" алгоритмы NVIDIA AI и Megatron 530B позволили ему распознать лица и мимику двух человек, понимать их речь и отвечать на вопросы, правда, каждый раз ему требовалось несколько секунд на обработку запроса.
Omniverse Avatars также нашли применение в платформе DRIVE Concierge AI для автомобилей. Виртуальный помощник на базе бортового компьютера подсказал оптимальный режим вождения, чтобы вовремя добраться до пункта назначения. Кроме того, он по просьбе водителя установил напоминание о снижении запаса хода машины до 100 миль.
Дженсен Хуанг также продемонстрировал способность Project Maxine добавлять современные видео- и аудиофункции в приложения для виртуального сотрудничества и создания контента. Женщина связалась с собеседником по видеосвязи из кафе, однако Omniverse Avatar изменила ее одежду и прическу на более деловые, а также перевела речь с английского на французский, испанский и немецкий языки с сохранением тембра голоса и интонаций.
За распознавание речи отвечает пакет программного обеспечения под названием NVIDIA Riva. Алгоритмы распознают слова на нескольких языках и генерирует ответы с возможностью преобразования печатного текста в устную речь. Обученная языковая модель Megatron 530B способна "понимать" естественный язык.
Аватары являются частью крупного проекта "Омнивселенная", который конкурирует с "Метавселенной" компании Meta (экс-Facebook). Как отмечают аналитики The Verge, Nvidia стремится не столько перенести деятельность человека в виртуальную реальность, сколько перенести в реальный мир цифровые копии людей, которые смогут взаимодействовать с реальными людьми и друг с другом.
"Неясно, насколько полезна эта технология в реальном мире. Например, возникает резонный вопрос: действительно ли клиенты предпочтут такой вид интерактивного взаимодействия (общение с роботом) простому выбору нужных им элементов из меню", — отметили эксперты, напомнив о долгом времени отклика ИИ-бота.
Ранее писали, как Facebook планировали выкачивать деньги при помощи метавселенной. Еще в 2018 году сотрудники компании разработали концепцию виртуальной реальности, которая должна вызывать "шок и трепет" у пользователей.
Недавно Microsoft презентовал собственную метавселенную под названием Mesh: что о ней известно. Как утверждает компания, сервис будет доступен любому обладателю гаджета в 2022 году.