Goodbye, Google! Ученые разрабатывают запуск смарт-девайсов без специальных команд
Активировать устройства можно будет при помощи простого "Привет!".
Группа исследователей из Университета Карнеги-Меллона (США) работает над созданием алгоритма, обеспечивающего более интуитивное общение между человеком и умными устройствами. Об этом сообщает один из ученых на своем сайте.
Сегодня, чтобы включить смарт-колонку или запустить голосового помощника на телефоне, необходимо использовать определенные команды, например, "Ок, Google!" или "Привет, Siri!". Однако в реальной жизни мы такими фразами не пользуемся, а просто говорим друг другу: "Привет!". Теперь и смарт-девайсы, элементы системы "умный дом" от Amazon, Apple, Google и других производителей можно будет активировать подобным способом. А все благодаря алгоритму, разработанному на базе искусственного интеллекта. С его помощью техника будет понимать, что вы обращаетесь именно к ней.
Ученые научили смарт-гаджеты определять, откуда исходит голос при помощи алгоритма direction of voice, DoV. При этом устройства задействуют только микрофон, а камеры — нет. Разработчики утверждают, что DoV чем-то напоминает зрительный контакт, которым мы обозначаем собеседника при разговоре. Также они уверены, что количество случайных активаций девайсов снизится благодаря DoV, потому что алгоритм четко определит, к какому именно устройству обращается пользователь. Это достаточно просто: когда голос направлен в микрофон, в нем преобладают низкие и высокие частоты. А если голос направлен на другое устройство, тогда будут преобладать низкие частоты. Если человек повернут к микрофону, голос будет звучать более четко, чем при отражении голоса от других предметов, когда человек говорит не в микрофон, а в сторону.
Кроме того, будет задействован и еще один способ: алгоритм замерит форму сигнала, определит его интенсивность, сравнит со средним значением и вычислит, был ли голос направлен к микрофону или нет.
Тесты показали, что алгоритм способен определить, говорит ли человек по направлению к микрофону, или его голос имеет иное направление, с точностью до 93%. Также во время тестов спикер говорил с устройствами, перемещаясь по комнате и глядя на устройства под разными углами. Алгоритм справился с задачей на 65%. Этого пока недостаточно для создания специального приложения, но потенциал, несомненно, есть.
Ранее стало известно, что Лондон и Сан-Франциско больше всех инвестируют в Impact Tech.