Диджитал

Ученые создали алгоритм для "супернаушников": будет глушить внешний звук по выбору владельца

Филипп Бойко 14.11.2023 в 13:18

Алгоритм на основе ИИ сделает наушники более "умными" | Фото: Getty

Алгоритм на основе искусственного интеллекта определит тип шума и позволит из всего многообразия звуков заглушить или оставить именно тот, который выберет пользователь.

Группа ученых из Вашингтонского университета разработала алгоритмы глубокого обучения, которые позволяют пользователям выбирать, какие шумы фильтровать через наушники в режиме реального времени. Об этом сообщает Interesting Engineering.

Создатели системы назвали систему "семантическим слухом". Наушники с искусственным интеллектом по алгоритму ученых устраняют весь фоновый шум, передавая записанный звук на смартфон, подключенный к устройствам.

Благодаря этому процессу пользователи наушников могут усилить или отключить 20 типов звуков, включая сирены, детские крики, речь, звуки пылесоса и щебетание птиц, используя голосовые команды или приложение для смартфона. Затем наушники будут обрабатывать только те звуки, которые выбрал пользователь.

"Семантический слух" помогает определять различные типы шумов

Фото: interestingengineering.com

"Понимание того, как звучит птица, и выделение его из всех других звуков в окружающей среде требует интеллекта в реальном времени, чего не могут достичь современные наушники с шумоподавлением, — сказал старший автор опубликованной научной статьи Шьям Голлакота, профессор Университета Вашингтона в Школе Пола Г. Аллена. — Проблема в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их визуальными ощущениями. Вы не можете услышать чей-то голос через две секунды после того, как он заговорит с вами. Это означает, что нейронные алгоритмы должны обрабатывать звуки менее чем за сотую долю секунды".

Из-за этого ограничения по времени вместо использования более надежных облачных серверов система семантического слуха выбирает процесс, основанный на шумах, передаваемых на таком устройстве, как подключенный смартфон. Более того, чтобы люди могли продолжать эффективно воспринимать звуки окружающей среды, системе необходимо поддерживать эти задержки и другие пространственные сигналы, поскольку звуки, исходящие с разных направлений, достигают ушей людей в разное время.

Испытания проводились исследователями в различных условиях, включая улицы, парки и офисы. Эксперименты показали, что система семантического слуха способна изолировать целевые звуки, такие как сирены и щебетание птиц, и в то же время устранять фоновый шум. Что касается вывода звука системы для желаемых звуков, 22 участника дали ему среднюю оценку выше, чем они присвоили исходным шумовым записям.

Однако было и несколько недостатков: у системы на базе искусственного интеллекта иногда возникали проблемы с распознаванием звуков, которые считались слишком похожими, например вокальная музыка и человеческая речь. Исследователи работают над решением этих проблем, утверждая, что система могла бы давать лучшие результаты, если бы ее модели машинного обучения были обучены на большем количестве реальных данных.

Ранее Фокус сообщал, что ученые разработали особые датчики для наушников, которые отследят активность мозга. Это улучшит тренировки и поможет проводить мониторинг нервных состояний.