Діджитал

Учені створили алгоритм для "супернавушників": глушитиме зовнішній звук на вибір власника

Пилип Бойко 14.11.2023 в 13:18

Алгоритм на основі ШІ зробить навушники "розумнішими" | Фото: Getty

Алгоритм на основі штучного інтелекту визначить тип шуму й дозволить із усього різноманіття звуків заглушити або залишити саме той, який вибере користувач.

Група вчених із Вашингтонського університету розробила алгоритми глибокого навчання, що дозволяють користувачам вибирати, які шуми фільтрувати через навушники в режимі реального часу. Про це повідомляє Interesting Engineering.

Автори системи назвали систему "семантичним слухом". Навушники зі штучним інтелектом за алгоритмом учених усувають весь шум фону, передаючи записаний звук на смартфон, підключений до пристроїв.

Завдяки цьому процесу користувачі навушників можуть посилити або вимкнути 20 типів звуків, включаючи сирени, дитячі крики, мовлення, звуки пилотяга та щебетання птахів, використовуючи голосові команди або програму для смартфона. Потім навушники будуть обробляти лише звуки, які вибрав користувач.

"Семантичний слух" допомагає визначати різні типи шумів

Фото: interestingengineering.com

"Розуміння того, як звучить птах, і виділення його з усіх інших звуків у навколишньому середовищі вимагає інтелекту в реальному часі, чого не можуть досягти сучасні навушники з шумом придушення, — сказав старший автор опублікованої наукової статті Ш'ям Голлакота, професор Університету Вашингтона в Школі Пола Г. Аллена — Проблема в тому, що звуки, які чують користувачі навушників, повинні синхронізуватися з їхніми візуальними відчуттями — ви не можете почути чийсь голос через дві секунди після того, як він заговорить із вами. Це означає, що нейронні алгоритми повинні обробляти звуки менш ніж соту частку секунди".

Через це обмеження часу замість використання надійніших хмарних серверів система семантичного слуху вибирає процес, заснований на шумах, що передаються на такому пристрої як підключений смартфон. На додаток, щоб люди могли продовжувати ефективно сприймати звуки навколишнього середовища, системі необхідно підтримувати ці затримки й інші просторові сигнали, оскільки звуки, що виходять із різних напрямків, досягають вух людей у різний час.

Випробування проводилися дослідниками в різних умовах, включаючи вулиці, парки й офіси. Експерименти показали, що система семантичного слуху здатна ізолювати цільові звуки, такі як сирени та щебетання птахів, і водночас усувати фоновий шум. Що стосується виведення звуку системи для бажаних звуків, 22 учасники дали йому середню оцінку вище, ніж вони надали вихідним шумовим записам.

Однак було й кілька недоліків: у системи на базі штучного інтелекту іноді виникали проблеми з розпізнаванням звуків, які вважалися надто схожими, наприклад, вокальна музика та людське мовлення. Дослідники працюють над розв'язанням цих проблем, стверджуючи, що система могла б давати кращі результати, якби її моделі машинного навчання були навчені більшою кількістю реальних даних.

Раніше Фокус повідомляв, що вчені розробили спеціальні датчики для навушників, які відстежать активність мозку. Це покращить тренування й допоможе проводити моніторинг нервових станів.