Система автоматической транскрибации и перевода YouTube некорректно передала слова президента США Дональда Трампа на встрече президентом Украины Владимиром Зеленским и европейскими лидерами.

Когда Дональд Трамп говорил о канцлере Германии Фридрихе Мерце, искусственный интеллект (ИИ) вдруг решил, что речь идет о "канцлере Меркель". Причину этого раскрыл журнал Forbes.

ИИ неправильно транскрибировал слова Трампа

Как отмечают в издании, даже передовые системы на основе ИИ путают вчерашнюю правду с сегодняшней реальностью. Это происходит из-за некоторых особенностей их "мышления".

Транскрибация с помощью ИИ происходит по следующей схеме:

аудио разбивается на очень короткие фрагменты и преобразуется в числовые данные;

языковая модель предусматривает наиболее вероятное слово, которое соответствует как звучанию, так и контексту;

система предсказывает следующее слово в стенограмме.

Из этого следует, что ИИ-модель не понимает слов, а просто рассчитывает вероятности. Именно поэтому система автоматической транскрибации YouTube неправильно отобразила слова американского президента.

Поскольку в течение 16 лет "канцлер Германии" почти всегда означало Ангелу Меркель, то словосочетание "канцлер Меркель" было вплетено в огромное количество данных для обучения ИИ. Поэтому, когда модель услышала слово "Мерц", которое акустически близко к "Меркель", но гораздо реже встречается, она предпочла более знакомое продолжение.

"Ключевой пробел: модели транскрибации на основе искусственного интеллекта не проверяют факты. Они не останавливаются и не думают: "Меркель больше не канцлер, поэтому это, видимо, неправильно". Они не получают доступ к графикам знаний в реальном времени и не проверяют реальность. Они просто генерируют наиболее вероятную последовательность слов на основе исторических данных", — пояснили эксперты издания.

