Глаз - алмаз. ИИ впервые превзошел людей в распознавании образов

Компьютерное зрение
Фото: Pixabay

В ходе тестов алгоритм машинного зрения дал правильные ответы в 81% случаев, а люди — в 80%. Но пока машина все равно не способна полностью заменить человека.

Related video

Алгоритм машинного зрения AliceMind от китайской компании Alibaba впервые превзошел человека в распознавании визуальных образов. Об этом пишет газета South China Morning Post.

До недавних пор искусственный интеллект всегда уступал людям, как только дело доходило до картинок, стоит вспомнить хотя бы "капчу" — распространенную защиту от ботов в Интернете, когда пользователю необходимо выбрать картинки с определенными объектами. Ситуацию в корне меняет ИИ под названием AliceMind, показавший свои возможности на мероприятии Visual Question Answering Challenge 2021 (VQA).

В этот году участникам испытаний показали более 250 тыс. изображений и задали 1,1 млн вопросов о них. Алгоритм от Alibaba Group показал точность в 81,26%, тогда как участники-люди не ошиблись лишь в 80,83% случаев. Кроме того, AliceMind превзошел всех "искусственных конкурентов", включая модель от Microsoft.

"Мы гордимся тем, что достигли еще одной важной вехи в области машинного интеллекта, что подчеркивает наши постоянные усилия по продвижению исследований и разработок в смежных областях", — заявил Си Луо, руководитель отдела обработки естественного языка (Natural Language Processing) в Alibaba DAMO Academy.

По его словам, успех алгоритма не означает, что машины в будущем смогут полностью заменить людей, однако окажут помощь, взяв на себя сложную и рутинную работу. Благодаря этому человечество сможет сфокусироваться на креативных задачах, которые ИИ не под силу.

Си Луо добавил, что технологию VQA уже сейчас можно применять в самых разных областях, например, тренировать алгоритмы для первичной диагностики болезней по изображениям, для беспилотных автомобилей или поиска на продуктов на сайтах электронной коммерции. Alibaba уже использовала ее в нескольких приложениях, в том числе в своем интеллектуальном чат-боте Alime Shop Assistant, которым ежедневно пользуются десятки тысяч продавцов на розничных платформах.

Ранее Фокус писал, что ученые из США наделили ИИ фантазией. Нейросеть научилась "рисовать" предметы и явления, которые раньше никогда не "видела".