Диджитал

Назван самый точный ИИ и это не ChatGPT: эксперты проверили популярные сервисы (фото)

Журналисты совместно с библиотекарями провели масштабное тестирование девяти популярных ИИ-сервисов, чтобы выяснить, какой из них дает самые точные ответы и реже всего "галлюцинирует". Результаты оказались неожиданными: безоговорочным лидером стал не ChatGPT, а новый AI Mode от Google.

В ходе эксперимента эксперты задали ИИ-сервисам, включая разные версии ChatGPT, Claude, Grok, Perplexity и Bing Copilot, 30 сложных вопросов, пишет The Washington Post. Запросы были разделены на пять категорий, призванных выявить слабые места нейросетей: малоизвестные факты, требующие поиска по специализированным источникам, свежие события, предубеждения и анализ изображений.

Победителем стал AI Mode от Google, который показал самые точные результаты в поиске информации о недавних событиях и интересных фактах. Его главное преимущество — способность проводить более глубокий поиск по сети перед тем, как дать ответ. Второе место занял ChatGPT-5, а третье — нейропоисковик Perplexity. Худшие результаты показали Meta AI и Grok, которые часто отказывались отвечать или давали неверную информацию.

Відео дня

Тестирование выявило несколько ключевых проблем современных ИИ. Во-первых, все без исключения сервисы "галлюцинировали", то есть придумывали ответы на некоторые вопросы и уверенно презентовали их как истину. Во-вторых, многие из них, особенно Perplexity и Grok, давали неверные ответы, но при этом ссылались на источники, которые не подтверждали их слова, создавая ложное чувство надежности.

chatgpt claude google ai mode grok bing copilot perplexity meta ai тесты ии 2025 — Инфографика The Washington Post: какой ИИ чаще всего отвечал правильно

Фото: The Washington Post

Особенно плохо нейросети справились с анализом изображений. На вопрос "Какого цвета был галстук у Дональда Трампа на встрече с Владимиром Путиным в Осаке в 2019 году?" правильно ответил только ChatGPT-5. Остальные либо путали Трампа с Путиным, либо просто ошибались в цвете.

Эксперты-библиотекари отметили, что в 64% случаев обычный поиск в Google позволил бы найти правильный ответ быстрее и проще. По их мнению, ИИ-сервисы хороши для сложных, исследовательских задач, но для простых вопросов они часто оказываются менее надежными. Главный вывод исследования: к любому ответу ИИ нужно относиться критически и всегда проверять источники.

Раньше Фокус писал, что ChatGPT будет передавать в полицию диалоги с людьми: что грозит в таком случае. Компания OpenAI признала, что сканирует диалоги пользователей ChatGPT и в некоторых случаях передает их в полицию. Эта мера призвана предотвратить реальные преступления, но вызывает серьезные вопросы о конфиденциальности и границах вмешательства ИИ в личную жизнь.

Последние новости

Больше новостей