Cоздатели ChatGPT выпустили передовую ИИ-модель GPT-5.4, ориентированную на сложные задачи.

Новая версия объединяет в себе актуальные достижения в области логического мышления, программирования и автономной работы. Модель превосходит предшественников в работе с электронными таблицами, презентациями и документами, пишет OpenAI.

Функции управления ПК

Разработчики называют GPT-5.4 своей первой моделью общего назначения с нативной поддержкой управления компьютером. Искусственный интеллект способен анализировать снимки экрана и напрямую взаимодействовать с интерфейсом ОС и сторонних приложений.

Модель может самостоятельно перемещать курсор, нажимать на кнопки и вводить текст, выполняя многоэтапные рабочие процессы в браузере и десктопных программах. По результатам тестирования в среде OSWorld, имитирующей работу на обычном компьютере, новая модель достигла показателя успешности в 75%, тогда как GPT 5.2 набирала лишь 47,3%. Для точного распознавания интерфейсов улучшили обработку изображений сверхвысокого разрешения.

Відео дня

GPT‑5.4 понимает скриншоты браузера и взаимодействует с элементами сайта посредством щелчков по координатам, чтобы отправлять электронные письма и планировать события в календаре Фото: OpenAI

Профессиональные задачи

В ChatGPT модель теперь предоставляет предварительный план своих действий перед выполнением сложного запроса. Пользователь может прочитать алгоритм и скорректировать направление работы нейросети прямо в процессе, чтобы избежать неточных результатов в конце.

Особое внимание создатели уделили качеству работы с офисными форматами. Искусственный интеллект значительно лучше справляется с финансовым моделированием в таблицах и созданием сложных презентаций с графикой. В тестах на знание навыков из 44 различных профессий GPT-5.4 работает на уровне или превосходит профильных специалистов в 83 процентах случаев. При этом количество фактических ошибок и галлюцинаций было существенно снижено по сравнению с прошлой версией.

Эффективность и поиск

Модель поддерживает контекстное окно объемом до одного миллиона токенов, что позволяет загружать в нее огромные массивы данных за один раз. Для разработчиков внедрена новая система умного поиска инструментов. Теперь нейросети не нужно постоянно держать в памяти описания всех доступных функций. Она умеет находить нужный инструмент по мере необходимости, что сокращает расход токенов почти вдвое и снижает общую стоимость использования API.

Также значительно улучшена способность глубокого поиска в интернете. Нейросеть стала более настойчивой при поиске труднодоступной информации и умеет синтезировать ответы из множества разрозненных источников без участия пользователя.

Улучшения GPT 5.4 в бенчмарке, оценивающем точность в инженерных задачах программирования Фото: OpenAI

Доступность для пользователей

На данный момент модель GPT-5.4 постепенно становится доступна платным подписчикам тарифов Plus, Team и Pro. Пользователи корпоративных планов могут получить к ней доступ через настройки администратора.

Также представлена более мощная и требовательная версия GPT-5.4 Pro, предназначенная исключительно для пользователей дорогих тарифов Pro и Enterprise для решения самых ресурсоемких задач. Предыдущая версия системы останется доступной в меню выбора моделей до начала лета 2026 года, после чего будет отключена.

Ранее сообщалось, на что способна улучшенная версия чат-бота для бесплатных пользователей. В новой модели GPT-5.3 Instant создатели популярного ИИ-сервиса уделили внимание естественности диалога, уместности ответов и снижению числа раздражающих ограничений.