Чат-бот, способный управлять компьютером: OpenAI показала GPT 5.4 (фото)
Cоздатели ChatGPT выпустили передовую ИИ-модель GPT-5.4, ориентированную на сложные задачи.
Новая версия объединяет в себе актуальные достижения в области логического мышления, программирования и автономной работы. Модель превосходит предшественников в работе с электронными таблицами, презентациями и документами, пишет OpenAI.
Функции управления ПК
Разработчики называют GPT-5.4 своей первой моделью общего назначения с нативной поддержкой управления компьютером. Искусственный интеллект способен анализировать снимки экрана и напрямую взаимодействовать с интерфейсом ОС и сторонних приложений.
Модель может самостоятельно перемещать курсор, нажимать на кнопки и вводить текст, выполняя многоэтапные рабочие процессы в браузере и десктопных программах. По результатам тестирования в среде OSWorld, имитирующей работу на обычном компьютере, новая модель достигла показателя успешности в 75%, тогда как GPT 5.2 набирала лишь 47,3%. Для точного распознавания интерфейсов улучшили обработку изображений сверхвысокого разрешения.
Профессиональные задачи
В ChatGPT модель теперь предоставляет предварительный план своих действий перед выполнением сложного запроса. Пользователь может прочитать алгоритм и скорректировать направление работы нейросети прямо в процессе, чтобы избежать неточных результатов в конце.
Особое внимание создатели уделили качеству работы с офисными форматами. Искусственный интеллект значительно лучше справляется с финансовым моделированием в таблицах и созданием сложных презентаций с графикой. В тестах на знание навыков из 44 различных профессий GPT-5.4 работает на уровне или превосходит профильных специалистов в 83 процентах случаев. При этом количество фактических ошибок и галлюцинаций было существенно снижено по сравнению с прошлой версией.
Эффективность и поиск
Модель поддерживает контекстное окно объемом до одного миллиона токенов, что позволяет загружать в нее огромные массивы данных за один раз. Для разработчиков внедрена новая система умного поиска инструментов. Теперь нейросети не нужно постоянно держать в памяти описания всех доступных функций. Она умеет находить нужный инструмент по мере необходимости, что сокращает расход токенов почти вдвое и снижает общую стоимость использования API.
Также значительно улучшена способность глубокого поиска в интернете. Нейросеть стала более настойчивой при поиске труднодоступной информации и умеет синтезировать ответы из множества разрозненных источников без участия пользователя.
Доступность для пользователей
На данный момент модель GPT-5.4 постепенно становится доступна платным подписчикам тарифов Plus, Team и Pro. Пользователи корпоративных планов могут получить к ней доступ через настройки администратора.
Также представлена более мощная и требовательная версия GPT-5.4 Pro, предназначенная исключительно для пользователей дорогих тарифов Pro и Enterprise для решения самых ресурсоемких задач. Предыдущая версия системы останется доступной в меню выбора моделей до начала лета 2026 года, после чего будет отключена.
Ранее сообщалось, на что способна улучшенная версия чат-бота для бесплатных пользователей. В новой модели GPT-5.3 Instant создатели популярного ИИ-сервиса уделили внимание естественности диалога, уместности ответов и снижению числа раздражающих ограничений.