Чат-бот, здатний керувати комп'ютером: OpenAI показала GPT 5.4 (фото)
Творці ChatGPT випустили передову ШІ-модель GPT-5.4, орієнтовану на складні завдання.
Нова версія об'єднує в собі актуальні досягнення в галузі логічного мислення, програмування та автономної роботи. Модель перевершує попередників у роботі з електронними таблицями, презентаціями та документами, пише OpenAI.
Функції управління ПК
Розробники називають GPT-5.4 своєю першою моделлю загального призначення з нативною підтримкою управління комп'ютером. Штучний інтелект здатний аналізувати знімки екрана і безпосередньо взаємодіяти з інтерфейсом ОС і сторонніх додатків.
Модель може самостійно переміщати курсор, натискати на кнопки та вводити текст, виконуючи багатоетапні робочі процеси в браузері та десктопних програмах. За результатами тестування в середовищі OSWorld, що імітує роботу на звичайному комп'ютері, нова модель досягла показника успішності в 75%, тоді як GPT 5.2 набирала лише 47,3%. Для точного розпізнавання інтерфейсів поліпшили обробку зображень надвисокої роздільної здатності.
Професійні завдання
У ChatGPT модель тепер надає попередній план своїх дій перед виконанням складного запиту. Користувач може прочитати алгоритм і скорегувати напрямок роботи нейромережі прямо в процесі, щоб уникнути неточних результатів наприкінці.
Особливу увагу творці приділили якості роботи з офісними форматами. Штучний інтелект значно краще справляється з фінансовим моделюванням у таблицях і створенням складних презентацій з графікою. У тестах на знання навичок із 44 різних професій GPT-5.4 працює на рівні або перевершує профільних фахівців у 83 відсотках випадків. При цьому кількість фактичних помилок і галюцинацій було істотно знижено порівняно з минулою версією.
Ефективність і пошук
Модель підтримує контекстне вікно обсягом до одного мільйона токенів, що дає змогу завантажувати в неї величезні масиви даних за один раз. Для розробників впроваджено нову систему розумного пошуку інструментів. Тепер нейромережі не потрібно постійно тримати в пам'яті описи всіх доступних функцій. Вона вміє знаходити потрібний інструмент у міру необхідності, що скорочує витрату токенів майже вдвічі і знижує загальну вартість використання API.
Також значно поліпшено здатність глибокого пошуку в інтернеті. Нейромережа стала більш наполегливою під час пошуку важкодоступної інформації та вміє синтезувати відповіді з безлічі розрізнених джерел без участі користувача.
Доступність для користувачів
Наразі модель GPT-5.4 поступово стає доступною платним передплатникам тарифів Plus, Team і Pro. Користувачі корпоративних планів можуть отримати до неї доступ через налаштування адміністратора.
Також представлено потужнішу і вимогливішу версію GPT-5.4 Pro, призначену винятково для користувачів дорогих тарифів Pro і Enterprise для розв'язання найбільш ресурсномістких завдань. Попередня версія системи залишиться доступною в меню вибору моделей до початку літа 2026 року, після чого буде відключена.
Раніше повідомлялося, на що здатна поліпшена версія чат-бота для безкоштовних користувачів. У новій моделі GPT-5.3 Instant творці популярного АІ-сервісу приділили увагу природності діалогу, доречності відповідей і зниженню кількості дратівливих обмежень.