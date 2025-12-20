Наприкінці 2025 року оновилися топові ШІ-моделі. OpenAI випустила GPT-5.2, а Google трохи раніше показала Gemini 3 Pro. Обидві системи отримали режим Thinking і передові можливості, але який помічник виявився кращим?

Фокус наводить огляд функцій, бенчмарків і результатів незалежних тестів, щоб визначити сильні та слабкі сторони конкурентів.

Характеристики та доступ

Моделі різняться умовами використання, актуальністю даних і обсягом пам'яті. GPT-5.2 має три версії: Instant (швидкий), Thinking (той, хто міркує) і Pro (глибокий аналіз). Контекстне вікно становить 400 000 токенів, доступні знання до 31 серпня 2025 року. Модель уже доступна безкоштовно на сайті ChatGPT з лімітами, які можна розширити підписками Plus ($20/міс) або Pro ($200/міс).

Google Gemini 3 Pro позиціонується як найкраща модель для різних типів контенту: не лише тексту, а й картинок з відео. Контекст значно більший — 1 000 000 токенів стануть у пригоді під час роботи з великими документами та довгими діалогами. ШІ знає про всі події аж до січня 2025 року. Безкоштовно пропонується до 5 запитів, далі відбувається перемикання на Gemini 2.5 Flash, є підписка AI Pro ($19.99/міс).

Актуальний рейтинг Artificial Analysis Intelligence Index

Синтетичні тести (дані OpenAI)

Згідно з офіційною документацією, новіша модель GPT-5.2 Thinking випереджає варіант від Google у більшості ключових сценаріїв.

GPQA Diamond (наукові знання рівня PhD): GPT-5.2 — 92,4% , Gemini 3 Pro — 91,9%.

(наукові знання рівня PhD): GPT-5.2 — , Gemini 3 Pro — 91,9%. AIME 2025 (олімпіадна математика): GPT-5.2 досягла абсолютного результату 100% , Gemini 3 Pro — 95,0%.

(олімпіадна математика): GPT-5.2 досягла абсолютного результату , Gemini 3 Pro — 95,0%. GDPval (прикладні робочі завдання): GPT-5.2 — 70,9% , Gemini 3 Pro — 53,5%.

(прикладні робочі завдання): GPT-5.2 — , Gemini 3 Pro — 53,5%. ARC-AGI-2 (візуальна логіка): GPT-5.2 — 52,9% , Gemini 3 Pro — 31,1%.

(візуальна логіка): GPT-5.2 — , Gemini 3 Pro — 31,1%. SWE-bench Verified (програмування): GPT-5.2 — 80,0%, Gemini 3 Pro — 76,2%.

Єдиним тестом, де GPT-5.2 поступилася, став FrontierMath (математичні завдання підвищеної складності), однак розрив там мінімальний.

Незалежні оцінки

Незалежні рейтинги показують паритет. В індексі Artificial Analysis обидві моделі ділять перше місце з оцінкою 73 бали.

У практичних сценаріях (кодинг, робота із зображеннями) спостерігаються відмінності в підходах. GPT-5.2 Thinking пише складніший і функціональніший код (наприклад, реалізує 3D-ефекти), створює детальні інструкції на основі фото, але працює повільніше й іноді припускається помилок у верстці. Gemini 3 Pro генерує лаконічний код, часто супроводжуючи його навчальними поясненнями. У роботі із зображеннями швидше схоплює контекст (наприклад, за назвою файлу), але може упускати дрібні деталі.

Бенчмарк Sansa Censorship Фото: trysansa.com

Цензура і безпека

Істотну відмінність між моделями виявив бенчмарк Sansa Censorship, що оцінює рівень обмежень у відповідях нейромереж (що вищий бал, то вільніша модель).

Gemini 3 Pro: 0,824 бала (високий рівень свободи).

0,824 бала (високий рівень свободи). GPT-5.2: 0,324 бала (найсуворіший рівень фільтрації).

Нова модель OpenAI посіла останнє місце в рейтингу. Користувачі зазначають, що GPT-5.2 часто відмовляється виконувати запити, які вважає потенційно небезпечними, навіть якщо йдеться про освітні цілі (наприклад, опис схем шахрайства). Розробники пояснюють це підвищеним захистом від шкідливих інструкцій і планують впровадити "дорослий режим" із верифікацією віку 2026 року. Gemini 3 Pro в цьому плані демонструє більшу гнучкість і готовність підтримувати діалог на різні теми.

Що в підсумку? Обидві моделі на практиці дуже близькі, і здатні закрити потреби більшості. GPT-5.2 — вибір для корпоративних завдань і точних наук. Якщо вам потрібен просунутий код, безпомилкова математика і ви готові миритися з ухильними відповідями на чутливі теми, це ваш інструмент. Вийшов хороший, але "нудний" асистент, який просто виконує інструкції.

Gemini 3 Pro, хоча на папері відстає в точності, однозначно варта уваги і анітрохи не застаріла. Вона краще підходить для живого спілкування і креативу. Модель від Google пропонує більше свободи, малює красиві ілюстрації, глибше обізнана про різні тренди, меми і культурні контексти, а також чудово розуміє зображення.

