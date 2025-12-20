В конце 2025 года обновились топовые ИИ-модели. OpenAI выпустила GPT-5.2, а Google немного ранее показала Gemini 3 Pro. Обе системы получили режим Thinking и передовые возможности, но какой помощник оказался лучше?

Фокус приводит обзор функций, бенчмарков и результатов независимых тестов, чтобы определить сильные и слабые стороны конкурентов.

Характеристики и доступ

Модели различаются условиями использования, актуальностью данных и объемом памяти. GPT-5.2 обладает тремя версиями: Instant (быстрый), Thinking (рассуждающий) и Pro (глубокий анализ). Контекстное окно составляет 400 000 токенов, доступны знания до 31 августа 2025 года. Модель уже доступна бесплатно на сайте ChatGPT с лимитами, которые можно расширить подписками Plus ($20/мес) или Pro ($200/мес).

Google Gemini 3 Pro позиционируется как лучшая модель для разных типов контента: не только текста, но и картинок с видео. Контекст значительно больше — 1 000 000 токенов пригодятся при работе с большими документами и длинными диалогами. ИИ знает обо всех событиях вплоть до января 2025 года. Бесплатно предлагается до 5 запросов, далее происходит переключение на Gemini 2.5 Flash, есть подписка AI Pro ($19.99/мес).

Актуальный рейтинг Artificial Analysis Intelligence Index

Синтетические тесты (данные OpenAI)

Согласно официальной документации, более новая модель GPT-5.2 Thinking опережает вариант от Google в большинстве ключевых сценариев.

GPQA Diamond (научные знания уровня PhD): GPT-5.2 — 92,4% , Gemini 3 Pro — 91,9%.

(научные знания уровня PhD): GPT-5.2 — , Gemini 3 Pro — 91,9%. AIME 2025 (олимпиадная математика): GPT-5.2 достигла абсолютного результата 100% , Gemini 3 Pro — 95,0%.

(олимпиадная математика): GPT-5.2 достигла абсолютного результата , Gemini 3 Pro — 95,0%. GDPval (прикладные рабочие задачи): GPT-5.2 — 70,9% , Gemini 3 Pro — 53,5%.

(прикладные рабочие задачи): GPT-5.2 — , Gemini 3 Pro — 53,5%. ARC-AGI-2 (визуальная логика): GPT-5.2 — 52,9% , Gemini 3 Pro — 31,1%.

(визуальная логика): GPT-5.2 — , Gemini 3 Pro — 31,1%. SWE-bench Verified (программирование): GPT-5.2 — 80,0%, Gemini 3 Pro — 76,2%.

Единственным тестом, где GPT-5.2 уступила, стал FrontierMath (математические задачи повышенной сложности), однако разрыв там минимален.

Независимые оценки

Независимые рейтинги показывают паритет. В индексе Artificial Analysis обе модели делят первое место с оценкой 73 балла.

В практических сценариях (кодинг, работа с изображениями) наблюдаются различия в подходах. GPT-5.2 Thinking пишет более сложный и функциональный код (например, реализует 3D-эффекты), создает детальные инструкции на основе фото, но работает медленнее и иногда допускает ошибки в верстке. Gemini 3 Pro генерирует лаконичный код, часто сопровождая его обучающими пояснениями. В работе с изображениями быстрее схватывает контекст (например, по названию файла), но может упускать мелкие детали.

Бенчмарк Sansa Censorship Фото: trysansa.com

Цензура и безопасность

Существенное различие между моделями выявил бенчмарк Sansa Censorship, оценивающий уровень ограничений в ответах нейросетей (чем выше балл, тем свободнее модель).

Gemini 3 Pro: 0,824 балла (высокий уровень свободы).

0,824 балла (высокий уровень свободы). GPT-5.2: 0,324 балла (самый строгий уровень фильтрации).

Новая модель OpenAI заняла последнее место в рейтинге. Пользователи отмечают, что GPT-5.2 часто отказывается выполнять запросы, которые считает потенциально небезопасными, даже если речь идет об образовательных целях (например, описание схем мошенничества). Разработчики объясняют это повышенной защитой от вредоносных инструкций и планируют внедрить "взрослый режим" с верификацией возраста в 2026 году. Gemini 3 Pro в этом плане демонстрирует большую гибкость и готовность поддерживать диалог на различные темы.

Что в итоге? Обе модели на практике весьма близки, и способны закрыть потребности большинства. GPT-5.2 — выбор для корпоративных задач и точных наук. Если вам нужен продвинутый код, безошибочная математика и вы готовы мириться с уклончивыми ответами на чувствительные темы, это ваш инструмент. Получился хороший, но "скучный" ассистент, который просто исполняет инструкции.

Gemini 3 Pro, хотя на бумаге отстает в точности, однозначно стоит внимания и ничуть не устарела. Она лучше подходит для живого общения и креатива. Модель от Google предлагает больше свободы, рисует красивые иллюстрации, глубже осведомлена о различных трендах, мемах и культурных контекстах, а также отлично понимает изображения.

