Google сьогодні випустила Gemini 3.1 Pro, щойно побачив тестові оцінки, і відчувається, що це спрямовано на побиття рекордів (продовжується гонка моделей, вигідна для напівпровідників!)😂
Офіційна позиція дуже чітка: спеціально для складних завдань, таких як глибокі дослідження, інженерні задачі, довгі ланцюги логіки та агентські робочі процеси. Ключові особливості: 1M токенів у контекстному вікні (залишається незмінним) Підтримка мультимодальності (текст+зображення+відео+аудіо+код) Максимальна вихідна довжина 64k токенів Порівняння продуктивності з сучасними провідними моделями (Claude Opus 4.6, GPT-5.2/5.3 тощо): ARC-AGI-2 (найскладніший тест на абстрактне мислення): Gemini 3.1 Pro 77.1%, випереджає Claude 4.6 (68.8%) приблизно на 8-9 відсоткових пунктів, випереджає GPT-5 серії на 20-30+ відсоткових пунктів. Це найбільший прогрес, що означає якісне стрибок у основному логічному мисленні. GPQA Diamond (наукове мислення рівня PhD): 94.3%, трохи випереджає Claude 4.6 (91.3%) і GPT-5.2 (92.4%), різниця 2-3 відсоткових пункти, базовий рівень вже майже насичений. SWE-Bench Verified (реальні завдання з програмної інженерії): 80.6%, випереджає Claude 4.6 (приблизно 76-77%) на 3-5 відсоткових пунктів, значно випереджає GPT (5-15%). Інше: Terminal-Bench, APEX-Agents та інші довготривалі агентські задачі також отримали кілька перших місць; індекс LMArena/Artificial Analysis наразі на першому місці, висока ефективність за витратами. Що ще важливо, переваги за ціною очевидні: Ціноутворення API (за 1M токенів, на основі останніх даних Vertex AI / Gemini API, стандартна ціна для контексту ≤200k): Gemini 3.1 Pro: вхід $2.00, вихід $12.00 (понад 200k контекст подвоюється до $4/$18) Claude Opus 4.6: вхід $5.00, вихід $25.00 GPT-5.2 / 5.x: зазвичай $10–15+, вихід $30–75+ (вищий рівень залежно від версії) Перевага за ціною: Gemini приблизно на 60% дешевше за Claude (2 проти 5), більш ніж на 70–80% дешевше за серію GPT. За вихідними даними: Gemini приблизно на 52% дешевше за Claude (12 проти 25), більш ніж на 60–80% дешевше за GPT.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Google сьогодні випустила Gemini 3.1 Pro, щойно побачив тестові оцінки, і відчувається, що це спрямовано на побиття рекордів (продовжується гонка моделей, вигідна для напівпровідників!)😂
Офіційна позиція дуже чітка: спеціально для складних завдань, таких як глибокі дослідження, інженерні задачі, довгі ланцюги логіки та агентські робочі процеси.
Ключові особливості: 1M токенів у контекстному вікні (залишається незмінним)
Підтримка мультимодальності (текст+зображення+відео+аудіо+код)
Максимальна вихідна довжина 64k токенів
Порівняння продуктивності з сучасними провідними моделями (Claude Opus 4.6, GPT-5.2/5.3 тощо):
ARC-AGI-2 (найскладніший тест на абстрактне мислення):
Gemini 3.1 Pro 77.1%, випереджає Claude 4.6 (68.8%) приблизно на 8-9 відсоткових пунктів,
випереджає GPT-5 серії на 20-30+ відсоткових пунктів. Це найбільший прогрес, що означає якісне стрибок у основному логічному мисленні.
GPQA Diamond (наукове мислення рівня PhD): 94.3%, трохи випереджає Claude 4.6 (91.3%) і GPT-5.2 (92.4%), різниця 2-3 відсоткових пункти, базовий рівень вже майже насичений.
SWE-Bench Verified (реальні завдання з програмної інженерії): 80.6%, випереджає Claude 4.6 (приблизно 76-77%) на 3-5 відсоткових пунктів, значно випереджає GPT (5-15%).
Інше: Terminal-Bench, APEX-Agents та інші довготривалі агентські задачі також отримали кілька перших місць; індекс LMArena/Artificial Analysis наразі на першому місці, висока ефективність за витратами.
Що ще важливо, переваги за ціною очевидні:
Ціноутворення API (за 1M токенів, на основі останніх даних Vertex AI / Gemini API, стандартна ціна для контексту ≤200k):
Gemini 3.1 Pro: вхід $2.00, вихід $12.00 (понад 200k контекст подвоюється до $4/$18)
Claude Opus 4.6: вхід $5.00, вихід $25.00
GPT-5.2 / 5.x: зазвичай $10–15+, вихід $30–75+ (вищий рівень залежно від версії)
Перевага за ціною: Gemini приблизно на 60% дешевше за Claude (2 проти 5), більш ніж на 70–80% дешевше за серію GPT.
За вихідними даними: Gemini приблизно на 52% дешевше за Claude (12 проти 25), більш ніж на 60–80% дешевше за GPT.