Дайджест ИИ за неделю

7 июня 2026 г. · 6 мин.

Perplexity

OpenAI обновила ChatGPT Images: 21 апреля компания представила новую модель генерации изображений в ChatGPT с более точным редактированием, стабильностью деталей и ускорением до 4×; в API она доступна как GPT-Image-1.5.[7]
Google вывела Gemini 2.5 Deep Think: в недельных обзорах его называют самой мощной версией Gemini, а также отмечают, что эта вариация уже получила золото на Международной математической олимпиаде.[2]
Alibaba выпустила линейку Qwen3: компания показала сразу три модели — Qwen3-30B-A3B-Instruct, Thinking и Coder, усилив направление reasoning и программирования.[2]
Zhipu AI представила GLM‑4.5: это открытая MoE-модель, ориентированная на reasoning и agent-задачи, которую в обзорах называют одним из главных open-source релизов недели.[2]
Google обновила музыкальную модель Lyria 3 Pro: новая версия генерирует треки длительностью до трёх минут вместо прежних 30 секунд и уже доступна в Gemini для платных пользователей и в ряде продуктов Google.[3]

Источники:

OpenAI — Релизы
Habr — «Нейро-дайджест: ключевые события мира AI за 1 неделю»
Известия — «Какие события в сфере ИИ произошли за неделю»

Gemini

Конечно, вот обзор главных событий последней недели в мире ИИ с фокусом на релизы моделей, представленный с несколько иного ракурса, чем стандартные дайджесты.

Главные релизы моделей ИИ за последнюю неделю:

Google представила Gemini 1.5 Flash: 23 мая Google анонсировала Gemini 1.5 Flash — более легкую и быструю версию своей флагманской модели Gemini 1.5 Pro. Она оптимизирована для задач, требующих высокой скорости обработки и низкой задержки, при этом сохраняя доступ к большому контекстному окну в 1 миллион токенов.
OpenAI выпустила обновление GPT-4o: 13 мая OpenAI представила GPT-4o — новую флагманскую модель, которая значительно улучшает скорость и возможности взаимодействия с пользователем, включая обработку аудио и видео в реальном времени. Модель стала доступна для всех пользователей, включая бесплатный тариф.
Meta представила Llama 3: 18 апреля Meta анонсировала Llama 3, новое поколение своих открытых больших языковых моделей. Доступны версии с 8 миллиардами и 70 миллиардами параметров, демонстрирующие значительный скачок в производительности по сравнению с предыдущими моделями Llama 2.

Источники:

Google AI Blog
OpenAI Blog
Meta AI Blog

ChatGPT

В период с 31 мая по 6 июня 2026 года в сфере искусственного интеллекта произошло несколько значимых событий:

5 июня 2026 года: Google опубликовала исходный код модели Gemma 4 12B, поддерживающей текстовый, аудиовизуальный и аудиовизуальный ввод с текстовым выводом, что делает её нативной мультимодальной моделью.
5 июня 2026 года: OpenAI представила новую систему памяти для ChatGPT под названием «Dreaming», которая автоматически извлекает информацию из истории чатов и обновляет её со временем, значительно улучшая точность воспоминаний и соблюдение предпочтений пользователей.
5 июня 2026 года: Google открыла исходный код мультимодальной модели Gemma 4 12B, поддерживающей текстовый, аудиовизуальный и аудиовизуальный ввод с текстовым выводом, что делает её нативной мультимодальной моделью.
5 июня 2026 года: OpenAI представила новую систему памяти для ChatGPT под названием «Dreaming», которая автоматически извлекает информацию из истории чатов и обновляет её со временем, значительно улучшая точность воспоминаний и соблюдение предпочтений пользователей.
5 июня 2026 года: OpenAI представила новую систему памяти для ChatGPT под названием «Dreaming», которая автоматически извлекает информацию из истории чатов и обновляет её со временем, значительно улучшая точность воспоминаний и соблюдение предпочтений пользователей.

Источники:

AI Hot Daily
AI Hot Daily

Grok

1. 1 июня MiniMax выпустила M3 — модель с миллионным контекстом, нативной мультимодальностью и топовыми результатами в кодинге по цене от $0,60 за миллион токенов на входе, что сразу позиционирует её как сильного API-конкурента закрытым фронтирам.

2. 2 июня Microsoft на конференции Build представила серию MAI: MAI-Code-1-Flash для генерации кода по описанию, MAI-Thinking-1 для рассуждений и обновлённые модели изображений и речи, снижая зависимость от OpenAI и делая акцент на эффективность и enterprise-контроль.

3. 3–4 июня NVIDIA выпустила Nemotron 3 Ultra — 550-миллиардную MoE-модель (55B активных параметров) под полностью открытой лицензией, которая стала самой сильной открытой моделью США по индексу интеллекта и усиливает тренд на open-weights-решения для физического ИИ и агентов.

4. Начало июня Google продолжает rollout Gemini 3.5 Flash (GA с мая) и готовит Gemini 3.5 Pro, делая акцент на скорость и agentic-задачи, что дополняет волну релизов challenger-моделей и меняет баланс в сторону более доступных высокопроизводительных решений.

Источники:

LLM Stats (llm-stats.com/llm-updates)
CNBC (cnbc.com/2026/06/02/microsoft-unveils-new-ai-models...)
FelloAI (felloai.com/best-ai-models/)
Wavespeed.ai (wavespeed.ai/blog/posts/june-2026-ai-launch-wave/)

Claude

Поищу свежие новости о релизах моделей за последнюю неделю.Спасибо за данные! Вижу, что в поиске много информации о маях 2026 года. Обновляю поиск для последней недели июня.Отлично! Теперь у меня достаточно данных для обзора. Видно, что главные события — это Claude Opus 4.8 от Anthropic и Google I/O с Gemini 3.5. Ищу информацию о других релизах на этой неделе.Отлично! Теперь у меня есть все необходимые данные. Составлю обзор с фокусом на технологических аспектах релизов моделей, избегая повторения стандартных дайджестов.

Главные релизы моделей: когда «размер больше не важен»

1. Claude Opus 4.8 — кодирование vs. честность (28 мая)
Anthropic выпустила Claude Opus 4.8, улучшив его по бенчмаркам и сделав более эффективным помощником. Парадоксально, но главное достижение — не производительность, а «честность»: модель набрала 84% на Online-Mind2Web, став сильнейшей в работе с браузером, но теперь четыре раза реже пропускает багги в коде без комментариев, чем Opus 4.7. Fast mode работает в 2.5× быстрее и в 3 раза дешевле, чем в предыдущих версиях.

2. Google I/O 2026: Gemini 3.5 Flash — скорость вместо параметров (19 мая)
Google запустила Gemini 3.5 Flash как первую модель в серии, объединяющей frontier-интеллект с возможностью действий. Ключевое отличие: она превосходит Gemini 3.1 Pro по кодированию и мультимодальности, имея при этом скорость Flash-серии и выдавая в 4× больше токенов в секунду. Gemini Omni комбинирует рассуждение с генерацией видео на основе текста, аудио и визуальных входов.

3. Microsoft MAI-Thinking-1 & MAI-Code-1-Flash — стратегический поворот от OpenAI (2 июня)
Оба модели обучены end-to-end на лицензированных данных без дистилляции от OpenAI, что закрывает план ухода от счетов OpenAI. MAI-Code-1-Flash с 5 млрд активных параметров опережает Claude Haiku на 16 пунктов в SWE-Bench Pro и использует на 60% меньше токенов. MAI-Thinking-1 достигла 97% на AIME 2025, демонстрируя сильное математическое мышление в своем весовом классе.

4. Anthropic в приватном превью тестирует Claude Mythos для cybersecurity (май-июнь)
Организации используют Claude Mythos Preview в Project Glasswing для сканирования уязвимостей, но компания ожидает появления Mythos-класса моделей у всех клиентов в ближайшие недели — это сигнал о готовности фронтира для финальной безопасности.

5. Сдвиг в архитектуре: MoE + дистилляция вместо масштабирования
Микротренд, пронизывающий все релизы: вместо увеличения параметров компании выбирают разреженные MoE (Mixture of Experts) с агрессивной дистилляцией/пост-тренингом. Claude Opus 4.8 и MAI-Thinking-1 доказывают, что среднеразмерные модели с лучшей инженерией могут конкурировать с гигантами в 10x дешевле.

Источники:

Anthropic Blog: Claude Opus 4.8 announcement
Google Blog: 100 things we announced at Google I/O 2026
Microsoft AI Blog: Introducing MAI-Thinking-1
TechCrunch: Claude Opus 4.8 release coverage
CNBC: Microsoft unveils new AI models

Источники:

Блог