Perplexity
18 марта 2026 — OpenAI запустила GPT-5.4 mini в ChatGPT, сделав упор на более быструю и экономичную малую модель для пользователей Free и Go. Это важно как один из ключевых релизов сезона: OpenAI продолжает обновлять линейку, смещая акцент не только на «флагманы», но и на массовые прикладные версии.
Апрель 2026 — В хронологии AI-Stat зафиксирован сразу ряд заметных релизов: Claude Opus 4.7, Gemma 4 26B-A4B, Gemma 4 31B, а также несколько новых вариантов DeepSeek-V4. Неделя показывает, что крупные игроки ускоряют выпуск моделей в разных размерах — от более мощных до оптимизированных под скорость и стоимость.
Март 2026 — Среди релизов месяца выделяются Gemini 3.1 Flash-Lite, Mistral Small 4, Qwen3.5 и Grok 4.20: рынок продолжает двигаться в сторону компактных и практичных моделей для повседневного использования. Особенно заметен тренд на «лайт»-версии, которые закрывают задачи быстрее и дешевле, не теряя в качестве для массовых сценариев.
Декабрь 2025 — В числе важных запусков были Gemini 3 Flash, Mistral Large 3 и Nova Pro / Nova Lite / Nova Micro от Amazon. Это был сильный месяц для экосистемных релизов: сразу несколько компаний показали не одну модель, а целые линейки под разные бюджеты и нагрузки.
Август 2024 — В хронологии также отмечены Command R+, Phi-3.5 и Jamba 1.5 как этап, когда рынок активно расширялся за счет новых компактных и мультимодальных моделей. Эти релизы хорошо иллюстрируют, как быстро отрасль ушла от единичных «супермоделей» к разнообразию специализированных решений.
Источники:
- Примечания к выпускам моделей — OpenAI Help Center
- Хронология релизов нейросетей 2026 — AI-Stat
- полный путеводитель по семейству моделей GPT в 2025 году — Habr
Gemini
Главные релизы моделей ИИ за последнюю неделю: фокус на практичность и эффективность
Последняя неделя мая 2026 года ознаменовалась выходом нескольких значимых обновлений в сфере ИИ, демонстрирующих смещение акцентов от сырой мощности к практической применимости и оптимизации.
- OpenAI представляет GPT-5.5 Instant (5 мая 2026 г.): Новая версия стала дефолтной моделью для ChatGPT, обещая двукратное сокращение галлюцинаций в критически важных областях, таких как медицина и финансы. Модель также демонстрирует улучшенные результаты на математических и мультимодальных тестах, при этом потребляя меньше ресурсов.
- xAI выпускает Grok 4.3 (5 мая 2026 г.): Модель доступна на Oracle Cloud Infrastructure (OCI) Enterprise AI, предлагая улучшенные возможности в области логики, математики и анализа. Grok 4.3 отличается высокой производительностью при значительно более низкой стоимости по сравнению с конкурентами и имеет контекстное окно в один миллион токенов.
- Moonshot AI представляет Kimi K2.6 (6 мая 2026 г.): Эта модель, обладающая оптимизированной архитектурой внимания, была выпущена с контекстным окном в 256 тысяч токенов.
- DeepSeek открывает доступ к DeepSeek V4 Pro и Flash (7 мая 2026 г.): Новые версии моделей с архитектурой Mixture of Experts (MoE) и контекстным окном до одного миллиона токенов стали доступны для широкого использования.
Эти релизы подчеркивают общую тенденцию индустрии: фокус на повышение надежности, эффективности и снижение стоимости использования передовых ИИ-моделей.
Источники:
- AI Updates Today (May 2026) – Latest AI Model Releases - LLM Stats
- New AI Models May 2026: The Frontier Took a Breath, Architecture Took the Stage
- Best AI Models May 2026: Which One Actually Wins Right Now?
- Last Week in AI - ART19
- Начало мая 2026 года принесло одновременный релиз пяти крупных AI-моделей и нового подхода к памяти агентов - FileEnergyCom
- AI Models in 2026: Which One Should You Actually Use?
- Самые громкие ИИ-релизы февраля и марта 2026 | 7 инструментов за 2 недели
- New Models Today — AI & LLM Releases Last 24 Hours - Price Per Token
- Top 5 AI Models of May 2026 | From Chatbots to Digital Coworkers - Medium
- OpenAI выпустила «самую умную» ИИ-модель GPT-5.5 - Реальное время
- Свежие нейросети 2026 года: обзор того, что только вышло - THE TECH
- AI Model Benchmarks May 2026 | Compare GPT-5, Claude 4.5, Gemini 2.5, Grok 4
- What's New in AI? May 2026 Edition | ai-and-datascience - Oracle Blogs
- Исследования OpenAI | Релизы
- 6 новых ИИ и сервисов с нейросетями для бизнеса
- Новости искусственного интеллекта: главные тренды и обновления
- Последние новости из мира нейросетей и ИИ - Deeplist
- Last Week in AI | Substack
- AI Model Release Tracker | Evertune
ChatGPT
В период с 10 по 16 мая 2026 года в сфере искусственного интеллекта были представлены несколько значимых моделей:
11 мая 2026 года: Компания OpenBMB выпустила MiniCPM-V 4.6 с 1,3 миллиардами параметров, продолжая развитие линейки компактных моделей.
11 мая 2026 года: xAI представила Grok 4.3, новую версию своей модели, улучшенную для более точных и быстрых ответов.
10 мая 2026 года: IBM анонсировала Granite 4.1 с 30 миллиардами параметров, ориентированную на решения задач в области обработки естественного языка.
Источники:
AI Flash Report — Frontier AI Model Tracker, Benchmarks & News
AI/TLDR — New AI Releases Daily: Models, Tools, Repos & Papers
NeuroSignal — Daily AI News & Developments
Grok
5 мая 2026 г. OpenAI запустила GPT-5.5 Instant — новую модель по умолчанию в ChatGPT, которая заметно быстрее обрабатывает сложные запросы и даёт более лаконичные ответы без потери качества.
5 мая 2026 г. Стартап Subquadratic представил SubQ 1M-Preview — первую коммерческую субквадратичную модель с контекстом до 12 млн токенов, которая при этом стоит в пять раз дешевле фронтирных аналогов.
6 мая 2026 г. xAI развернула Grok 4.3 в широкую доступность через API и платформу X, добавив улучшенные возможности рассуждения после апрельской беты.
6–7 мая 2026 г. Zyphra открыла под Apache 2.0 модель ZAYA1-8B — компактную MoE-архитектуру, обученную на чипах AMD и готовую к бесплатному self-hosting’у.
8 мая 2026 г. Google выпустила Gemini 3.1 Flash Lite — облегчённую версию семейства Gemini 3.1, оптимизированную для быстрых и недорогих задач при сохранении высокого качества.
Источники:
Claude
Начну поиск главных новостей о релизах моделей за последнюю неделю.Отлично, у меня достаточно информации для обзора. Вижу конкретные релизы за последнюю неделю мая. Составлю пост с фокусом на архитектурные инновации и смену парадигмы, а не просто на очередной дайджест релизов.
Парадигма встопорщилась: когда миллиарды параметров уступили место миллионам умных нейронов
Май 2026 отличился не рекордами на бенчмарках, а переломом в том, как строят модели. Вот главное:
SubQ — коммерческий прорыв субквадратичной архитектуры (май 2026) — первая коммерческая субквадратная LLM с контекстом в 12 млн токенов запущена в продакшене. Это значит: в 50 раз дороже обычного контекста, но работает за пятую часть стоимости GPT-5.5 на огромных документах. Контекст 12M при пятикратной экономии затрат — первый раз в истории суперподвесистость стала практична для customer-facing приложений.
ZAYA1-8B: 8 млрд параметров с логикой 200-миллиардника (май 2026) — открытый MoE-модель от Zyphra с 8B параметров и 760M активными на токен, обучена на AMD Instinct железе. Это мегафон разработчикам: забудьте о гонке масштаба. Фокус на плотности интеллекта на активный параметр означает: frontier-качество рассуждений без видеокарт за $50k.
GPT-5.5 Instant как новый дефолт (5 мая) — GPT-5.5 Instant стал ChatGPT по умолчанию с 5 мая. Не новая граница умности, а смена ставки: упор на скорость ответов и снижение галлюцинаций в стрессовых доменах (медицина, право, финансы). Сотни миллионов юзеров получили другую модель, чем неделю назад.
Gemini 3.1 Flash Lite в production (8 мая) — Gemini 3.1 Flash Lite запущена 8 мая. Google ставит на том же: дешевле и безопаснее, чем умнее. Оба апдейта (GPT-5.5 Instant и Gemini 3.1 Flash Lite) замещают модели, с которыми ежедневно работают сотни миллионов юзеров; и дефолт-гонка определяет retention, latency, стоимость и доверие.
April потолок держится, но май заинтересовал сдвигом архитектуры — апрельский потолок на Intelligence Index (60.24) держится через май; новых фронтирных релизов нет; интересующие май-движки — архитектурные (SubQ), по эффективности (ZAYA1-8B) и на уровне продукта.
Главное: Рынок переходит от кто выше к кто полезнее. Gallop на бенчмарки закончился. Начало эры cost-per-quality, hallucination-per-domain, latency-per-context.
Источники:
- WhatLLM.org — New AI Models May 2026
- LLM Stats — AI Model Updates (May 2026)
- OpenAI Release Notes — GPT-5.5 Instant rollout (май 2026)
Источники:
- Главные релизы кроссовок недели: инновации и культовые ...
- Хронология релизов нейросетей 2026 - AI-Stat
- OpenAI выпустила новую ИИ-модель GPT‑5 — как всегда - Meduza
- Новости ИИ: тренды, релизы и главные обновления
- Итоги недели моды в Париже осень-зима 2025/2026 - The Blueprint
- полный путеводитель по семейству моделей GPT в 2025 году
- Примечания к выпускам моделей - OpenAI Help Center
- как релиз GPT 5.5 вернул OpenAI лидерство в гонке ИИ - VC.ru
- Модели ChatGPT: какой чат лучше выбрать, сравнение
- llm-stats.com
- fileenergy.com
- oracle.com
- pricepertoken.com
- https://blog.mean.ceo/large-language-model-news-may-2026/
- https://aiflashreport.com/model-releases.html