← На главную

Блог

Статьи об ИИ-поиске, верификации и обновлениях платформы

Дайджест ИИ за неделю

Perplexity

  1. 18 марта 2026 — OpenAI запустила GPT-5.4 mini в ChatGPT, сделав упор на более быструю и экономичную малую модель для пользователей Free и Go. Это важно как один из ключевых релизов сезона: OpenAI продолжает обновлять линейку, смещая акцент не только на «флагманы», но и на массовые прикладные версии.

  2. Апрель 2026 — В хронологии AI-Stat зафиксирован сразу ряд заметных релизов: Claude Opus 4.7, Gemma 4 26B-A4B, Gemma 4 31B, а также несколько новых вариантов DeepSeek-V4. Неделя показывает, что крупные игроки ускоряют выпуск моделей в разных размерах — от более мощных до оптимизированных под скорость и стоимость.

  3. Март 2026 — Среди релизов месяца выделяются Gemini 3.1 Flash-Lite, Mistral Small 4, Qwen3.5 и Grok 4.20: рынок продолжает двигаться в сторону компактных и практичных моделей для повседневного использования. Особенно заметен тренд на «лайт»-версии, которые закрывают задачи быстрее и дешевле, не теряя в качестве для массовых сценариев.

  4. Декабрь 2025 — В числе важных запусков были Gemini 3 Flash, Mistral Large 3 и Nova Pro / Nova Lite / Nova Micro от Amazon. Это был сильный месяц для экосистемных релизов: сразу несколько компаний показали не одну модель, а целые линейки под разные бюджеты и нагрузки.

  5. Август 2024 — В хронологии также отмечены Command R+, Phi-3.5 и Jamba 1.5 как этап, когда рынок активно расширялся за счет новых компактных и мультимодальных моделей. Эти релизы хорошо иллюстрируют, как быстро отрасль ушла от единичных «супермоделей» к разнообразию специализированных решений.

Источники:

Gemini

Главные релизы моделей ИИ за последнюю неделю: фокус на практичность и эффективность

Последняя неделя мая 2026 года ознаменовалась выходом нескольких значимых обновлений в сфере ИИ, демонстрирующих смещение акцентов от сырой мощности к практической применимости и оптимизации.

  1. OpenAI представляет GPT-5.5 Instant (5 мая 2026 г.): Новая версия стала дефолтной моделью для ChatGPT, обещая двукратное сокращение галлюцинаций в критически важных областях, таких как медицина и финансы. Модель также демонстрирует улучшенные результаты на математических и мультимодальных тестах, при этом потребляя меньше ресурсов.
  2. xAI выпускает Grok 4.3 (5 мая 2026 г.): Модель доступна на Oracle Cloud Infrastructure (OCI) Enterprise AI, предлагая улучшенные возможности в области логики, математики и анализа. Grok 4.3 отличается высокой производительностью при значительно более низкой стоимости по сравнению с конкурентами и имеет контекстное окно в один миллион токенов.
  3. Moonshot AI представляет Kimi K2.6 (6 мая 2026 г.): Эта модель, обладающая оптимизированной архитектурой внимания, была выпущена с контекстным окном в 256 тысяч токенов.
  4. DeepSeek открывает доступ к DeepSeek V4 Pro и Flash (7 мая 2026 г.): Новые версии моделей с архитектурой Mixture of Experts (MoE) и контекстным окном до одного миллиона токенов стали доступны для широкого использования.

Эти релизы подчеркивают общую тенденцию индустрии: фокус на повышение надежности, эффективности и снижение стоимости использования передовых ИИ-моделей.

Источники:

  • AI Updates Today (May 2026) – Latest AI Model Releases - LLM Stats
  • New AI Models May 2026: The Frontier Took a Breath, Architecture Took the Stage
  • Best AI Models May 2026: Which One Actually Wins Right Now?
  • Last Week in AI - ART19
  • Начало мая 2026 года принесло одновременный релиз пяти крупных AI-моделей и нового подхода к памяти агентов - FileEnergyCom
  • AI Models in 2026: Which One Should You Actually Use?
  • Самые громкие ИИ-релизы февраля и марта 2026 | 7 инструментов за 2 недели
  • New Models Today — AI & LLM Releases Last 24 Hours - Price Per Token
  • Top 5 AI Models of May 2026 | From Chatbots to Digital Coworkers - Medium
  • OpenAI выпустила «самую умную» ИИ-модель GPT-5.5 - Реальное время
  • Свежие нейросети 2026 года: обзор того, что только вышло - THE TECH
  • AI Model Benchmarks May 2026 | Compare GPT-5, Claude 4.5, Gemini 2.5, Grok 4
  • What's New in AI? May 2026 Edition | ai-and-datascience - Oracle Blogs
  • Исследования OpenAI | Релизы
  • 6 новых ИИ и сервисов с нейросетями для бизнеса
  • Новости искусственного интеллекта: главные тренды и обновления
  • Последние новости из мира нейросетей и ИИ - Deeplist
  • Last Week in AI | Substack
  • AI Model Release Tracker | Evertune

ChatGPT

В период с 10 по 16 мая 2026 года в сфере искусственного интеллекта были представлены несколько значимых моделей:

  1. 11 мая 2026 года: Компания OpenBMB выпустила MiniCPM-V 4.6 с 1,3 миллиардами параметров, продолжая развитие линейки компактных моделей.

  2. 11 мая 2026 года: xAI представила Grok 4.3, новую версию своей модели, улучшенную для более точных и быстрых ответов.

  3. 10 мая 2026 года: IBM анонсировала Granite 4.1 с 30 миллиардами параметров, ориентированную на решения задач в области обработки естественного языка.

Источники:

  • AI Flash Report — Frontier AI Model Tracker, Benchmarks & News

  • AI/TLDR — New AI Releases Daily: Models, Tools, Repos & Papers

  • NeuroSignal — Daily AI News & Developments

Grok

  1. 5 мая 2026 г. OpenAI запустила GPT-5.5 Instant — новую модель по умолчанию в ChatGPT, которая заметно быстрее обрабатывает сложные запросы и даёт более лаконичные ответы без потери качества.

  2. 5 мая 2026 г. Стартап Subquadratic представил SubQ 1M-Preview — первую коммерческую субквадратичную модель с контекстом до 12 млн токенов, которая при этом стоит в пять раз дешевле фронтирных аналогов.

  3. 6 мая 2026 г. xAI развернула Grok 4.3 в широкую доступность через API и платформу X, добавив улучшенные возможности рассуждения после апрельской беты.

  4. 6–7 мая 2026 г. Zyphra открыла под Apache 2.0 модель ZAYA1-8B — компактную MoE-архитектуру, обученную на чипах AMD и готовую к бесплатному self-hosting’у.

  5. 8 мая 2026 г. Google выпустила Gemini 3.1 Flash Lite — облегчённую версию семейства Gemini 3.1, оптимизированную для быстрых и недорогих задач при сохранении высокого качества.

Источники:

Claude

Начну поиск главных новостей о релизах моделей за последнюю неделю.Отлично, у меня достаточно информации для обзора. Вижу конкретные релизы за последнюю неделю мая. Составлю пост с фокусом на архитектурные инновации и смену парадигмы, а не просто на очередной дайджест релизов.


Парадигма встопорщилась: когда миллиарды параметров уступили место миллионам умных нейронов

Май 2026 отличился не рекордами на бенчмарках, а переломом в том, как строят модели. Вот главное:

  1. SubQ — коммерческий прорыв субквадратичной архитектуры (май 2026) — первая коммерческая субквадратная LLM с контекстом в 12 млн токенов запущена в продакшене. Это значит: в 50 раз дороже обычного контекста, но работает за пятую часть стоимости GPT-5.5 на огромных документах. Контекст 12M при пятикратной экономии затрат — первый раз в истории суперподвесистость стала практична для customer-facing приложений.

  2. ZAYA1-8B: 8 млрд параметров с логикой 200-миллиардника (май 2026) — открытый MoE-модель от Zyphra с 8B параметров и 760M активными на токен, обучена на AMD Instinct железе. Это мегафон разработчикам: забудьте о гонке масштаба. Фокус на плотности интеллекта на активный параметр означает: frontier-качество рассуждений без видеокарт за $50k.

  3. GPT-5.5 Instant как новый дефолт (5 мая) — GPT-5.5 Instant стал ChatGPT по умолчанию с 5 мая. Не новая граница умности, а смена ставки: упор на скорость ответов и снижение галлюцинаций в стрессовых доменах (медицина, право, финансы). Сотни миллионов юзеров получили другую модель, чем неделю назад.

  4. Gemini 3.1 Flash Lite в production (8 мая) — Gemini 3.1 Flash Lite запущена 8 мая. Google ставит на том же: дешевле и безопаснее, чем умнее. Оба апдейта (GPT-5.5 Instant и Gemini 3.1 Flash Lite) замещают модели, с которыми ежедневно работают сотни миллионов юзеров; и дефолт-гонка определяет retention, latency, стоимость и доверие.

  5. April потолок держится, но май заинтересовал сдвигом архитектуры — апрельский потолок на Intelligence Index (60.24) держится через май; новых фронтирных релизов нет; интересующие май-движки — архитектурные (SubQ), по эффективности (ZAYA1-8B) и на уровне продукта.

Главное: Рынок переходит от кто выше к кто полезнее. Gallop на бенчмарки закончился. Начало эры cost-per-quality, hallucination-per-domain, latency-per-context.

Источники:

  • WhatLLM.org — New AI Models May 2026
  • LLM Stats — AI Model Updates (May 2026)
  • OpenAI Release Notes — GPT-5.5 Instant rollout (май 2026)

Источники: