Perplexity
DeepSeek выпустила новую модель с оптимизацией для длинных диалогов (2 мая 2026)
Китайская компания DeepSeek представила обновленную версию своей языковой модели, которая решает критическую проблему современных LLM — резкий рост вычислительных затрат при обработке длинных диалогов[6]. Новая модель демонстрирует результаты, сопоставимые с предыдущей версией DeepSeek-V3.1-Terminus, но при этом сохраняет высокую точность и способность эффективно работать с длинными последовательностями текста[6].
Особенно значимо, что DeepSeek открыла исходные компоненты под лицензией MIT и предоставила открытые веса модели[6]. Это позволяет другим исследователям проверять решения и развивать их дальше — подход, который контрастирует с закрытыми моделями лидеров рынка. Релиз подтверждает тренд, выявленный экспертами: монополии на прогресс в ИИ больше нет, и инновации приходят не только от крупных западных лабораторий[4].
Источники:
- SecurityLab: Обогнали ChatGPT, стоили копейки и снова удивили. DeepSeek
- Habr: Гонка ИИ-моделей в 2026: реальный прогресс, маркетинговый
Gemini
В середине апреля 2026 года Anthropic представила Claude Opus 4.7, новую флагманскую модель, которая продемонстрировала лидирующие результаты на большинстве агентских и кодинговых бенчмарков среди публично доступных решений. Модель обладает контекстным окном в 1 миллион токенов на входе и до 128 тысяч на выходе, а также улучшенными возможностями рассуждений и увеличенным разрешением зрения до 3,75 МП. Claude Opus 4.7 показала лучшие результаты на SWE-bench Verified (87,6%) и GPQA Diamond (94,2%), а также заняла лидирующие позиции в бенчмарках Terminal-Bench 2.0 (69,4%) и OSWorld (78,0%).
Другим значимым событием стало появление GPT-5.5 от OpenAI, анонсированного 22 апреля 2026 года. Эта модель является полностью омнимодальной, способной обрабатывать текст, изображения, аудио и видео в рамках единой архитектуры. GPT-5.5 лидирует на Artificial Analysis Intelligence Index с результатом 60, превосходя Claude Opus 4.7 (57). Модель предлагает контекстное окно до 1 миллиона токенов и представлена в трех вариантах: GPT-5.5, GPT-5.5 Thinking и GPT-5.5 Pro.
Также стоит отметить релиз DeepSeek V4 27 апреля 2026 года, который включает модель V4-Pro с 1,6 триллиона параметров и контекстным окном в 1 миллион токенов. Эта модель оптимизирована для работы на чипах Huawei Ascend и позиционируется как конкурент закрытым моделям, превосходящий открытые аналоги в задачах агентного программирования и рассуждений.
Источники:
- Claude Opus 4.7, GPT-5.5, DeepSeek V4: главные LLM-релизы апреля 2026 года
- LLM Leaderboard 2026 — Compare Top AI Models
- Рейтинг ИИ | Сравнение языковых моделей и нейросетей | Лучшие ИИ 2026
ChatGPT
16 апреля 2026 года компания Anthropic представила обновлённую языковую модель Claude Opus 4.7. Эта модель достигла 64,3% на бенчмарке SWE-Bench Pro, что делает её лидером среди публичных моделей. Кроме того, она показала высокие результаты на других бенчмарках, включая Terminal-Bench 2.0 (69,4%) и GPQA Diamond (94,2%). Claude Opus 4.7 поддерживает контекст до 1 миллиона токенов на входе и до 128 тысяч на выходе, а также улучшенное разрешение зрения до 2576 пикселей. Модель доступна по цене $5 за миллион токенов, с дополнительными тарифами для контекста свыше 200 тысяч токенов.
Источники:
- New AI Models Released in 2026: Full Ranked List
- 9 главных LLM 2026 года: какую модель брать под какую задачу — AI на vc.ru
Grok
Китайская компания DeepSeek 24 апреля 2026 года выпустила превью-версию долгожданной крупной языковой модели V4 — полностью открытой, с версиями "pro" и "flash". Модель оптимизирована для агентных задач, обработки знаний и инференса, показывает отличные результаты в соответствующих бенчмарках против конкурентов, при этом с заметно меньшими затратами на вычисления. Она совместима с локальными чипами Huawei Ascend, что усиливает позиции Китая в гонке ИИ на фоне ограничений на Nvidia.
Это не просто апгрейд: V4 снижает зависимость от импортного железа, позволяет разработчикам свободно модифицировать код и запускается локально, подогревая конкуренцию в open-source сегменте.
Источники:
- CNBC: China's DeepSeek releases preview of long-awaited V4 model
- LLM Stats: AI Trends (May 2026)
Claude
Интересную находку нашёл — стоит углубиться в тему 1-битных моделей, это действительно крупный прорыв в апреле 2026. Позволит мне уточнить детали.Отлично, теперь у меня есть достаточно информации. Это действительно значимый прорыв, совсем другой угол, чем политические новости и бенчмарки.
31 марта 2026. Архитектурный прорыв: 1-битные языковые модели
PrismML, основанная исследователями из Caltech, вышла из скрытого режима с раундом финансирования в 6,25 млн и открытым релизом семейства 1-битных языковых моделей. Модель Bonsai 8B отличается компактностью и скоростью, с модестными требованиями к электроэнергии и характеристиками производительности на бенчмарках, которые соперничают с гораздо более крупными моделями.
Суть инновации в радикальном переходе от архитектуры: вместо 16–32-битных чисел с плавающей запятой каждый вес модели сводится только к его знаку — положительный или отрицательный (+1 или -1), с единым масштабирующим коэффициентом для каждой группы весов. Результат — модель в 14 раз меньше своего полнодиапазонного эквивалента, работающая в 8 раз быстрее на периферийном оборудовании и потребляющая в 5 раз меньше энергии.
Это меняет парадигму: мощные генеративные ИИ-модели смогут работать нативно на потребительском оборудовании — ноутбуках, планшетах, смартфонах — с потреблением энергии в несколько раз меньше, чем требовалось традиционно. На фоне озабоченности энергопотреблением больших моделей и облачными зависимостями это один из центральных вызовов 2026-го.
Источники:
- The Register
- HPCwire
- AI Productivity
Источники:
- Анализ 800 языковых моделей показал: успех ИИ ... - IXBT.com
- Что нужно знать про языковые LLM модели в 2026 году в связке ...
- Ученые НИУ ВШЭ научились сжимать большие языковые ...
- Гонка ИИ-моделей в 2026: реальный прогресс, маркетинговый ...
- Прогноз 15 научных трендов и открытий на 2026 год
- Обогнали ChatGPT, стоили копейки и снова удивили. DeepSeek ...
- LLM следующего поколения: точечные усовершенствования или ...
- Эра Physical AI и квантовый рассвет - Типичная Москва
- О чем молчит Искусственный интеллект? - Ведомости
- От языковых моделей к моделям мира - secuteck.ru
- From 'AI slop' to world models, bubbles and small models: What to expect from AI in 2026 | Euronews
- LLM (Большие языковые модели)
- Рейтинг ИИ | Сравнение языковых моделей и нейросетей | Лучшие ИИ 2026
- Будущее искусственного интеллекта: 5 прорывов, определяющих апрель 2026 года - Switas Consultancy
- Итоги 2025 в AI: прорывы, которые сдвинули индустрию, и ставки на 2026 / Хабр