Новости ИИ: главное за день

4 мая 2026 г. · 5 мин.

Perplexity

DeepSeek выпустила новую модель с оптимизацией для длинных диалогов (2 мая 2026)

Китайская компания DeepSeek представила обновленную версию своей языковой модели, которая решает критическую проблему современных LLM — резкий рост вычислительных затрат при обработке длинных диалогов[6]. Новая модель демонстрирует результаты, сопоставимые с предыдущей версией DeepSeek-V3.1-Terminus, но при этом сохраняет высокую точность и способность эффективно работать с длинными последовательностями текста[6].

Особенно значимо, что DeepSeek открыла исходные компоненты под лицензией MIT и предоставила открытые веса модели[6]. Это позволяет другим исследователям проверять решения и развивать их дальше — подход, который контрастирует с закрытыми моделями лидеров рынка. Релиз подтверждает тренд, выявленный экспертами: монополии на прогресс в ИИ больше нет, и инновации приходят не только от крупных западных лабораторий[4].

Источники:

SecurityLab: Обогнали ChatGPT, стоили копейки и снова удивили. DeepSeek
Habr: Гонка ИИ-моделей в 2026: реальный прогресс, маркетинговый

Gemini

В середине апреля 2026 года Anthropic представила Claude Opus 4.7, новую флагманскую модель, которая продемонстрировала лидирующие результаты на большинстве агентских и кодинговых бенчмарков среди публично доступных решений. Модель обладает контекстным окном в 1 миллион токенов на входе и до 128 тысяч на выходе, а также улучшенными возможностями рассуждений и увеличенным разрешением зрения до 3,75 МП. Claude Opus 4.7 показала лучшие результаты на SWE-bench Verified (87,6%) и GPQA Diamond (94,2%), а также заняла лидирующие позиции в бенчмарках Terminal-Bench 2.0 (69,4%) и OSWorld (78,0%).

Другим значимым событием стало появление GPT-5.5 от OpenAI, анонсированного 22 апреля 2026 года. Эта модель является полностью омнимодальной, способной обрабатывать текст, изображения, аудио и видео в рамках единой архитектуры. GPT-5.5 лидирует на Artificial Analysis Intelligence Index с результатом 60, превосходя Claude Opus 4.7 (57). Модель предлагает контекстное окно до 1 миллиона токенов и представлена в трех вариантах: GPT-5.5, GPT-5.5 Thinking и GPT-5.5 Pro.

Также стоит отметить релиз DeepSeek V4 27 апреля 2026 года, который включает модель V4-Pro с 1,6 триллиона параметров и контекстным окном в 1 миллион токенов. Эта модель оптимизирована для работы на чипах Huawei Ascend и позиционируется как конкурент закрытым моделям, превосходящий открытые аналоги в задачах агентного программирования и рассуждений.

Источники:

Claude Opus 4.7, GPT-5.5, DeepSeek V4: главные LLM-релизы апреля 2026 года
LLM Leaderboard 2026 — Compare Top AI Models
Рейтинг ИИ | Сравнение языковых моделей и нейросетей | Лучшие ИИ 2026

ChatGPT

16 апреля 2026 года компания Anthropic представила обновлённую языковую модель Claude Opus 4.7. Эта модель достигла 64,3% на бенчмарке SWE-Bench Pro, что делает её лидером среди публичных моделей. Кроме того, она показала высокие результаты на других бенчмарках, включая Terminal-Bench 2.0 (69,4%) и GPQA Diamond (94,2%). Claude Opus 4.7 поддерживает контекст до 1 миллиона токенов на входе и до 128 тысяч на выходе, а также улучшенное разрешение зрения до 2576 пикселей. Модель доступна по цене $5 за миллион токенов, с дополнительными тарифами для контекста свыше 200 тысяч токенов.

Источники:

Grok

Китайская компания DeepSeek 24 апреля 2026 года выпустила превью-версию долгожданной крупной языковой модели V4 — полностью открытой, с версиями "pro" и "flash". Модель оптимизирована для агентных задач, обработки знаний и инференса, показывает отличные результаты в соответствующих бенчмарках против конкурентов, при этом с заметно меньшими затратами на вычисления. Она совместима с локальными чипами Huawei Ascend, что усиливает позиции Китая в гонке ИИ на фоне ограничений на Nvidia.

Это не просто апгрейд: V4 снижает зависимость от импортного железа, позволяет разработчикам свободно модифицировать код и запускается локально, подогревая конкуренцию в open-source сегменте.

Источники:

CNBC: China's DeepSeek releases preview of long-awaited V4 model
LLM Stats: AI Trends (May 2026)

Claude

Интересную находку нашёл — стоит углубиться в тему 1-битных моделей, это действительно крупный прорыв в апреле 2026. Позволит мне уточнить детали.Отлично, теперь у меня есть достаточно информации. Это действительно значимый прорыв, совсем другой угол, чем политические новости и бенчмарки.

31 марта 2026. Архитектурный прорыв: 1-битные языковые модели

PrismML, основанная исследователями из Caltech, вышла из скрытого режима с раундом финансирования в

Блог