Представлена новая нейросетевая модель на русском языке GigaChat 2.0

Общество

Фото - © Медиасток.рф

Сбер представляет GigaChat 2.0 — новую нейросетевую модель на русском языке. По данным бенчмарка MERA для русского языка, модель Сбера GigaChat 2 MAX занимает первое место среди AI-моделей, а в международных бенчмарках обновленный модельный ряд превосходит по многим показателям GPT4o, DeepSeek-V3, LLaMA 70B и Qwen2.5.

Модельный ряд GigaChat 2.0 претерпел значительные улучшения, что позволяет бизнес-клиентам эффективнее справляться с текущими задачами и реализовывать крупные проекты.

Версия GigaChat 2 MAX стала еще более мощной и демонстрирует превосходство над многими зарубежными аналогами в задачах, связанных с русским языком. Модель GigaChat 2 Pro сохраняет качество, сопоставимое с предыдущей версией MAX, и успешно справляется с задачами, требующими креативности и точности, при этом потребляя меньше ресурсов. Базовая модель GigaChat 2 Lite, предназначенная для решения простых задач, теперь по качеству сравнима с предыдущей версией Pro, что позволяет быстрее и экономичнее решать более сложные задачи.

Пользователи сохраняют доступ к моделям первого поколения и могут протестировать GigaChat 2.0 перед переходом на новую линейку. Для выбора подходящей версии и настройки промптов не требуется глубоких знаний в программировании. Все модели доступны для бизнеса через облачное API или могут быть развернуты локально в инфраструктуре компании (on-premise).

«GigaChat 2.0 — не просто рост метрик и технических характеристик, а значительный шаг в развитии русскоязычных больших языковых моделей (LLM). Мы создали модель на уровне лучших мировых решений, а в задачах на русском языке модель превосходит большинство из них. Сильные отечественные нейросети стратегически важны для любого бизнеса, который ведет свою деятельность в России. 15 тысяч внешних клиентов уже используют GigaChat, и мощное обновление нашей линейки позволит еще большему числу клиентов эффективнее решать огромный спектр задач. Совершенствуя процессы с помощью искусственного интеллекта, компании получат уникальную возможность опередить конкурентов, увеличить прибыль и повысить лояльность потребителей», — отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.

На базе GigaChat 2.0 компании могут создавать более эффективных автономных помощников (AI-агенты), способных рассуждать и самостоятельно решать сложные задачи. Это стало возможным благодаря расширению знаний моделей в математике, естественных и гуманитарных науках, а также улучшению их навыков программирования и написания кода. Для разработки агентов на Python и JS можно использовать популярный SDK LangChain, который полностью совместим с GigaChat. Пакеты совместимости доступны в публичном репозитории GigaChain.

Модели нового поколения способны обрабатывать в четыре раза больше контекста, что позволяет им дольше удерживать нить беседы, отвечать на сложные вопросы и анализировать большие объемы текста. Если раньше максимальный объем запроса составлял около 48 страниц текста формата A4 (шрифт 14 pt), то теперь этот показатель увеличился до почти 200 страниц. Это делает GigaChat 2.0 более удобным для создания чат-ботов.

Новые модели в два раза точнее следуют инструкциям пользователя и на 25% лучше отвечают на вопросы, соблюдая заданные форматы и условия. Это помогает эффективнее решать рабочие задачи, такие как подготовка правовой документации, анализ обращений клиентов и другие.

Согласно независимому бенчмарку MERA для русского языка, GigaChat 2 MAX занимает первое место среди AI-моделей. По результатам бенчмарков MMLU на русском и английском языках, новая линейка не уступает, а в некоторых случаях превосходит мировых лидеров. Флагманская модель GigaChat 2 MAX демонстрирует лучшие результаты в ответах на фактологические вопросы на русском языке и в следовании заданным форматам по сравнению с такими моделями, как DeepSeek-V3, Qwen2.5 (версия Qwen-2.5-75b), GPT4o и LLaMA 70B. Кроме того, она превосходит зарубежные аналоги в тестах на оценку кодовых способностей HumanEval и демонстрирует более глубокие знания в точных науках.