Крупнейший open-source проект в Европе: Сбер выложил линейку передовых российских нейросетевых моделей

Общество

Фото - © Пресс-служба Сбера

Сбер открывает веса двух новый флагманских MoE-моделей в линейке GigaChat — Ultra-Preview и Lightning — созданных с нуля для русскоязычных задач, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи с пунктуацией и нормализацией.

Кроме того, стали доступны все модели генерации изображений и видео новой линейки Kandinsky 5.0 —Video Pro, Video Lite и Image Lite — собственные продвинутые нейросети, нативно понимающие промптына русском языке, знающие русскую культуру и умеющие писать кириллический текст на изображениях и видео, а также модели для сжатия визуальных данных K-VAE 1.0, необходимые для обучения моделей генерации визуального контента и являющиеся лучшими в мире среди открытых аналогов. Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.

«Для создания настоящего ИИ мирового уровня нужны две вещи: колоссальные ресурсы и, что еще важнее, — R&D команды мирового уровня. У Сбера есть и то, и другое. Но наша принципиальная позиция — не строить „закрытую“ технологию. Наша стратегия — стать открытым фундаментом для всей страны. Именно поэтому мы открываем веса наших моделей. Это ключевой момент. Когда мы отдаем модели, любая компания в России, от банка до стартапа, может установить их внутри своего закрытого контура и дообучить на своих чувствительных данных, никому их не показывая. Это и есть настоящий технологический суверенитет, когда ИИ есть у всей страны, и он становится основой для трансформаций бизнеса и стимула роста экономики. Хочу также отметить, что модель Ultra будет скоро доступна и для корпоративных клиентов, оптимизированная по стоимости владения для размещения в периметре компании», — отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.