Новый AI-редактор позволяет редактировать изображения по текстовым запросам
:focal(0.45:0.67):format(webp)/YXJ0aWNsZXMvaW1hZ2UvMjAyNS82LzliYWEwZDU0LTNlNDEtNDQ3Mi04MjM3LTQ4NjBjMmZiZGI4Ni5qcGVn.webp)
Новая версия Kandinsky позволит создавать еще более качественные изображения, а функциональный AI-редактор в GigaChat — доводить любую картинку до совершенства. Об этом сообщила пресс-служба Сбера.
Сбер представляет новую модель генерации изображений по тексту Kandinsky 4.1 Image — теперь она создает еще более качественные и детализированные изображения, при этом лучше следует текстовым инструкциям пользователей.
Для нейрохудожников появился AI-редактор MALVINA (Multimodal Artificial Language VIsion Neural Assistant), который позволяет редактировать изображение, следуя текстовым инструкциям. Удалить лишние объекты или текст с картинки, сменить цвет волос или возраст человека на изображении, отреставрировать и раскрасить старое фото, заменить фон, сменить лето на зиму — MALVINA поможет воплотить любую креативную идею нейрохудожника, открывая новые горизонты сотворчества человека и генеративного AI.
Причем в отличие от других моделей, предназначенных для редактирования фото, MALVINA старается сохранять геометрию исходного изображения: изменения затрагивают только релевантные части картинки. Таким образом, даже при внесении серьезных изменений в сцену будут сохранены черты лица людей или вид объектов, не затрагиваемых в процессе редактирования.
Запуск новых моделей значительно расширяет возможности генеративной системы GigaChat от Сбера в области создания и редактирования визуального контента.
«Новый редактор изображений в GigaChat — это простой и удобный интеллектуальный помощник в реализации любых креативных задумок. Он работает с пиксельной точностью, сохраняя максимум исходных деталей, но при этом позволяет легко менять фон, объекты и даже стиль фото. Теперь пользователям можно не тратить часы в графических редакторах — достаточно освоить нескольких текстовых команд. Мы специально обучали обновленную модель Kandinsky на разнообразных и при этом детально выверенных и размеченных данных, чтобы нейросеть могла работать с различными сценами: от портретов до пейзажей. Интеграция с GigaChat превращает нашу языковую модель в универсальный инструмент для творчества и работы, который может освоить любой желающий», — отметил тарший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.
Протестировать обновленные нейросети Сбера можно в телеграм-ботах GigaChat и Kandinsky, а также в VK-боте Kandinsky.