Новый AI-редактор позволяет редактировать изображения по текстовым запросам

Общество

Новая версия Kandinsky позволит создавать еще более качественные изображения, а функциональный AI-редактор в GigaChat — доводить любую картинку до совершенства. Об этом сообщила пресс-служба Сбера.

Сбер представляет новую модель генерации изображений по тексту Kandinsky 4.1 Image — теперь она создает еще более качественные и детализированные изображения, при этом лучше следует текстовым инструкциям пользователей.

Для нейрохудожников появился AI-редактор MALVINA (Multimodal Artificial Language VIsion Neural Assistant), который позволяет редактировать изображение, следуя текстовым инструкциям. Удалить лишние объекты или текст с картинки, сменить цвет волос или возраст человека на изображении, отреставрировать и раскрасить старое фото, заменить фон, сменить лето на зиму — MALVINA поможет воплотить любую креативную идею нейрохудожника, открывая новые горизонты сотворчества человека и генеративного AI.

Причем в отличие от других моделей, предназначенных для редактирования фото, MALVINA старается сохранять геометрию исходного изображения: изменения затрагивают только релевантные части картинки. Таким образом, даже при внесении серьезных изменений в сцену будут сохранены черты лица людей или вид объектов, не затрагиваемых в процессе редактирования.

Запуск новых моделей значительно расширяет возможности генеративной системы GigaChat от Сбера в области создания и редактирования визуального контента.

«Новый редактор изображений в GigaChat — это простой и удобный интеллектуальный помощник в реализации любых креативных задумок. Он работает с пиксельной точностью, сохраняя максимум исходных деталей, но при этом позволяет легко менять фон, объекты и даже стиль фото. Теперь пользователям можно не тратить часы в графических редакторах — достаточно освоить нескольких текстовых команд. Мы специально обучали обновленную модель Kandinsky на разнообразных и при этом детально выверенных и размеченных данных, чтобы нейросеть могла работать с различными сценами: от портретов до пейзажей. Интеграция с GigaChat превращает нашу языковую модель в универсальный инструмент для творчества и работы, который может освоить любой желающий», — отметил тарший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.

Протестировать обновленные нейросети Сбера можно в телеграм-ботах GigaChat и  Kandinsky, а также в  VK-боте Kandinsky.