Kandinsky 3.1: Как пользоваться нейросетью от Sberbank? (Гайд)

За последние пару лет развитие нейросетей продвигалось буквально семимильными шагами, поэтому отставание в этой отрасли от зарубежных разработчиков для российских создателей генеративных моделей попросту непозволительная роскошь. Очень многие сервисы на базе искусственного интеллекта получили масштабные обновления и известная нейросеть от Сбера Kandinsky не стала исключением. Всего за один год платформа для генерации картинок и видео смогла выдержать три глобальных обновления и теперь для общего доступа открыта последняя версия, имеющая нумерацию 3.1. Рассмотрим же подробнее, что было добавлено в последнем обновлении и какие новые преимущества получила нейросеть Кандински.

Содержание:

1. История возникновения Kandinsky
2. Немного о возможностях Kandinsky 3.1
3. Все способы использования нейросети Kandinsky
4. Проверенная методика создания изображений в Кандински
5. Создание анимации и видео в Kandinsky
6. Преимущества и недостатки Кандински 3.1

1. История возникновения Kandinsky

Первый прототип данной нейросети появился в ноябре 2021 года и на тот момент сервис носил совершенно иное название – ruDALL-E XL, что было довольно жирным намеком на связь с одноименной нейросетью. Однако, в результате множества перенесенных сервисом обновлений, было принято решение изменить название платформы на Kandinsky.

Нейросеть долго и старательно обновлялась, обрастая все новым функционалом, пока в апреле 2023 года не вышла версия Kandinsky 2.1, уже наступавшая на пятки общепринятому лидеру по генерации изображений Midjourney. Хотя на тот момент сервису много чего не доставало, Кандински 2.1 смог заявить о себе в положительном ключе, отчего количество пользователей нейросети стало расти в геометрической прогрессии.

Спустя три месяца, в июле того же года, Kandinsky получил новую версию платформы – 2.2, расширившую возможности сервиса генерацией изображений в высоком разрешении, буквально неотличимых от фотографий.

Данное обновление дало еще больший толчок для развития нейросети и нового глобального обновления, получившего номер 3.0, ждать пришлось очень недолго. В предыдущей версии Кандински была добавлена возможность генерировать короткие видео, не длиннее четырех секунд, по текстовому запросу. Тогда же нейросеть поближе познакомилась с фольклорными особенностями России и ее архитектурными стилями, поэтому создание ярких и красочных народных картинок стало своеобразной визитной карточкой Kandinsky 3.0.

В настоящее же время последней и наиболее продвинутой версией данного сервиса является Kandinsky 3.1, функционал которой претерпел большие изменения.

2. Немного о возможностях нейросети - что может Kandinsky 3.1?

В перечень функций последнего обновления нейросети входит:

Создание изображений по текстовому запросу;
Генерирование картинок на базе иного изображения или фотографии с добавлением текстового описания;
Добавление новых объектов на сгенерированную или загруженную картинку;
Создание изображений в восемнадцати разнообразных стилях;
Возможность задавать текстовое описание на русском языке;
Генерация изображений в браузере, ВКонтакте и через Telegram.

Нейросеть Kandinsky 3.1 полностью бесплатна и не имеет никаких платных тарифов. Все созданные при помощи нейросети картинки полностью приватны и не публикуются в общий доступ через сохраненную историю генераций иных пользователей. Также стоит учитывать, что сгенерированные изображения нельзя использовать в коммерческих целях в соответствии с пользовательским соглашением.

3. Как пользоваться нейросетью Kandinsky - все способы

Чтобы воспользоваться нейросетью Кандински есть семь действенных способов, каждый из которых обладает своими преимуществами:

Официальный сайт Kandinsky1. Данный сервис содержит наиболее актуальную версию нейросети и обладает максимально стабильным качеством для работы с изображениями. Все генерации проходят на портале Fusion Brain, принадлежащим научно-исследовательскому институту искусственного интеллекта (институт AIRI). Этот сайт обладает максимальным функционалом Kandinsky 3.1, включающим в себя не только генерацию изображений, но и создание коротких видеороликов. Сервис невероятно прост в освоении и создан полностью на русском языке, хотя есть возможность переключения интерфейса на английский.
Сайт ruDALL-E. В этом сервисе доступен не только Кандински 3.1, но также и более ранние, архивные версии 3.0, 2.2, 2.1, и ушедшие в прошлое обновления самого сайта ruDALL-E Kandinsky, Emojich и Malevich. Не смотря возможность использования архивных версий, данный сайт частенько «падает», что может порой оттолкнуть от его использования для генераций.
Чат-бот ВКонтакте. Данный способ генерации изображений несколько ограничен и по качеству создаваемых картинок и по доступности актуальной версии нейросети, зато он буквально не требует никаких усилий. Чат-бот идеален для визуализации сиюминутных идей или для картинок, подходящих для постов, однако для создания более качественных изображений лучше воспользоваться иными способами генераций.
Чат-бот Telegram для изображений. Еще один способ для быстрой генерации изображений через бота в мессенджере, который, в отличие от версии для ВК, обладает более расширенным функционалом. Telegram-бот поддерживает как актуальную версию нейросети, так и архивные 3.0. 2.2 и 2.1, а также обладает пусть и немного урезанными, но практически идентичными официальному сайту функциями.
Чат-бот Telegram для видео. Данный бот предназначен для генерации только видеороликов, однако в настоящее время сразу же использовать этот чат не получится. Чтобы генерировать видео через бота в Телеграме потребуется запустить чат и отправить заявку на использования этой версии нейросети. Только после ее одобрения можно будет пользоваться функцией создания видео с помощью Кандински.
Приложение «Салют». Данный способ доступен тем, кто обладает умными устройствами, управляемыми этим приложением. Чтобы запустить генерацию изображений через «Салют», воспользуйтесь командой «Включи художника».
Интеграция API на свой сайт или приложение. Для владельцев собственного интернет-ресурса доступен еще один способ использования Kandinsky, а именно – интеграция нейросети в свой продукт. Осуществить данный способ можно через сайт Fusion Brain буквально в пару кликов.

4. Как создавать изображения в Кандински?

В зависимости от выбранного способа генерации порядок действий может отличаться в некоторых деталях, однако в основном конструкция запроса будет одинаковой.

Практически все доступные способы, кроме сайта Fusion Brain и в отчасти чат-бот в Telegram, обладают довольно урезанным набором функций, что позволяет делать быстрые, но не всегда качественные генерации. В то же время официальный сайт нейросети имеет гибкую и обширную систему настроек, позволяющую создавать наиболее приближенный к желаемому результат. Здесь же мы будем рассматривать метод генерации именно для Fusion Brain, поскольку для других способов достаточно ввести стандартный текстовый промт.

Перед началом генерации необходимо выбрать размер и качество разрешения будущего изображения. На выбор предлагается соотношение сторон картинки:

1:1 (1024х1024);
16:9 (1024х576);
9:16 (576х1024);
3:2 (1024х680);
2:3 (680х1024).

Далее нужно ввести в соответствующее поле ваш запрос, максимально отображающий желаемый результат. При составлении промта следует учитывать, что нейросеть не понимает крылатых выражений или иносказательности, поэтому вводите запрос обрывочными, но четкими командами, придерживаясь правила трех характеристик:

Что должно быть изображено с добавлением как можно большего количества деталей (внешнего вида и возраста для людей, породы и цвета шерсти для животных и т.д.);
Где нужно разместить главный объект (описание помещения или объектов на улице, время суток, погода и т.д.);
Как генерировать картинку (стиль, качество и иные уточнения).

Учтите, что нейросеть не всегда с первого раза способна сгенерировать желаемый результат. Зачастую приходится перезапускать генерацию десятки раз в попытках получения нужного изображения.

После создания базовой картинки пора приступать в необходимым исправлениям, поскольку зачастую нейросеть серьезно грешит с деталями. Иногда требуется пара косметических правок, но чаще всего приходится как следует попотеть, добиваясь от нейросети желаемого результата.

Тоже касается и расширения изображения, которую Kandinsky позволяет увеличивать в любую сторону, добавляя все новые детали и объекты на первоначальную картинку. Главное, чтобы область генерации пересекалась с изначальным изображением. Это обязательное условие, чтобы получившаяся генерация была целостной, состоящей из взаимосвязанных друг с другом областей, а иначе может получиться немного корявый результат.

5. Как создавать видео и анимации в Kandinsky?

В сущности генерация анимации, равно как и видео, не сильно отличаются от процесса создания картинок.

Точно также первым шагом потребуется выбрать размер будущей анимации, которая предлагается в следующих разрешениях:

1:1 (640х640);
9:16 (480х854);
16:9 (854х480).

Далее выбираете модель генерации – анимацию или видео, а затем начинаете описывать текстовым промтом желаемую сцену. Каждая сцена занимает 4 секунды времени и требует отдельного описания, однако желательно, чтобы между ними была некая взаимосвязь, чтобы будущая генерация выглядела единой.

Для видеозаписи настроек намного меньше, чем для анимации и предложенные сервисом разрешения несколько ниже, а качество генерации – хуже, поэтому данной функцией нейросети практически не пользуются.

6. Преимущества и недостатки Кандински 3.1

Как и любая другая нейросеть, Kandinsky имеет свои преимущества перед другими сервисами и также не обделен недостатками. Хотя преимуществ у этой платформы несравнимо больше.

К плюсам Кандински можно отнести:

Полностью бесплатное использование нейросети без скрытых транзакций и ограничений по количеству генераций;
Создание качественных картинок на множестве языков, особенно на русском;
Огромная вариативность доступных стилей для создания изображений;
Полная приватность генерируемых картинок;
Доступность для использования не только на официальном сайте, но и через чат-боты в мессенджерах;
Простой и удобный интерфейс полностью на русском языке;
Возможность интегрирования нейросети в иные сайты и приложения.

Из негативных характеристик Kandinsky можно отметить:

Невозможность использования созданных картинок в коммерческих целях;
Низкое качество сгенерированных видео и анимации;
Зачастую непредсказуемые результаты генерации, даже с учетом четких указаний в запросе.

Хотя нейросети Kandinsky 3.1 пока еще далеко до идеала, она все же находится на достаточно высоком уровне среди аналогичных сервисов. Однако тот факт, что разработчики платформы регулярно обновляют ее, каждый раз добавляя новые функции и исправляя по мере возможности недочеты нейросети, в некоторой степени гарантирует, что в скором времени Кандински сможет занять лидирующее место среди сервисов по генерации изображений.