“Сбер” продолжает разрабатывать и совершенствовать свои инновационные технологии в области искусственного интеллекта. Недавно компания выпустила обновленную версию своей нейросети под названием Kandinsky 2.2, способной генерировать изображения на основе текстовых запросов. Согласно заявлениям внутри компании, новая версия Kandinsky лучше предыдущих моделей справляется с созданием портретов и способна генерировать стикеры.
Первая версия нейросети Kandinsky была представлена в июне 2022 года, после чего последовали обновления: Kandinsky 2.0 в ноябре того же года и Kandinsky 2.1 в апреле 2023 года. Новую версию можно протестировать бесплатно на сайте “Сбера”, а также на платформах Fusion Brain и ML Space, через ботов в Telegram и во “ВКонтакте”. Кроме того, пользователи могут воспользоваться функцией “Запусти художника” на умных устройствах Sber и в приложении “Салют”.
Основное усовершенствование Kandinsky 2.2 заключается в том, что разработчики дообучили нейросеть на более крупном наборе данных. Теперь модель обучена на 1,5 миллиарда пар “текст-изображение”, что на 300 миллионов больше, чем в предыдущей версии. Благодаря этому Kandinsky 2.2 способна создавать более реалистичные изображения с высоким разрешением, а также более точно обрабатывать портреты и изменять соотношение сторон на изображении.
В новой версии модели также представлен уникальный элемент – ControlNet, который является структурным блоком управляемых изменений. Эта архитектура позволяет пользователю изменять отдельные элементы на уже сгенерированных изображениях, сохраняя при этом исходную композицию. Это открывает новые возможности для пользователей в области редактирования и творчества.
Кроме того, в Kandinsky 2.2 была добавлена функция генерации стикеров. Пользователи могут создавать собственные коллекции стикеров для использования в мессенджере Telegram. Теперь Kandinsky стала еще более универсальным инструментом для творчества и коммуникации.
Нейросеть Kandinsky понимает запросы на 101 языке, включая русский и английский, и способна рисовать в более чем 20 стилях, смешивать несколько рисунков и дорисовывать недостающие части изображения. Ее обучение проводили сотрудники Sber AI и ученые из Института искусственного интеллекта AIRI на дата-сетах Sber AI и SberDevices.
Внедрение обновленной нейросети Kandinsky 2.2 от “Сбера” позволяет пользователям создавать качественные изображения и стикеры с помощью текстовых запросов. Это является важным шагом в развитии искусственного интеллекта в России и открывает новые возможности для творческой деятельности и взаимодействия с помощью цифровых технологий.