Alexander Vedyakhin, primer vicepresidente del Consejo de Administración de Sberbank:
«Hoy se cumple exactamente un año del lanzamiento de la versión Kandinsky 2.1. Durante este tiempo, hemos desarrollado constantemente nuestra red neuronal, que ayuda a las personas a crear nuevas imágenes y ofrece a todos oportunidades fenomenales para la creatividad. En comparación con el modelo anterior, Kandinsky 3.1 es aún más rápido, cómodo y realista. Kandinsky 3.1 es una herramienta flexible, multifuncional y absolutamente gratuita que convertirá a cualquier persona en artista y creador. Pronto todos podrán probar las nuevas capacidades de la red neuronal. Al igual que las versiones anteriores, el modelo será gratuito y estará disponible en diferentes plataformas».
Una de las características clave de la versión es la mayor velocidad de generación de imágenes: el tiempo de una generación se ha reducido casi 10 veces y la resolución de las generaciones se puede aumentar hasta 4K. También existe la posibilidad de mejorar la consulta de texto mediante un modelo lingüístico. Los usuarios volverán a tener disponibles las funciones de creación de diversas variaciones de imágenes, la mezcla de imágenes y texto, la creación de paquetes de stickers y la posibilidad de realizar cambios locales en la imagen sin cambiar toda la composición de la escena (ControlNet).
Puede encontrar detalles técnicos sobre el modelo, los enfoques de aprendizaje y ver ejemplos de generaciones en el artículo en «Habr».
Además, en breve aparecerá un nuevo modelo Kandinsky Video 1.1 para la generación de vídeo a partir de descripciones de texto. Nuestro equipo ha logrado mejorar significativamente la calidad de las generaciones aumentando el volumen del conjunto de datos de entrenamiento de pares «texto-vídeo» y las mejoras arquitectónicas del modelo. Los cambios realizados también han permitido duplicar la resolución de vídeo en comparación con Kandinsky Video 1.0.
El modelo ha sido desarrollado por el equipo de Sber AI con el apoyo de los científicos del Instituto de Inteligencia Artificial AIRI en los conjuntos de datos combinados de Sber AI y la empresa SberDevices.