Modelos de IA por valor de quinientos millones de rublos: "Avito" lanza A-Vibe y A-Vision de código abierto

El código fuente de los modelos generativos A-Vibe y A-Vision (8 mil millones de parámetros) para comercio electrónico está disponible en Hugging Face con documentación y ejemplos de uso.

Generado por la red neuronal Midjourney
Generado por la red neuronal Midjourney

Según informó el servicio de prensa, estos son los primeros modelos de código abierto rusos entrenados con datos de comercio electrónico y adaptados al idioma ruso. La empresa invirtió alrededor de quinientos millones de rublos en su desarrollo.

Los modelos están construidos sobre la base de Qwen 3 y Qwen 2.5-VL, incluyen su propio tokenizador para el idioma ruso (duplica la velocidad de generación de texto) y admiten function calling: la capacidad de conectar herramientas externas para crear agentes de IA. Para evaluar los modelos en ruso, el equipo de Avito adaptó cuatro benchmarks internacionales (MATH-500, GPQA Diamond, DROP_RU y BFCL V3) y los puso a disposición del público. En "Avito" señalaron:

En las pruebas MERA y RU Arena Hard, el modelo A-Vibe mostró los mejores resultados en su clase, superando a redes neuronales más grandes como GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku y otras.

Ahora en la página principal