En Rusia han desarrollado un método para adaptar rápidamente los chatbots a nuevos escenarios

El trabajo fue incluido en el programa EACL 2026, una de las conferencias internacionales más grandes en el campo del procesamiento de textos (NLP), que se celebra en Rabat (Marruecos) del 24 al 29 de marzo de 2026.

Científicos rusos de MWS AI, la Universidad ITMO e IITU han desarrollado un método que aumenta la precisión del seguimiento del estado del diálogo en chatbots y asistentes de voz. El nuevo enfoque permite que el sistema comprenda mejor las solicitudes de los usuarios en cada etapa de la comunicación, lo que mejora la calidad de la interacción.

El método se basa en el aprendizaje por refuerzo GRPO, que no requiere grandes recursos computacionales ni conjuntos de datos masivos. Los experimentos demostraron que un modelo de 8 mil millones de parámetros, entrenado con GRPO, superó a GPT-4 y a un modelo cuatro veces más grande en precisión de seguimiento del diálogo. Esto abre nuevas posibilidades para adaptar los sistemas a nuevos escenarios sin importantes costos de tiempo y recursos.

El ingeniero investigador de MWS AI, Timur Ionov, destacó que GRPO reduce la barrera de entrada al adaptar el sistema a nuevos escenarios y será útil en la atención al cliente, los asistentes de voz y los sistemas de reservas. Todo el proceso de aprendizaje e inferencia cabe en una sola GPU. El código está disponible en acceso abierto.