В России разработали метод быстрой адаптации чат-ботов к новым сценариям

Российские ученые из MWS AI, Университета ИТМО и IITU разработали метод, повышающий точность отслеживания состояния диалога в чат-ботах и голосовых помощниках. Новый подход позволяет системе лучше понимать запросы пользователей на каждом этапе общения, что улучшает качество взаимодействия.

Метод основан на обучении с подкреплением GRPO, не требующем больших вычислительных ресурсов и массивов данных. Эксперименты показали, что модель на 8 млрд параметров, обученная с использованием GRPO, превзошла GPT-4 и модель в четыре раза крупнее по точности отслеживания диалога. Это открывает новые возможности для адаптации систем к новым сценариям без значительных затрат времени и ресурсов.

Инженер-исследователь MWS AI Тимур Ионов подчеркнул, что GRPO снижает барьер входа при адаптации системы к новым сценариям и будет полезен в клиентской поддержке, голосовых ассистентах и системах бронирования. Весь процесс обучения и инференса укладывается на одну GPU. Код выложен в открытый доступ.