Сервис MWS Data Scout стал частью платформы MWS Data и представляет собой ИИ-агента, в основе которого лежит большая языковая модель (LLM). Он просматривает все базы данных компании и формирует краткое описание того, что в них находится и как они связаны между собой.
В МТС подчеркнули, что это первый подобный сервис в России. ИИ-агент может подключиться к IT-системам компании как и из облака, так и из защищенного контура клиента. Решение интегрируется с популярными дата-каталогами, такими как DataHub, OpenMetadata, а также дата-каталогом от MWS. Сервис может проанализировать, как таблицы связаны между собой, какие в них хранятся данные и определить другие их характеристики.
Также сервис может выявлять, в каких базах данных хранится критическая информация, такая как паспортные данные (номер, серия, дата выдачи), персональные данные (ФИО, место жительства, телефон), банковские данные (pin, cvv, имя держателя).
На первом этапе ИИ-агент получает мета-данные (общие сведения о том, как называются таблицы и столбцы в них), а также подключается к Confluence компании, где также могут храниться дополнительные сведения о БД. Это позволяет сервису получить более полное представление о структуре и назначении данных, повысить точность описаний и учесть бизнес-контекст, зафиксированный в документации. Далее ИИ-агент описывает сами таблицы и столбцы, находит критичные данные. После окончания анализа ИИ-агент предоставляет структурированный отчет с описанием обнаруженных таблиц, связей между ними и загружает результаты в дата-каталог.
В будущем сервис сможет строить пайплайны данных от поиска нужного источника (например, с мастер-данными) до дообогащения данных и доставки их до BI-систем или ML-моделей с обязательными проверкам качества данных. Также он сможет обнаруживать аномалии, помогая распознавать резкие отклонения в данных, которые могут сигнализировать о неполадках или подозрительных событиях.