La plataforma MWS Data Lakehouse permite trabajar con tipos de datos estructurados, no estructurados y vectoriales para realizar diferentes tipos de tareas: desde la creación de informes operativos hasta el entrenamiento e inferencia de modelos ML y LLM.
La plataforma permite almacenar y procesar datos como información sobre ventas y pedidos, demanda de productos y logística, información sobre pagos y servicios prestados. Sobre la plataforma se pueden ejecutar herramientas para el entrenamiento e inferencia de ML y modelos de lenguaje grandes.
En MTS Web Services destacaron:
La plataforma permite utilizar el almacenamiento de forma un 40% más económica al eliminar la duplicación de datos entre diferentes sistemas, aumentar 2,5 veces la eficiencia del personal de servicio gracias a la centralización y automatización de las funciones de administración y reducir a la mitad el tiempo de cálculo de las vitrinas analíticas.
Como infraestructura para el despliegue de la plataforma se pueden utilizar diversas soluciones, entre ellas, Kubernetes, almacenamiento de objetos compatible con S3. La plataforma también incorpora herramientas de centralización del control de acceso, auditoría y cifrado, enmascaramiento dinámico de datos sensibles.
La plataforma es compatible con Greenplum y Postgres, y admite una amplia gama de datos, incluidos los formatos abiertos Apache Parquet e Iceberg.
La administración del servicio se realiza a través de una interfaz única, que permite gestionar de forma centralizada los usuarios, los clústeres y el escalado. Se admite el cambio dinámico de los recursos de los clústeres de computación, lo que garantiza la continuidad del trabajo y la ausencia de tiempos de inactividad durante el escalado.