Cloud Spark proporciona procesamiento distribuido por lotes y en flujo de datos no estructurados y semiestructurados de diferentes fuentes, como S3, ClickHouse, Kafka y otras. Gracias a la optimización y al almacenamiento en caché en la memoria, el servicio realiza consultas analíticas a datos de prácticamente cualquier volumen.
Con Cloud Spark, se pueden resolver de forma rápida y con costes mínimos de infraestructura tareas de Data Science y análisis, incluido el análisis exploratorio de datos (EDA), así como entrenar modelos de aprendizaje automático con los datos de la empresa. Los analistas y especialistas en datos obtienen acceso rápido a los datos necesarios de diferentes fuentes a través de consultas SQL, y los desarrolladores de ML pueden utilizar las capacidades de la biblioteca MLlib integrada para trabajar con el aprendizaje automático. Todos los usuarios también pueden gestionar el servicio desde cualquier entorno conveniente, incluido un ordenador local y desde JupyterHub, gracias a la biblioteca de cliente integrada.
Cloud Spark se implementa sobre la base del servicio gestionado de Kubernetes de VK Cloud, que permite escalar y reducir automáticamente los recursos informáticos en función de la carga actual. De este modo, la empresa puede gestionar y optimizar de forma flexible los costes del servicio, ahorrando hasta un 60% del coste de la infraestructura. El soporte de la operatividad y la administración de Cloud Spark lo proporciona la plataforma VK Cloud, lo que elimina la necesidad de que los especialistas de la propia empresa dediquen tiempo y recursos a tareas rutinarias.
«El servicio en la nube Cloud Spark pone las tecnologías de nivel empresarial a disposición de empresas de cualquier tamaño. Las empresas obtienen una herramienta escalable para trabajar con big data sin necesidad de ejecutar, configurar y administrar Spark o Kubernetes por sí mismas. La plataforma VK Cloud proporciona un escalado flexible de los recursos, seguridad y cumplimiento de los requisitos de la ley 152-FZ, mientras que los especialistas de la empresa pueden centrarse en tareas analíticas y de investigación, trabajando con el aprendizaje automático, es decir, en extraer valor de los datos para la empresa», señala Alexander Volynsky, director técnico de producto de VK Cloud.