Problemas de arranque en frío en el "aprendizaje automático"

Fuente de la imagen proporcionado por el servicio de prensa de la compañía Yandex

No siempre el problema para los sistemas de ML se reduce a que aparece un nuevo usuario del que no hay información. A veces no hay datos sobre una nueva unidad añadida a la plataforma: sobre una película, si el sistema rs funciona en interés de un servicio de streaming, sobre un producto, si se trata de una plataforma de comercio electrónico.

De manera similar, el problema surge si el propio servicio o su nueva funcionalidad se están lanzando y aún no se ha acumulado información sobre los usuarios. Finalmente, existe el llamado tipo "contextual" del problema del arranque en frío. Un ejemplo de cómo puede manifestarse puede ser un sistema rs que recomienda películas: la falta de información más general sobre el usuario, por ejemplo, sobre sus características demográficas, estado de ánimo, preferencias, puede llevar a recomendaciones que no funcionarán.

La ganancia y la supervivencia de las empresas tecnológicas y las startups dependen de la solución del problema del arranque en frío, ya que la satisfacción de los usuarios con los servicios de TI depende precisamente de ello. Existe una serie de estrategias típicas que permiten hacer frente al "arranque en frío":

● aumento de datos o proceso de aumento artificial del volumen y la diversidad de un conjunto de datos de entrenamiento mediante la creación de versiones modificadas de ejemplos existentes, sin cambiar sus características clave;

● enfoques híbridos en el ámbito de los sistemas de recomendación;

● transferencia de aprendizaje y aprendizaje automático activo.

Hablemos de todo esto con más detalle.

<a></a>Factores que conducen a la aparición del problema del arranque en frío

La aparición del problema del arranque en frío se ve influenciada por varios factores en los sistemas de ML. Todos juntos y cada uno por separado pueden hacer que los modelos predictivos y las recomendaciones en los sistemas de recomendación no funcionen.

<a></a>Nuevos usuarios y productos procesados en la plataforma, solo sus unidades

Cuando un sistema de recomendación se enfrenta a nuevos usuarios que se han suscrito recientemente y no han acumulado un historial de interacción con la interfaz de la plataforma, prácticamente no hay datos para comprender sus preferencias. De manera similar, si aparece un nuevo producto, noticia, película, sección en el sistema, no hay reacción de los usuarios a ellos. Sin datos históricos sobre ellos, los algoritmos no pueden evaluar su relevancia para ninguna categoría de usuarios.

<a></a>Falta de datos sobre la interacción de los usuarios con una u otra entidad en la plataforma

Un problema similar surge a menudo en las plataformas de comercio electrónico de nicho. Hay tan poca información sobre cómo un usuario se relaciona con ciertos tipos de productos o cualquier otra entidad con la que trabaja la plataforma que es imposible predecir el interés de un visitante del servicio. La especificidad de algunas industrias es tal que el usuario no interactúa con la plataforma o interactúa con demasiada poca frecuencia.

<a></a>Dispersión de datos en el espacio de características

Esta situación surge cuando ciertos atributos o características tienen una cobertura limitada en el conjunto de datos. Esto crea dificultades al incluir nuevas características o información contextual en el modelo, ya que el sistema puede tener dificultades para generalizar eficazmente sin suficientes datos.

Si el problema del arranque en frío es que se ha añadido una nueva "característica" al servicio de TI o se está lanzando un nuevo servicio por primera vez, no hay información sobre las acciones anteriores de los usuarios. La efectividad de las recomendaciones u otros mecanismos predictivos será baja, ya que los algoritmos de "aprendizaje automático" solo tienen el conjunto de datos inicial, pero no hay retroalimentación de los usuarios que permita reentrenar el modelo o corregir el entrenamiento inicial.

Esto conduce a situaciones similares al escándalo en torno al chatbot "Tay" en redes neuronales de Microsoft, que estalló en 2016. La "inteligencia artificial", entrenada para comunicarse con los usuarios y lanzada en Twitter, mostró eficacia al principio de su trabajo con usuarios reales. Desafortunadamente, tenía la capacidad de aprender de los diálogos con usuarios humanos y adoptar su forma de hablar sin suficiente filtrado. Como resultado, el chatbot comenzó a insultar a los usuarios, por lo que tuvo que ser desactivado.

<a></a>Problema de arranque en frío: casos reales

Ejemplos reales de cómo las plataformas de ML y las redes neuronales se enfrentan al problema del arranque en frío permiten comprender mejor cuánto afecta a la eficacia de los modelos de ML y a la experiencia de usuario positiva o, por el contrario, negativa. Aquí hay varios escenarios que los especialistas en "aprendizaje automático" encuentran en la práctica:

● nuevas suscripciones a plataformas de streaming: algunos servicios de streaming se especializan en recomendaciones de música y películas personalizadas con la ayuda de redes neuronales. Un nuevo suscriptor no tiene historial de uso del servicio, por lo que los servicios al principio dan recomendaciones inseguras y muy generales, hasta que el usuario muestra con sus acciones lo que le gusta;

● tarjeta de producto recién creada en una plataforma de comercio electrónico: un nuevo vendedor en un mercado publica una tarjeta de producto, pero los sistemas de ML de la plataforma electrónica aún no tienen historial de compras o historial de búsqueda en la nueva tarjeta. Surge un problema en la formación de recomendaciones a los usuarios, que incluirá el nuevo producto. Lo que es peor, el estado inicial incierto de la tarjeta puede afectar la actitud del sistema hacia ella y hacer que a los usuarios solo se les muestren productos antiguos con los que sabe qué hacer;

● mercados de nicho con datos limitados sobre los usuarios: en las plataformas de comercio electrónico de nicho que venden productos relacionados con algún hobby o interés específico, sufren de una interacción rara y comparativamente pasiva de los usuarios con los servicios interactivos. Les interesa comprar y nada más. Muchas plataformas no pueden hacer frente al problema, sus herramientas de ML funcionan mal. Sin embargo, existen muchos enfoques para hacer que las recomendaciones sean mucho más efectivas;

● venta a través de Internet de productos con un ciclo de vida largo: para estos productos, las redes neuronales no encuentran suficiente historial de búsquedas del usuario y sus compras. Surge el problema del arranque en frío. Al igual que con los productos de nicho, existen oportunidades para mejorar la situación, a pesar de que el problema es causado por la especificidad del producto en sí.

Los ejemplos propuestos de la aparición del problema del arranque en frío en la práctica muestran claramente cuán serio puede ser el efecto desde el punto de vista de las ganancias de los servicios de IT. ¿Qué caminos de solución existen?

<a></a>¿Cómo resolver el problema del arranque en frío en los algoritmos de ML?

Es extremadamente difícil mejorar la experiencia del usuario y aumentar las ganancias si no se encuentra una solución al problema del arranque en frío. Existen varios métodos para hacerlo:

● aumento de datos: se pueden sintetizar los datos faltantes y realizar la imputación (atribución de datos), es decir, enseñar a la red neuronal a sacar conclusiones sobre los valores faltantes basándose en los disponibles. De esta manera, se pueden crear ejemplos artificiales para el "aprendizaje automático" que el usuario no proporciona;

● enfoque híbrido para recomendaciones: la combinación de varios algoritmos de ML, incluida la filtración colaborativa, el enfoque orientado al contenido y otros métodos permite que el sistema de ML forme una representación más completa y confiable del usuario. Donde un método no reciba suficiente información, los vacíos podrán ser llenados por otro;

● transferencia de aprendizaje y aprendizaje previo: al transferir el aprendizaje, el conocimiento obtenido por la red neuronal se extrapola a tareas similares. Si se entrena el modelo de antemano en enormes conjuntos de datos, y también se le enseña a encontrar analogías entre situaciones nuevas y habituales, entonces podrá funcionar correctamente en condiciones del problema del arranque en frío. Utilice muchos datos para el entrenamiento y márquelos bien;

● aprendizaje automático activo: una forma de "entrenar" redes neuronales, cuando se les enseña con datos mal preparados, por ejemplo, en alguna fuente que no ha sido procesada para el "aprendizaje automático". Como resultado, la red neuronal aprende a interactuar con los datos marcados, asimila métodos para su sistematización independiente. En muchos casos, esto puede ayudar a compensar el problema del arranque en frío.

Si el problema está relacionado con el funcionamiento de los sistemas de recomendación como tales, entonces existen varios enfoques más capaces de minimizar las consecuencias del problema del arranque en frío para la plataforma:

● se pueden hacer recomendaciones basadas en el contenido: utilice en los modelos de ML tantos atributos significativos como sea posible: etiquetas, descripciones, metadatos. Entrene a las redes neuronales para que trabajen de manera eficiente con ellos si faltan otros datos. A diferencia de otros enfoques, el contenido permite recomendar sobre la base de la búsqueda que el usuario realiza aquí y ahora;

● se pueden hacer recomendaciones basadas en la popularidad: si la información sobre el usuario es escasa, entonces de integraciones externas, por ejemplo, API con calificaciones, se pueden obtener datos sobre la moda general de ciertos productos y utilizar un trasfondo común relacionado con un producto en particular para recomendaciones más cualitativas a los usuarios;

● se puede utilizar información contextual y respuestas de los usuarios: para modelos de ML efectivos en condiciones del problema del arranque en frío, se puede utilizar un círculo más amplio de datos: contactos sociales del usuario, tiempo de permanencia en las páginas, clics, tipo de dispositivo del usuario, su ubicación y mucho más;

● se puede utilizar ML basado en conocimientos y en ejemplos: los métodos basados en datos directos y obtenidos se pueden complementar con heurística, un conjunto de datos del área de conocimiento correspondiente que la red neuronal podrá utilizar en la toma de decisiones. También se puede entrenar eficazmente el sistema con ayuda de ML basado en ejemplos de cómo debe actuar.

Al elegir un método o una combinación de ellos, se puede aumentar radicalmente la eficiencia del ML y los sistemas en plataformas tecnológicas que funcionan sobre la base del "aprendizaje automático".

<a></a>Problemas y desafíos en la solución del problema del arranque en frío

En la práctica, no existe un único escenario correcto para superar el problema. Si los especialistas eligen la forma incorrecta de resolver estos problemas, entonces la plataforma no logra construir una personalización de contenido efectiva. Pierde en la lucha competitiva. Se producen todo tipo de colisiones éticas. Los expertos han señalado durante mucho tiempo que los algoritmos de recomendación mal configurados juegan un papel de amplificadores de prejuicios. Por ejemplo, en el e-commerce pueden discriminar nuevos productos, lo que resulta en una restricción desleal de la competencia. Incluso si los algoritmos de ML desleales recibieron la configuración correspondiente para aumentar la rentabilidad de la plataforma aquí y ahora, al final las contradicciones inherentes a ella salen a la luz. El interés en la plataforma cae, pierde a sus usuarios.

<a></a>Conclusiones

El problema del arranque en frío se convierte en un compañero constante de las plataformas de ML. En su solución, existen varios métodos efectivos que utilizan los científicos de datos. Data Scientists son especialistas que crean herramientas para resolver problemas empresariales. Data Scientist trabaja en la intersección de tres áreas de conocimiento: estadística, aprendizaje automático y programación.

La eficiencia de sus esfuerzos depende de un cóctel correcto de metodologías y su aplicación correcta. Cuanto más profesional es el experto en "aprendizaje automático", mayor es la probabilidad de éxito. ¡Ay de las empresas tecnológicas y las startups donde los sistemas de recomendación y otros mecanismos basados en redes neuronales fueron entrenados incorrectamente! Como muestran los casos reales del problema del arranque en frío, las consecuencias de que el problema no se resuelva serán devastadoras para la base de clientes de las aplicaciones y sus ganancias.

Nikolái Vavílov

Problemas de arranque en frío en el "aprendizaje automático"

<a></a><b>Factores que conducen a la aparición del problema del arranque en frío</b>

<a></a><b>Nuevos usuarios y productos procesados en la plataforma, </b><b>solo </b><b>sus unidades </b>

<a></a><b>Falta de datos sobre la interacción de los usuarios con una u otra entidad en la plataforma</b>

<a></a><b>Dispersión de datos en el espacio de características </b>

<a></a><b>Problema de arranque en frío: casos reales</b>

<a></a><b>¿Cómo resolver el problema del arranque en frío en los algoritmos de ML?</b>

<a></a><b>Problemas y desafíos en la solución del problema del arranque en frío</b>

<a></a>Conclusiones