En Rusia se ha creado el mayor conjunto de datos del mundo para cajas registradoras inteligentes y sistemas de contabilidad de tiendas

Ingenieros de Yandex, el Centro de Inteligencia Artificial de Skoltech y la Universidad Estatal de Instrumentación Aeroespacial de San Petersburgo han presentado PackEat, el conjunto de datos abierto más grande del mundo para sistemas de visión artificial en el comercio minorista.

Generado por la red neuronal Midjourney
Generado por la red neuronal Midjourney

Ingenieros de Yandex, el Centro de Inteligencia Artificial de Skoltech y la Universidad Estatal de Instrumentación Aeroespacial de San Petersburgo han presentado PackEat, el conjunto de datos abierto más grande del mundo para sistemas de visión artificial en el comercio minorista.

El conjunto de datos incluye fotografías de frutas y verduras que ayudarán a los minoristas a entrenar algoritmos para cajas registradoras inteligentes y sistemas de contabilidad. El conjunto de datos contiene imágenes de 34 tipos y 65 variedades de productos, tomadas en tiendas reales desde diferentes puntos de vista. En total, se han recopilado más de 100 mil fotografías, que capturan más de 370 mil objetos. Alrededor de 9 mil imágenes tienen el marcado de cada objeto individual, indicando el peso y el número de unidades del producto.

Según la idea de los desarrolladores, PackEat permitirá aumentar la precisión del reconocimiento de productos en los supermercados, teniendo en cuenta las imágenes de objetos con paquetes, intersecciones y fondos "ruidosos". Esto ayudará a resolver las tareas clave de la visión artificial en el comercio minorista: distinguir tipos y variedades de productos, resaltar cada objeto por separado, contar automáticamente el número de unidades del producto.

El conjunto de datos está alojado en la plataforma Zenodo, y el código y los ejemplos de modelos están en Kaggle, los investigadores y desarrolladores pueden utilizarlos en sus proyectos.

Fuentes
Yandeks

Ahora en la página principal