En Rusia se presentó el primer conjunto de datos a gran escala con documentos falsificados

El conjunto de datos permitirá a los desarrolladores capacitar, probar y mejorar los sistemas antifraude basados en IA.

Imagen proporcionada por el servicio de prensa de Smart Engines
Imagen proporcionada por el servicio de prensa de Smart Engines

La empresa rusa Smart Engines ha lanzado MIDV-DM, un conjunto de datos especializado de documentos falsificados para desarrolladores de IA. Las muestras incluidas en el conjunto se fabricaron utilizando los métodos de falsificación más comunes entre los estafadores. Incluye 8.000 imágenes con identificaciones de Rusia, la CEI y otros países.

Como destacó la empresa, MIDV-DM se convirtió en el primer conjunto de datos público que sistematizó todos los métodos principales de manipulación de documentos. La base del conjunto es de 1.000 imágenes de la muestra MIDV-2020 publicada anteriormente por investigadores de Smart Engines: muestras del pasaporte interno de la Federación Rusa, pasaportes nacionales y tarjetas de identificación de Azerbaiyán, Letonia, Estonia, Finlandia y otros.

Los desarrolladores utilizaron manipulaciones con documentos como la inserción de campos de texto o fotos de un documento "donante", el "enmascaramiento" de campos individuales del documento, la unión de diferentes fragmentos en una sola imagen, la inserción de objetos extraños: emblemas, hologramas, etc.

En el futuro, con la ayuda de MIDV-DM, Smart Engines planea desarrollar su propio sistema antifraude "Sherlock 2o", un modelo de IA multimodal capaz de trabajar simultáneamente con imágenes de documentos de espectros ópticos, ultravioleta e infrarrojo, campos de texto, datos de chips NFC, códigos de barras, metadatos y firmas. En total, el sistema verifica la autenticidad de un documento según 600 parámetros.

Ahora en la página principal