Российский ИИ научили распознавать поддельные паспорта с помощью датасета

Компания Smart Engines создала датасет из 8 тысяч изображений поддельных документов для обучения систем ИИ. Технология сможет анализировать паспорта в разных спектрах.

Российский ИИ научили распознавать поддельные паспорта с помощью датасета
Источник фото: ru.freepik.com

Российские исследователи совершили прорыв в борьбе с цифровым мошенничеством. Компания Smart Engines представила уникальный масштабный датасет MIDV-DM, состоящий из 8 тысяч изображений фальсифицированных удостоверений личности — первый в России специализированный сборник данных для обучения систем искусственного интеллекта задачам антифрода.

В коллекцию вошли не только поддельные внутренние паспорта РФ, но и национальные документы стран СНГ, Евросоюза и других государств. Это позволяет обучать нейросети на разнообразных примерах, повышая их адаптивность и точность. Особую ценность датасету придает включение всех типов манипуляций: от замены фотографий и текстовых полей до склеивания фрагментов разных документов и внедрения посторонних объектов.

В перспективе на основе этого датасета Smart Engines планирует развивать собственную комплексную антифрод-систему. Она станет настоящим цифровым криминалистом, способным одновременно анализировать документ в оптическом, ультрафиолетовом и инфракрасном диапазонах, проверять текстовые поля, данные NFC-чипов, штрих-коды и метаданные.