ИИ проверит поддельные документы
Силуянов партнер "Лиги Цифровой Экономики"
Искусственный интеллект стал одним из основных инструментов для решения бизнес-задач, его возможности расширяются. Одна из новых областей применения ИИ — проверка подлинности документов. О том, как проходит процесс проверки документов и можно ли будет полностью передать эту задачу ИИ, рассказывает Дмитрий Силуянов, партнер "Лиги Цифровой Экономики".
Как искусственный интеллект проверяет документы
Выявление поддельных документов — идеальная задача для искусственного интеллекта, поскольку она не типовая, а умственная. С ней могут справиться только высококвалифицированные специалисты: необходимо знать множество признаков и обнаруживать их. Если бы это была простая задача, ее с необходимой точностью выполняли бы автоматические системы уже в 1980-х годах. Экспертов, способных справляться с этой задачей, мало, и они могут уставать в течение дня. Обладающая интеллектом машина надежнее. Не менее важно, что выявление подделок — малоприятная работа. Поручение ее искусственному интеллекту помогает выполнить этические требования, то есть передать машине исключительно рутинные задачи.
Искусственный интеллект делает проверку документов независимой от психологического воздействия на оператора. В отличие от человека, ИИ способен точно выявлять изменения в цифровом образе документа. Люди не могут запомнить, как выглядят все паспорта мира и в чем заключаются особенности каждого образца, — искусственный интеллект легко справляется с этой задачей.
Какого типа документы можно доверить проверке ИИ?
Если говорить о физической проверке, то, например, ИИ разработчика Smart Engines обучен проверять все страницы паспорта и загранпаспорта РФ (биометрического и обычного), военный билет, полис ОМС, форму 2П, медкнижку, водительские права, национальные удостоверения и ID-карты граждан СНГ, а также паспорта всех стран мира. Поддерживаются большие документы размером до А4: свидетельства о государственной регистрации акта гражданского состояния РФ (свидетельство о рождении, смерти, браке, разводе, смене имени и т. п.), нотариальные доверенности, ПТС, дипломы о высшем образовании. Доработка системы выполнялась при поддержке Фонда содействия инновациям.
Проверка электронных копий, то есть изображений, в цифровых каналах включает набор универсальных проверок (вмешательства в изображение в редакторах, пересъемка с экрана, проверка цветности) и набор специальных проверок для конкретного документа (шрифты, кросс-валидация данных, проверка дат).
Процесс проверки
Физическая проверка подлинности документов включает несколько этапов. Это контроль люминесценции бланка документа при освещении излучением в УФ-диапазоне 365 нм, контроль бланка и реквизитов в ближнем ИК-диапазоне, выявление клеевых пятен и следов изменения данных, разрывов и надрывов, контроль наличия, целостности и отсутствия специальных элементов защиты в видимом, ИК- и УФ-диапазонах, а также многостраничный анализ документа.
Существуют антифрод-системы на базе ИИ в цифровых каналах, помогающие выявить поддельные документы. Они обладают несколькими модулями проверки.
Модуль выявления цифрового вмешательства ("антифотошоп") отвечает за поиск цифрового вмешательства и модификаций, проверку метаданных и структуры файла с изображением, выявление признаков синтеза документа.
Модуль выявления признаков компрометации документов ("антифрод") основывается на проверке валидности бланка документа, контрольных разрядов, формата и правил заполнения, специальных визуальных элементов бланка, а также выявляет признаки переклейки фотографии владельца документа.
Модуль проверки "живости" документов (document liveness detection) осуществляет детекцию и контроль оптически переменных элементов (OVD), текстовых и графических элементов, выявление признаков съемки документа с экрана (screen re-capture).
В общей сложности документы проверяются по более чем 60 параметрам. Дополнительно антифрод-система может быть усилена новым модулем небиометрической сверки лиц. Это сквозная нейросетевая модель, которая комплексно решает задачу, не выделяя биометрические дескрипторы. Нейросеть обучена сравнивать лица, ориентируясь на метрические характеристики (например, расстояние между глазами). Она оценивает, насколько изображения лиц совпадают друг с другом. Этот процесс напоминает "традиционную" сверку лиц "на глаз", только за человека это делает машина.
На рынке уже доступны специальные сканеры, в которых встроенный ИИ проверяет документ на подлинность и действительность в трех диапазонах: оптическом, ультрафиолетовом, инфракрасном. На весь процесс уходит всего пара секунд. Кроме того, искусственный интеллект в паспортах с чипами сравнивает данные чипа с данными на документе. Система также проверяет "действительность" документа в момент обращения.
Сферы применения
Внедрение ИИ эффективно в сферах, где необходима проверка подлинности документов, например в банковских и кредитных организациях. Поскольку они выдают займы, им важно быть уверенными, что клиент — тот, кем представляется. Не менее актуально это и для транспортной отрасли. Злоумышленники могут использовать подделки для покупки билетов на поезд или самолет. Например, в 2022 году мужчина
Возможно ли обмануть ИИ?
Несомненный плюс искусственного интеллекта — независимость от человеческого фактора. Тем не менее при проверке подлинности документа он действует по заранее обученному алгоритму. Поэтому единственный доступный способ обмануть его — найти уязвимость в алгоритме. Сделать это можно разными методами: "украсть" описание алгоритма и выявить в нем уязвимости или атаковать ИИ.
Важно, чтобы искусственный интеллект, проверяющий документы, не опирался на открытые модели. При всех экономических преимуществах открытой разработки, уязвимости при таком подходе найти значительно проще.
Проверяющий ИИ должен регулярно обновляться. Задача разработчиков — развивать имеющиеся проверки, добавлять новые и действовать на опережение. Это затрудняет злоумышленникам сбор информации об актуальных уязвимостях, поскольку многие из них меняются в новых версиях, даже если о них неизвестно публично.
Перспективы развития
Сегодня ИИ может сам находить признаки подделки документа без участия человека. Вопрос стоит в интерпретации результатов по обнаруженным признакам. Простой пример: пользователь может обрезать лишнее на изображении в фоторедакторе, не меняя ничего в документе. Антифрод-система распознает вмешательство в изображение и даст сигнал. Считать такое изображение "подделкой" или нет, будет зависеть от интерпретации той методологии, которую используют в конкретной организации для определенного процесса. Есть и другие примеры, в том числе когда выполняется усиленная мультиспектральная проверка документа на спецоборудовании.
Полностью передать эту задачу ИИ возможно, но необходимо учитывать, в каком канале она выполняется. Максимальная защита обеспечивается в физическом канале — то есть при проверке непосредственно бумажного или пластикового документа. В цифровом канале (изображения документов приходят извне) не все подделки обнаруживаются в принципе, но и здесь, с учетом специфики конкретного бизнес-процесса, можно выделить модели угроз, которые ИИ надежно отработает самостоятельно.