Sorry, that text will be in Russian (just in a hurry).

Критерии блокировки

Вся верификация пользователей базируется на трех столпах:

  • серверные данные об устройстве - IP, useragent etc
  • данные из клиентского скрипта — поддержка шрифтов, размеры экрана и т.п.
  • Data Enrichment - обогащение существующих данных пользователя данными других сервисов (регистрация на других сайтах)
  • исторические данные по репутации ip и пользователя (данные других клиента сервиса)

Серверные данные об устройстве

Сами по себе они не достаточны для определения каких либо ботов, только самых простеньких ботов. Потому что банально мало информации. Совсем простые боты блокируются на этом уровне со стороны cloudflare автоматически.

Данные клиентского скрипта

На этом уровне у нас работает turnstile (cloudflare captcha). Загружается скрипт, опрашивает браузер о его свойствах и сообщает эту информацию на сервер, для принятия решения, о том, бот ли это. Ботов которые не люди так можно хорошо детектить. Люди с настоящими браузерами на этом этапе абсолютно валидные видны.

Data Enrichment

Дополнительные данные по авторизационным данным пользователя, к примеру связанные с этим email регистрации на других сервисах и ФИО пользователя на других сайтах. Информация о места работы, информация о количестве детей и т.п.

имхо: в целом — мне кажется что этот тип проверки для нас не сильно полезен, потому что у нас регистрируются живые люди.

Исторические данные

Это данные по репутации IP, браузера, email и т.п. Тут мы хотим знать, что с этого ip у других казино был фрод. Или с этого е-мейла этот человек жаловался в gambling commission etc. Репутация этого пользователя в аналогичных сервисах на основании взаимодействия с антифродом.

имхо: фактически это наверное основное, что мы хотим купить у поставщиков скоринга данных. У нас недостаточно данных чтобы самим строить эффективный скоринг по ботам, и мы хотим купить эту информацию, чтобы согласно нее банить подозрительных.

Поведенческие данные для блокировки

Дополнительная реализация клиентского скрипта, которая позволяет выделить паттерны поведения (сценарии) для блокировки. Сейчас у нас этого нет, но добавление может нам помочь блокировать часть людей которые мотивированны делать не хорошие вещи.

Сервисы

CloudFlare

  • не предоставляет нам исторические данные других клиентов, НО имеет базу репутации IP и TLS Fingerprints и используют их для блокировок (однако для нас она не релевантна, потому что у нас юзеры используют VPN часто)
  • Данные клиентского скрипта - качественно убивают ботов
  • не предоставляют data enrichment
  • не предоставляют дашборда для поведенческих блокировок, как и сами поведенческие блокировки не предоставляют

имхо: все что касается ботов — решает хорошо, что касается плохих, но живых людей, никак нам не поможет.

SEON

  • НЕ предоставляют нам исторические данные других клиентов.
  • Предоставляют data enrichment по емейлам и телефонам (к примеру, что на этом email присутствует facebook и github - человек живой)
  • Предлагают дашборд для построения поведенческих блокировок (дашборд может опираться и на действия людей на сайте так и на data enrichment)

Тестирование

Для теста запросили клиентские данные в формате:

registration time, ip, email, phoneneumber, name, surname, birthData, fraud
2024.05.21 12:32:22, 132.33.24.11, [email protected], +4787343425, 22.05.1988, true

Мы делаем два датасета и шлем им. Один размеченный, один контрольный. Размеченный содержит информацию кто был фродом, а кто нет. Неразмеченный мы даем как контрольный, они в нем отмечают кого они, считают фродом, а мы зная ответ, смотрим на эффективность.

имхо: без поведенческих, скорее всего, лажа.

Human

  • я забыл спросить предоставляют ли они данные исторические от других клиентов (нужно уточнить)
  • предоставляют data enrichment
  • Предлагают что они сами построить какие-то поведенческие схемы для блокировки. Дашборд не смотрел, но знаю что он есть

Тестирование:

Проработать с ними сценарий поведения пользователя, поставить скрипт, сделать замер за месяц.