Артур Хачуян — Построение кросс-ID для веб-аналитики
—
В своем докладе Артур рассмотрит все стороны построения системы удаленной идентификации пользователей в вебе с учетом современных технических и юридических реальностей.
Мы сохраняем множество транзакционных данных пользователей внутри нашей системы веб-аналитики несмотря на введение ITP 2.x. Расчет и ранжирование метрик первого этапа, которые потом станут фичами модели, можно собрать с учетом cookies-less. Артур расскажет о нескольких библиотеках для расчета фингерпринтов, которые в его команде использовали и используют. Самый важный момент — это последующая векторизация клиентских идентификаторов в Super ID. Это исключительно статистический процесс, который может показывать точность в 99%, а иногда и в 40%. Для проброса данных внутрь модели используется ее развертка как сервис (model deployed as a separate service), но также будет сравнение с вариантами, когда она является встроенной моделью (embedded model) или опубликована как данные (Model published as data). Так как процессы сбора данных, обучения и валидации в задачах реального времени неотделимы друг от друга, Артур расскажет об архитектуре, которая используется для тестирования моделей и переобучении. Несколько технических особенностей архитектуры, такие как распределение обработчиков бэкенда, согласно стране обращений, основаны на применении локальных законов — GDPR и CCPA, и ведут к коллизиям идентификаторам и невозможности собрать их воедино. Закончит спикер парой слов об ошибках использовании k-anonimity в распределенных базах, так как это позволяет делиться обезличенными срезами с партнерами и клиентами.
Посмотреть презентацию: https://tazeros.com/presentation/agregaciya_identificatorov_otslezhivaniya_na_storone_servera_v_epokhu_cokkieless_i_gdpr
Видео Артур Хачуян — Построение кросс-ID для веб-аналитики канала SmartData
В своем докладе Артур рассмотрит все стороны построения системы удаленной идентификации пользователей в вебе с учетом современных технических и юридических реальностей.
Мы сохраняем множество транзакционных данных пользователей внутри нашей системы веб-аналитики несмотря на введение ITP 2.x. Расчет и ранжирование метрик первого этапа, которые потом станут фичами модели, можно собрать с учетом cookies-less. Артур расскажет о нескольких библиотеках для расчета фингерпринтов, которые в его команде использовали и используют. Самый важный момент — это последующая векторизация клиентских идентификаторов в Super ID. Это исключительно статистический процесс, который может показывать точность в 99%, а иногда и в 40%. Для проброса данных внутрь модели используется ее развертка как сервис (model deployed as a separate service), но также будет сравнение с вариантами, когда она является встроенной моделью (embedded model) или опубликована как данные (Model published as data). Так как процессы сбора данных, обучения и валидации в задачах реального времени неотделимы друг от друга, Артур расскажет об архитектуре, которая используется для тестирования моделей и переобучении. Несколько технических особенностей архитектуры, такие как распределение обработчиков бэкенда, согласно стране обращений, основаны на применении локальных законов — GDPR и CCPA, и ведут к коллизиям идентификаторам и невозможности собрать их воедино. Закончит спикер парой слов об ошибках использовании k-anonimity в распределенных базах, так как это позволяет делиться обезличенными срезами с партнерами и клиентами.
Посмотреть презентацию: https://tazeros.com/presentation/agregaciya_identificatorov_otslezhivaniya_na_storone_servera_v_epokhu_cokkieless_i_gdpr
Видео Артур Хачуян — Построение кросс-ID для веб-аналитики канала SmartData
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
Какой язык программирования выбрать в 2022 году?Jacek Laskowski — The latest and greatest of Delta LakeИгорь Ашманов - аналитика Big Data. Все секреты больших данных с конференции eTarget (полное видео)Computer Scientist Explains One Concept in 5 Levels of Difficulty | WIRED10 космических открытий 2020 года, которые потрясли научный мир«На чём корпорации вертели вашу приватность», Артур Хачуян (Tazeros Global)Apprendre JavaScript - Cours CompletОсновы Программирования - #1 - Логика. АлгоритмыMirosław Zelent - Programowanie: 6 najczęstszych błędów podczas nauki programowaniaНОВЫЙ СПОСОБ! НЕ решай задание 19-21 из ЕГЭ по информатике, пока не посмотришь это видео!Презентация первого iPhone на русском языке в HD. Когда мир изменился навсегда.Круглый стол «Что, если не Hadoop»What is Coding? How to Learn as Beginner? 2022Cours Complet HTML CSS - Tutoriel pour Débutants et Confirmés [Partie 1/3]Паша Финкельштейн — Воркшоп. Делаем жизнь инженеров проще с Big Data ToolsTon Badal — Optimizing test data coverage in functional testingУчим Python за 1 час! #От ПрофессионалаПутешествие по вашему телуYazılıma/Programlamaya nereden başlamalıyım?Максим Стаценко — Обзор технологий хранения больших данных. Плюсы, минусы, кому подойдет.