Мастер-класс по обработке данных деклараций с помощью регулярных выражений
1 марта в 18:00 приглашаем на онлайн мастер-класс «Вскрываем декларации. Как при помощи регулярных выражений привести Word’овскую табличку к пригодной для анализа форме», который состоится накануне Дня открытых данных.
Иногда журналистам и аналитикам приходится работать с таблицами, которые не пригодны для анализа. Перед началом работы такие таблицы надо «очищать» — убрать все сдвоенные ячейки; заставить табличный редактор правильно определять числа и разнести каждое свойство изучаемого объекта в разные колонки.
Мы рассмотрим один из примеров такого «сложного» датасета — декларации чиновников — и научимся «очищать» его автоматическим образом. Для этого мы изучим основы работы с регулярными выражениями — шаблонами для поиска и извлечения текстов.
Мастер-класс проведет Алексей Смагин, дата-журналист в Тинькофф-журнале; приглашённый преподаватель курсов по журналистике данных в ВШЭ.
Технологии: Google Docs, регулярные выражения.
Требования к участникам: базовое понимание Excel (формулы, сводные таблицы, автозаполнение).
Регистрация для участия в мастер-классе на сайте https://opendataday.ru/msk.
Видео Мастер-класс по обработке данных деклараций с помощью регулярных выражений канала Infoculture
Иногда журналистам и аналитикам приходится работать с таблицами, которые не пригодны для анализа. Перед началом работы такие таблицы надо «очищать» — убрать все сдвоенные ячейки; заставить табличный редактор правильно определять числа и разнести каждое свойство изучаемого объекта в разные колонки.
Мы рассмотрим один из примеров такого «сложного» датасета — декларации чиновников — и научимся «очищать» его автоматическим образом. Для этого мы изучим основы работы с регулярными выражениями — шаблонами для поиска и извлечения текстов.
Мастер-класс проведет Алексей Смагин, дата-журналист в Тинькофф-журнале; приглашённый преподаватель курсов по журналистике данных в ВШЭ.
Технологии: Google Docs, регулярные выражения.
Требования к участникам: базовое понимание Excel (формулы, сводные таблицы, автозаполнение).
Регистрация для участия в мастер-классе на сайте https://opendataday.ru/msk.
Видео Мастер-класс по обработке данных деклараций с помощью регулярных выражений канала Infoculture
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
Семинар «Социальные проблемы через призму данных о госфинансах»Семинар «От данных к истории: подготовка исследований к публикации в медиа»Исследования по цифровой антропологии этнографии и открытые данные. ДокладыКак сделать варган: мастер-класс Сергея ПыжоваМастер-класс "Обработка текстов на естественном языке" (Д.Бугайченко)Алгоритмы на Python 3. Лекция №1Исследования НКО. Основы визуализации данныхИсследования НКО. Неочевидные приемы визуализации данных в ExcelИсследования НКО. Методы статистического анализа данныхИсследования НКО. Роль и место исследований в процессах поиска финансов для НКОИсследования НКО. О чем на самом деле говорят данные? Часть 1Исследования НКО. Базовые приемы анализа данныхИсследования НКО. О чем на самом деле говорят данные? Часть 2Тема 1: основные положения и терминыУникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинЧто называется хешированием?Исследования НКО. Как провести опрос? Часть 2Исследования НКО. Гайд исследовательского интервью. Часть 1Уникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинИсследования НКО. Как провести опрос? Часть 1