Загрузка страницы

Мастер-класс по обработке данных деклараций с помощью регулярных выражений

1 марта в 18:00 приглашаем на онлайн мастер-класс «Вскрываем декларации. Как при помощи регулярных выражений привести Word’овскую табличку к пригодной для анализа форме», который состоится накануне Дня открытых данных.

Иногда журналистам и аналитикам приходится работать с таблицами, которые не пригодны для анализа. Перед началом работы такие таблицы надо «очищать» — убрать все сдвоенные ячейки; заставить табличный редактор правильно определять числа и разнести каждое свойство изучаемого объекта в разные колонки.

Мы рассмотрим один из примеров такого «сложного» датасета — декларации чиновников — и научимся «очищать» его автоматическим образом. Для этого мы изучим основы работы с регулярными выражениями — шаблонами для поиска и извлечения текстов.

Мастер-класс проведет Алексей Смагин, дата-журналист в Тинькофф-журнале; приглашённый преподаватель курсов по журналистике данных в ВШЭ.
Технологии: Google Docs, регулярные выражения.

Требования к участникам: базовое понимание Excel (формулы, сводные таблицы, автозаполнение).

Регистрация для участия в мастер-классе на сайте https://opendataday.ru/msk.

Видео Мастер-класс по обработке данных деклараций с помощью регулярных выражений канала Infoculture
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
27 февраля 2021 г. 13:14:50
00:00:00
Другие видео канала
Семинар «Социальные проблемы через призму данных о госфинансах»Семинар «Социальные проблемы через призму данных о госфинансах»Семинар «От данных к истории: подготовка исследований к публикации в медиа»Семинар «От данных к истории: подготовка исследований к публикации в медиа»Исследования по цифровой антропологии этнографии и открытые данные. ДокладыИсследования по цифровой антропологии этнографии и открытые данные. ДокладыКак сделать варган: мастер-класс Сергея ПыжоваКак сделать варган: мастер-класс Сергея ПыжоваМастер-класс "Обработка текстов на естественном языке" (Д.Бугайченко)Мастер-класс "Обработка текстов на естественном языке" (Д.Бугайченко)Алгоритмы на Python 3. Лекция №1Алгоритмы на Python 3. Лекция №1Исследования НКО. Основы визуализации данныхИсследования НКО. Основы визуализации данныхИсследования НКО. Неочевидные приемы визуализации данных в ExcelИсследования НКО. Неочевидные приемы визуализации данных в ExcelИсследования НКО. Методы статистического анализа данныхИсследования НКО. Методы статистического анализа данныхИсследования НКО. Роль и место исследований в процессах поиска финансов для НКОИсследования НКО. Роль и место исследований в процессах поиска финансов для НКОИсследования НКО. О чем на самом деле говорят данные? Часть 1Исследования НКО. О чем на самом деле говорят данные? Часть 1Исследования НКО. Базовые приемы анализа данныхИсследования НКО. Базовые приемы анализа данныхИсследования НКО. О чем на самом деле говорят данные? Часть 2Исследования НКО. О чем на самом деле говорят данные? Часть 2Тема 1: основные положения и терминыТема 1: основные положения и терминыУникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинУникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинЧто называется хешированием?Что называется хешированием?Исследования НКО. Как провести опрос? Часть 2Исследования НКО. Как провести опрос? Часть 2Исследования НКО. Гайд исследовательского интервью. Часть 1Исследования НКО. Гайд исследовательского интервью. Часть 1Уникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинУникальный мастер-класс "Мгновенный анализ данных с помощью Excel". Олег ВидякинИсследования НКО. Как провести опрос? Часть 1Исследования НКО. Как провести опрос? Часть 1
Яндекс.Метрика