Загрузка страницы

005. Текст как данные автоматизируем формирование контента – Михаил Острогорский

Случалось ли вам штудировать объемный документ, чтобы извлечь из него немного нужной информации? Текст наполнен данными, но они в нем зарыты, как игрушки в песочнице. Быстро найти эти данные и затем представить их в удобной форме бывает непросто. Например, у вас есть подробное описание всех компонентов какой-нибудь системы и вам нужно наглядно показать, как они связаны между собой. На схеме или в таблице. Обычно такие задачи приходится решать вручную: читаем текст, выписываем нужное и придаем найденной информации нужный вид. Но есть и хорошие новости. Если для представления текста использовать структурированный формат (например DITA), то можно автоматически извлекать из него данные, а затем формировать из них нужный текст или даже графические элементы.

Я расскажу о собственных подходах к автоматизации формирования контента и приведу примеры реальных проектов, в которых они использовались. Нанесем еще один удар по ненавистному копипейсту и сократим объем рутинной работы.

Видео 005. Текст как данные автоматизируем формирование контента – Михаил Острогорский канала Yandex for Developers
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
31 октября 2018 г. 16:52:33
00:30:19
Другие видео канала
IAM: Identity and Access ManagementIAM: Identity and Access ManagementКак оценивать качество машинного перевода? – Мария ШматоваКак оценивать качество машинного перевода? – Мария Шматова002. E2E VLAN-based Traffic assurance under Path Computation Element (PCE)002. E2E VLAN-based Traffic assurance under Path Computation Element (PCE)Выход userver в Open Source – Антон ПолухинВыход userver в Open Source – Антон Полухин09. Storage —  Александр Вайцеховский09. Storage — Александр ВайцеховскийКак наши кластеры оказались в топе суперкомпьютеровКак наши кластеры оказались в топе суперкомпьютеровКак поднимают миры в Kubernetes – Нарек Татевосян, ЯндексКак поднимают миры в Kubernetes – Нарек Татевосян, ЯндексYaTalks 2022 —  Сергей Орешков / Анализ проб воды нейросетямиYaTalks 2022 — Сергей Орешков / Анализ проб воды нейросетямиYaTalks 2022 — Алексей Гусаков / ML в Яндексе: как поймать баланс между продуктом и исследованиямиYaTalks 2022 — Алексей Гусаков / ML в Яндексе: как поймать баланс между продуктом и исследованиямиПод капотом робота-доставщикаПод капотом робота-доставщикаYaTalks 2022 — Сергей Дуканов / Нейродубляж: стираем языковые барьеры в видеоYaTalks 2022 — Сергей Дуканов / Нейродубляж: стираем языковые барьеры в видеоAndroid Инструменты контроля приложенияAndroid Инструменты контроля приложения002. Как справляться с ростом инфраструктуры сервиса - Игорь Андреев002. Как справляться с ростом инфраструктуры сервиса - Игорь АндреевОpen source трибунаОpen source трибунаВызовы в оценке генеративных текстовых моделей: задачи и категорииВызовы в оценке генеративных текстовых моделей: задачи и категорииЦифровая доступность глазами незрячих тестировщиковЦифровая доступность глазами незрячих тестировщиков008. Панельная дискуссия «SDN  10 лет после хайпа»008. Панельная дискуссия «SDN 10 лет после хайпа»Как бэкенд Толоки выбирает задания для исполнителейКак бэкенд Толоки выбирает задания для исполнителейКак выжить hardware-продукту в software-компании? - Сергей МельникКак выжить hardware-продукту в software-компании? - Сергей МельникWeekend Offer для frontend-разработчиков в Яндекс, 27 и 28 маяWeekend Offer для frontend-разработчиков в Яндекс, 27 и 28 мая004. We Love Route Leaks004. We Love Route Leaks
Яндекс.Метрика