Загрузка страницы

SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии

Докладчик: Антон Вахрушев (Sber AI Lab)

Градиентный бустинг — один из самых эффективных инструментов для решения задач машинного обучения на табличных данных. Однако в задачах, когда требуется прогнозировать сразу несколько выходов, таких как multiclass/multilabel классификация и multitask регрессия, построение бустинга на деревьях требует существенных вычислительных затрат и может занимать неприемлемо много времени. Мы придумали практичный метод сжатия информации, который применяется на каждой итерации бустинга, а так же реализовали его на базе нашей библиотеки py-boost, которая доступна в opensource. В ходе нашего доклада мы расскажем, как можно добиться значительного ускорения времени обучения модели (в десятки раз) без каких-либо потерь в качестве.

Статья: https://arxiv.org/abs/2211.12858

Запись чата: https://drive.google.com/file/d/16amBcOgz3EV3iAgDxy8LMUMqW8khpMAb/view?usp=sharing

Видео SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии канала BayesGroup.ru
Показать
Страницу в закладки Мои закладки
Все заметки Новая заметка Страницу в заметки