SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии
Докладчик: Антон Вахрушев (Sber AI Lab)
Градиентный бустинг — один из самых эффективных инструментов для решения задач машинного обучения на табличных данных. Однако в задачах, когда требуется прогнозировать сразу несколько выходов, таких как multiclass/multilabel классификация и multitask регрессия, построение бустинга на деревьях требует существенных вычислительных затрат и может занимать неприемлемо много времени. Мы придумали практичный метод сжатия информации, который применяется на каждой итерации бустинга, а так же реализовали его на базе нашей библиотеки py-boost, которая доступна в opensource. В ходе нашего доклада мы расскажем, как можно добиться значительного ускорения времени обучения модели (в десятки раз) без каких-либо потерь в качестве.
Статья: https://arxiv.org/abs/2211.12858
Запись чата: https://drive.google.com/file/d/16amBcOgz3EV3iAgDxy8LMUMqW8khpMAb/view?usp=sharing
Видео SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии канала BayesGroup.ru
Градиентный бустинг — один из самых эффективных инструментов для решения задач машинного обучения на табличных данных. Однако в задачах, когда требуется прогнозировать сразу несколько выходов, таких как multiclass/multilabel классификация и multitask регрессия, построение бустинга на деревьях требует существенных вычислительных затрат и может занимать неприемлемо много времени. Мы придумали практичный метод сжатия информации, который применяется на каждой итерации бустинга, а так же реализовали его на базе нашей библиотеки py-boost, которая доступна в opensource. В ходе нашего доклада мы расскажем, как можно добиться значительного ускорения времени обучения модели (в десятки раз) без каких-либо потерь в качестве.
Статья: https://arxiv.org/abs/2211.12858
Запись чата: https://drive.google.com/file/d/16amBcOgz3EV3iAgDxy8LMUMqW8khpMAb/view?usp=sharing
Видео SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии канала BayesGroup.ru
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
Scalable Bayesian Inference in Low-Dimensional SubspacesAutoformer and Autoregressive Denoising Diffusion Models for Time Series Forecasting [in Russian]Stochastic computational graphs: optimization and applications in NLP, Maksim Kretov[DeepBayes2018]: Day 2, lecture 4. Discrete latent variablesSparse Bayesian Variational Learning with Matrix Normal DistributionsTensor Train Decomposition for Fast Learning in Large Scale Gaussian Process Models, Dmitry KropotovСлучайные матрицы: теория и приложенияNeural Program Synthesis, part 2 [in Russian]Hyperbolic Deep Learning [in Russian]Tensor Programs, part 2 [in Russian]Discovering Faster Matrix Multiplication Algorithms with Reinforcement Learning [in Russian]Learning Differential Equations that are easy to solve [in Russian][DeepBayes2018]: Day 3, Practical session 5. Distributional reinforcement learningOn Power Laws in Deep Ensembles [in Russian][DeepBayes2019]: Day 5, Sponsor talkMathematical Models of the Genetic Architecture in Complex Human DisordersControlling GANs Latent Space [in Russian][DeepBayes2019]: Day 2, practical session 2. Variational autoencodersPredicting Oil Movement in a Development System using Deep Latent Dynamics ModelsDomain Adaptation of GANs [in Russian]