Загрузка страницы

Линейная регрессия и L1/L2-регуляризация

Запишетесь на полный курс Машинного обучения на Python по адресу support@ittensive.com

Линейная регрессия в общем виде может быть записана как:

y = a0 + a1*x1 + ... + an*xn

Где y - значение неизвестной величины, а xi - известные параметры.

Одним из вариантов оптимизации гиперпараметров линейной регрессии является отказ от свободного члена (a0), т.е. мы считаем, что зависимый, предсказываемый, процесс полностью определяется независимыми переменными.

Другим вариантом оптимизации гиперпараметров линейной регрессии является регуляризация - т.е. намеренное смещение весов в модели с целью уменьшения статистической ошибки. Естественно, для минимизации весов входные данные должны быть нормализованы.

Коэффициенты ai вычисляются таким образом, чтобы минимизировать ошибку, т.е. минимизировать выражение:

L = Σ(y - yi)^2

А что если в это выражение добавить еще какой-нибудь член, чтобы как-то уменьшить величины коэффициентов ai? Например, вместо L можно было бы минимизировать выражение:

L1 = Σ(y - yi)^2 + λ1*Σ|ai|

или другой вариант

L2 = Σ(y - yi)^2 + λ2*Σ(ai)^2

Что мы здесь сделали? Мы добавили в наше выражение штраф за большие значения ai. И величина этого штрафа пропорциональна величине параметрам λ, с помощью которого мы теперь можем настраивать наш алгоритм.

Первый вариант носит название L1-регуляризация (в английской литературе LASSO regression), второй вариант L2-регуляризация, или регуляризация Тихонова, или гребневая регуляризация (в английской литературе ridge regression).

Совмещая оба этих подхода, получим ElasticNet (эластичную сеть):

L = Σ(y - yi)^2 + λ1*Σ|ai| + λ2*Σ(ai)^2

Поскольку значения λ могут быть произвольными, то обычно проводят "жадный" поиск по логарифмической сетке значений, от 0.01 до 100, а затем уточняют полученную оптимальную пару значений.

Видео Линейная регрессия и L1/L2-регуляризация канала Центр digital профессий ITtensive
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
15 мая 2020 г. 20:43:57
00:13:56
Яндекс.Метрика