Загрузка страницы

APPRENTISSAGE NON-SUPERVISÉ avec Python (24/30)

L'apprentissage Non-Supervisé (Unsupervised Learning) est une technique de Machine Learning tres populaire. Dans ce tutoriel Python sur sklearn en français, je vous dévoile les algorithmes les plus importants : K-Means Clustering, IsolationForest, et PCA (Analyse en composantes principales)

0:00 : Intro
00:33 : Apprentissage Non-Supervisé
03:17 : K-Means Clustering
06:04 : K-Means Sklearn
11:00 : K-Means – Elbow Method
14:50 : Anomaly Detection (Isolation Forest)
19:52 : Isolation Forest Sklearn
22:03 : Application Isolation Forest (digits)
26:54 : Réduction de dimension (PCA)
30:14 : Visualisation de données
33:14 : Compression de données
40:00 : Conclusion et exercice

Pour rappel, l’apprentissage supervisé est une technique d’apprentissage qui consiste à montrer à la machine des exemples X, y de ce qu’elle doit apprendre.
À l’inverse, l’apprentissage non-supervisé consiste à fournir à la machine uniquement des données X, et lui demander d’analyser la structure de ces données pour apprendre elle-même à réaliser certaines tâches.

1. Clustering
Une des applications les plus populaires de l’apprentissage non-supervisé est le Clustering. Le principe est de laisser la machine apprendre à trier des données selon leur ressemblances (et donc en analysant uniquement les features X).
Les algorithmes à connaitre :
- K-Means : Tres rapide, mais non-efficace sur les clusters non-convexes.
- AgglomerativeClustering : assez lent, mais efficace sur les données non-convexes
- DBSCAN : efficace sur les données non-convexes, mais sélection du nombre de clusters automatique
Applications :
- Trier des documents, des photos, des tweets
- Segmenter la clientèle d’une entreprise
- Optimiser l’organisation d’un système informatique, etc…

2. Détection d’Anomalies
Un autre exemple d’application de l’apprentissage non-supervisé est la Détection d’Anomalies. En analysant la structure X des données, la machine est capable de trouver les échantillons dont les features sont tres éloignées de celles des autres échantillons. Ces échantillons sont alors considérés comme étant des anomalies.
Les algorithmes à connaitres :
- IsolationForest : Efficace pour détecter des outliers dans le train_set
- Local Outlier Factor : Efficace pour détecter des anomalies futures
Applications :
- Nettoyer un Dataset des valeurs aberrantes qui le composent
- Détecter un comportement anormal sur un site Internet ou sur une caméra de surveillance
- Maintenance prédictive des machines d’une usine

3. Réduction de dimension
La dernière application très importante de l’apprentissage non-supervisé est la réduction de dimension. Le principe est de réduire la complexité superflue d’un dataset en projetant ses données dans un espace de plus petite dimension (un espace avec moins de variables). Le but est d’Accélérer l’apprentissage de la machine et de Lutter contre le fléau de la dimension.
Algorithmes a connaitres :
- Analyse en composantes principales (PCA) : le plus populaire et le plus simple a comprendre
- TSNE
- Isomap

Applications :
- Visualisation de données : afficher sur un graphique 2D un espace de grande dimension
- Compression de dataset : réduire au maximum le poids d’un dataset en conservant un maximum de qualité
► MON SITE INTERNET EN COMPLÉMENT DE CETTE VIDÉO:
https://machinelearnia.com/
► REJOINS NOTRE COMMUNAUTÉ DISCORD
https://discord.gg/WMvHpzu

► D'autres BONUS sur Tipeee:
https://fr.tipeee.com/machine-learnia

► Recevez gratuitement mon Livre:
APPRENDRE LE MACHINE LEARNING EN UNE SEMAINE
CLIQUEZ ICI:
https://machinelearnia.com/apprendre-le-machine-learning-en-une-semaine/
► Télécharger gratuitement mes codes sur github:
https://github.com/MachineLearnia
► Abonnez-vous : https://www.youtube.com/channel/UCmpptkXu8iIFe6kfDK5o7VQ

► Pour En Savoir plus : Visitez Machine Learnia : https://machinelearnia.com/

► Qui suis-je ?
Je m’appelle Guillaume Saint-Cirgue et je suis Data Scientist au Royaume Uni. Après avoir suivi un parcours classique maths sup maths spé et avoir intégré une bonne école d’ingénieur, je me suis tourné vers l’intelligence artificielle de ma propre initiative et j’ai commencé à apprendre tout seul le machine learning et le deep learning en suivant des formations payantes, en lisant des articles scientifiques, en suivant les cours du MIT et de Stanford et en passant des week end entier à développer mes propres codes.
Aujourd’hui, je veux vous offrir ce que j’ai appris gratuitement car le monde a urgemment besoin de se former en Intelligence Artificielle.
Que vous souhaitiez changer de vie, de carrière, ou bien développer vos compétences à résoudre des problèmes, ma chaîne vous y aidera.
C’est votre tour de passer à l’action !

► Une question ? Contactez-moi: contact@machinelearnia.com

Видео APPRENTISSAGE NON-SUPERVISÉ avec Python (24/30) канала Machine Learnia
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
30 марта 2020 г. 22:38:24
00:41:13
Яндекс.Метрика