Загрузка...

ما هو Variational Autoencoder (VAE)؟ شرح الـ Latent Space + توليد وتعديل الوجوه باستخدام PyTorch

في هذا الفيديو نشرح ما هو Variational Autoencoder (VAE) بطريقة مبسطة ثم ننتقل إلى التطبيق العملي لبناء نموذج كامل من الصفر باستخدام PyTorch. سنتعرف على مفهوم Latent Space وكيف يمكن استخدامه لتوليد الصور وتعديلها، مثل جعل الوجوه أكثر سعادة أو تغيير اتجاه الوجه بعد تدريب النموذج على CelebA dataset.
سنتناول:
• شرح فكرة الـ VAE والفرق عن Autoencoder العادي
• فهم الـ Encoder و Decoder بالتفصيل
• ما هو Latent Space وكيف يتم تنظيمه Gaussian باستخدام KL Divergence
• استخدام الـ Latent Directions لتعديل الصور (happy / sad / pose)
• شرح طبقات Linear و Convolution و Transposed Convolution
• شرح دالة الخسارة (Reconstruction L2 norm loss + Kullback Leibler Divergence)
• كتابة كود VAE كامل من الصفر باستخدام PyTorch
• تدريب نموذج لتوليد الوجوه باستخدام CelebA
• اختبار النموذج وتوليد وجوه جديدة
• تعديل الصور داخل الـ Latent Space باعتبارها Vectors in vector space
هذا الفيديو مناسب لمستخدمي Generative AI ليتعرفو على مفهوم الVAE الذي يستخدمونه في ComfyUI وغيرها من أدوات إنشاء المحتوى. وهو أيضاً لمهندسي وطلاب الAI الذين يريدون فهم Generative Models و Representation Learning بشكل عملي.
links:
Github repo: https://github.com/arab-future-academy/deep_dive_in_gen_ai
CelebFaces(CelebA) Dataset: https://www.kaggle.com/datasets/jessicali9530/celeba-dataset
ComfyUI intro to motivate the need for VAE: https://www.youtube.com/watch?v=SDg0AbqwRvg&list=PLa_45zxyaspH71syIG8SAqaaQkSnXSPKk&index=15
Auto-Encoding Variational Bayes paper by Kingma and Welling: https://arxiv.org/abs/1312.6114

══════════════════════════════
Timeline:
00:00 Introduction
00:29 Variational autoencode (VAE) in few words
01:08 Two parts of the video
02:19 Video contents
03:16 Architecture of the Variational Autoencoder (VAE)
03:20 The encoder
04:04 The decoder
04:53 The faces VAE written in this video including encoder and decoder layers
09:17 Uses and importance of teh VAE (Content generation and latent space image editing)
12:21 Tool for computing directions in the latent space such as (happy or sad and so on)
14:21 Editing images in the latent space using computed directions
15:17 making faces happier/sader or changing the direction of the face
17:06 Linear neural networks layers
18:14 Convolutional neural networks layers
19:44 Transposed Convolutional Layers
20:37 Loss function (reconstruction error, L2 Norm or Binary cross entropy)
21:55 Kullback-Leibler Divergence to make the latent space Gaussian
23:00 VAE code from scratch using pytorch to encode and decode faces
34:43 Training and testing code walkthrough for the VAE
41:48 CelebA dataset path and running the training script
42:47 Training output the model and the test images
══════════════════════════════

Видео ما هو Variational Autoencoder (VAE)؟ شرح الـ Latent Space + توليد وتعديل الوجوه باستخدام PyTorch канала Arabic Future Academy
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять