ما هو Variational Autoencoder (VAE)؟ شرح الـ Latent Space + توليد وتعديل الوجوه باستخدام PyTorch

في هذا الفيديو نشرح ما هو Variational Autoencoder (VAE) بطريقة مبسطة ثم ننتقل إلى التطبيق العملي لبناء نموذج كامل من الصفر باستخدام PyTorch. سنتعرف على مفهوم Latent Space وكيف يمكن استخدامه لتوليد الصور وتعديلها، مثل جعل الوجوه أكثر سعادة أو تغيير اتجاه الوجه بعد تدريب النموذج على CelebA dataset.
سنتناول:
• شرح فكرة الـ VAE والفرق عن Autoencoder العادي
• فهم الـ Encoder و Decoder بالتفصيل
• ما هو Latent Space وكيف يتم تنظيمه Gaussian باستخدام KL Divergence
• استخدام الـ Latent Directions لتعديل الصور (happy / sad / pose)
• شرح طبقات Linear و Convolution و Transposed Convolution
• شرح دالة الخسارة (Reconstruction L2 norm loss + Kullback Leibler Divergence)
• كتابة كود VAE كامل من الصفر باستخدام PyTorch
• تدريب نموذج لتوليد الوجوه باستخدام CelebA
• اختبار النموذج وتوليد وجوه جديدة
• تعديل الصور داخل الـ Latent Space باعتبارها Vectors in vector space
هذا الفيديو مناسب لمستخدمي Generative AI ليتعرفو على مفهوم الVAE الذي يستخدمونه في ComfyUI وغيرها من أدوات إنشاء المحتوى. وهو أيضاً لمهندسي وطلاب الAI الذين يريدون فهم Generative Models و Representation Learning بشكل عملي.
links:
Github repo: https://github.com/arab-future-academy/deep_dive_in_gen_ai
CelebFaces(CelebA) Dataset: https://www.kaggle.com/datasets/jessicali9530/celeba-dataset
ComfyUI intro to motivate the need for VAE: https://www.youtube.com/watch?v=SDg0AbqwRvg&list=PLa_45zxyaspH71syIG8SAqaaQkSnXSPKk&index=15
Auto-Encoding Variational Bayes paper by Kingma and Welling: https://arxiv.org/abs/1312.6114

══════════════════════════════
Timeline:
00:00 Introduction
00:29 Variational autoencode (VAE) in few words
01:08 Two parts of the video
02:19 Video contents
03:16 Architecture of the Variational Autoencoder (VAE)
03:20 The encoder
04:04 The decoder
04:53 The faces VAE written in this video including encoder and decoder layers
09:17 Uses and importance of teh VAE (Content generation and latent space image editing)
12:21 Tool for computing directions in the latent space such as (happy or sad and so on)
14:21 Editing images in the latent space using computed directions
15:17 making faces happier/sader or changing the direction of the face
17:06 Linear neural networks layers
18:14 Convolutional neural networks layers
19:44 Transposed Convolutional Layers
20:37 Loss function (reconstruction error, L2 Norm or Binary cross entropy)
21:55 Kullback-Leibler Divergence to make the latent space Gaussian
23:00 VAE code from scratch using pytorch to encode and decode faces
34:43 Training and testing code walkthrough for the VAE
41:48 CelebA dataset path and running the training script
42:47 Training output the model and the test images
══════════════════════════════

Видео ما هو Variational Autoencoder (VAE)؟ شرح الـ Latent Space + توليد وتعديل الوجوه باستخدام PyTorch канала Arabic Future Academy

Комментарии отсутствуют

Информация о видео

9 апреля 2026 г. 18:30:15

00:43:42

Arabic Future Academy

Теги

Правообладателям

Жалоба на материал Недопустимый материал Нарушение авторских прав

Комментарии

Другие видео канала

ما هو Variational Autoencoder (VAE)؟ شرح الـ Latent Space + توليد وتعديل الوجوه باستخدام PyTorch

هل يمكن بناء تطبيق فيديو كامل بالذكاء الاصطناعي بدون خبرة برمجية باستخدام Gemini CLI؟

🚀 تثبيت ComfyUI مع واجهة عربية وإنشاء أول صورة في دقائق

من فكرة إلى فيديو 🎆 | إنشاء فيديو رأس السنة بالذكاء الاصطناعي (ComfyUI Tutorial, ollama qwen wan2.2)

الدليل الكامل لـ LTX 2.3: صناعة فيديو من نص وصورة وصوت داخل ComfyUI بسهولة ببرومت احترافي ومفصل

شرح LTX 2.3 في ComfyUI | ID LoRA + FLF2V + Transition LoRA بالكامل وحالات استخدامها وتفاصيل البرومت

ComfyUI Crystools Nodes عقد متقدمة لمراقبة النظام وتبسيط التصميم

شرح SCAIL في ComfyUI: تحريك عدة شخصيات ومقارنة مع SteadyDancer | أفضل موديل للأنيميشن

شرح تكبير الفيديو بالذكاء الاصطناعي في ComfyUI مع مقارنة أقوى 3 موديلات من حيث السرعة والأداء

أفضل طريقة لتوليد صوت عربي في ComfyUI باستخدام Chatterbox (مع استنساخ الصوت وسرد القصص)

إنشاء بطاقة معايدة بالذكاء الصنعي ComfyUI وبرامج مفتوحة المصدر. تهنئة عيد الميلاد 🎅 فيديو قصير مذهل

أقوى ذكاء اصطناعي لتعديل الصور Qwen 2509 – غيّر الملابس والعمر والمواقف بسهولة!

ComfyUI + Wan 2.2: أفضل طريقة للتحكم بالكاميرا | شرح بالعربي

إنشاء فيديوهات AI من النص والصورة باستخدام LTX | موديل صغير يناسب جميع الأجهزة وسير عمل كومفي يو أي

شرح Ollama ودمجه مع ComfyUI لإنشاء برومبتات نص وصورة (LLM & Vision)

دبلجة الفيديوهات من الإنجليزية إلى العربية باستخدام الذكاء الاصطناعي | ComfyUI + Whisper + Pyannote

ComfyUI بالعربي: دليل سريع للملفات وكتابة البرومبت

شرح WAN2.2 Rapid AIO | توليد فيديو من نص وصورة بسرعة وعلى كرت شاشة ضعيف

سير عمل صورة إلى فيديو باستخدام كومفي يو أي

RVC vs Seed VC شرح تحويل الصوت | AI Voice Conversion + Realtime + تدريب موديل صوت

تحريك الشخصيات بالذكاء الاصطناعي 🎥 Wan 2.1 SteadyDancer vs Wan 2.2 | شرح كامل