درباره

وبینار مبانی و مقدمات یادگیری تقویتی

آیا تا به حال به این فکر کرده‌اید که چطور یک ربات می‌تواند یاد بگیرد راه برود، یک عامل هوشمند در بازی Atari یا شطرنج از انسان جلو بزند، یا الگوریتم‌های ترید خودکار بدون نظارت مستقیم انسان تصمیم‌های سودآور بگیرند؟
پشت همه‌ی این دستاوردها، یادگیری تقویتی (Reinforcement Learning) قرار دارد. شاخه‌ای هیجان‌انگیز از هوش مصنوعی که در آن «تجربه» به دانش تبدیل می‌شود.

در این وبینار، با زبانی ساده و مثال‌های عملی، شما را قدم‌به‌قدم با مفاهیم و تکنیک‌های بنیادین RL آشنا می‌کنیم. از مروری بر مفاهیم پایه‌ی هوش مصنوعی و یادگیری ماشینی آغاز می‌کنیم و سپس به سراغ چارچوب اصلی یادگیری تقویتی، اجزای کلیدی آن (عامل، محیط، پاداش و سیاست)، و الگوریتم‌های مهمی مانند Q-Learning و SARSA می‌رویم.
در ادامه، تفاوت و ارتباط روش‌های Dynamic Programming، Monte Carlo و Temporal-Difference را بررسی کرده و خواهید دید هرکدام در چه موقعیت‌هایی کاربرد دارند.با شرکت در این وبینار، یاد می‌گیرید چطور یک عامل هوشمند را طوری طراحی کنید که خودش یاد بگیرد تصمیم بگیرد.

 
 

🤖

مزایای

وبینار مبانی و مقدمات یادگیری تقویتی

دریافت گواهی شرکت در کارگاه

گواهی انگلیسی زبان و قابل استعلام در پایان رویداد به شما داده خواهد شد.

دسترسی همیشگی به محتوای وبینار

ویدیوی وبینار ضبط میشود و در اختیار شما قرار می‌گیرد.

عضویت در کامیونیتی

با شرکت در این وبینار در کامیونیتی تخصصی ما عضو می‌شوید که در آن میتوانید به مدرس این وبینار و دیگر وبینارها دسترسی مستقیم داشته باشید.

مخاطبین

وبینار مبانی و مقدمات یادگیری تقویتی

دانشجویان و پژوهشگران هوش مصنوعی

اگر در رشته‌های هوش مصنوعی، علوم داده یا مهندسی کامپیوتر تحصیل می‌کنید، این وبینار فرصتی است تا پایه‌های یادگیری تقویتی را به‌صورت مفهومی و عملی یاد بگیرید و مسیر ورود به تحقیقات Deep RL را بشناسید.

برنامه‌نویسان و علاقه‌مندان به Python

کسانی که با پایتون آشنا هستند و می‌خواهند بدانند چطور می‌توان با چند خط کد، الگوریتم‌های RL مثل Q-Learning یا SARSA را پیاده‌سازی و آزمایش کرد، از این جلسه بیشترین بهره را می‌برند.

متخصصان داده و یادگیری ماشینی

اگر در حال حاضر با مدل‌های یادگیری نظارت‌شده و بدون‌نظارت کار می‌کنید، این وبینار به شما کمک می‌کند تا درک کنید RL چطور می‌تواند تصمیم‌گیری‌های هوشمند و تطبیقی را به پروژه‌هایتان اضافه کند.

علاقه‌مندان به کاربردهای عملی هوش مصنوعی

از بازی‌های ویدیویی تا رباتیک، کنترل هوشمند و معاملات خودکار، یادگیری تقویتی ستون فقرات بسیاری از پیشرفت‌های اخیر است. این وبینار دیدی واقعی از کاربردها و مسیر یادگیری آینده به شما می‌دهد.

مدرس‌ها و منتورها

وبینار مبانی و مقدمات یادگیری تقویتی

امیررضا بابااحمدی

امیررضا بابااحمدی

زمانبندی رویداد

وبینار مبانی و مقدمات یادگیری تقویتی

  • بخش تئوری 29 آبان 1404
  • بخش عملی 29 آبان 1404
بخش تئوری 29 آبان 1404
1
امیررضا بابااحمدی

مروری بر مفاهیم پایه هوش مصنوعی و یادگیری ماشینی

‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌
2
امیررضا بابااحمدی

تعریف و چارچوب کلی یادگیری تقویتی (RL Framework)

3
امیررضا بابااحمدی

محیط، عامل، پاداش و سیاست (Environment, Agent, Reward, Policy)

‌‌‌‌‌‌‌‌‌‌‌‌
4
امیررضا بابااحمدی

مفاهیم پیشرفته‌تر

مروری بر Dynamic Programming (DP) | الگوریتم‌های Value Iteration و Policy Iteration | روش‌های Monte Carlo در یادگیری تقویتی | الگوریتم‌های Temporal-Difference (TD Learning)
بخش عملی 29 آبان 1404
1
امیررضا بابااحمدی

معرفی و پیاده‌سازی الگوریتم SARSA

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌
2
امیررضا بابااحمدی

معرفی و پیاده‌سازی الگوریتم Q-Learning

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌
3
امیررضا بابااحمدی

مقایسه روش‌های Monte Carlo، TD و DP

‌‌‌‌‌‌‌‌
4
امیررضا بابااحمدی

چالش‌ها و کاربردهای عملی یادگیری تقویتی، جمع‌بندی و مسیر یادگیری پیشرفته (Deep RL)

‌‌‌‌‌‌‌‌

اطلاعات مهم

وبینار مبانی و مقدمات یادگیری تقویتی

تاریخ شروع: 1404/08/29

  • شماره پشتیبانی: 09934601284
  • روش ثبت نام: آنلاین
  • محل برگزاری : گوگل میت پریمیوم
  • مدت زمان رویداد : 3 ساعت
  • تایم : 18 تا 21
  • تاریخ شروع : 1404/08/29
  • تاریخ پایان : 1404/08/29
  • ظرفیت : 100
  • برگزار کننده : شبکه آموزشی بِست | be5t.ir
 
 

🤖