آیا تا به حال به این فکر کردهاید که چطور یک ربات میتواند یاد بگیرد راه برود، یک عامل هوشمند در بازی Atari یا شطرنج از انسان جلو بزند، یا الگوریتمهای ترید خودکار بدون نظارت مستقیم انسان تصمیمهای سودآور بگیرند؟
پشت همهی این دستاوردها، یادگیری تقویتی (Reinforcement Learning) قرار دارد. شاخهای هیجانانگیز از هوش مصنوعی که در آن «تجربه» به دانش تبدیل میشود.
در این وبینار، با زبانی ساده و مثالهای عملی، شما را قدمبهقدم با مفاهیم و تکنیکهای بنیادین RL آشنا میکنیم. از مروری بر مفاهیم پایهی هوش مصنوعی و یادگیری ماشینی آغاز میکنیم و سپس به سراغ چارچوب اصلی یادگیری تقویتی، اجزای کلیدی آن (عامل، محیط، پاداش و سیاست)، و الگوریتمهای مهمی مانند Q-Learning و SARSA میرویم.
در ادامه، تفاوت و ارتباط روشهای Dynamic Programming، Monte Carlo و Temporal-Difference را بررسی کرده و خواهید دید هرکدام در چه موقعیتهایی کاربرد دارند.با شرکت در این وبینار، یاد میگیرید چطور یک عامل هوشمند را طوری طراحی کنید که خودش یاد بگیرد تصمیم بگیرد.