توضیحات
هوش مصنوعی در جاوا قسمت چهارم: یادگیری تقویت شده
نام دوره : Artificial Intelligence IV – Reinforcement Learning in Java
پیش نیاز های دوره به ترتیب زیر پیشنهاد می شود:
هوش مصنوعی در جاوا قسمت اول:الگوریتم های فرا ابتکاری
هوش مصنوعی در جاوا قسمت دوم: شبکه های عصبی
هوش مصنوعی در جاوا قسمت سوم: یادگیری عمیق
توضیحات:
اين دوره در مورد يادگيري تقويتي است. اولين قدم صحبت در مورد پيشينه رياضي است: ما مي توانيم از فرآيند تصميم گيري مارکوف به عنوان مدلي براي يادگيري تقويتي استفاده کنيم.
ما مي توانيم مشکل را از 3 راه حل کنيم: تکرار ارزش، تکرار سياست و يادگيري Q.
يادگيري Q يک رويکرد بدون مدل است، بنابراين رويکردي پيشرفته است. سياست بهينه را با تعامل با محيط مي آموزد.
بنابراين اين موضوعات هستند:
- فرآيندهاي تصميم گيري مارکوف
- ارزش-تکرار و سياست-تکرار
- اصول يادگيري کيو
- الگوريتم هاي مسيريابي با يادگيري Q
- يادگيري Q با شبکه هاي عصبي
دوره هوش مصنوعی در جاوا قسمت چهارم: یادگیری تقویت شده براي چه کساني است:
- هر کسي که مي خواهد هوش مصنوعي و يادگيري تقويتي را بفهمد
نقد و بررسیها
هنوز بررسیای ثبت نشده است.