Алгоритмы обучения с подкреплением на Python 21601
Ця книга допоможе читачеві оволодіти алгоритмами навчання з підкріпленням (ВП) і навчитися реалізовувати їх при створенні самонавчаючих агентів.
У першій частині розглядаються різні елементи ОП, сфера його застосування, інструменти, необхідні для роботи в середовищі ОП. Друга і третя частини присвячені безпосередньо алгоритмами. Серед іншого автор показує, як поєднувати Q-навчання з нейронними мережами для вирішення складних завдань, описує методи градієнта стратегії, TRPO і PPO, що дозволяють підвищити продуктивність і стійкість, а також детерміновані алгоритми DDPG і TD3. Читач дізнається про те, як працює техніка подражательного навчання, познайомиться з алгоритмами дослідження на базі верхньої довірчої межі (UCB і UCB1) і мета-алгоритмом ESBAS.
Видання призначене для тих, хто цікавиться дослідженнями в області штучного інтелекту, застосовує в роботі глибоке навчання або хоче освоїти навчання з підкріпленням з нуля. Обов'язкова умова – володіння мовою Python на робочому рівні.
- АвторАндреа Лонца
- КатегоріяПрограмування
- МоваРосійська
- Рік2020
- Сторінок286
- Формат170х240 мм
- ОбкладинкаТверда
- Тип паперуОфсетний
- ІлюстраціїКольорові
- ПерекладачА. Слинкин
допоможіть тим, хто ще не читав