Глубокое обучение с подкреплением. AlphaGo и другие технологии 30004
Ця книга - докладне керівництво по новітніх інструментів DL та їх обмежень. Ви оціните на практиці такі методи, як крос-ентропія і градієнти по стратегіям, а потім навчитеся застосовувати їх. Поупражняетесь і з колекцією віртуальних ігор від Atari, і з сучасними фаворитами, наприклад Connect4. Максим Лапан підготував прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчальні агенти, здатні вирішувати колосальне безліч прикладних задач.
Почніть впроваджувати Q-навчання в середовищах класу grid world, навчіть вашого агента торгувати на біржі, дізнайтеся, як моделі обробки природної мови призвели до вибухового поширення чат-ботів.
В цій книзі
- Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
- Освоїте базовий рівень RL: марковські процеси прийняття рішень
- Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін
- Дізнаєтеся, як працювати з дискретними і безперервними просторами дій у різних середовищах
- Навчитеся перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
- Створите власну середу по моделі OpenAI Gym для навчання біржового агента
- Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
- Познайомитеся з новітніми дослідженнями в області глибокого навчання, стосуються розробки чат-ботів
- АвторМаксим Лапан
- КатегоріяПрограмування
- МоваРосійська
- Рік2020
- Сторінок496
- Формат170х240 мм
- ОбкладинкаМ'яка
- Тип паперуОфсетний
- ІлюстраціїЧорно-білі
- СеріяДля профессионалов
680 ₴
Відділення Нова Пошта80 ₴
Поштомат Нова Пошта40 ₴
Кур’єр Нова Пошта120 ₴
Відділення УкрПошта50 ₴
Кур’єр за адресою90 ₴
допоможіть тим, хто ще не читав