Алгоритмы обучения с подкреплением на Python 21601

Ця книга допоможе читачеві оволодіти алгоритмами навчання з підкріпленням (ВП) і навчитися реалізовувати їх при створенні самонавчаючих агентів.

У першій частині розглядаються різні елементи ОП, сфера його застосування, інструменти, необхідні для роботи в середовищі ОП. Друга і третя частини присвячені безпосередньо алгоритмами. Серед іншого автор показує, як поєднувати Q-навчання з нейронними мережами для вирішення складних завдань, описує методи градієнта стратегії, TRPO і PPO, що дозволяють підвищити продуктивність і стійкість, а також детерміновані алгоритми DDPG і TD3. Читач дізнається про те, як працює техніка подражательного навчання, познайомиться з алгоритмами дослідження на базі верхньої довірчої межі (UCB і UCB1) і мета-алгоритмом ESBAS.

Видання призначене для тих, хто цікавиться дослідженнями в області штучного інтелекту, застосовує в роботі глибоке навчання або хоче освоїти навчання з підкріпленням з нуля. Обов'язкова умова – володіння мовою Python на робочому рівні.

  • Автор
    Андреа Лонца
  • Категорія
    Програмування
  • Мова
    Російська
  • Рік
    2020
  • Сторінок
    286
  • Формат
    170х240 мм
  • Обкладинка
    Тверда
  • Тип паперу
    Офсетний
  • Ілюстрації
    Кольорові
  • Перекладач
    А. Слинкин
1000 ₴
Купити
Відділення Нова Пошта80 ₴
Поштомат Нова Пошта40 ₴
Кур’єр Нова Пошта120 ₴
Відділення УкрПошта50 ₴
Кур’єр за адресою90 ₴
Алгоритмы обучения с подкреплением на Python - фото 1
21601
Залиште свій відгук про книгу,
допоможіть тим, хто ще не читав