Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга – первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.
Для аналитиков данных и специалистов по искусственному интеллекту.
Чтобы оставить свою оценку и/или комментарий, Вам нужно войти под своей учетной записью или зарегистрироваться
Пока никто не оставил впечатление о книге...
Пока никто не оставил цитат из этой книги...
Автор | Денис Балуев |
Жанр | Интернет, Сети и коммуникации, Программы и утилиты для цифровых устройств, Компьютерные технологии |
Год | 2010 |
Автор | Алексей Гладкий |
Жанр | Бухучет и аудит, Программы и утилиты для цифровых устройств, Компьютерные технологии |
Год | 2012 |
Автор | freeduino.ru/arduino/isp.html |
Жанр | Аппаратное обеспечение, Программы и утилиты для цифровых устройств, Компьютерные технологии |
Автор | (2) Эльвира Вашкевич |
Жанр | Программы и утилиты для цифровых устройств, Компьютерные технологии |
Год | 2008 |
Автор | Владимир Вуль |
Жанр | Интернет, Сети и коммуникации, Программы и утилиты для цифровых устройств, Компьютерные технологии |
Год | 2003 |
Автор | Алексей Гультяев |
Жанр | Операционные системы и утилиты для ПК, Программы и утилиты для цифровых устройств, Компьютерные технологии |
Год | 2006 |