Глубокое обучение с подкреплением. AlphaGo и другие технологии - Лапань М.

Артикул:5775587

ISBN:
978-5-4461-1079-7

Автор:
Лапань М.

Издательство:
Питер Издательский дом

Количество страниц:
496

Название:
Глубокое обучение с подкреплением. AlphaGo и другие технологии

Серия:
Для профессионалов

Глубокое обучение с подкреплением. AlphaGo и другие технологии - Лапань М.

2 655,00 руб.

Проверить наличие и купить по самой выгодной цене:

Узнать цену и купить в Book24.ru   Узнать цену и купить в Book24.ru 

Узнать цену и купить в Лабиринте    Узнать цену и купить в Лабиринте 

Узнать цену и купить в My-Shop.ru   Узнать цену и купить в My-Shop.ru 

Узнать цену и купить в Читай-Город  Узнать цену и купить в Читай-Город

Узнать цену и купить в Book24.ru    Узнать цену и купить в Book24.ru  

Узнать цену и купить в Буквоед      Узнать цену и купить в Буквоед   

Узнать цену и купить в ЛитРес       Узнать цену и купить в ЛитРес    


Товар можно купить в книжных интернет-магазинах, указанных выше.
Цена при переходе на сайт интернет-магазина может отличаться как в большую, так и в меньшую сторону! Указанная цена была актуальна на дату последнего обновления каталога.

Реклама. Рекламодатель ООО "Лабиринт.Ру" / ИНН 7728644571 / Labirint.ru / Erid: 2VtzqwQYCqU

Реклама. Рекламодатель ООО "Магазин книг" / ИНН 9725076959 / My-shop.ru / Erid: AX1LYwMgKUvoDX6y

Реклама. Рекламодатель ООО "Новый Книжный Центр" / ИНН 7710422909 / Chitai-gorod.ru / Erid: 2Vtzqufp5tz

Реклама. Рекламодатель ООО "Новый Книжный Центр" / ИНН 7710422909 / Book24.ru / Erid: 2VtzqvPNRe6

Реклама. Рекламодатель ООО "Новый Книжный Центр" / ИНН 7710422909 / Bookvoed.ru / Erid: LatgBqrsQ

Реклама. Рекламодатель ООО "Литрес" / ИНН 7719571260 / Litres.ru / Erid: 2Vtzqx9kwnn

Реклама. Рекламодатель ООО "Клевер-Медиа-Групп" / ИНН 7717567452 / Clever-media.ru / Erid: LatgBnRdu
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.
ISBN
978-5-4461-1079-7
Автор
Лапань М.
Издательство
Питер Издательский дом
Количество страниц
496
Название
Глубокое обучение с подкреплением. AlphaGo и другие технологии
Серия
Для профессионалов
 
Хотите купить ещё дешевле? Используйте секретное слово Лабиринт и получите дополнительную скидку!
Все кодовые слова и акции Лабиринта можно найти

<<< НА ЭТОЙ СТРАНИЦЕ >>>