9783747500361 - Deep Reinforcement Learning - Maxim Lapan Kartoniert (TB)

EAN: 9783747500361

Produktdaten aktualisiert am: 20.11.2024
Bilder-Quelle: discount24.de - Sport-Freizeit
Loading
Hersteller: - Hersteller-ArtNr. (MPN): - ASIN: -

Alle wichtigen Methoden und Algorithmen praxisnah erläutert mit Codebeispielen in Python Selbstständig lernende Agenten programmieren für die Steuerung von Robotern NLP in interaktiven Spielen Chatbots und mehr Deep Q-Networks Wertiteration Policy Gradients Trust Region Policy Optimization (TRPO) genetische Algorithmen moderne Explorationsverfahren u.v.m. Reinforcement Learning ist ein Teilgebiet des Machine Learnings. Hierbei werden selbstständig lernende Agenten programmiert deren Lernvorgang ausschließlich durch ein Belohnungssystem und die Beobachtung der Umgebung gesteuert wird. In diesem umfassenden Praxis-Handbuch zeigt Ihnen Maxim Lapan wie Sie diese zukunftsweisende Technologie in der Praxis einsetzen. Sie lernen wie Sie passende RL-Methoden für Ihre Problemstellung auswählen und mithilfe von Deep-Learning-Methoden Agenten für verschiedene Aufgaben trainieren wie zum Beispiel für das Lösen eines Zauberwürfels für Natural Language Processing in Microsofts TextWorld-Umgebung oder zur Realisierung moderner Chatbots. Alle Beispiele sind so gewählt dass sie leicht verständlich sind und Sie diese auch ohne Zugang zu sehr großer Rechenleistung umsetzen können. Unter Einsatz von Python und der Bibliothek PyTorch ermöglicht Ihnen der Autor so einen einfachen und praktischen Einstieg in die Konzepte und Methoden des Reinforcement Learnings wie Deep Q-Networks Wertiteration Policy Gradients Trust Region Policy Optimization (TRPO) genetische Algorithmen und viele mehr. Es werden grundlegende Kenntnisse in Machine Learning und Deep Learning sowie ein sicherer Umgang mit Python vorausgesetzt.Aus dem Inhalt: Implementierung komplexer Deep-Learning-Modelle mit RL in tiefen neuronalen Netzen Ermitteln der passenden RL-Methoden für verschiedene Problemstellungen darunter DQN Advantage Actor Critic PPO TRPO DDPG D4PG und mehr Bauen und Trainieren eines kostengünstigen Hardware-Roboters NLP in Microsofts TextWorld-Umgebung für interaktive Spiele Diskrete Optimierung für das Lösen von Zauberwürfeln Trainieren von Agenten für Vier Gewinnt mittels AlphaGo Zero Die neuesten Deep-RL-Methoden für Chatbots Moderne Explorationsverfahren wie verrauschte Netze und Netz-Destillation

Produktzustand:

Verfügbarkeit:

Versandkosten:

Sonderpreis:

Loading
Barcode:
9783747500361
QR-Code:
Sie sind Shopbetreiber? Listen Sie ganz einfach Ihre Produkte hier bei uns im Portal >>>