In uralten Spielen wie Schach oder Go können sich die brillantesten Spieler verbessern indem
sie die von einer Maschine produzierten Strategien studieren. Robotische Systeme üben ihre
Bewegungen selbst. In Arcade Games erreichen lernfähige Agenten innerhalb weniger Stunden
übermenschliches Niveau. Wie funktionieren diese spektakulären Algorithmen des bestärkenden
Lernens? Mit gut verständlichen Erklärungen und übersichtlichen Beispielen in Java und
Greenfoot können Sie sich die Prinzipien des bestärkenden Lernens aneignen und in eigenen
intelligenten Agenten anwenden. Greenfoot (M.Kölling King¿s College London) und das
Hamster-Modell (D.Bohles Universität Oldenburg) sind einfache aber auch mächtige didaktische
Werkzeuge die entwickelt wurden um Grundkonzepte der Programmierung zu vermitteln. Wir werden
Figuren wie den Java-Hamster zu lernfähigen Agenten machen die eigenständig ihre Umgebung
erkunden. Die zweite Auflage enthält neue Themen wie "Genetische Algorithmen" und "Künstliche
Neugier" sowie Erklärungen zu aktuellen Algorithmen wie A3C und PPO (wurde u.a. für das
Finetuning von ChatGPT verwendet) außerdem Korrekturen und Überarbeitungen.