Följade områden kommer bland annat att behandlas:
Reinforcement learning med kända och okända modeller, diskreta och kontinuerliga dynamiska system, Markov process formalism, Bellman optimality principle, exakta och approximativa algoritmer, konvergens bevis, action policies, MDPs, discounted MDPs, POMDPs, reinforcement learning med temporal difference, Monte Carlo, och Q-learning.
I kursen ingår också moment där studeter ska förberedda en föreläsning samt utveckla en laboration där andra studenter medverkar.
Kursen ger en introduktion till området reinforcement learning. Målet är att studenter ska bekantas med olika metoder som avänds för inlärning baserat pååterkoppling.
Efter genomförd kurs ska du kunna:
* identifiera grundläggande begrepp, terminologi, teorier, modeller och metoder inom reinforcement learning
* utveckla och systematiskt testa ett antal grundläggande metoder inom reinforcement learning
* experimentellt utvärdera olika inlärningsalgoritmer och tolka och dokumentera resultat av experimentella undersökningar
* välja lämplig metod för att automatiskt bearbeta olika typer av data som tex sensordata som används i styrningsalgoritmer
* redogöra för grundläggande metoder och begränsningar inom reinforcement learning
* bygga en verktygslåda av olika algoritmer och kunna tillämpa dessa på verkliga problem
för att
* känna till grundläggande möjligheter och begränsningar för reinforcement learning och därmed kunna bedöma vilka problem inom t.ex. robot rörelsereglering och automatiskt beslutsfattande som kan lösas med dessa tekniker
* kunna implementera, analysera och utvärdera enkla system baserat på reinforcement learning
* ha en bred kunskapsbas för att kunna läsa och tillgodogöra sig litteratur inom området.