Hoppa till huvudinnehållet
Till KTH:s startsida

FDD3359 Reinforcement Learning 6,0 hp

Information per kursomgång

Kursomgångar saknas för aktuella eller kommande terminer.

Kursplan som PDF

Notera: all information från kursplanen visas i tillgängligt format på denna sida.

Kursplan FDD3359 (VT 2019–)
Rubriker med innehåll från kursplan FDD3359 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Följade områden kommer bland annat att behandlas:

Reinforcement learning med kända och okända modeller, diskreta och kontinuerliga dynamiska system,   Markov process formalism, Bellman optimality principle, exakta och approximativa algoritmer, konvergens bevis, action policies, MDPs, discounted MDPs, POMDPs, reinforcement learning med temporal difference, Monte Carlo, och Q-learning.

I kursen ingår också moment där studeter ska förberedda en föreläsning samt utveckla en laboration där andra studenter medverkar.

Lärandemål

Kursen ger en introduktion till området reinforcement learning. Målet är att studenter ska bekantas med olika metoder som avänds för inlärning baserat pååterkoppling.

Efter genomförd kurs ska du kunna:

* identifiera grundläggande begrepp, terminologi, teorier, modeller och metoder inom reinforcement learning

* utveckla och systematiskt testa ett antal grundläggande metoder inom reinforcement learning

* experimentellt utvärdera olika inlärningsalgoritmer och tolka och dokumentera resultat av experimentella undersökningar

* välja lämplig metod för att automatiskt bearbeta olika typer av data som tex sensordata som används i styrningsalgoritmer

* redogöra för grundläggande metoder och begränsningar inom reinforcement learning

* bygga en verktygslåda av olika algoritmer och kunna tillämpa dessa på verkliga problem

för att

* känna till grundläggande möjligheter och begränsningar för reinforcement learning och därmed kunna bedöma vilka problem inom t.ex. robot rörelsereglering och automatiskt beslutsfattande som kan lösas med dessa tekniker

* kunna implementera, analysera och utvärdera enkla system baserat på reinforcement learning

* ha en bred kunskapsbas för att kunna läsa och tillgodogöra sig litteratur inom området.

Kurslitteratur och förberedelser

Särskild behörighet

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

P, F

Examination

  • EXA1 - Examination, 6,0 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

SEM1 (4hp, P/F), PRO1 (2hp, P/F)

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Denna kurs tillhör inget huvudområde.

Utbildningsnivå

Forskarnivå

Påbyggnad

Ingen information tillagd

Kontaktperson

Johannes Stork

Forskarkurs

Forskarkurser på EECS/Robotik, perception och lärande