Kursen ger en introduktion till teorin för statistisk inferens och prediktion, vilka utgör de grundläggande målen för modern statistisk dataanalys och maskininlärning. Stor vikt ges åt flerdimensionella sannolikhetsfördelningar och exponentialfamiljer, vilka är fundamentala verktyg för att modellera dataanalytiska problem, och med hjälp av grafiska modeller erhålls en kraftfull teori för att beskriva betingade beroenden med bäring på statistiska inferensproblem av hög dimension. Beslutsteori ger ett ramverk för att dels fatta optimala beslut under statistisk osäkerhet, dels väga olika statistiska tillvägagångssätt mot varandra. Speciellt spelar Bayesiansk beslutsteori – i vilken inferens- och inlärningsproblemen löses genom beräknandet av posteriorifördelningar respektive prediktiva fördelningar – idag en central roll inom statistisk dataanalys och används för att konstruera Bayesianska punktskattningar, hypotestest och kredibilitetsintervall. Parallellt med det Bayesianska synsättet diskuteras även likelihood-teori och i synnerhet maximum likelihood-skattningens asymptotiska egenskaper då mängden data växer mot oändligheten. I kursen introduceras även grundläggande statistiska beräkningsmetoder, såsom stokastiska gradientmetoder och Markovkedjemetoder (MCMC). Sådana metoder är av stor betydelse inom modern datorintensiv statistik och tillämpas i kursen på verkliga dataanalytiska problem inom ramen för ett datorbaserat projekt.
SF1930 Statistisk inlärning och dataanalys 6,0 hp
Kursen ger en introduktion till teorin för modern statistisk inferens och inlärning.
Information per kursomgång
Information för HT 2024 Start 2024-08-26 programstuderande
- Studielokalisering
KTH Campus
- Varaktighet
- 2024-08-26 - 2024-10-27
- Perioder
- P1 (6,0 hp)
- Studietakt
50%
- Anmälningskod
52123
- Undervisningsform
Normal Dagtid
- Undervisningsspråk
Svenska
- Kurs-PM
- Kurs-PM är inte publicerat
- Antal platser
Ingen platsbegränsning
- Målgrupp
Endast CTMAT åk2
- Planerade schemamoduler
- [object Object]
- Schema
Kontakt
Kursplan som PDF
Notera: all information från kursplanen visas i tillgängligt format på denna sida.
Kursplan SF1930 (HT 2021–)Innehåll och lärandemål
Kursinnehåll
Lärandemål
Efter avslutad kurs ska studenten kunna:
- formulera och tillämpa begrepp inom statistisk inferens och prediktion för att lösa teoretiska problem;
- formulera och tillämpa metoder inom statistisk inferens och prediktion för att lösa problem inom dataanalys;
- utforma och implementera metoder inom statistisk inlärning för dataanalys.
Kurslitteratur och förberedelser
Särskild behörighet
Slutförd grundkurs i sannolikhetsteori och statistik (SF1918, SF1922 eller motsvarande).
Utrustning
Kurslitteratur
Meddelas senast 4 veckor före kursstart på kursens hemsida.
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
Examination
- INL1 - Inlämningsuppgift, 2,0 hp, betygsskala: P, F
- TEN1 - Skriftlig tentamen, 4,0 hp, betygsskala: A, B, C, D, E, FX, F
Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
Möjlighet till komplettering
Möjlighet till plussning
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.
Ytterligare information
Kursrum i Canvas
Ges av
Huvudområde
Utbildningsnivå
Påbyggnad
- SF2930 Regressionsanalys
- SF2935 Moderna metoder för statistisk inlärning
- SF2955 Datorintensiva metoder inom matematisk statistik
- SF2957 Statistisk maskininlärning