Ämnen:
• Distribuerade filsystem
• “No-SQL”-databaser
• Skalbara meddelandesystem
• Exekveringsmaskiner för Big Data: Map-Reduce, Spark
• Högnivå-frågor och interaktiv bearbetning: Hive och Spark SQL
• Stream processing
• Graph processing
• Skalbar maskininlärning
• Resurshantering.
FID3019 Avancerad kurs i data-intensiv databehandling 7,5 hp
Information per kursomgång
Information för HT 2024 Start 2024-08-26 programstuderande
- Studielokalisering
KTH Kista
- Varaktighet
- 2024-08-26 - 2024-10-27
- Perioder
- P1 (7,5 hp)
- Studietakt
50%
- Anmälningskod
51307
- Undervisningsform
Normal Dagtid
- Undervisningsspråk
Engelska
- Kurs-PM
- Kurs-PM är inte publicerat
- Antal platser
Ingen platsbegränsning
- Målgrupp
- Ingen information tillagd
- Planerade schemamoduler
- [object Object]
- Schema
- Del av program
- Ingen information tillagd
Kontakt
Kursplan som PDF
Notera: all information från kursplanen visas i tillgängligt format på denna sida.
Kursplan FID3019 (VT 2019–)Information för forskarstuderande om när kursen ges
On a yearly basis during the fall semester (period 1)
Innehåll och lärandemål
Kursinnehåll
Lärandemål
Kursen kompletterar kurserna i distribuerade system med ett fokus på bearbetning, lagring och analys av massiva datamängder. Den förbereder studenterna på forskarutbildning inom området data-intensive computing systems.
Huvudsyftet med denna kurs är att erbjuda studenten en solid grund för att förstå storskaliga distribuerade system som används för att lagra och bearbeta massiva datamängder.
Mer specifikt kommer studenter efter avslutad kurs att kunna
• förklara arkitekturen och de egenskaper hos datorsystem som behövs för att lagra, utsöka och indexera stora datavolymer
• beskriva olika beräkningsmodeller för att bearbeta stora datamängder för statiska data (batchbearbetning) och för data i rörelse (stream processing)
• använda olika beräkningssystem för design och implementation av icke-triviala analysmetoder på massiva data
• förklara olika modeller för att schemalägga och allokera resurser för beräkningsuppgifter på stora datorkluster
• förklara avvägningarna som görs vid design av effektiva algoritmer för att bearbeta stora datamängder i en distribuerad beräkning.
Kurslitteratur och förberedelser
Särskild behörighet
Inskriven som forskarstuderande.
Rekommenderade förkunskaper
Rekommenderade förkunskaper: Grundkunskaper inom distribuerade system och programmeringsmodeller, programmeringsspråk (Scala, Java, Python).
Utrustning
Kurslitteratur
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
Examination
- EXA1 - Examination, 7,5 hp, betygsskala: P, F
Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
P/F
Övriga krav för slutbetyg
Kursen betygsätts med skalan P/F (godkänd/icke godkänd), baserat på en godkänd presentation, levererandet av en vetenskapligt sund rapport och identifieringen av lämpliga artiklar för läslistan. Dessförutan måste studenten delta i minst 75% av kursens seminarier
Möjlighet till komplettering
Möjlighet till plussning
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.