- Introduktion till datautvinning
- Frekventa Itemmängder
- Att hitta liknande enheter
- Klustring
- Rekommendationssystem
- Datautvinning från strömmar
- Dimensionalitetsreduktion
- Storskalig maskininlärning
ID2222 Datautvinning 7,5 hp
![](https://kursinfostorageprod.blob.core.windows.net/kursinfo-image-container/Picture_by_MainFieldOfStudy_03_Computer_Science.jpg)
Om kursomgång
Gäller för kursomgång
HT 2024 Start 2024-10-28 programstuderande
Målgrupp
Öppen för alla program under förutsättning att kursen kan ingå i programmet.
Del av program
Masterprogram, ICT Innovation, åk 2, CLNI, Rekommenderad
Masterprogram, ICT Innovation, åk 2, CLNS, Rekommenderad
Masterprogram, ICT Innovation, åk 2, DASC, Obligatorisk
Masterprogram, ICT Innovation, åk 2, DASE, Obligatorisk
Masterprogram, industriell ekonomi, åk 1, MAIG, Villkorligt valfri
Masterprogram, maskininlärning, åk 1, Villkorligt valfri
Masterprogram, maskininlärning, åk 2, Villkorligt valfri
Masterprogram, programvaruteknik för distribuerade system, åk 1, DASC, Villkorligt valfri
Masterprogram, programvaruteknik för distribuerade system, åk 1, PVT, Villkorligt valfri
Perioder
P2 (7,5 hp)Varaktighet
Studietakt
50%
Undervisningsform
Normal Dagtid
Undervisningsspråk
Engelska
Studielokalisering
KTH Kista
Antal platser
Min: 25
Planerade schemamoduler
Kurs-PM
Kurs-PM är inte publiceratSchema
Länk till SchemaKursval
Gäller för kursomgång
HT 2024 Start 2024-10-28 programstuderande
Anmälningskod
50247
Kontakt
Gäller för kursomgång
HT 2024 Start 2024-10-28 programstuderande
Kontaktperson
Sarunas Girdzijauskas
Examinator
Ingen information tillagdKursansvarig
Ingen information tillagdLärare
Ingen information tillagdInnehåll och lärandemål
Kursinnehåll
Lärandemål
Kursen behandlar fundamenta inom datautvinning, bearbetning av dataströmmar, och maskininlärningsalgoritmer för att analysera mycket stora datamängder. Vi använder plattformar för storskaliga datamängder, såsom MapReduce, Spark och Apache Flink, för att implementera parallella algoritmer, och även beräkningssystem för bearbetning av dataströmmar, såsom Storm och InfoSphere.
Efter denna kurs kommer studenterna att kunna utföra datautvinning på olika typer av data, till exempel data av högre dimension, grafdata och infinita/icke-avslutade data (dataströmmar); liksom att programmera och bygga tillämpningar inom datautvinning. De förväntas också att kunna lösa problem i praktiska tillämpningar, till exempel rekommendationssystem, associationsregler, länkanalys, och detektion av duplikat. Dessutom kommer de att behärska olika matematiska tekniker till exempel linjär algebra, optimering, och dynamisk programmering.
Kurslitteratur och förberedelser
Särskild behörighet
Rekommenderade förkunskaper
Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1020 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).
Utrustning
Kurslitteratur
Innehållet i kursen hämtas från dessa två kursböcker:
A. Rajaraman and J. D. Ullman, Mining of massive datasets. Cambridge University Press, 2012 (alternative: J. Han, M. Kamber, J. Pei, Data Mining: Concepts and Techniques, 3-rd Ed., Morgan Kaufmann, 2012)
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
Examination
- LAB1 - Programmeringsuppgifter, 3,0 hp, betygsskala: P, F
- TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
Skriftlig tentamen. Laborativa uppgifter.
Möjlighet till komplettering
Möjlighet till plussning
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.
Ytterligare information
Kursrum i Canvas
Ges av
Huvudområde
Utbildningsnivå
Påbyggnad
Kontaktperson
Övrig information
I denna kurs tillämpas EECS hederskodex, se: http://www.kth.se/eecs/utbildning/hederskodex.