Hoppa till huvudinnehållet
Till KTH:s startsida

FID3016 Data mining 7,5 hp

Information per kursomgång

Termin

Information för HT 2024 Start 2024-10-28 programstuderande

Studielokalisering

KTH Kista

Varaktighet
2024-10-28 - 2025-01-13
Perioder
P2 (7,5 hp)
Studietakt

50%

Anmälningskod

50918

Undervisningsform

Normal Dagtid

Undervisningsspråk

Engelska

Kurs-PM
Kurs-PM är inte publicerat
Antal platser

Ingen platsbegränsning

Målgrupp
Ingen information tillagd
Planerade schemamoduler
[object Object]
Schema
Schema är inte publicerat
Del av program
Ingen information tillagd

Kontakt

Examinator
Ingen information tillagd
Kursansvarig
Ingen information tillagd
Lärare
Ingen information tillagd

Kursplan som PDF

Notera: all information från kursplanen visas i tillgängligt format på denna sida.

Kursplan FID3016 (VT 2019–)
Rubriker med innehåll från kursplan FID3016 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Innehåll:
• Introduction till Data Mining
• Frekventa Itemmängder
• Att hitta  liknande enheter
• Klustring
• Recommender-system
• Mining Data Streams
• Dimensionalitetsreduktion
• Storskalig maskininlärning
• Översikt av aktuell forskning inom data mining och dess koppling till andra relevanta forskningsområden.

Lärandemål

Kursen behandlar fundamenta inom data mining, data stream processing, och maskininlärningsalgoritmer för att analysera mycket stora datamängder. Vi använder plattformar för big data, såsom MapReduce, Spark och Apache Flink, för att implementera parallella algoritmer, och även beräkningssystem för data stream processing, såsom Storm och InfoSphere.
Efter denna kurs kommer studenterna att kunna utföra data mining på olika typer av data, t.ex. data av högre dimension, grafdata, och infinita/icke-avslutade data (data streams); liksom att programmera och bygga tillämpningar inom data-mining. De förväntas också att kunna lösa problem i praktiska tillämpningar, t.ex. recommender-system, associationsregler, länkanalys, och detektion av duplikat. Dessutom kommer de att behärska olika matematiska tekniker t.ex. linjär algebra, optimering, och dynamisk programmering. Dessutom ska studenten kunna beskriva och tillämpa aktuella forsknings trender i data mining (inklusive metoder, algoritmer, språkstöd och verktyg).

Kurslitteratur och förberedelser

Särskild behörighet

Rekommenderade förkunskaper:
Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1020 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).

Rekommenderade förkunskaper

Rekommenderade förkunskaper:
Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1020 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

P, F

Examination

  • EXA1 - Examination, 7,5 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Övriga krav för slutbetyg

Godkänd skriftlig tentamina,  godkända inlämningsuppgifter och godkänd tillämpning av nuvarande forskning (till exempel: användning i en forskningsartikel, forskningsrapport, eller forskningsprojekt).

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Denna kurs tillhör inget huvudområde.

Utbildningsnivå

Forskarnivå

Påbyggnad

Ingen information tillagd

Forskarkurs

Forskarkurser på EECS/Programvaruteknik och datorsystem