Syntax och semantik för programspråk som är särskilt lämpade för data science, t.ex. Python.
Rutiner för att importera, kombinera, omvandla och göra urval av data.
Algoritmer för hantering av saknade värden, diskretisering och dimensionalitetsreduktion.
Algoritmer för övervakad maskininlärning, t.ex. naïve Bayes, beslutsträd, random forests.
Algoritmer för oövervakad maskininlärning, t.ex. k-means clustering.
Bibliotek för dataanalys.
Utvärderingsmetoder och prestandamått.
Visualisering och analys av resultat från dataanalys.
Efter godkänd kurs ska studenten kunna
- redogöra för och resonera om tillämpningen av i) tekniker för att omvandla data till lämpligt format för dataanalys, ii) algoritmer för att analysera data genom övervakad och oövervakad maskininlärning, samt iii) tekniker och prestandamått för utvärdering av dataanalysresultat
- implementera och tillämpa i) tekniker för att omvandla data till lämpligt format för dataanalys, ii) algoritmer för övervakad och oövervakad maskininlärning, samt iii) tekniker och prestandamått för utvärdering av dataanalysresultat.