Kursen introducerar principerna för analys och sökning av visuella data, diskuterar grundläggande begrepp för att avgöra likhet och ger praktisk erfarenhet av utvalda populära algoritmer för visuellt sökande. Kursen innehåller ämnen som visuella ordlistor och påsar-av-ord, bildsärdrag, bildsärdragsdetektion och -beskrivning, särdragsbaserad objektigenkänning, klassificering och klustring, robust igenkänning, skalbar igenkänning, kompression av bildsärdragdeskriptorer, entropi-begränsat särdragsurval, mobilt visuellt sökande, likhetsfrågor på komprimerade data, identifikationshastighet för D-tillåtna system, kompressionsmetoder för likhetsfrågor.
EQ2425 Analys och sökning av visuella data 7,5 hp
Kursen introducerar principerna för analys och sökning av visuella data, diskuterar grundläggande begrepp för att avgöra likhet och ger praktisk erfarenhet av utvalda populära algoritmer för visuellt sökande. Kursen innehåller ämnen som visuella ordlistor och påsar-av-ord, bildsärdrag, bildsärdragsdetektion och -beskrivning, särdragsbaserad objektigenkänning, klassificering och klustring, robust igenkänning, skalbar igenkänning, kompression av bildsärdragdeskriptorer, entropi-begränsat särdragsurval, mobilt visuellt sökande, likhetsfrågor på komprimerade data, identifikationshastighet för D-tillåtna system, kompressionsmetoder för likhetsfrågor.
Information per kursomgång
Information för HT 2024 Start 2024-08-26 programstuderande
- Studielokalisering
KTH Campus
- Varaktighet
- 2024-08-26 - 2024-10-27
- Perioder
- P1 (7,5 hp)
- Studietakt
50%
- Anmälningskod
50240
- Undervisningsform
Normal Dagtid
- Undervisningsspråk
Engelska
- Kurs-PM
- Antal platser
Min: 10
- Målgrupp
Öppen för alla program under förutsättning att kursen kan ingå i programmet.
- Planerade schemamoduler
- [object Object]
- Schema
- Del av program
Masterprogram, ICT Innovation, åk 1, AUSM, Rekommenderad
Masterprogram, ICT Innovation, åk 1, AUSY, Rekommenderad
Masterprogram, ICT Innovation, åk 2, VCCN, Obligatorisk
Masterprogram, information och nätverksteknologi, åk 2, Rekommenderad
Masterprogram, information och nätverksteknologi, åk 2, MMB, Rekommenderad
Kontakt
Kursplan som PDF
Notera: all information från kursplanen visas i tillgängligt format på denna sida.
Kursplan EQ2425 (VT 2019–)Innehåll och lärandemål
Kursinnehåll
Lärandemål
Efter genomgången kurs ska deltagarna kunna:
(1) Beskriva principerna för analys och sökning av visuella data, t.ex., visuella ordlistor, bildsärdrag, klassificering, igenkänning, visuella frågor.
(2) Utveckla och implementera (till exemple med MatLab) metoder för bildsärdragsextraktion, klassificering, igenkänning, och mobil visuell sökning.
(3) Analysera, jämför och förklara designalternativ med hjälp av principerna för analys och sökning av visuella data.
(4) kvantitativt bedöma de utvecklade metoderna för frågor / igenkänning
(5) Analysera givna frågeproblem, identifiera och förklara utmaningar, föreslå möjliga lösningar, och förklara den valda designen.
För högre betyg ska deltagarna också kunna:
- Lösa givna projektproblem väl och producera tydliga, vetenskapliga och välskrivna tekniska rapporter.
Kurslitteratur och förberedelser
Särskild behörighet
För fristående kursstudent: 120 hp samt Engelska B eller motsvarande.
Rekommenderade förkunskaper
EQ2330 Bild- och videobehandling eller motsvarande
Utrustning
Kurslitteratur
Föreläsningsanteckningar och utvalda artiklar / bokkapitel finns på kurshemsidan, t.ex.:
- B. Girod, V. Chandrasekhar, D. M. Chen, N. M. Cheung, R. Grzeszczuk, Y. Reznik, G. Takacs, S. S. Tsai and R. Vedantham, “Mobile Visual Search”, IEEE Signal Processing Magazine, vol. 28, no. 4, pp. 61-76, July 2011.
- J. Sivic and A. Zisserman, “Video Google: A text retrieval approach to object matching in videos,” in Proc. IEEE Int. Conf. Computer Vision (ICCV), Washington, DC, 2003.
- D. Lowe, “Distinctive image features from scale-invariant keypoints,” Int. J. Comput. Vis., vol. 60, no. 2, pp. 91–110, 2004.
- D. Nistér and H. Stewénius, “Scalable recognition with a vocabulary tree,” in Proc. IEEE Conf. Computer Vision and Pattern Recognition (CVPR), New York, June 2006.
- H. Li and M. Flierl, "Mobile 3D visual search using the helmert transformation of stereo features," Proc. IEEE International Conference on Image Processing, Melbourne, Australia, Sept. 2013.
- David Chen and Bernd Girod,
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
Examination
- INL1 - Förberedelseuppgifter, 1,5 hp, betygsskala: P, F
- PRO1 - Kursprojekt, 3,0 hp, betygsskala: A, B, C, D, E, FX, F
- TEN1 - Tentamen, 3,0 hp, betygsskala: A, B, C, D, E, FX, F
Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
Övriga krav för slutbetyg
(1) Förberedelseuppgifter, 1.5 ECTS (G/U): Några dagar innan en övning delas en kort individuell uppgift ut. Under övningen diskuterar du uppgiften med kurskamrater. Den kommenterade versionen av din förberedda lösning lämnas in vid slutet av övningen.
(2) Kursprojekt, 3 ECTS (A-F): Projekten ska ge praktisk erfarenhet och bör utföras i grupper av två studenter.
(3) Skriftlig tentamen, 3 ECTS (A-F).
Slutbetyget baseras på en sammanvägning av kursprojekt och tentamen. Examinatorn avgör viktningen inför varje kursomgång.
Möjlighet till komplettering
Möjlighet till plussning
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.
Ytterligare information
Kursrum i Canvas
Ges av
Huvudområde
Utbildningsnivå
Påbyggnad
Övrig information
I denna kurs tillämpas EECS hederskodex, se:
http://www.kth.se/eecs/utbildning/hederskodex.