Datateknik AV, Maskininlärning med visuella mediaapplikationer, 6 hp
Observera att litteraturen i kursplanen kan ändras/revideras fram till:
• 1 juni för en kurs som startar på höstterminen
• 15 november för en kurs som startar på vårterminen
• 1 april för en kurs som startar på sommaren
Skriv ut eller spara kursplanen som PDF
Du kan enkelt skriva ut en kursplan direkt från webbsidan. Använd kortkommandot ctrl+p (Windows) eller command+p (Mac). I nästa steg väljer du om du vill skriva ut eller spara kursplanen som PDF.
För en nedlagd kurs kan eventuell information om avvecklingsperiod hittas under rubriken "Övergångsregel" i senaste versionen av kursplanen.
Kursplan för:
Datateknik AV, Maskininlärning med visuella mediaapplikationer, 6 hp
Computer Engineering MA, Machine Learning with Visual Media Applications, 6 credits
Allmänna data om kursen
- Kurskod: DT088A
- Ämne huvudområde: Datateknik
- Nivå: Avancerad nivå
- Högskolepoäng: 6
- Fördjupning vs. Examen: A1N - Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav
- Utbildningsområde: Tekniska området 100%
- Ansvarig institution: Data- och elektroteknik
- Fastställd: 2025-03-10
- Giltig fr.o.m: 2025-09-01
Syfte
Syftet med denna kurs är att förse studenterna med teoretisk kunskap och praktiska färdigheter i moderna maskininlärnings- (ML) och djupinlärningsmodeller (DL) för visuella medieapplikationer och verkliga forskningsutmaningar. Genom föreläsningar och praktiska projekt kommer studenterna att utveckla en stark koppling mellan teori och praktik inom visuella ML/DL-områden, med fokus på bild- och videobehandling, datorseende, generativ AI med mera.
Lärandemål
Efter avslutad kurs ska studenten kunna:
- Förstå och bedöma djupinlärningsmodeller och tekniker för visuella medieapplikationer.
- Utveckla, optimera och finjustera djupa neurala nätverk, inklusive modeller såsom CNN, visuella transformers, VAE, GAN och andra.
- Tillämpa avancerade ML/DL-metoder och använda överföringsinlärningsstrategier för att anpassa arkitekturer till specialiserade visuella medieapplikationer.
- Designa och genomföra projekt baserade på djupinlärning för verkliga tillämpningar och forskningsändamål.
- Kritiskt utvärdera forskningsrön och etiska överväganden inom ML/DL-tillämpningar för visuella medier.
Innehåll
Introduktion till de senaste trenderna och grundläggande metoder, arkitekturer (CNN, visuella transformers, diffusionsmodeller, VAE, GAN med flera) samt tekniker för optimering och finjustering, med en balanserad betoning på teoretiska grunder och praktisk tillämpning.
En kritisk granskning av överföringsinlärning, dataaugmentation och hyperparameteroptimering för specialiserade applikationer, med fokus på avvägningar och prestandamått.
Effektiva och skalbara ML-tekniker för hantering av storskaliga visuella data, inklusive modellkomprimering, beskärning och utrullningsstrategier.
Exempel från olika visuella AI-applikationsområden illustrerar både styrkor och begränsningar hos nuvarande metoder. Projektbaserad implementering och utvärdering av ML/DL-lösningar speglar verkliga utmaningar inom området.
En översyn av aktuella forskningsrön och etiska aspekter inom ML/DL för visuella medieapplikationer.
Behörighet
60 hp datateknik eller elektroteknik, inkluderande 10 hp programmering, 6 hp signal- och bildbehandling, 6 hp datorseende och multivygeometri, 6 hp neurala nätverk och djupinlärning, och 6 hp bildanalys.
30 hp matematiska ämnen, inklusive kurser i sannolikhetsteori och statistik samt linjär algebra.
Urvalsregler
Urval sker i enlighet med Högskoleförordningen och den lokala antagningsordningen.
Undervisning
Kursen ges genom föreläsningar och projektarbete. Föreläsningarna behandlar den senaste utvecklingen inom maskininlärning för visuella medier, medan projektarbetet ger studenterna möjlighet att tillämpa dessa koncept på ett forskningsinriktat problem. Självständigt arbete är en central del, där studenter förväntas ta del av föreläsningsmaterial, forskningsartiklar och projektuppgifter med begränsad handledning.
Undervisningen kan ske på svenska eller engelska.
Examination
P101: Projekt, med skriftlig rapport, 3 hp
Betygsskala: Sju-gradig skala, A-F o Fx
T101: Skriftlig tentamen, 3 hp
Betygsskala: Sju-gradig skala, A-F o Fx
Länk till betygskriterier: https://www.miun.se/betygskriterier.
Om student har ett besked från samordnaren vid Mittuniversitetet om pedagogiskt stöd vid funktionsnedsättning, har examinatorn rätt att ge anpassad examination för studenten.
Begränsning av examination
Studenter registrerade på denna version av kursplan har rätt att examineras 3 gånger inom loppet av 1 år enligt angivna examinationsformer. Därefter gäller examinationsform enligt senast gällande version av kursplan.
Betygsskala
Sju-gradig skala, A-F o Fx
Litteratur
Obligatorisk litteratur:
Vetenskapliga artiklar inom Visuell AI.
Referenslitteratur:
Författare: Deepika Ghai, Suman Lata Tripathi, Sobhit Saxena, Manash Chanda, Mamoun Alazab
Titel: Machine Learning Algorithms for Signal and Image Processing
Förlag: IEEE Press Wiley
Upplaga:
Kommentar: preferably ISBN 13 characters: 9781119861829
www: https://www.researchgate.net/publication/365579592_Machine_Learning_Algorithms_for_Signal_and_Image_Processing