Statistik: Maskininlärning ur ett regressionsperspektiv (7,5 hp)

Datavetenskap

Maskininlärning

Matematik och statistik

Med den snabba utvecklingen inom informationstekniken har vi under de senaste decennierna bevittnat en explosiv tillväxt i vår förmåga att generera och samla in data. Hur man skall analysera stora mängder data, så att de kan förstås och användas på ett effektivt sätt, är ett utmanande problem.

Maskininlärning handlar om statistiska prediktioner som förbättras genom erfarenhet; modellen lär och anpassar sig allt eftersom nya data blir tillgängliga. Exempelvis priset som en matvarubutik kan ta ut av en leverantör för en annons beror på hur bra den är på att hitta de kunder som är benägna att köpa leverantörens produkter. På samma sätt är det pris som Google kan ta ut för en annonslänk direkt kopplat till dess förmåga att identifiera de individer som med hög sannolikhet kommer att klicka på länken. Det är här maskininlärning kommer in.

Kursens innehåll

I den här kursen lär du dig grunderna i maskininlärning och genom att fokusera på de metoder som på ett eller annat sätt bygger på vanlig regressionsanalys. Några av delmomenten i kursen är klassificering med hjälp av logistisk regression, modellval genom informationskriterium och korsvalidering, krympningsmetoder såsom lasso och ridgeregression, dimensionsreduceringsmetoder såsom principalkomponentanalys och partiell regression, och neuronnät. Teoristudier varvas med empiriska tillämpningar inom företags- och nationalekonomi. Vid de empiriska tillämpningarna används mjukvaruprogrammet R.

Efter kursen

När kursen är slut kommer du att ha lärt grunderna i maskininlärning. Vill du fördjupa dig rekommenderas du fortsätta med STAN52 Avancerad maskininlärning.