Data Science - gratis kursus fra Skolen for Dataanalyse, uddannelse 4 semestre, dato 2. december 2023.
Miscellanea / / December 05, 2023
For dem, der ønsker at skabe problemer ved hjælp af dataanalyse, foreslå løsninger og evaluere deres effektivitet ikke kun i et syntetisk eksperiment, men også under virkelige forhold.
Statistik, maskinlæring og arbejde med forskellige typer data.
Data understøtter de fleste moderne tjenester og produkter, fra vejrudsigtsapps til selvkørende biler. En dataforsker udfører eksperimenter, bygger målinger, ved, hvordan man optimerer driften af tjenester og forstår, hvor deres vækstpunkter er.
Hver studerende skal gennemføre mindst tre kurser i løbet af semesteret. Hvis der for eksempel er to af dem i hovedprogrammet, så skal du vælge et af specialkurserne.
Viden testes primært gennem lektier - eksamener og prøver gennemføres kun i nogle fag.
Første semester
Obligatorisk
Algoritmer og datastrukturer, del 1
01.Kompleksitet og beregningsmodeller. Analyse af regnskabsværdier (begyndelse)
02. Analyse af regnskabsværdier (slut)
03.Merge-Sort og Quick-Sort algoritmer
04. Ordinalstatistik. Dynger (begyndelse)
05. Dynger (slut)
06.Hashing
07.Søg i træer (begyndelse)
08.Søg i træer (fortsat)
09.Søg i træer (slut). System af usammenhængende sæt
10. RMQ og LCA opgaver
11.Datastrukturer til geometrisk søgning
12. Problemet med dynamisk forbindelse i en urettet graf
Python sprog
01. Grundlæggende sprog (del 1)
02. Grundlæggende sprog (del 2)
03.Objektorienteret programmering
04.Fejlhåndtering
05. Kodedesign og test
06. Arbejde med strenge
07.Hukommelsesmodel
08Funktionel programmering
09. Biblioteksanmeldelse (del 1)
10. Biblioteksanmeldelse (del 2)
11.Parallel computing i Python
12.Avanceret arbejde med objekter
Machine learning, del 1
01.Grundlæggende begreber og eksempler på anvendte problemer
02.Metriske klassifikationsmetoder
03.Logiske klassifikationsmetoder og beslutningstræer
04. Gradient lineære klassificeringsmetoder
05.Support Vector Machine
06.Multivariat lineær regression
07. Ikke-lineær og ikke-parametrisk regression, ikke-standardiserede tabsfunktioner
08.Tidsserieprognose
09.Bayesianske klassifikationsmetoder
10.Logistisk regression
11.Søg efter foreningens regler
Anden periode
Obligatorisk
Grundlæggende om statistik i maskinlæring
01.Introduktion
02. Vigtigste opgaver og metoder i teorien om statistisk inferens
03. Fordelingsestimat og statistiske funktioner
04.Monte Carlo simulering, bootstrap
05. Parametrisk estimering
06. Hypotesetestning
07. Reduktion af dimensionaliteten af multidimensionelle data
08.Vurdering af modellens følsomhed
09.Lineær og logistisk regression
10. Metoder til design af eksperimenter
11.Forskellige typer af regularisering i lineær regression
12. Ikke-lineære metoder til at konstruere regressionsafhængigheder
13.Ikke-parametrisk estimering
14. Bayesiansk tilgang til estimering
15. Bayesiansk tilgang til regression
16. Bayesiansk tilgang til regression og optimering
17.Brug af den tilfældige Gaussiske feltmodel i dataanalyseproblemer
18.Brug af statistiske modeller og metoder i surrogatmodellering og optimeringsproblemer
Machine learning, del 2
01. Neurale netværksmetoder til klassificering og regression
02.Kompositionelle metoder til klassificering og regression
03.Kriterier for valg af modeller og metoder til valg af funktioner
04.Ranking
05.Forstærkningslæring
06.Læring uden lærer
07.Problemer med delvis træning
08.Samarbejde filtrering
09. Emnemodellering
Tredje semester
At vælge imellem
Automatisk tekstbehandling
01Kursusmateriale
eller
Computer vision
Kurset er helliget metoder og algoritmer til computersyn, dvs. udtrække information fra billeder og videoer. Lad os se på det grundlæggende i billedbehandling, billedklassificering, billedsøgning efter indhold, ansigtsgenkendelse, billedsegmentering. Så taler vi om videobehandling og analysealgoritmer. Den sidste del af kurset er helliget 3D rekonstruktion. For de fleste problemer vil vi diskutere eksisterende neurale netværksmodeller. På kurset forsøger vi kun at være opmærksomme på de mest moderne metoder, der i øjeblikket bruges til at løse praktiske og forskningsmæssige problemer. Kurset er stort set praktisk frem for teoretisk. Derfor er alle forelæsninger udstyret med laboratorie- og hjemmeopgaver, som giver dig mulighed for at prøve de fleste af de omhandlede metoder i praksis. Arbejdet udføres i Python ved hjælp af forskellige biblioteker.
01.Digitalt billede og tonekorrektion.
02.Grundlæggende om billedbehandling.
03.Kombinering af billeder.
04. Klassificering af billeder og søg efter lignende.
05. Konvolutionelle neurale netværk til klassificering og søgning efter lignende billeder.
06. Genstandsdetektering.
07. Semantisk segmentering.
08. Stiloverførsel og billedsyntese.
09.Videogenkendelse.
10. Sparsom 3D-rekonstruktion.
11.Tæt tredimensionel rekonstruktion.
12.Rekonstruktion fra én ramme og punktskyer, parametriske modeller.
Fjerde semester
Anbefalede specialkurser
Dyb læring
01.Kursusmateriale
Forstærkende læring
01.Kursusmateriale
Selvkørende biler
Kurset dækker kernekomponenterne i selvkørende teknologi: lokalisering, perception, forudsigelse, adfærdsniveau og bevægelsesplanlægning. For hver komponent vil de vigtigste tilgange blive beskrevet. Derudover vil de studerende blive fortrolige med aktuelle markedsforhold og teknologiske udfordringer.
01.Oversigt over hovedkomponenter og sensorer i et ubemandet køretøj. Niveauer af autonomi. Drive by Wire. Selvkørende biler som erhvervsprodukt. Måder at evaluere fremskridt i at skabe droner. Grundlæggende lokalisering: gnss, hjulafstandsmåling, Bayesianske filtre.
02. Metoder til lidar lokalisering: ICP, NDT, LOAM. Introduktion til visuel SLAM med ORB-SLAM som eksempel. Redegørelse for GraphSLAM-problemet. Reduktion af GraphSLAM-problemet til en ikke-lineær mindste kvadraters metode. Valg af den korrekte parametrering. Systemer med en særlig struktur i GraphSLAM. Arkitektonisk tilgang: frontend og backend.
03. Genkendelsesopgave i selvkørende bil. Statiske og dynamiske forhindringer. Sensorer til genkendelsessystemet. Repræsentation af statiske forhindringer. Detektering af statiske forhindringer ved hjælp af lidar (VSCAN, neurale netværksmetoder). Brug af lidar i forbindelse med billeder til at detektere statik (semantisk billedsegmentering, dybdeafslutning). Stereokamera og få dybde fra et billede. Stixel verden.
04.Forestiller dig dynamiske forhindringer i en selvkørende bil. Neurale netværksmetoder til at detektere objekter i 2D. Detektion baseret på fugleperspektiv af lidar-skyrepræsentation. Brug af lidar med billeder til at opdage dynamiske forhindringer. Bildetektering i 3D baseret på billeder (3D-boksemontering, CAD-modeller). Radarbaseret dynamisk forhindringsdetektion. Objektsporing.
05. Bilkørselsmønstre: baghjul, forhjul. Vejplanlægning. Konceptet med konfigurationsrum. Grafiske metoder til at konstruere baner. Baner, der minimerer ryk. Optimeringsmetoder til at konstruere baner.
06.Hastighedsplanlægning i et dynamisk miljø. ST planlægning. Forudsigelse af andre trafikanters adfærd.