Maskinlæring i praksis - kursus 41.500 rub. fra IBS Training Center, træning 24 timer, Dato 26. november 2023.
Miscellanea / / December 02, 2023
Kurset er bygget op omkring flere praktiske cases indeholdende tabeller med indledende data.
For hvert enkelt tilfælde gennemgår vi hele livscyklussen af et maskinlæringsprojekt:
forskning, rensning og udarbejdelse af data,
at vælge en træningsmetode, der passer til opgaven (lineær regression for regression, tilfældig skov til klassificering, K-midler og DBSCAN til klyngedannelse),
træning efter den valgte metode,
resultat evaluering,
model optimering,
præsentation af resultatet for kunden.
Under diskussionsdelen af kurset diskuterer vi praktiske problemer, som eleverne står over for, som kan løses ved hjælp af de omtalte metoder.
Emner dækket:
1. Gennemgang af opgaven (teori – 1 time)
Hvilke problemer løses godt ved maskinlæring, og hvilke problemer forsøger de at løse?
Hvad sker der, hvis man i stedet for en Data Scientist ansætter en ikke-specialist på området (bare en udvikler/analytiker/manager) med en forventning om, at de lærer i processen.
2. Forberedelse, rengøring, dataforskning (teori – 1 time, praksis – 1 time)
Hvordan man forstår kildeforretningsdataene (og generelt registrerer enhver rækkefølge i dem).
Behandlingssekvens.
Hvad kan og bør delegeres til domæneanalytikere, og hvad gøres bedst af Data Scientisten selv.
Prioriteter for at løse et specifikt problem.
3. Klassifikatorer og regressorer (teori – 2 timer, praksis – 2 timer)
Praktisk afsnit - velformaliserede opgaver med udarbejdet data.
Forskel mellem opgaver (binær/ikke-binær/sandsynlighedsklassifikation, regression), omfordeling af opgaver mellem klasser.
Eksempler på klassificering af praktiske problemer.
4. Clustering (teori – 1 time, praksis – 2 timer)
Hvor og hvordan udføres klyngedannelse: dataforskning, kontrol af problemformuleringen, kontrol af resultaterne.
Hvilke sager kan reduceres til klyngedannelse.
5. Modelevaluering (teori – 1 time, praksis – 1 time)
Forretningsmålinger og tekniske målinger.
Metrik til klassifikations- og regressionsproblemer, fejlmatrix.
Interne og eksterne målinger af klyngekvalitet.
Krydsvalidering.
Vurdere omskoling.
6. Optimering (teori – 5 timer, praksis – 3 timer)
Hvad gør en model bedre end en anden: parametre, funktioner, ensembler.
Administration af indstillinger.
Praksis for valg af funktioner.
Gennemgang af værktøjer til at finde de bedste parametre, funktioner og metoder.
7. Diagrammer, rapporter, arbejde med levende opgaver (teori – 2 timer, praksis – 2 timer)
Hvordan man tydeligt forklarer, hvad der sker: til dig selv, til teamet, til klienten.
Flere smukke svar på meningsløse spørgsmål.
Sådan præsenterer du tre terabyte resultater på et dias.
Halvautomatiske tests, hvilke proceskontrolpunkter der virkelig er brug for.
Fra levende opgaver til en fuld F&U-proces ("F&U i praksis") - analyse og analyse af opgaver fra publikum.