Matematik og maskinlæring for datavidenskab - kursus RUB 50.040. fra SkillFactory, træning 5,5 måneder, Dato: 13. august 2023.
Miscellanea / / November 29, 2023
Du vil være i stand til at studere fra hvor som helst i verden. Nye moduler åbnes en gang om ugen. Specielt designet indhold og yderligere materialer vil hjælpe dig med at forstå emnet.
Praksis består af tre dele: udførelse af simple regneøvelser; udførelse af Python-baserede øvelser; løsning af livsproblemer inden for dataanalyse, forecasting og optimering.
Du vil konstant kommunikere med dine medstuderende i private Slack-kanaler. Hvis du ikke forstår noget eller ikke kan klare en opgave, hjælper vi dig med at finde ud af det.
I slutningen af forløbet får du en særlig opgave, hvor du vil kunne anvende alle de færdigheder, du har tilegnet dig, og bekræfte din succesfulde indlæring af materialet.
Matematik kursus program
Del 1 - Lineær algebra
- Vi studerer vektorer og typer af matricer
- Lære at udføre operationer på matricer
- Bestemmelse af lineær afhængighed ved hjælp af matricer
- Vi studerer inverse, singulære og ikke-singulære matricer
- Vi studerer systemer af lineære ligninger, egen- og komplekse tal
- Mestring af matrix og singular dekomponering
- Løsning af lineære afhængighedsproblemer ved hjælp af matricer
- Optimering ved hjælp af principal komponent metoden
- Forstærkning af det matematiske grundlag for lineær regression
Del 2 - Grundlæggende om matematisk analyse
- Vi studerer funktioner af en og mange variabler og afledte
- Mestring af begrebet gradient og gradient descent
- Træning i optimeringsproblemer
- Vi studerer Lagrange multiplikatormetoden, Newtons metode og simuleret udglødning
- Vi løser problemer med at forudsige og søge efter en vindende strategi ved hjælp af afledte og numeriske optimeringsmetoder
- Forstærkning af matematikken bag gradientnedstigning og simuleret udglødning
Del 3 - Grundlæggende om sandsynlighed og statistik
- Vi studerer de generelle begreber deskriptiv og matematisk statistik
- At mestre kombinatorik
- Vi studerer hovedtyperne af fordelinger og korrelationer
- Forstå Bayes' sætning
- At lære en naiv Bayes Classifier
- Vi løser problemer med kombinatorik, validitet og forecasting ved hjælp af statistik og sandsynlighedsteori
- Vi konsoliderer det matematiske grundlag for klassificering og logistisk regression
Del 4 - Tidsserier og andre matematiske metoder
- Introduktion til tidsserieanalyse
- Mestring af mere komplekse typer regression
- Forecasting af budgettet ved hjælp af tidsserier
- Forstærkning af det matematiske grundlag for klassiske maskinlæringsmodeller
Kort kursusprogram om Machine Learning
Vejlederhjælp under uddannelse
Modul 1 - Introduktion til Machine Learning
Vi stifter bekendtskab med de vigtigste opgaver og metoder til maskinlæring, studerer praktiske cases og anvender den grundlæggende algoritme til at arbejde på et ML-projekt
Vi løser 50+ problemer for at styrke emnet
Modul 2 - Dataforbehandlingsmetoder
Vi studerer datatyper, lærer at rense og berige data, bruger visualisering til forbehandling og mestrer feature engineering
Vi løser 60+ problemer for at styrke emnet
Modul 3 - Regression
Vi mestrer lineær og logistisk regression, studerer grænserne for anvendelighed, analytisk inferens og regularisering. Træning af regressionsmodeller
Vi løser 40+ problemer for at styrke emnet
Modul 4 - Klynger
Vi mestrer læring uden lærer, øver dens forskellige metoder, arbejder med tekster ved hjælp af ML
Vi løser 50+ problemer for at styrke emnet
Modul 5 - Træbaserede algoritmer: introduktion til træer
Lad os stifte bekendtskab med beslutningstræer og deres egenskaber, mestre træer fra sklearn-biblioteket og bruge træer til at løse et regressionsproblem
Vi løser 40+ problemer for at styrke emnet
Modul 6 - Træbaserede algoritmer: ensembler
Vi studerer træensemblers egenskaber, øver os i boosting, bruger ensemblet til at bygge logistisk regression
Vi løser 40+ problemer for at styrke emnet
Vi deltager i en konkurrence om kaggle til træning af en træbaseret model
Modul 7 - Vurdering af kvaliteten af algoritmer
Vi studerer principperne for prøveopdeling, under- og overtilpasning, evaluerer modeller ved hjælp af forskellige kvalitetsmålinger, lærer at visualisere læringsprocessen
Evaluering af kvaliteten af flere ML-modeller
Vi løser 40+ problemer for at styrke emnet
Modul 8 - Tidsserier i Machine Learning
Lad os stifte bekendtskab med tidsserieanalyse i ML, mestre lineære modeller og XGBoost, studere principperne for krydsvalidering og parametervalg
Vi løser 50+ problemer for at styrke emnet
Modul 9 - Anbefalingssystemer
Vi studerer metoder til at konstruere anbefalingssystemer, mestrer SVD-algoritmen, evaluerer kvaliteten af anbefalingerne fra den trænede model
Vi løser 50+ problemer for at styrke emnet
Modul 10 - Final Hackathon
Vi anvender alle de undersøgte metoder for at opnå maksimal nøjagtighed af modelforudsigelser på Kaggle