"Python: Introduktion til dataanalyse" - kursus RUB 30.000. fra MSU, træning 4 uger. (1 måned), Dato: 30. november 2023.
Miscellanea / / December 03, 2023
Det avancerede træningsprogram er rettet mod at opnå færdigheder i at arbejde med Python-programmeringssproget til big data-analyse.
Uddannelsens varighed – 36 timer (24 timers klasseundervisning med en lærer, 12 timers selvstændig studie af materialer).
Studieform – ansigt til ansigt med mulighed for fjernforbindelse.
Udgifter til uddannelse 30.000 rubler.
Start af undervisning - efterår 2023 akademisk år.
Der indgås uddannelsesaftaler med enkeltpersoner og juridiske enheder.
Tilmelding til kurser udføres via e-mail [email protected] (for enkeltpersoner).
Du kan kontakte kursusadministratoren, Anton Martyanov, for at tilmelde dig eller med spørgsmål via WhatsApp eller Telegram på +79264827721.
1. Python programmeringssprog biblioteker.
Bibliotekers hovedformål og funktioner;
Typer af biblioteker til dataanalyse: Pandas, Numpy, Statsmodels, Sklearn, Seabourne;
Typer af biblioteker til datavisualisering;
2. Typer og datastrukturer i Python.
Typer af datatyper: Heltal, float, bool, srting, objekt;
Typer af datastrukturer: Dataramme, serier, array, tupler, lister osv.;
3. Indlæsning af data i programmet og foreløbig analyse.
Indlæsning af data i forskellige formater (xlsx, csv, html osv.);
Bestemmelse af antallet af rækker og kolonner;
Identifikation af manglende værdier;
Identifikation af datatyper i en matrix;
4. Python-funktioner til dataanalyse.
Funktioner til at opnå beskrivende statistik (finde max, min, middelværdi, median, kvartiler);
Funktioner til visualisering af tætheden af datadistribution (normal Gauss-fordeling);
Funktioner til at skabe binære variabler (dummies var);
Funktioner af maskinlæringsalgoritmer til bygning af modeller (mindste kvadrater, støttevektormaskiner, tilfældig skov, logistisk regression, tidsserier);
5. Konstruktion af regressionsmodeller.
Formålet med at konstruere lineære regressioner ved hjælp af mindste kvadraters metode;
Foreslå hypoteser og opstilling af et problem (baseret på arbejdsdata);
Opbygning af en regressionsmodel i Python;
Vurdering af betydningen af de opnåede koefficienter og modellen som helhed (t-statistik, F-statistik);
Modelkvalitetsvurdering (R2);
Kontrol af Gauss-Markovs antagelser;
Fortolkning af de opnåede resultater;
6. Konstruktion af klassifikationsmodeller.
Random Forest algoritme;
Logistisk regression;
Support Vector Machine;
Adresse
119991, Moskva, st. Leninskie Gory, 1, bygn. 51, 5. sal, værelse 544 (dekans kontor)
Universitet