Data Scientist fra bunden til PRO - kursus 233.640 RUB. fra SkillFactory, træning 24 måneder, Dato 15. august 2023.
Miscellanea / / November 29, 2023
Efter grundforløbet vil du kunne vælge en smallere specialisering i Data Science - ML Engineer, CV Engineer eller NLP Engineer
M.L. Ingeniør — Machine learning udvikler
Udvikle en kreditvurderingsforudsigelsesmodel
Løs problemet med at klassificere spam-SMS-beskeder
Udvikle et system til at anbefale egnede produkter ved køb
Byg en model til at øge salget i detailhandelen
Opret billeder baseret på tekstbeskrivelse ved hjælp af DALL-E neurale netværk
CV ingeniør - Specialist i computersyn
Lær at løse alle de grundlæggende problemer inden for Computer Vision
Du får viden om det reelle flow i arbejdet med CV-modeller, aktuelle tilgange og avancerede værktøjer, der er nødvendige for at skabe CV-tjenester
I det afsluttende projekt skal du oprette en virtuel coach, der er i stand til at vurdere rigtigheden af øvelser på video
NLP ingeniør — Specialist i behandling af naturligt sprog
Lær naturlig sprogbehandling at kende
Få en forståelse af NLP-opgaver - klassificering, opsummering og tekstgenerering, oprettelse af systemer til maskinoversættelse og systemer til besvarelse af spørgsmål
I det afsluttende projekt vil du selvstændigt udvikle værktøjer til automatiseret søgning af sammenhænge om givne emner.
GRUNDLAG
På dette trin vil du lære det grundlæggende i programmering i Python, lære at forbehandle og analysere data og også blive fortrolig med en dataforskers hovedopgaver.
Introduktion - 1 uge
Du vil være i stand til at formulere rigtige læringsmål for dig selv, finde ud af, hvad værdien af DS er for erhvervslivet, sætte sig ind i en dataforskers hovedopgaver og forstå, hvordan udviklingen af evt DS projekt.
INTRO-1. Sådan studerer du effektivt - onboarding i træning
INTRO-2. Professionsoversigt. Typer af problemer i datavidenskab. Stadier og tilgange til udvikling af et Data Science-projekt
Udviklingsdesign - 5 uger
Du vil lære at arbejde med grundlæggende datatyper ved hjælp af Python og være i stand til at bruge looping-konstruktioner, betingede udsagn og funktioner i dit daglige arbejde.
PYTHON-1. Grundlæggende om Python
PYTHON-2. Dyk ned i datatyper
PYTHON-3. Betingede erklæringer
PYTHON-4. Cykler
PYTHON-5. Funktioner og funktionel programmering
PYTHON-6. Øve sig
PYTHON-7. Python Style Guide (Bonus)
Grundlæggende matematik - 7 uger
MATH-1. Tal og udtryk
MATH-2. Ligninger og uligheder
MATH-3. Grundlæggende begreber i funktionsteori
MATH-4. Grundlæggende om geometri: planimetri, trigonometri og stereometri
MATH-5. Sæt, logik og elementer af statistik
MATH-6. Kombinatorik og det grundlæggende i sandsynlighedsteori
MATH-7. Problemløsning
Arbejde med data - 8 uger
På dette stadium vil du mestre grundlæggende datafærdigheder: hvordan man forbereder, renser og transformerer data, så de er egnede til analyse. Apropos analyse: du vil analysere data ved hjælp af de populære biblioteker Matplotlib, Seaborn, Plotly.
PYTHON-8. Datavidenskabsværktøjer
PYTHON-9. NumPy bibliotek
PYTHON-10. Introduktion til pandaer
PYTHON-11. Grundlæggende teknikker til at arbejde med data i Pandas
PYTHON-12. Avancerede datateknikker i pandaer
PYTHON-13. Datarensning
PYTHON-14. Datavisualisering
PYTHON-15. Principper for OOP i Python og fejlfindingskode (valgfrit modul)
Projekt 1. Datasætanalyse om lukkede emner
Dataindlæsning - 6 uger
Du vil være i stand til at downloade data fra forskellige formater og kilder. Og SQL, et struktureret forespørgselssprog, vil hjælpe dig med dette. Du lærer at bruge aggregerede funktioner, tabelsammenføjninger og komplekse sammenkædninger.
PYTHON-16. Hvordan man downloader data fra filer i forskellige formater
PYTHON-17. Hentning af data fra webkilder og API'er
SQL-0. Hej SQL!
SQL-1. Grundlæggende SQL
SQL-2. Samlede funktioner
SQL-3. Sammenføjning af borde
SQL-4. Komplekse sammenføjninger
Projekt 2. Indlæser nye data. Forfining af analysen
Statistisk dataanalyse - 7 uger
Intelligence Data Analysis (EDA) er det, der vil være dit fokus. Du vil blive fortrolig med alle stadier af en sådan analyse og lære, hvordan du udfører den ved hjælp af bibliotekerne Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Derudover vil du kunne arbejde på Kaggle, en populær tjeneste til deltagelse i konkurrencer.
EDA-1. Introduktion til efterretningsdataanalyse. EDA algoritmer og metoder
EDA-2. Matematisk statistik i forbindelse med EDA. Typer af funktioner
EDA-3. Feature Engineering
EDA-4. Statistisk dataanalyse i Python
EDA-5. Statistisk dataanalyse i Python. Del 2
EDA-6. Design af eksperimenter
EDA-7. Kaggle platform
Projekt 2
Introduktion til Machine Learning - 9 uger
Du vil blive fortrolig med ML-biblioteker til modellering af dataafhængigheder. Du vil være i stand til at træne hovedtyperne af ML-modeller, udføre validering, fortolke resultaterne af arbejdet og udvælge vigtige funktioner (feature vigtighed).
ML-1. Maskinlæringsteori
ML-2. Superviseret læring: Regression
ML-3. Superviseret læring: Klassifikation
ML-4. Uovervåget læring: Klynger og dimensionsreduktionsteknikker
ML-5. Datavalidering og modelevaluering
ML-6. Udvælgelse og udvælgelse af egenskaber
ML-7. Optimering af modelhyperparametre
ML-8. ML kogebog
Projekt 3. Klassificeringsproblem
HOVEDENHED
Lineær algebra, matematisk analyse, diskret matematik - det lyder skræmmende, men vær ikke bange: vi analyserer alle disse emner og lærer dig, hvordan du arbejder med dem! På anden fase vil du dykke ned i matematik og det grundlæggende i maskinlæring, lære mere om DS-fag og gennem karrierevejledning vælge et andet års studieretning.
Matematik og maskinlæring. Del 1 - 6 uger
Du vil kunne løse praktiske problemer ved hjælp af manuel beregning og Python (vektor- og matrixberegninger, arbejde med mængder, studere funktioner ved hjælp af differentialanalyse).
MATH&ML-1. Lineær algebra i sammenhæng med lineære metoder. Del 1
MATH&ML-2. Lineær algebra i sammenhæng med lineære metoder. Del 2
MATH&ML-3. Matematisk analyse i sammenhæng med et optimeringsproblem Del 1
MATH&ML-4. Matematisk analyse i sammenhæng med et optimeringsproblem. Del 2
MATH&ML-5. Matematisk analyse i sammenhæng med et optimeringsproblem. Del 3
Projekt 4. Regressionsproblem
Matematik og maskinlæring. Del 2 - 6 uger
Du bliver fortrolig med de grundlæggende begreber i sandsynlighedsteori og matematisk statistik, algoritmer clustering, og også lære at evaluere kvaliteten af den udførte clustering og præsentere resultaterne i grafisk form.
MATH&ML-6. Sandsynlighedsteori i sammenhæng med en naiv Bayes-klassifikator
MATH&ML-7. Algoritmer baseret på beslutningstræer
MATH&ML-8. Boosting & stabling
MATH&ML-9. Klyngedannelse og dimensionsreduktionsteknikker. Del 1
MATH&ML-10. Klyngedannelse og dimensionsreduktionsteknikker. Del 2
Projekt 5. Ensemble metoder
Diskret matematik - 4 uger
MATH&MGU-1 sæt og kombinatorik
MATH&MGU-2 Logik
MATH&MGU-3 grafer. Del 1
MATH&MGU-4 grafer. Del 2
ML i erhvervslivet - 8 uger
Du lærer at bruge ML-biblioteker til at løse tidsserieproblemer og anbefalingssystemer. Du vil kunne træne en ML-model og validere den, samt lave en fungerende prototype og køre modellen i webgrænsefladen. Og få også A/B-testfærdigheder, så du kan evaluere modellen.
MATH&ML-11. Tidsserier. Del 1
MATH&ML-12. Tidsserier. Del 2
MATH&ML-13. Anbefalingssystemer. Del 1
MATH&ML-14. Anbefalingssystemer. Del 2
PROD-1. Forberedelse af modellen til produktion
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Forretningsforståelse. Sag
Projekt 6. Emne at vælge imellem: Tidsserier eller Anbefalingssystemer
PRO NIVEAU
På tredje trin bliver du fortrolig med en af maskinlæringsmetoderne - deep learning (DL). Og også en fuldgyldig blok af den valgte specialisering venter på dig: du kan mestre maskinlæringsfærdigheder (ML), stifte bekendtskab med rutinen for CV (computersyn) eller forbedre i NLP*, naturlig behandling Sprog.
Andet studieår - 3 specialiseringer at vælge imellem
Karrierevejledning
ML, CV eller NLP: På dette stadium skal du endelig træffe et valg om, hvilken vej du vil tage næste gang. Vi vil fortælle dig om hver specialisering og tilbyde dig at løse flere praktiske problemer for at gøre det lettere for dig at beslutte.
Spor ML - ingeniør
I ML-sporet lærer du at løse dybdegående maskinlæringsproblemer, mestre en dataingeniørs kompetencer og finpudse dine færdigheder i at arbejde med Python-biblioteker. Du vil også lære, hvordan du opretter en MVP (minimum levedygtig version af et produkt), lærer alle forviklingerne ved at udskrive en ML-model til produktion og lære, hvordan ML-ingeniører arbejder i det virkelige liv.
Introduktion til Deep Learning
Grundlæggende datateknik
Yderligere Python og ML kapitler
Økonomisk evaluering af effekter og MVP-udvikling
ML til produktion
Dybdegående undersøgelse af ML udvikling og afgangsprojekt om et valgt emne
Spor CV - ingeniør
På CV-sporet lærer du at løse computersynsproblemer såsom billedklassificering, segmentering og detektion, billedgenerering og stilisering, restaurering og kvalitetsforbedring fotografier. Derudover vil du lære, hvordan du udruller neurale netværk til produktion.
Introduktion til Deep Learning
Grundlæggende datateknik
Yderligere Python og ML kapitler
Økonomisk evaluering af effekter og MVP-udvikling
ML til produktion
Dybdegående undersøgelse af ML udvikling og afgangsprojekt om et valgt emne
Spor NLP - ingeniør
Under træning på NLP-sporet lærer du, hvordan du løser hovedproblemerne med naturlig sprogbehandling, i herunder klassificering, opsummering og tekstgenerering, maskinoversættelse og skabelse af dialog systemer
Introduktion til Deep Learning
Neural netværksmatematik til NLP
Hard & Software til løsning af NLP-problemer
NLP opgaver og algoritmer
Neurale netværk i produktionen
Dybdegående undersøgelse af NLP udvikling og afgangsprojekt om et valgt emne
Vælger du CV- eller ML-specialiseringen, kan du gratis tage NLP-kurset uden mentorstøtte.
Dyb læring og neurale netværk
Hvor bruges neurale netværk? Hvordan træner man et neuralt netværk? Hvad er Deep Learning? Du finder svarene på disse spørgsmål i bonussektionen i DL.
Introduktion til Data Engineering
Du vil lære forskellen på rollerne som data scientist og dataingeniør, hvilke værktøjer sidstnævnte bruger i sit arbejde, og hvilke opgaver han løser til daglig. Ordene "snefnug", "stjerne" og "sø" vil få nye betydninger :)