Kursus "Data Science Specialist" - kursus 112.000 rub. fra Yandex Workshop, træning 8 måneder, dato 30. november 2023.
Miscellanea / / November 28, 2023
Hvad laver dataforskere?
Analyser store mængder data, udvikle modeller og anvend maskinlæring til at lave forudsigelser og identificere mønstre. De er nødvendige på forskellige områder, hvor der er behov for at opbevare og behandle data.
I banker
Analyser data om kunder og afgør, hvilke indikatorer der påvirker deres kreditværdighed, forudsige sandsynligheden for, at kunden forlader banken
I industrien
Ved hjælp af maskinlæring forudsiger de, hvornår udstyr vil svigte, og i hvilken indskudsminedrift vil give den største profit.
I marketing og handel
De hjælper med at finde vækstpunkter ved at analysere sæsonudsving, topsalgsdage og skabe et anbefalingssystem
I transportsektoren
Optimer driften af trafiklys, vurder belastningen på vejene og hjælp med at justere reparationsplaner
Komplet kursusprogram i Data Science
Vi opdaterer den regelmæssigt for at sikre, at den opfylder industriens og arbejdsgivernes behov. Du lærer med andre ord kun det, der helt sikkert vil være nyttigt i dit arbejde.
Grundlæggende om Python og dataanalyse: Gratis introduktionskursus:
Lær de grundlæggende begreber inden for dataanalyse og forstå, hvad dataanalytikere og dataforskere gør. Løs fem tilfælde af arbejde med data fra forskellige områder:
- find ud af årsagen til den massive nedbrydning af gadgets,
- Tjek tilbagebetalingen af mobilapplikationsannoncering,
- find den bedste placering til en ny butik,
- hjælpe dig med at vælge en udviklingsstrategi for en AI-startup,
- evaluere effektiviteten af robotter i supporttjenesten.
Ved at løse cases vil du lære det grundlæggende i Python og pandas-biblioteket, lære at bygge nogle grafer og fortolke dem korrekt.
Introduktion til professionen "Data Science Specialist"
Hvad er en Data Science Specialist?
Hvordan vi underviser.
Grundlæggende Python:
Dyk dybere ned i Python-programmeringssproget og panda-biblioteket.
+1 projekt i portefølje
Sammenlign Yandex-brugerdata. Musik efter by og ugedag.
Dataforbehandling:
Lær at rense data fra outliers, udeladelser og dubletter, samt konverter forskellige dataformater.
+1 projekt i portefølje
Analyser data om bankkunder og bestem andelen af kreditværdige.
Udforskende dataanalyse:
Lær det grundlæggende om sandsynlighed og statistik. Brug dem til at udforske de grundlæggende egenskaber ved data, lede efter mønstre, fordelinger og anomalier. Lær scipy- og matplotlib-bibliotekerne at kende. Tegn diagrammer og øv dig i at analysere grafer.
+1 projekt i portefølje
Udforsk arkivet med annoncer for salg af fast ejendom i St. Petersborg og Leningrad-regionen.
Sandsynlighedsteori. Ekstra kursus
Husk eller genkend de grundlæggende begreber i sandsynlighedsteori: uafhængige, modsatte, uforenelige begivenheder osv. Ved hjælp af simple eksempler og sjove problemer vil du øve dig i at arbejde med tal og opbygge logikken i løsninger.
Dette er en valgfri sprint. Det betyder, at hver elev selv vælger en af mulighederne:
- Tag et ekstra kursus på ti korte lektioner, frisk op på teori og løs problemer.
- Åbn kun blokken med interviewopgaver, husk praksis uden teori.
- Spring kurset helt over eller vend tilbage til det, når der er tid og behov.
Afsluttende projekt på første modul
Lær, hvordan du udfører foreløbig dataforskning og formulerer og tester hypoteser.
+1 projekt i portefølje
Find mønstre, der bestemmer spillets succes.
Introduktion til Machine Learning:
Mestre grundlæggende maskinlæringskoncepter. Lær Scikit-Learn-biblioteket at kende, og brug det til at oprette dit første maskinlæringsprojekt.
+1 projekt i portefølje
Udvikle et takstanbefalingssystem for en mobiloperatør.
Undervist træning:
Dyk dybere ned i det hotteste område inden for maskinlæring: overvåget læring. Lær, hvordan du håndterer ubalancerede data.
+1 projekt i portefølje
Forudsige sandsynligheden for, at en kunde forlader banken.
Maskinlæring i erhvervslivet:
Lær, hvordan maskinlæring (fork. MO) hjælper virksomheden med, hvordan man indsamler data, og hvordan produktmålinger relaterer sig til MO-målinger. Lær at lancere ny servicefunktionalitet ved hjælp af ML. Lær, hvad forretningsmålinger, KPI'er og A/B-test er.
+1 projekt i portefølje
Træn en model, der hjælper med at identificere et nyt sted for olieproduktion med den mindste risiko for tab.
Afsluttende projekt på andet modul:
Forbered data til maskinlæring. Brug modellen til at evaluere dens kvalitet.
+1 projekt i portefølje
Simuler processen med at smelte guldmalm for at forbedre virksomhedens drift.
Lineær algebra:
Tag et kig ind i nogle af de algoritmer, du har lært indtil nu, og få en bedre forståelse af, hvordan du bruger dem. I praksis beherske hovedbegreberne i lineær algebra fra bunden: lineære rum, lineære operatorer, euklidiske rum.
+1 projekt i portefølje
Brug datakonverteringsmetode til at beskytte forsikringsselskabets kunders personlige oplysninger.
Numeriske metoder:
Du vil analysere en række algoritmer og tilpasse dem til at løse praktiske problemer ved hjælp af numeriske metoder. Mestre omtrentlige beregninger, algoritmekompleksitetsestimater og gradientnedstigning. Lær, hvordan neurale netværk trænes, og hvad gradientboosting er.
+1 projekt i portefølje
Udvikl en model til at bestemme prisen på en brugt bil.
Tidsserier:
Tidsserier beskriver, hvordan parametre, såsom elforbrug eller antal taxabestillinger, ændrer sig over tid. Du lærer at analysere serier, se efter trends og identificere sæsonbestemte. Lær, hvordan du opretter tabeldata og et tidsserieregressionsproblem.
+1 projekt i portefølje
Byg en model og forudsige spidsbelastninger for taxaer.
Maskinlæring til tekster:
Lær at lave numeriske vektorer ud fra tekster og løse klassifikations- og regressionsproblemer for dem. Lær, hvordan TF-IDF-funktioner beregnes, og bliv fortrolig med word2vec- og BERT-sprogrepræsentationer.
+1 projekt i portefølje
Fremskynd moderering af kommentarer i dit samfund ved at automatisere toksicitetsvurderinger.
Grundlæggende SQL:
Lær det grundlæggende i SQL-forespørgselssprog og relationel algebra til at arbejde med databaser. Bliv bekendt med funktionerne ved at arbejde i PostgreSQL, et populært databasestyringssystem (abbr. DBMS). Lær at skrive forespørgsler af varierende kompleksitetsniveauer og oversætte forretningsproblemer til SQL.
Du kommer til at arbejde med en database over en netbutik, der har specialiseret sig i film og musik.
+1 projekt i portefølje
Skriv en række forespørgsler af varierende kompleksitet til en database, der gemmer data om ventureinvestorer, startups og investeringer i dem.
Computer vision:
Lær at løse simple computersynsproblemer ved hjælp af færdige neurale netværk og Keras-biblioteket. Lær Deep learning at kende.
+1 projekt i portefølje
Byg en model for at bestemme en persons omtrentlige alder ud fra et fotografi.
Uovervåget læring:
Uovervåget læring er en af metoderne til maskinlæring, hvor systemet løser et problem uden forudmærkede data baseret på dets funktioner og struktur. Lær om problemer med klyngedannelse og anomalidetektion.
Afgangsprojekt:
I det sidste projekt skal du bekræfte, at du har mestret et nyt erhverv. Tydeliggør kundens opgave og gennemgå alle stadier af dataanalyse og maskinlæring. Nu er der ingen lektioner eller lektier - alt er som på et rigtigt job.
+1 projekt i portefølje
Projekt at vælge imellem:
- Byg en model, der forudsiger kundeafgang fra et teleselskab.
- Byg en model, der forudsiger parametrene for den teknologiske proces på et metallurgisk anlæg.
D
daryamanannikova
01.10.2020 G.
Eksempel på ideelle onlinekurser
I Yandex. Under workshoppen studerer jeg erhvervet DataScience, en ret moderigtig retning nu, og som det viste sig, er det ret svært, som man siger, svært at lære - let at kæmpe. (adsbygoogle = window.adsbygoogle || []).push({}); Der var mange vanskeligheder på min vej, jeg havde ikke tid nok (jeg tog mit eksamensbevis og arbejdede), styrken til at forstå statistikker forlod mig med jævne mellemrum, coronavirus låste os alle hjemme...
S
sergen355
14.07.2021 G.
Fantastisk pædagogisk projekt
Fordele: egen simulator, projektgennemgange, konsultationer, fællesskab i Slack, hjælp til alle spørgsmål. Ulemper: det eneste negative er, at der i nogle emner ikke er noget komplet materiale i simulatoren; der kræves yderligere tid til selvstændigt at søge efter information. Jeg studerede på Data Science Fakultetet. Godt træningsformat. Nogle kommer ind, nogle gør ikke. Men for mig er dette maksimum...