Dataingeniør - kursus 89.000 rub. fra Otus, træning 4 måneder, dato 30. november 2023.
Miscellanea / / December 03, 2023
Hvad vil dette kursus give dig?
- Forstå de vigtigste måder at integrere, behandle og lagre big data på
- Evne til at arbejde med Hadoop økosystemkomponenter, distribueret storage og cloud-løsninger
- Praktiske færdigheder i at udvikle datatjenester, butiksfacader og applikationer
- Kendskab til principperne for organisering af overvågning, orkestrering, test
Kurset behandles udviklere, DBMS-administratorer og alle, der søger at forbedre deres faglige niveau, mestre nye værktøjer og engagere sig i interessante opgaver inden for at arbejde med data.
Efter at have studeret Data Engineering bliver du en efterspurgt specialist, der:
- implementerer, justerer og optimerer databehandlingsværktøjer
- tilpasser datasæt til videre arbejde og analyser
- skaber tjenester, der bruger resultaterne af behandling af store mængder data
- ansvarlig for dataarkitekturen i virksomheden
Real Case Studies: eksempler på implementeringer, brug af værktøj, ydeevneoptimering, problemer, fejl og anvendte resultater
Meget praktisk orientering:
I løbet af kurset vil vi trinvist skabe et fungerende produkt, der løser anvendte problemer
Et helhedsbillede af moderne virksomheds udfordringer og opgaver, og dataingeniørens rolle i løsningen af dem
Efterspørgsel blandt arbejdsgivere
40 arbejdsgivere er allerede klar til at indkalde kandidater til en samtale
6
kurserDataingeniør hos Wildberries, DE Junior kursusholder. Mere end 7 år indenfor IT
Uddannet fra Voronezh State University med udmærkelse. I øjeblikket studerende på HSE kandidatuddannelsen "System and Software Engineering". Erhvervserfaring - 2 års arbejde som dataanalytiker og dataingeniør. Nu arbejder han med 5 populære databaser, udvikler i Python og udvikler hurtigt sine færdigheder. Klar til at dele min oplevelse.
1
godtHan har udviklet analyser i virksomheden i mere end 10 år. Blandt resultaterne: - Opbygning af vores eget end-to-end webanalysesystem; - Opbygning af et analytisk lager baseret på MPP Vertica; - Organisering af databehandling baseret på Spark, Kafka, HDFS; -...
Han har udviklet analyser i virksomheden i mere end 10 år. Blandt resultaterne: - Opbygning af vores eget end-to-end webanalysesystem; - Opbygning af et analytisk lager baseret på MPP Vertica; - Organisering af databehandling baseret på Spark, Kafka, HDFS;- Opbygning af processer til at arbejde med data, herunder datakvalitet;- Oprettelse af flere interne værktøjer til at arbejde og strukturere metadata (Data Catalog);- Opbygning af et virksomhedsrapporteringssystem, inklusive realtid; - I mere end 5 år har han øget datakompetencen i virksomheden, gennemført forskellige træninger i at arbejde med data, værktøjer, SQL; Han udviklede også flere analyseledere, som nu arbejder i store virksomheder. Hovedfokus er på at forstå forretningsproblemer, når man arbejder med data og løser dem.
1
godtAfdelingsleder, Sberbank 8 års erfaring med industriel udvikling, herunder oprettelse og vedligeholdelse af webapplikationer både i store virksomheder og i startups. 3 års udvikling af distribuerede systemer til store offentlige...
Afdelingsleder, Sberbank 8 års erfaring med industriel udvikling, herunder oprettelse og vedligeholdelse af webapplikationer både i store virksomheder og i startups. 3 års udvikling af distribuerede systemer til store offentlige kunder. Gennemført tre projekter fra bunden, fra prototype til klar til industriel brug. I øjeblikket beskæftiget med fuld stack udvikling for interne kunder i banken, løsning af problemer relateret til dataanalyse og engineering. Erfaring med programmering i Java, Scala, Python, Javascript. En bred vifte af faglige interesser, lige fra at bygge distribuerede systemer til prædiktiv analyse og hensigtsanalyse. Uddannelse: Bachelor fra UrFU opkaldt efter. B.N. Jeltsin "Informationsteknologier".
Dataarkitektur
-Emne 1.Dataingeniør. Opgaver, færdigheder, værktøjer, markedsbehov
-Emne 2.Arkitektur af analytiske applikationer: grundlæggende komponenter og principper
-Emne 3.On premises / Cloud-løsninger
-Emne 4. Pipeline automation og orkestrering – 1
-Emne 5. Pipeline automation og orkestrering – 2
Data Lake
-Emne 6. Distribuerede filsystemer. HDFS/S3
-Emne 7.SQL-adgang til Hadoop. Apache Hive/Presto
-Emne 8. Datalagringsformater og deres funktioner
-Emne 9. Analyse af fjernbetjening til 1 sag
-Emne 10.Beskedkøer. Kafka oversigt.
-Emne 11.Download af data fra eksterne systemer
-Emne 12. Apache Spark – 1
-Emne 13. Apache Spark – 2
DWH
-Emne 14.Analytisk DBMS. MPP databaser
-Emne 15.DWH-modellering – 1. dbt grundlæggende
-Emne 16.DWH-modellering – 2. Data Vault 2.0
-Emne 17.DevOps-praksis i analytiske applikationer. CI+CD
-Emne 18. Analyse af fjernbetjening til sag 2
-Emne 19.Datakvalitet. Datakvalitetsstyring
-Emne 20. Implementering af en BI-løsning
-Emne 21.Overvågning / Metadata
NoSQL/NewSQL
-Emne 22.NoSQL Storage. Bred kolonne og nøgleværdi
-Emne 23.NoSQL Storage. Dokumentorienteret
-Tema 24.ELK
-Tema 25.ClickHouse
-Emne 26. Analyse af fjernbetjening til case 3
MLOps
-Emne 27.Organisation og pakning af kode
-Emne 28.Docker og REST arkitektur
-Tema 29.MLFlow + DVC
-Emne 30. Udrulning af modeller
-Emne 31. Analyse af fjernbetjening til case 4
-Emne 32. Analyse af fjernbetjening til sag 5
Afgangsprojekt
-Emne 33. Valg af emne og tilrettelæggelse af projektarbejdet
-Emne 34.Konsultation
-Emne 35.Beskyttelse