Specialisering "Data Analyst" - kursus 2900 rub. fra Stepik, træning 36 lektioner, Dato: 29. oktober 2023.
Miscellanea / / December 05, 2023
Dataanalytiker, produktanalytiker, kundebaseanalytiker, CRM-analytiker, dataforsker - alle disse erhverv er relateret til dataanalyse.
🎯 TOP krav til disse erhverv:
- Kendskab til SQL og erfaring med at arbejde med databaser;
- Kendskab til grundlæggende Python-syntaks og kendskab til Pandas-biblioteket;
- Kendskab til statistik og evne til at anvende den i dataanalyse;
- Analytisk tænkning.
Dette er ikke en komplet liste. For eksempel skal webanalytikere kende Google Analytics og Yandex. Metrics, og for data scientists - machine learning. Men jeg gav de grundlæggende krav, der findes i 70-80% af de ledige stillinger.
Dataanalytiker-specialiseringen består i øjeblikket af to kurser:
1️⃣ SQL for alle
I løbet af kurset vil du mestre SQL til niveau med at skrive komplekse SQL-forespørgsler og øve dig i at bruge data fra en handelsvirksomhed i et af de mest populære databasestyringssystemer.
Kurset er designet til begyndere, der gerne vil mestre SQL, samt dem, der kender SQL på et grundlæggende niveau, men ønsker at udfylde hullerne og konsolidere deres viden i praksis.
2️⃣ Python: Dataanalyse med pandaer
Kurset er helliget praktisk arbejde med pandaer. Du vil modtage den nødvendige teori og forstærke den med en lang række praktiske problemer.
Kurset er velegnet til dem, der allerede er bekendt med den grundlæggende Python-syntaks:
- Kender grundlæggende datatyper (inklusive lister og ordbøger) og operationer på dem;
- Har forståelse for, hvad en funktion og en metode er.
Kurset kan tages selv af begyndere, der selvstændigt kan finde ud af, hvordan man installerer Python og Pandas-biblioteket. Men hvis du lige er startet med Python, bliver du nødt til at indhente nogle grundlæggende ting på egen hånd, efterhånden som kurset skrider frem. Du kan i øvrigt få grundlæggende viden om Python-syntaks på dette kursus. Så vil det være meget nemmere at lære pandaer.
Kursernes koncept er baseret på tre principper:
Enkelhed
Præsentationen af materialet er tilgængelig og konsekvent - dette vil give dig mulighed for at danne den nødvendige vidensbase trin for trin.
Øve sig
Der lægges stor vægt på praksis - så du ikke kun løser kursusproblemerne, men også kan anvende viden i fremtiden, på rigtige projekter.
Support
Stil gerne spørgsmål i kommentarerne, det er vigtigt for mig, at alt stoffet er lært. Jeg svarer på kommentarer inden for en dag.
Den rækkefølge, som kurserne tages i, er ikke vigtig.
1. SQL for alle
Operationer på ét bord
1. Introduktion til databasen
2. Filtrering af WHERE-rækker. Regulære udtryk LIKE. OG og ELLER
3. Sortering af strenge BESTIL EFTER
4. Aggregerende funktioner: COUNT, SUM, MIN, MAX, AVG. Aliaser
5. Gruppering af GROUP BY og HAVING linjer. Generering af rapporter
6. Øv dig med udgangspunkt i resultaterne af 1. modul
Operationer på flere borde
1. Begreber primærnøgle og fremmednøgle. Typer af relationer i databasen
2. Generering af forespørgsler fra flere tabeller. INDRE JOIN og Aliaser
3. LEFT JOIN og andre typer JOINs
4. Deltag i flere borde ved hjælp af UNION og UNION ALL
5. Underforespørgsler
6. Øv dig ud fra resultaterne af 2. modul
Yderligere vigtige emner
1. CASE udtryk
2. Populære funktioner til at arbejde med strenge
Praktiske opgaver til at styrke kursusmateriale
1. Simple forespørgsler
2. Komplekse forespørgsler
3. Konklusion
2. Python: Dataanalyse med pandaer
Analyse af datarammer individuelt
1. Læsning af data fra filer
2. Eksplicit introduktion til data
3. Kolonne output
4. Datatyper
5. Filtrering af rækker
6. Regelmæssige udtryk
7. Sortering af strenge
8. Aggregationsfunktioner
9. Rækkegruppering
Analyse af flere relaterede datarammer
1. Flet a. k. en joinforbindelse
2. Sammenkædning
Yderligere påkrævet modul
1. Arbejder med datoer og tidspunkter
2. Pivottabeller
3. Nye måder at skabe datarammer på
4. Kategorisering af nominelle træk
5. Udskiftning af værdier i en dataramme
6. Visualisering i pandaer
7. Udskæring
8. Konklusion