Machine learning på big data - gratis kursus fra Open Education, træning 5 uger, fra 5 til 14 timer om ugen, Dato: 3. december 2023.
Miscellanea / / December 08, 2023
Stilling: Crowd Solution Architect, Neatsy, Inc.
Begyndte at arbejde på Handelshøjskolen i 2017. Hun underviser i kurser i digital literacy, tekstanalyse og værktøjer og teknikker til at arbejde med store mængder tekstinformation. Faglige interesser: big data-analyse Uddannelse 2018 Bachelorgrad: National Research University Higher School of Economics, speciale "Anvendt matematik og datalogi"
1. Forberedelse af data til træning
I dag fungerer maskinlæring effektivt, når vi har store mængder mærkede data. I denne uge vil vi se på, hvilke dataformater og markup der findes, og hvordan denne markup kan indsamles
2. Træning af klassiske modeller på big data
I denne uge lærer vi, hvordan man træner klassiske algoritmer (lineære modeller og beslutningstræer) på big data.
3. Bygning af anbefalingssystemer
Vi vil se på, hvordan vi kan parallelisere klassiske algoritmer, der bruges i anbefalingssystemer.
4. Analyse af store mængder tekstinformation
Lad os overveje maskinlæringsproblemer på tekster. Lad os tale om tekstforbehandling, og hvordan man får en struktureret repræsentation af tekstdata ved hjælp af modeller som word2vec og BERT.
5. Træning af dybe neurale netværk
Vi vil lære, hvordan man paralleliserer træningen af moderne neurale netværk, hvordan Horovod og Parameter Server fungerer indeni, og taler om Transfer Learning.