Generaliserede lineære modeller - kursus 3600 gnid. fra Åben uddannelse, træning 3 uger, ca. 6 timer om ugen, Dato 29. november 2023.
Miscellanea / / December 01, 2023
En af betingelserne for anvendeligheden af konventionelle lineære modeller er uafhængigheden af observationer fra hinanden, på grundlag af hvilken modellen vælges. Men i praksis er der ofte situationer, hvor udformningen af materialesamlingen er sådan, at overtrædelse af denne betingelse er uundgåelig. Forestil dig, at du besluttede at bygge en model, der beskriver forholdet mellem idrætspræstationer og IQ-testresultater blandt elever. For at løse dette problem har du lavet adskillige prøver på flere institutioner. Er det muligt at kombinere sådanne data i én analyse, bygget efter det traditionelle skema? Selvfølgelig ikke. Studerende på hvert universitet kan på nogle måder ligne hinanden. Selv arten af forholdet mellem de mængder, der undersøges, kan være noget anderledes. Denne type data, hvori der er intragruppekorrelationer, bør analyseres ved hjælp af lineære blandede modeller. Vi vil vise, at nogle prædiktorer bør indgå i modellen som såkaldte "tilfældige faktorer". Du vil lære, at tilfældige faktorer kan være hierarkisk underordnet. Vi vil diskutere, hvordan sådanne blandede modeller kan bygges for afhængige variabler, der følger forskellige typer fordelinger. Derudover vil vi vise, at den tilfældige del af modellen kan være endnu mere kompleks – den kan have en komponent, der modellerer variansens adfærd som reaktion på påvirkningen af en kovariat. I slutningen af forløbet finder du et projekt, hvor du kan øve dig i at bygge blandede modeller ved at vælge et af flere datasæt. Baseret på analysen af disse data kan du oprette en rapport i traditionen for reproducerbar forskning.
Lektor, Institut for Invertebrat Zoologi, Biologisk Fakultet, St. Petersburg State University, Ph.D.
Videnskabelige interesser: struktur og dynamik af marine benthossamfund, rumlige skalaer, succession, interspecifik og intraspecifik biotiske interaktioner, vækst og reproduktion af marine hvirvelløse dyr, befolkningernes demografiske struktur, mikroevolution, biostatistik.
Kurset består af 4 moduler:
1) Introduktion til generaliserede lineære modeller
Generaliserede lineære modeller (GLM'er) giver dig mulighed for at modellere adfærden af mængder, der ikke følger en normalfordeling. For at gøre dine første skridt i GLM-verdenen nemmere, vil vi analysere deres struktur ved hjælp af eksemplet med GLM for normalfordelte mængder - på denne måde kan du drage paralleller med simple lineære modeller. Du vil lære, hvad en linkfunktion er, hvordan maksimal sandsynlighed virker, og hvordan man tester GLM-hypoteser ved hjælp af Wald-tests og likelihood-ratio-tests.
2) Modelvalgsproblem
I dette modul vil vi tale om metodiske problemstillinger forbundet med at bygge modeller. En model er en forenklet repræsentation af virkeligheden, og det er en hyppig opgave for analytikeren at vælge mellem forskellige konkurrerende metoder til en sådan forenkling. På dette modul lærer du at sammenligne modeller ved hjælp af informationskriterier. Vi vil diskutere de vigtigste muligheder for analysen ved valg af modeller og tale om de vanskeligheder, der opstår i forbindelse med den skjulte mangfoldighed af modeller. Til sidst vil vi lære dig at genkende hovedtyperne af misbrug af modelvalg (datafiskeri, p-hacking).
3) Generaliserede lineære modeller til optælling af data
I dette modul vil vi diskutere grundlæggende metoder til modellering af tællelige mængder. Først vil vi diskutere, hvorfor konventionelle lineære modeller ikke er egnede til at tælle data. Egenskaberne for tællelige distributioner hjælper dig med at forstå forskellene mellem typerne af GLM for tællelige data og funktionerne i deres diagnostik. Du vil se linkfunktionen på arbejde, når du visualiserer GLM-forudsigelser på linkfunktionsskalaen og på responsvariabelskalaen.
4) Generaliserede lineære modeller med binær respons
Nogle gange er der behov for at simulere, om en hændelse har fundet sted eller ej, om fodboldhold eller tabt, uanset om patienten kom sig efter behandling eller ej, om klienten forpligtede sig køb eller ej. Konventionelle lineære modeller er ikke egnede til modellering af sådanne binære data (hændelser med to udfald), men dette kan nemt gøres ved hjælp af generaliserede lineære modeller. I dette modul lærer du at modellere sandsynligheden for begivenheder, der opstår ved at repræsentere dem som odds. Vi vil se på, hvordan logit link-funktionen fungerer, og hvordan GLM-koefficienter fortolkes, når den bruges. Endelig vil du kunne øve dig i at analysere generaliserede lineære modeller med forskellige fordelinger ved at gennemføre et dataanalyseprojekt. Resultaterne af denne analyse skal præsenteres som en rapport i html-format, skrevet med rmarkdown/knitr.
• Lær hvilke færdigheder der er nødvendige for at komme i gang med analyse og datavidenskab • Lær at bruge Excel, SQL, Power BI, Google Data Studio til at arbejde med data og skriv din første kode i Python• Få en trin-for-trin guide og lær, hvordan du går ind i datavidenskabsfeltet og vælger en rolle i Data Science
4,4
1 490 ₽