Lineær regression - Kursus 4900 Rub. Fra åben uddannelse, træning 5 uger, ca. 2 timer om ugen, dato 29. november 2023.
Miscellanea / / November 29, 2023
Hvis korrelationsanalyse gør det muligt at kvantificere styrken og retningen af sammenhængen mellem to størrelser, så giver opbygningen af regressionsmodeller større muligheder. Ved hjælp af regressionsanalyse er det muligt kvantitativt at beskrive adfærden af de undersøgte størrelser afhængigt af prædiktorvariable og opnå forudsigelser på nye data. Du vil lære at bygge enkle og flere lineære modeller ved hjælp af R-sproget. Hver metode har sine begrænsninger, så vi hjælper dig med at forstå i hvilke situationer lineær regression kan og kan ikke bruges, og vi vil lære dig metoder til at diagnosticere udvalgte modeller. En særlig plads i kurset gives til regressionsanalysens dybdegående anatomi: du vil mestre operationer med matricer, der er grundlaget for lineær regression for at kunne forstå mere komplekse varianter af lineære modeller.
Hvis du står over for behovet for at søge og beskrive sammenhænge mellem bestemte fænomener, der kan måles kvantitativt, så er dette kursus en god mulighed for at forstå, hvordan simpel og multipel lineær regression virker, lære om muligheder og begrænsninger ved disse metoder.
Kurset er designet til dem, der allerede er fortrolige med de grundlæggende teknikker til dataanalyse ved brug af R-sproget og med oprettelsen af simple .html-dokumenter ved hjælp af rmarkdown og knitr.
Videnskabelige interesser: struktur og dynamik af marine benthossamfund, rumlige skalaer, succession, interspecifik og intraspecifik biotiske interaktioner, vækst og reproduktion af marine hvirvelløse dyr, befolkningernes demografiske struktur, mikroevolution, biostatistik.
Kurset består af 5 moduler:
1. Korrelationsanalyse. Simpel lineær regression
Vi vil begynde vores samtale om metoder til numerisk at beskrive sammenhænge mellem kvantitative størrelser med kovarians og korrelationskoefficienter, som giver os mulighed for at estimere styrken og retningen af sammenhængen. Derefter vil du lære, hvilken yderligere information om sammenhænge, der kan opnås ved at konstruere en lineær model af sammenhængen mellem størrelser. Du lærer at fortolke regressionskoefficienter og lære, hvornår og hvordan lineære modeller kan bruges til at lave forudsigelser på nye data. Ved afslutningen af dette modul vil du lære, hvordan du tilpasser en lineær modelligning og plotter den med et konfidensområde.
2. Test af signifikans og validitet af lineære modeller
At bygge en lineær model og nedskrive dens ligning er kun begyndelsen på analysen. I dette modul lærer du, hvordan du beskriver resultaterne af regressionsanalyse: hvordan man tester den overordnede models statistiske signifikans eller dens koefficienter og vurderer kvaliteten af tilpasningen. Lineære modeller (eller rettere, de statistiske test, der bruges til dem), som enhver metode, har deres begrænsninger. Du vil lære, hvad disse begrænsninger er, og hvor de kommer fra. De grafiske diagnostiske metoder, som vi vil bruge, er universelle for forskellige lineære modeller - mere øvelse vil hjælpe dig med at træffe beslutninger mere selvsikkert. Når du forstår alt dette, kan du skrive et komplet script i R for at tilpasse, diagnosticere og præsentere resultaterne af en simpel lineær regression.
3. En kort introduktion til den lineære algebras verden
I dette modul vil vi dykke ned i hjertet af lineære modeller. For at gøre dette skal du lære eller huske det grundlæggende i lineær algebra. Vi vil diskutere de forskellige typer matricer, hvordan man opretter dem i R og grundlæggende operationer med dem. Vi får brug for alt dette for at forstå, hvordan lineær regression virker indefra. Du lærer, hvad en modelmatrix er, lærer at skrive en lineær regressionsligning i form af matricer og finde dens koefficienter. Du vil med dine egne øjne se hattematricen, som giver dig mulighed for at opnå forudsagte værdier, og du vil endda være i stand til at beregne den manuelt. Til sidst lærer du at beregne den resterende varians, varians-kovariansmatrix og bruge alt dette til at opbygge en regressionskonfidenszone. Så vil denne viden hjælpe dig med at forstå strukturen af mere komplekse modeller: med diskrete prædiktorer, med forskellige fordelinger af residualer, med en anden struktur af variation-kovariansmatrixen.
4. Multipel lineær regression
Oftest er forholdet mellem størrelser mere komplekse, end det kan beskrives ved hjælp af simpel lineær regression. Multipel lineær regression bruges til at beskrive, hvordan en responsvariabel afhænger af flere prædiktorer. Med fremkomsten af flere prædiktorer i modellen har lineær regression en ny betingelse for anvendelighed - kravet om fravær af multikolinearitet. I dette modul lærer du, hvordan du identificerer og undgår multikolinearitet. Endelig er der ofte flere variabler i flere modeller, end der kan afbildes på et plan, Det er derfor, vi vil lære dig simple teknikker, der vil hjælpe dig med at skabe informativ grafik selv i dette sag.
5. Sammenligning af lineære modeller
Flere lineære modeller er som et byggesæt: mere komplekse modeller kan skilles ad og forenkles. Du vil lære, hvordan indlejrede modelsammenligninger ved hjælp af den partielle F-test bruges til at teste betydningen af individuelle forudsigere eller grupper af forudsigere. Mere komplekse modeller beskriver bedre de originale data, men overdreven komplikation er farlig, fordi sådanne modeller begynder at lave dårlige forudsigelser om nye data. Ved at bruge delvise F-tests kan du forenkle modeller ved gradvist at eliminere ikke-signifikante prædiktorer. Forenklede modeller er nemmere at bruge til at fortolke og præsentere resultater. Alt, hvad du hidtil har lært om lineær regression, kan anvendes ved at gennemføre et dataanalyseprojekt, hvor du skal opbygge en optimal multipel lineær model korrekt og præsentere dens resultater i en rapport skrevet vha afmærkning og strik.