Multippel lineær regresjon er en statistisk metode som brukes til å modellere forholdet mellom én avhengig variabel og to eller flere uavhengige variabler ved å tilpasse en lineær ligning til observerte data. Multippel lineær regresjon forklarer hvordan flere prediktorer påvirker en utfallsvariabel samtidig.
Hovedkomponenter i multippel lineær regresjon:
- Avhengig variabel (Y): Dette er variabelen vi ønsker å forutsi. Den kalles ofte også "målvariabelen" eller "responsen".
- Uavhengige variabler (X1, X2, ..., Xn): Dette er variablene vi bruker til å forutsi den avhengige variabelen. De kalles ofte også "prediktorer" eller "forklaringsvariabler".
- Regresjonsmodell: Ligningen for multippel lineær regresjon har følgende form:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
der:
Y er den avhengige variabelen. X1, X2, ..., Xn er de uavhengige variablene.
beta_0 er konstanten (skjæringspunktet). beta_1, beta_2, ..., beta_n er regresjonskoeffisientene som indikerer påvirkningen av de tilsvarende uavhengige variablene på den avhengige variabelen.
Anvendelser: - Økonomi (inntektsprediksjon); - Helsevesen (risikofaktoranalyse); - Ingeniørfag; - Samfunnsvitenskap; - Forretningsprognoser.
Eksempel: Prediksjon av boligpris basert på: - Størrelse på hus; - Antall soverom; - Husets alder
I appen beskrives hvert objekt Object_k(objekt_1, objekt_2 ... objekt_m) av uavhengige variabler (Xki – egenskaper, i = 1...n) og én avhengig variabel (Yk - mål). En metode som ordinære minste kvadrater (OLS) brukes til å beregne de optimale verdiene for koeffisientene (beta_0, beta_1, beta_2, ..., beta_n). Målverdien beregnes ved:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
hvor: P1, P2...Pn er prediktorer for målet.
Applikasjonen lagrer data for flere regresjonsmodeller i en database (DB) av typen SQLite med navnet AppMultipleLinearRegression.db. Regresjonsmodellene skilles fra hverandre ved navn.
Oppstartsskjermen til applikasjonen (App Multiple Linear Regression Solver) viser en liste over eksempler på regresjonsmodeller (i spinnerlisten) og knapper for å aktivere funksjonene for å opprette (Nytt eksempel), laste (Load), lagre (Save), lagre som (Save as), beregne (Calculate) og slette (Delete) eksempler på regresjonsmodeller. Fra hovedskjermen, via menyelementene, kan du også få tilgang til funksjoner som språkvalg, lagring og kopiering av databasen, initialisering av databasen med eksempeldata og tilleggsfunksjoner som hjelp for applikasjonen, innstillinger og en lenke til nettstedet med en beskrivelse av alle applikasjoner fra forfatterne.
Funksjonene for å opprette (Nytt eksempel) inkluderer dialogboksen for å legge inn størrelsen på matrisen der data for nytt eksempel legges inn – antall rader (tallet som inkluderer raden for predikerte data P1, P2...Pn – siste rad) og antall kolonner (tallet som inkluderer kolonnen for avhengige data Y1, Y2,...Yk – siste kolonne). Deretter genereres en tabell for å legge inn relevante data. Den utfylte tabellen må navngis før den lagres. Funksjonen Last inn (eller tøm tabellen). Den gamle lagrede tabellen kan vises ved å velge fra spinnerlisten. Den viste tabellen kan beregnes, og løsningen vises i dialogboksen App-resultater. Funksjonen Skriv ut kan utføres fra denne dialogboksen i filen AppMultipleLinearRegressionSolver.txt. Aktiviteten Skriv ut inkluderer aktiviteten Lagre database/lagre fil ved å velge den mappen der filen skal lagres. Etter at du har valgt mappe, vises en knapp for lagring. Fra samme aktivitet kan du vise innholdet i den valgte filen, gi nytt navn til filen eller mappen, opprette en ny mappe og også slette den valgte filen. Multippel lineær regresjon er et kraftig verktøy for dataanalyse, men det må brukes med forsiktighet og forståelse av dets begrensninger. Ulemper: Følsom for multikollinearitet (sterk korrelasjon mellom uavhengige variabler). Fanger ikke alltid opp ikke-lineære sammenhenger. Krever nøye validering og kontroll av antagelser.