Mitmekordne lineaarne regressioon on statistiline meetod, mida kasutatakse ühe sõltuva muutuja ja kahe või enama sõltumatu muutuja vahelise seose modelleerimiseks, sobitades vaadeldud andmetele lineaarse võrrandi. Mitmekordne lineaarne regressioon selgitab, kuidas mitu ennustajat samaaegselt tulemusmuutujat mõjutavad.
Mitmekordse lineaarse regressiooni peamised komponendid:
- Sõltuv muutuja (Y): See on muutuja, mida me tahame ennustada. Seda nimetatakse sageli ka "sihtmuutujaks" või "vastuseks".
- Sõltumatud muutujad (X1, X2, ..., Xn): Need on muutujad, mida me kasutame sõltuva muutuja ennustamiseks. Neid nimetatakse sageli ka "ennustajateks" või "selgitavateks muutujateks".
- Regressioonimudel: Mitmekordse lineaarse regressiooni võrrandil on järgmine kuju:
Y = beeta_0 + beeta_01* X1 + beeta_2*X2 + ... + beeta_n* Xn
kus:
Y on sõltuv muutuja. X1, X2, ..., Xn on sõltumatud muutujad.
beeta_0 on konstant (lõikepunkt). beeta_1, beeta_2, ..., beeta_n on regressioonikordajad, mis näitavad vastavate sõltumatute muutujate mõju sõltuvale muutujale.
Rakendused: - Majandus (sissetulekute ennustamine); - Tervishoid (riskitegurite analüüs); - Inseneriteadus; - Sotsiaalteadused; - Äriprognoosid.
Näide: Maja hinna ennustamine järgmiste tegurite põhjal: - Maja suurus; - Magamistubade arv; - Maja vanus
Rakenduses kirjeldatakse iga objekti Object_k(objekt_1, objekt_2 ... objekt_m) sõltumatute muutujate (Xki – tunnused, i = 1...n) ja ühe sõltuva muutuja (Yk - sihtmärk) abil. Koefitsientide (beeta_0, beeta_1, beeta_2, ..., beeta_n) optimaalsete väärtuste arvutamiseks kasutatakse meetodit nagu tavalised vähimruutud (OLS). Sihtväärtus arvutatakse järgmiselt:
Y = beeta_0 + beeta_01* P1 + beeta_2 *P2 + ... + beeta_n* Pn
kus: P1, P2...Pn on sihtmärgi ennustajad.
Rakendus salvestab mitme regressioonimudeli andmed andmebaasi (DB) tüüpi SQLite nimega AppMultipleLinearRegression.db. Regressioonimudeleid eristatakse nime järgi.
Rakenduse (App Multiple Linear Regression Solver) käivitusekraanil kuvatakse regressioonimudelite näidiste loend (kerimisloendis) ja nupud funktsioonide lubamiseks, et luua (New sample), laadida (Load), salvestada (Save), salvestada nimega (Save as), arvutada (Calculate) ja kustutada (Delete) regressioonimudelite näidiseid. Peamenüü elementide kaudu pääseb ligi ka sellistele funktsioonidele nagu keele valik, andmebaasi salvestamine ja kopeerimine, andmebaasi initsialiseerimine näidisandmetega ning abifunktsioonidele, nagu rakenduse abi, sätted ja link veebisaidile, kus on autorite kirjeldused kõigi rakenduste kohta.
Funktsioonid (New sample) loomiseks sisaldavad dialoogiboksi maatriksi suuruse sisestamiseks, kuhu sisestatakse uue valimi andmed – ridade arv (ennustatud andmete puhul kaasatavate ridade arv P1, P2...Pn – viimane rida) ja veergude arv (sõltuvate andmete puhul kaasatavate veergude arv Y1, Y2,...Yk – viimane veerg). Seejärel genereeritakse tabel asjakohaste andmete sisestamiseks. Täidetud tabel tuleb enne salvestamist nimetada. Funktsioon „Laadi ja tühjenda tabel“ võimaldab kuvada vana salvestatud tabelit, valides selle kerimisloendist. Kuvatavat tabelit saab arvutada ja lahendused kuvatakse dialoogiboksis „Rakenduse tulemused“. Funktsiooni „Prindi“ saab käivitada sellest dialoogiboksist failis „AppMultipleLinearRegressionSolver.txt“. „Prindi“ hõlmab toimingut „Salvesta andmebaas/Salvesta fail“, valides kausta, kuhu fail salvestada. Pärast kausta valimist kuvatakse salvestamise nupp. Samast toimingust saab kuvada valitud faili sisu, faili või kausta ümbernimetamist, uue kausta loomist ja ka valitud faili kustutamist.
Mitmekordne lineaarne regressioon on võimas andmeanalüüsi tööriist, kuid seda tuleb kasutada ettevaatlikult ja mõistes selle piiranguid.
Puudused: Tundlik multikollineaarsuse suhtes (tugev korrelatsioon sõltumatute muutujate vahel). Ei taba alati mittelineaarseid seoseid. Nõuab eelduste hoolikat valideerimist ja kontrollimist.
Värskendatud:
6. märts 2026