A többszörös lineáris regresszió egy statisztikai módszer, amely egy függő változó és két vagy több független változó közötti kapcsolatot modellez egy lineáris egyenlet megfigyelt adatokhoz való illesztésével. A többszörös lineáris regresszió elmagyarázza, hogy több prediktor hogyan befolyásolja egyidejűleg egy kimeneteli változót.
A többszörös lineáris regresszió fő összetevői:
- Függő változó (Y): Ez az a változó, amelyet meg akarunk jósolni. Gyakran "célváltozónak" vagy "válaszváltozónak" is nevezik.
- Független változók (X1, X2, ..., Xn): Ezeket a változókat használjuk a függő változó előrejelzésére. Gyakran "prediktoroknak" vagy "magyarázó változóknak" is nevezik őket.
- Regressziós modell: A többszörös lineáris regresszió egyenlete a következő alakú:
Y = béta_0 + béta_01* X1 + béta_2*X2 + ... + béta_n* Xn
ahol:
Y a függő változó. X1, X2, ..., Xn a független változók.
béta_0 az állandó (metszet). A béta_1, béta_2, ..., béta_n regressziós együtthatók, amelyek a megfelelő független változók hatását jelzik a függő változóra.
Alkalmazások: - Közgazdaságtan (jövedelem előrejelzés); - Egészségügy (kockázati tényező elemzés); - Mérnöki tudományok; - Társadalomtudományok; - Üzleti előrejelzés.
Példa: Házár előrejelzése a következők alapján: - Ház mérete; - Hálószobák száma; - Ház kora
Az alkalmazásban minden Object_k (objektum_1, objektum_2 ... objektum_m) objektumot független változók (Xki – jellemzők, i = 1...n) és egy függő változó (Yk – cél) ír le. Az együtthatók (béta_0, béta_1, béta_2, ..., béta_n) optimális értékeinek kiszámításához egy olyan módszert alkalmaznak, mint a közönséges legkisebb négyzetek módszere (OLS). A célérték kiszámítása a következőképpen történik:
Y = béta_0 + béta_01* P1 + béta_2 *P2 + ... + béta_n* Pn
ahol: P1, P2...Pn a célérték prediktorai.
Az alkalmazás több regressziós modell adatait egy AppMultipleLinearRegression.db nevű SQLite típusú adatbázisba (DB) menti. A regressziós modelleket név szerint különbözteti meg.
Az alkalmazás kezdőképernyője (App Multiple Linear Regression Solver) megjeleníti a regressziós modellek mintáinak listáját (léptető listában), valamint gombokat a regressziós modellek mintáinak létrehozásához (Új minta), betöltéséhez (Betöltés), mentéséhez (Mentés), mentéshez másként (Mentés másként), kiszámításához (Számítás) és törléséhez (Törlés). A főképernyőről a menüelemeken keresztül olyan funkciókhoz is hozzáférhet, mint a nyelvválasztás, az adatbázis mentése és másolása, az adatbázis inicializálása mintaadatokkal, valamint kiegészítő funkciókhoz, például az alkalmazás súgójához, a beállításokhoz és egy linkhez a weboldalhoz, amely a szerzők által leírt összes alkalmazást tartalmazza.
Az (Új minta) létrehozására szolgáló funkciók közé tartozik a mátrix méretének megadására szolgáló párbeszédpanel, ahol megadhatja az új minta adatait – a sorok számát (a belefoglalt sorok számát a prediktált adatokhoz P1, P2...Pn – utolsó sor) és az oszlopok számát (a belefoglalt oszlopok számát a függő adatokhoz Y1, Y2,...Yk – utolsó oszlop). Ezután táblázat generálódik a releváns adatok beviteléhez. A kitöltött táblázatot mentés előtt el kell nevezni. A Tábla betöltése és törlése funkcióval lehet megnyitni.
A régi mentett táblázat megjeleníthető a listából kiválasztva. A megjelenített táblázat kiszámítható, és a megoldások megjelennek az Alkalmazás eredményei párbeszédpanelen. A Nyomtatás funkció ebből a párbeszédpanelből futtatható az AppMultipleLinearRegressionSolver.txt fájlban. A Nyomtatás funkció tartalmazza a Adatbázis mentése/Fájl mentése műveletet, amely kiválasztja a fájl mentési mappáját. A mappa kiválasztása után megjelenik a mentés gomb. Ugyanebből a tevékenységből megjeleníthető a kiválasztott fájl tartalma, átnevezhető a fájl vagy mappa, létrehozható új mappa, és törölhető a kiválasztott fájl is.
A többszörös lineáris regresszió egy hatékony adatelemző eszköz, de óvatosan és a korlátai ismeretében kell használni.
Hátrányok: Érzékeny a multikollinearitásra (erős korreláció a független változók között). Nem mindig ragadja meg a nemlineáris kapcsolatokat. A feltételezések gondos validálását és ellenőrzését igényli.