Višestruka linearna regresija je statistička metoda koja se koristi za modeliranje odnosa između jedne zavisne varijable i dvije ili više nezavisnih varijabli prilagođavanjem linearne jednadžbe promatranim podacima. Višestruka linearna regresija objašnjava kako nekoliko prediktora istovremeno utječe na varijablu ishoda.
Glavne komponente višestruke linearne regresije:
- Zavisna varijabla (Y): Ovo je varijabla koju želimo predvidjeti. Često se naziva i "ciljna varijabla" ili "odgovor".
- Nezavisne varijable (X1, X2, ..., Xn): Ovo su varijable koje koristimo za predviđanje zavisne varijable. Često se nazivaju i "prediktori" ili "objašnjavajuće varijable".
- Regresijski model: Jednadžba višestruke linearne regresije ima sljedeći oblik:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
gdje je:
Y je zavisna varijabla. X1, X2, ..., Xn su nezavisne varijable.
beta_0 je konstanta (odsječak na osi). beta_1,beta_2, ..., beta_n su regresijski koeficijenti koji pokazuju utjecaj odgovarajućih nezavisnih varijabli na zavisnu varijablu.
Primjene: - Ekonomija (predviđanje dohotka); - Zdravstvo (analiza faktora rizika); - Inženjerstvo; - Društvene znanosti; - Poslovno predviđanje.
Primjer: Predviđanje cijene kuće na temelju: -Veličine kuće; -Broj spavaćih soba; - Starosti kuće
U aplikaciji svaki objekt Object_k( object_1, object_2 ... object_m) opisan je nezavisnim varijablama (Xki – značajke, i = 1...n) i jednom zavisnom varijablom (Yk - cilj). Metoda poput metode običnih najmanjih kvadrata (OLS) koristi se za izračun optimalnih vrijednosti koeficijenata (beta_0, beta_1, beta_2, ..., beta_n). Ciljana vrijednost izračunava se na sljedeći način:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
gdje su: P1, P2...Pn prediktori cilja.
Aplikacija sprema podatke za više regresijskih modela u bazu podataka (DB) tipa SQLite pod nazivom AppMultipleLinearRegression.db. Regresijski modeli se razlikuju po nazivu. Početni zaslon aplikacije (App Multiple Linear Regression Solver) prikazuje popis uzoraka regresijskih modela (u spinner listi) i gumbe za omogućavanje funkcija za stvaranje (New sample), učitavanje (Load), spremanje (Save), spremanje kao (Save as), izračun (Calculate) i brisanje (Delete) uzoraka regresijskih modela. S glavnog zaslona, putem elemenata izbornika, možete pristupiti i funkcijama kao što su odabir jezika, spremanje i kopiranje baze podataka, inicijalizacija baze podataka s uzorkom podataka i pomoćnim funkcijama kao što su pomoć za aplikaciju, postavke i poveznica na web stranicu s opisom svih aplikacija od strane autora. Funkcije za stvaranje (New sample) uključuju dijalog za unos veličine matrice gdje se unose podaci novog uzorka - broj redaka (broj uključenih redaka za predviđene podatke P1, P2...Pn – zadnji redak) i broj stupaca (broj uključenih stupaca za ovisne podatke Y1, Y2,...Yk – zadnji stupac). Zatim se generira tablica za unos relevantnih podataka. Popunjena tablica mora biti imenovana prije spremanja. Funkcija Load briše tablicu. Stara spremljena tablica može se prikazati odabirom s popisa. Prikazana tablica može se izračunati, a rješenje se pojavljuje u dijalogu App results. Funkcija Print može se izvršiti iz ovog dijaloga u datoteci AppMultipleLinearRegressionSolver.txt. Ispis uključuje aktivnost Spremi bazu podataka/Spremi datoteku odabirom mape u koju će se spremiti datoteka. Nakon odabira mape pojavljuje se gumb za spremanje. Iz iste aktivnosti može se prikazati sadržaj odabrane datoteke, preimenovati datoteka ili mapa, stvoriti nova mapa i izbrisati odabrana datoteka. Višestruka linearna regresija je moćan alat za analizu podataka, ali se mora koristiti s oprezom i razumijevanjem svojih ograničenja. Nedostaci: Osjetljivost na multikolinearnost (jaka korelacija između nezavisnih varijabli). Ne obuhvaća uvijek nelinearne odnose. Zahtijeva pažljivu validaciju i provjeru pretpostavki.