Vícenásobná lineární regrese je statistická metoda používaná k modelování vztahu mezi jednou závislou proměnnou a dvěma nebo více nezávislými proměnnými fitováním lineární rovnice na pozorovaná data. Vícenásobná lineární regrese vysvětluje, jak několik prediktorů současně ovlivňuje výstupní proměnnou.
Hlavní složky vícenásobné lineární regrese:
- Závislá proměnná (Y): Toto je proměnná, kterou chceme predikovat. Často se také nazývá „cílová proměnná“ nebo „odezva“.
- Nezávislé proměnné (X1, X2, ..., Xn): Toto jsou proměnné, které používáme k predikci závislé proměnné. Často se také nazývají „prediktory“ nebo „vysvětlující proměnné“.
- Regresní model: Rovnice vícenásobné lineární regrese má následující tvar:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
kde:
Y je závislá proměnná. X1, X2, ..., Xn jsou nezávislé proměnné.
beta_0 je konstanta (průsečík s osou). beta_1,beta_2, ..., beta_n jsou regresní koeficienty, které ukazují vliv odpovídajících nezávislých proměnných na závislou proměnnou.
Aplikace: - Ekonomie (predikce příjmů); - Zdravotnictví (analýza rizikových faktorů); - Strojírenství; - Společenské vědy; - Obchodní prognózy.
Příklad: Predikce ceny domu na základě: - Velikosti domu; - Počet ložnic; - Stáří domu
V aplikaci je každý objekt Object_k( object_1, object_2 ... object_m) popsán nezávislými proměnnými (Xki – vlastnosti, i = 1...n) a jednou závislou proměnnou (Yk - cíl). Pro výpočet optimálních hodnot koeficientů (beta_0, beta_1, beta_2, ..., beta_n) se používá metoda, jako je metoda nejmenších čtverců (OLS). Cílová hodnota se vypočítá podle:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
kde: P1, P2...Pn jsou prediktory cíle.
Aplikace ukládá data pro více regresních modelů do databáze (DB) typu SQLite s názvem AppMultipleLinearRegression.db. Regresní modely se liší podle názvu. Úvodní obrazovka aplikace (App Multiple Linear Regression Solver) zobrazuje seznam vzorků regresních modelů (v rotujícím seznamu) a tlačítka pro povolení funkcí pro vytváření (New sample), načítání (Load), ukládání (Save), ukládání jako (Save as), výpočet (Calculate) a mazání (Delete) vzorků regresních modelů. Z hlavní obrazovky můžete prostřednictvím prvků nabídky také přistupovat k funkcím, jako je výběr jazyka, ukládání a kopírování databáze, inicializace databáze s ukázkovými daty, a pomocným funkcím, jako je nápověda k aplikaci, nastavení a odkaz na webové stránky s popisem všech aplikací od autorů. Funkce pro vytváření (New sample) zahrnují dialog pro zadání velikosti matice, kde se zadávají data nového vzorku – počet řádků (počet zahrnutých řádků pro predikovaná data P1, P2...Pn – poslední řádek) a počet sloupců (počet zahrnutých sloupců pro závislá data Y1, Y2,...Yk – poslední sloupec). Poté se vygeneruje tabulka pro zadání relevantních dat. Naplněná tabulka musí být před uložením pojmenována. Funkce Load tabulku vymaže. Stará uložená tabulka se může zobrazit výběrem z rotujícího seznamu. Zobrazenou tabulku lze vypočítat a řešení se zobrazí v dialogovém okně App results. Funkci Print lze spustit z tohoto dialogu v souboru AppMultipleLinearRegressionSolver.txt. Funkce Print zahrnuje aktivitu Save Db/Save file a vybere složku, kam se má soubor uložit. Po výběru složky se zobrazí tlačítko pro uložení. Ze stejné aktivity lze zobrazit obsah vybraného souboru, přejmenovat soubor nebo složku, vytvořit novou složku a také smazat vybraný soubor. Vícenásobná lineární regrese je výkonný nástroj pro analýzu dat, ale musí být používán s opatrností a s pochopením svých omezení. Nevýhody: Citlivá na multikolinearitu (silná korelace mezi nezávislými proměnnými). Ne vždy zachycuje nelineární vztahy. Vyžaduje pečlivé validaci a kontrolu předpokladů.
Datum aktualizace
6. 3. 2026