Níže je uveden praktický průvodce vícenásobnou (vícerozměrnou) binární logistickou regresí – tj. predikcí binárního výsledku (0/1) z více atributů. Binomická logistická regrese (obvykle nazývaná jen logistická regrese) je statistická metoda používaná k modelování vztahu mezi jednou nebo více nezávislými proměnnými a binárním (dvoukategoriálním) výsledkem. Binární: cíl y∈{0,1}
Vícerozměrná (vícerozměrná): více než jeden vstupní atribut x_1, x_2, ..., x_n
Model:
p(y=1∣x)=1/(1+e^{−z}), kde z=w_0+w_1*x_1+⋯+w_n*x_n
a w_0, w_1...w_n jsou váhy vypočítané z x_1, x_2, ..., x_n a chyb mezi y a predikcemi.
Místo přímé predikce hodnot logistická regrese predikuje logaritmické pravděpodobnosti pomocí lineární kombinace prediktorů z. Logaritmické pravděpodobnosti se poté transformují pomocí logistické (sigmoidní) funkce za účelem získání pravděpodobností mezi 0 a 1.
Binární logistická regrese je pravděpodobnostní klasifikační model, který využívá sigmoidní funkci k predikci pravděpodobnosti jednoho ze dvou výsledků, díky čemuž se široce používá ve statistice, datové vědě a strojovém učení pro interpretovatelné binární rozhodování.
Parametry modelu se odhadují pomocí metody maximální pravděpodobnosti (MLE). Pro klasifikaci výsledků se používá prahová hodnota (obvykle 0,5) (pokud P ≥ 0,5 → třída 1; pokud P < 0,5 → třída 0).
Multinomická logistická regrese je statistická metoda a metoda strojového učení používaná k modelování vztahu mezi sadou nezávislých proměnných (prediktorů) a kategoriální závislou proměnnou s více než dvěma možnými výsledky, kde kategorie nemají žádné přirozené uspořádání.
Model: Pro třídu k:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x kde j=1,2...K
Kde: - x = vektor rysů
w_k = váhy pro třídu k
K = počet tříd
V aplikaci je každý objekt Object_k( object_1, object_2 ... object_m) popsán nezávislými proměnnými (X_ki – rysy, i = 1...n) a jednou závislou proměnnou (Y_k - cíl). Pro výpočet optimálních hodnot koeficientů (beta_0, beta_1, beta_2, ..., beta_n) se používá metoda, jako jsou obyčejné nejmenší čtverce (OLS). Cílová hodnota se vypočítá podle:
Y = beta_0 + beta_01* P_1 + beta_2 *P_2 + ... + beta_n* P_n
kde: P_1, P_2...P_n jsou prediktory cíle.
Aplikace ukládá data pro více logistických regresních modelů do databáze (DB) typu SQLite s názvem AppMultiNomialLogisticRegression.db. Regresní modely se liší podle názvu. Úvodní obrazovka aplikace (App Multinomial Linear Logistic Regression Solver) zobrazuje seznam vzorků regresních modelů (v rotujícím seznamu) a tlačítka pro povolení funkcí pro vytváření (New sample), načítání (Load), ukládání (Save), ukládání jako (Save as), výpočet (Calculate) a mazání (Delete) vzorků regresních modelů. Z hlavní obrazovky můžete prostřednictvím prvků nabídky také přistupovat k funkcím, jako je výběr jazyka, ukládání a kopírování databáze, inicializace databáze s ukázkovými daty a pomocným funkcím, jako je nápověda k aplikaci, nastavení a odkaz na webové stránky s popisem všech aplikací od autorů.
Funkce pro vytvoření (Nový vzorek) zahrnují dialog pro zadání velikosti matice, kde se zadávají data nového vzorku – počet řádků (počet zahrnutých řádků pro predikovaná data P_1, P_2...P_n – poslední řádek) a počet sloupců (počet zahrnutých sloupců pro závislá data Y_1, Y_2,...Y_k – poslední sloupec). Poté se vygeneruje tabulka pro zadání relevantních dat. Naplněná tabulka musí být před uložením pojmenována. Funkce Load tabulku vymaže.
Stará uložená tabulka se může zobrazit výběrem z číselníku. Zobrazenou tabulku lze vypočítat a řešení se zobrazí v dialogu Výsledky aplikace. Funkci Print lze spustit z tohoto dialogu v souboru AppMultipleLogisticRegressionSolver.txt. Funkce Print zahrnuje aktivitu Save Db/Save file, kde se vybere složka, kam se má soubor uložit. Po výběru složky se zobrazí tlačítko pro uložení. Stejnou aktivitou lze zobrazit obsah vybraného souboru a také soubor smazat.
Datum aktualizace
6. 3. 2026