Nižšie je uvedený praktický návod na viacnásobnú (viacrozmernú) binárnu logistickú regresiu – t. j. predpovedanie binárneho výsledku (0/1) z viacerých atribútov. Binomická logistická regresia (zvyčajne nazývaná len logistická regresia) je štatistická metóda používaná na modelovanie vzťahu medzi jednou alebo viacerými nezávislými premennými a binárnym (dvojkategóriovým) výsledkom. Binárna: cieľová hodnota y∈{0,1}
Viacnásobná (viacrozmerná): viac ako jeden vstupný atribút x_1, x_2, ..., x_n
Model:
p(y=1∣x)=1/(1+e^{−z}), kde z=w_0+w_1*x_1+⋯+w_n*x_n
a w_0, w_1...w_n sú váhy vypočítané z x_1, x_2, ..., x_n a chýb medzi y a predikciami.
Namiesto priameho predpovedania hodnôt logistická regresia predpovedá logaritmické pravdepodobnosti pomocou lineárnej kombinácie prediktorov z. Logaritmické pravdepodobnosti sa potom transformujú pomocou logistickej (sigmoidnej) funkcie, čím sa vytvoria pravdepodobnosti medzi 0 a 1.
Binárna logistická regresia je pravdepodobnostný klasifikačný model, ktorý používa sigmoidnú funkciu na predpovedanie pravdepodobnosti jedného z dvoch výsledkov, vďaka čomu sa široko používa v štatistike, dátovej vede a strojovom učení na interpretovateľné binárne rozhodovanie.
Parametre modelu sa odhadujú pomocou odhadu maximálnej pravdepodobnosti (MLE). Na klasifikáciu výsledkov sa používa prahová hodnota (zvyčajne 0,5) (ak P ≥ 0,5 → trieda 1; ak P < 0,5 → trieda 0).
Multinomická logistická regresia je štatistická a strojovo-učiaca metóda používaná na modelovanie vzťahu medzi súborom nezávislých premenných (prediktorov) a kategorickou závislou premennou s viac ako dvoma možnými výsledkami, kde kategórie nemajú prirodzené usporiadanie.
Model: Pre triedu k:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x kde j=1,2...K
Kde: - x = vektor znakov
w_k = váhy pre triedu k
K = počet tried
V aplikácii je každý objekt Object_k( object_1, object_2 ... object_m) opísaný nezávislými premennými (X_ki – znaky, i = 1...n) a jednou závislou premennou (Y_k - cieľ). Na výpočet optimálnych hodnôt koeficientov (beta_0, beta_1, beta_2, ..., beta_n) sa používa metóda, ako napríklad metóda najmenších štvorcov (OLS). Cieľová hodnota sa vypočíta podľa:
Y = beta_0 + beta_01* P_1 + beta_2 *P_2 + ... + beta_n* P_n
kde: P_1, P_2...P_n sú prediktory cieľa.
Aplikácia ukladá dáta pre viacero logistických regresných modelov do databázy (DB) typu SQLite s názvom AppMultiNomialLogisticRegression.db. Regresné modely sa líšia názvom.
Úvodná obrazovka aplikácie (App Multinomial Linear Logistic Regression Solver) zobrazuje zoznam vzoriek regresných modelov (v zozname s otáčavým zoznamom) a tlačidlá na povolenie funkcií na vytvorenie (New sample), načítanie (Load), uloženie (Save), uloženie ako (Save as), výpočet (Calculate) a odstránenie (Delete) vzoriek regresných modelov. Z hlavnej obrazovky môžete prostredníctvom prvkov ponuky pristupovať aj k funkciám, ako je výber jazyka, ukladanie a kopírovanie databázy, inicializácia databázy vzorovými dátami a pomocným funkciám, ako je pomocník pre aplikáciu, nastavenia a odkaz na webovú stránku s popisom všetkých aplikácií od autorov.
Funkcie na vytvorenie (Nová vzorka) zahŕňajú dialógové okno na zadanie veľkosti matice, kde sa zadávajú údaje novej vzorky – počet riadkov (počet zahrnutých riadkov pre predpokladané údaje P_1, P_2...P_n – posledný riadok) a počet stĺpcov (počet zahrnutých stĺpcov pre závislé údaje Y_1, Y_2,...Y_k – posledný stĺpec). Následne sa vygeneruje tabuľka na zadanie relevantných údajov. Naplnená tabuľka musí byť pred uložením pomenovaná. Funkcia Load vymaže tabuľku.
Stará uložená tabuľka sa môže zobraziť výberom zo zoznamu. Zobrazenú tabuľku je možné vypočítať a riešenie sa zobrazí v dialógovom okne App results. Funkciu Print je možné vykonať z tohto dialógového okna v súbore AppMultipleLogisticRegressionSolver.txt. Funkcia Print zahŕňa aktivitu Save Db/Save file (Uložiť databázu/Uložiť súbor) a vyberie priečinok, kam sa má súbor uložiť. Po výbere priečinka sa zobrazí tlačidlo pre uloženie. Z tej istej aktivity je možné zobraziť obsah vybraného súboru a tiež vybraný súbor odstrániť.