Žemiau pateikiamas praktinis vadovas, kaip taikyti daugybinę (daugiamatę) binarinę logistinę regresiją, t. y. numatyti binarinį rezultatą (0/1) pagal kelis požymius.
Binominė logistinė regresija (paprastai vadinama tiesiog logistine regresija) yra statistinis metodas, naudojamas modeliuoti ryšį tarp vieno ar kelių nepriklausomų kintamųjų ir binarinio (dviejų kategorijų) rezultato.
Dvejetainė: tikslinė reikšmė y∈{0,1}
Daugiamatė: daugiau nei vienas įvesties požymis x_1, x_2, ..., x_n
Modelis:
p(y=1∣x)=1/(1+e^{−z}), kur z=w_0+w_1*x_1+⋯+w_n*x_n
ir w_0, w_1...w_n yra svoriai, apskaičiuoti pagal x_1, x_2, ..., x_n ir paklaidas tarp y ir prognozuojamų verčių.
Užuot tiesiogiai prognozavus reikšmes, logistinė regresija prognozuoja logaritminius šansus naudodama tiesinę prognozuojamųjų veiksnių z kombinaciją. Tada logaritminiai šansai transformuojami naudojant logistinę (sigmoidinę) funkciją, kad būtų gautos tikimybės nuo 0 iki 1.
Dvejetainė logistinė regresija yra tikimybinis klasifikavimo modelis, kuris naudoja sigmoidinę funkciją vieno iš dviejų rezultatų tikimybei numatyti, todėl jis plačiai naudojamas statistikoje, duomenų moksle ir mašininio mokymosi srityje interpretuojamam dvejetainių sprendimų priėmimui.
Modelio parametrai įvertinami naudojant didžiausios tikimybės įvertinimą (MLE). Rezultatams klasifikuoti naudojama slenkstinė vertė (paprastai 0,5) (jei P≥0,5 → 1 klasė; jei P<0,5 → 0 klasė).
Daugianominė logistinė regresija yra statistinis ir mašininio mokymosi metodas, naudojamas modeliuoti ryšį tarp nepriklausomų kintamųjų (prognozuojamųjų veiksnių) rinkinio ir kategorinio priklausomo kintamojo, turinčio daugiau nei du galimus rezultatus, kai kategorijos neturi natūralios tvarkos.
Modelis: k klasei:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x, kur j=1,2...K
Kur: - x = požymių vektorius
w_k = k klasės svoriai
K = klasių skaičius
Programėlėje kiekvienas objektas Object_k(object_1, object_2 ... object_m) aprašomas nepriklausomais kintamaisiais (X_ki – požymiai, i = 1...n) ir vienu priklausomu kintamuoju (Y_k - tikslas). Optimalioms koeficientų (beta_0, beta_1, beta_2, ..., beta_n) reikšmėms apskaičiuoti naudojamas toks metodas kaip paprastųjų mažiausių kvadratų (OLS) metodas. Tikslinė reikšmė apskaičiuojama taip:
Y = beta_0 + beta_01* P_1 + beta_2 *P_2 + ... + beta_n* P_n
kur: P_1, P_2...P_n yra tikslo prognozavimo veiksniai. Programa išsaugo kelių logistinės regresijos modelių duomenis SQLite tipo duomenų bazėje (DB), pavadintoje „AppMultiNomialLogisticRegression.db“. Regresijos modeliai skiriasi pagal pavadinimus.
Programos („App Multinomial Linear Logistic Regression Solver“) paleidimo ekrane rodomas regresijos modelių pavyzdžių sąrašas (suktuko sąraše) ir mygtukai, skirti įjungti funkcijas, skirtas kurti (New sample), įkelti (Load), išsaugoti (Save), išsaugoti kaip (Save as), apskaičiuoti (Calculate) ir ištrinti (Delete) regresijos modelių pavyzdžius. Pagrindiniame ekrane, per meniu elementus, taip pat galite pasiekti tokias funkcijas kaip kalbos pasirinkimas, duomenų bazės išsaugojimas ir kopijavimas, duomenų bazės inicijavimas pavyzdiniais duomenimis ir pagalbines funkcijas, tokias kaip programos pagalba, nustatymai ir nuoroda į svetainę su visų autorių pateiktu programų aprašymu.
Funkcijos, skirtos sukurti (naują pavyzdį), apima dialogo langą, skirtą įvesti matricos dydį, į kurį įvedami naujo pavyzdžio duomenys – eilučių skaičių (įtraukiamų eilučių skaičius numatomiems duomenims P_1, P_2...P_n – paskutinė eilutė) ir stulpelių skaičių (įtraukiamų stulpelių skaičius priklausomiems duomenims Y_1, Y_2,...Y_k – paskutinis stulpelis). Tada generuojama lentelė atitinkamiems duomenims įvesti. Užpildyta lentelė prieš išsaugojant turi būti pavadinta. Funkcija „Įkelti“ išvalo lentelę.
Seną išsaugotą lentelę galima rodyti pasirinkus iš suktuko sąrašo. Rodoma lentelė gali būti apskaičiuota, o sprendimai rodomi dialogo lange „Programėlės rezultatai“. Funkciją „Spausdinti“ galima vykdyti iš šio dialogo lango faile „AppMultipleLogisticRegressionSolver.txt“. Įtraukiamo failo spausdinimo veikla „Įrašyti duomenų bazę / Įrašyti failą“ pasirenka aplanką, kuriame norite išsaugoti failą. Pasirinkus aplanką, pasirodo išsaugojimo mygtukas. Iš tos pačios veiklos galima peržiūrėti pasirinkto failo turinį ir ištrinti pasirinktą failą.