Az alábbiakban egy gyakorlati útmutató található a többszörös (többváltozós) bináris logisztikus regresszióhoz – azaz egy bináris kimenetel (0/1) előrejelzéséhez több jellemzőből.
A binomiális logisztikus regresszió (általában egyszerűen logisztikus regressziónak nevezik) egy statisztikai módszer, amelyet egy vagy több független változó és egy bináris (két kategóriájú) kimenetel közötti kapcsolat modellezésére használnak.
Bináris: cél y∈{0,1}
Többváltozós (többváltozós): egynél több bemeneti jellemző x_1, x_2, ..., x_n
Modell:
p(y=1∣x)=1/(1+e^{−z}), ahol z=w_0+w_1*x_1+⋯+w_n*x_n
és w_0, w_1...w_n az x_1, x_2, ..., x_n által kiszámított súlyok, valamint az y és az előrejelzések közötti hibák.
Az értékek közvetlen előrejelzése helyett a logisztikus regresszió a log-oddsokat a z prediktorok lineáris kombinációjával jósolja meg. A log-oddsokat ezután logisztikus (szigmoid) függvénnyel transzformálják, hogy 0 és 1 közötti valószínűségeket kapjanak.
A bináris logisztikus regresszió egy valószínűségi osztályozási modell, amely a szigmoid függvényt használja két kimenetel egyikének valószínűségének előrejelzésére, így széles körben használják a statisztikában, az adattudományban és a gépi tanulásban az értelmezhető bináris döntéshozatalhoz.
A modellparamétereket maximális valószínűségbecsléssel (MLE) becsülik meg. Az eredmények osztályozására egy küszöbértéket (általában 0,5) használnak (Ha P≥0,5 → 1. osztály; Ha P<0,5 → 0. osztály).
A multinomiális logisztikus regresszió egy statisztikai és gépi tanulási módszer, amelyet független változók (prediktorok) halmaza és egy kettőnél több lehetséges kimenetellel rendelkező kategorikus függő változó közötti kapcsolat modellezésére használnak, ahol a kategóriáknak nincs természetes sorrendjük.
Modell: A k osztályra:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x ahol j=1,2...K
Ahol: - x = jellemzővektor
w_k = a k osztály súlyai
K = osztályok száma
Az alkalmazásban minden Object_k(objektum_1, objektum_2 ... objektum_m) objektumot független változók (X_ki – jellemzők, i = 1...n) és egy függő változó (Y_k - cél) ír le. Az együtthatók (béta_0, béta_1, béta_2, ..., béta_n) optimális értékeinek kiszámításához a közönséges legkisebb négyzetek módszerét (OLS) alkalmazzák. A célérték kiszámítása a következőképpen történik:
Y = béta_0 + béta_01* P_1 + béta_2 *P_2 + ... + béta_n* P_n
ahol: P_1, P_2...P_n a cél prediktorai. Az alkalmazás több logisztikus regressziós modell adatait egy AppMultiNomialLogisticRegression.db nevű SQLite típusú adatbázisba (DB) menti. A regressziós modelleket név szerint különbözteti meg.
Az alkalmazás kezdőképernyője (App Multinomial Linear Logistic Regression Solver) regressziós modellek mintáinak listáját jeleníti meg (léptető listában), valamint gombokat a regressziós modellek mintáinak létrehozásához (Új minta), betöltéséhez (Betöltés), mentéséhez (Mentés), mentés másként (Mentés másként), kiszámításához (Számítás) és törléséhez (Törlés) szükséges funkciók engedélyezéséhez. A főképernyőről a menüelemeken keresztül olyan funkciókat is elérhet, mint a nyelvválasztás, az adatbázis mentése és másolása, az adatbázis inicializálása mintaadatokkal, valamint kiegészítő funkciókat, például az alkalmazás súgóját, a beállításokat és a weboldalra mutató linket, amely a szerzők által leírt összes alkalmazást tartalmazza.
Az (Új minta) létrehozására szolgáló függvények tartalmazzák a mátrix méretének megadására szolgáló párbeszédablakot, ahová beírjuk az új minta adatait – sorok számát (a prediktált adatok sorszáma P_1, P_2...P_n – utolsó sor) és oszlopok számát (a függő adatok oszlopszáma Y_1, Y_2,...Y_k – utolsó oszlop). Ezután táblázat generálódik a releváns adatok megadásához. A feltöltött táblázatot mentés előtt el kell nevezni. A Tábla törlése funkcióval a Betöltés funkcióval lehet megjeleníteni.
A régi mentett táblázat megjeleníthető a listából kiválasztva. A megjelenített táblázat kiszámítható, és a megoldások megjelennek az Alkalmazás eredményei párbeszédablakban. A Nyomtatás funkció ebből a párbeszédablakban futtatható az AppMultipleLogisticRegressionSolver.txt fájlban. A Nyomtatás funkcióval a Mentés adatbázisban/Fájl mentése funkcióval kiválaszthatjuk a mappát, ahová a fájlt menteni szeretnénk. A mappa kiválasztása után megjelenik a mentés gombja. Ugyanebből a tevékenységből megjeleníthető a kiválasztott fájl tartalma, valamint törölhető a kiválasztott fájl.