У наставку је практичан водич за вишеструку (мултиваријантну) бинарну логистичку регресију — тј. предвиђање бинарног исхода (0/1) на основу више карактеристика. Биномна логистичка регресија (обично се назива само логистичка регресија) је статистичка метода која се користи за моделирање односа између једне или више независних променљивих и бинарног (двокатегоријског) исхода. Бинарно: циљ y∈{0,1}
Вишеструка (мултиваријантна): више од једне улазне карактеристике x_1, x_2, ..., x_n
Модел:
p(y=1∣x)=1/(1+e^{−z}), где је z=w_0+w_1*x_1+⋯+w_n*x_n
и w_0, w_1...w_n су тежине израчунате помоћу x_1, x_2, ..., x_n и грешака између y и предвиђања.
Уместо директног предвиђања вредности, логистичка регресија предвиђа логаритамске шансе користећи линеарну комбинацију предиктора z. Логаритамске шансе се затим трансформишу коришћењем логистичке (сигмоидне) функције да би се добиле вероватноће између 0 и 1.
Бинарна логистичка регресија је вероватносни модел класификације који користи сигмоидну функцију за предвиђање вероватноће једног од два исхода, што је чини широко коришћеном у статистици, науци о подацима и машинском учењу за интерпретабилно бинарно доношење одлука.
Параметри модела се процењују коришћењем процене максималне вероватноће (MLE). Праг вредности (обично 0,5) се користи за класификацију исхода (ако је P≥0,5 → класа 1; ако је P<0,5 → класа 0).
Мултиномна логистичка регресија је статистичка метода и метода машинског учења која се користи за моделирање односа између скупа независних променљивих (предикторе) и категоријалне зависне променљиве са више од два могућа исхода, где категорије немају природни редослед.
Модел: За класу k:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x где је j=1,2...K
Где је: - x = вектор карактеристика
w_k = тежине за класу k
K = број класа
У апликацији, сваки објекат Објекат_k (објекат_1, објекат_2 ... објекат_m) је описан независним променљивим (X_ki – карактеристике, i = 1...n) и једном зависном променљивом (Y_k - циљ). Метода као што је метод обичних најмањих квадрата (OLS) се користи за израчунавање оптималних вредности коефицијената (beta_0, beta_1, beta_2, ..., beta_n). Циљна вредност се израчунава на следећи начин:
Y = beta_0 + beta_01* P_1 + beta_2 *P_2 + ... + beta_n* P_n
где је: P_1, P_2...P_n предиктори циља.
Апликација чува податке за више модела логистичке регресије у бази података (БД) типа SQLite под називом AppMultiNomialLogisticRegression.db. Модели регресије се разликују по имену.
Почетни екран апликације (App Multinomial Linear Logistic Regression Solver) приказује листу узорака регресионих модела (у ротирајућој листи) и дугмад за омогућавање функција за креирање (New sample), учитавање (Load), чување (Save), чување као (Save as), израчунавање (Calculate) и брисање (Delete) узорака регресионих модела. Са главног екрана, преко елемената менија, можете приступити и функцијама као што су избор језика, чување и копирање базе података, иницијализација базе података са подацима из узорка и помоћним функцијама као што су помоћ за апликацију, подешавања и линк до веб странице са описом свих апликација од стране аутора.
Функције за креирање (Нови узорак) укључују дијалог за унос величине матрице где се уносе подаци новог узорка – број редова (број укључених редова за предвиђене податке P_1, P_2...P_n – последњи ред) и број колона (број укључених колона за зависне податке Y_1, Y_2,...Y_k – последња колона). Затим се генерише табела за унос релевантних података. Попуњена табела мора бити именована пре чувања. Функција Учитај (Load) брише табелу.
Стара сачувана табела може се приказати изабрањем са листе. Приказана табела се може израчунати и решење се појављује у дијалогу Резултати апликације (App Results). Функција Штампа (Print) може се извршити из овог дијалога у датотеци AppMultipleLogisticRegressionSolver.txt. Активност Штампа (Print) укључује Сачувај базу података (Save Db/Save file) тако што се бира фасцикла у коју ће се сачувати датотека. Након избора фасцикле појављује се дугме за чување (Save). Из исте активности може се приказати садржај изабране датотеке, као и обрисати изабрана датотека.