Вишеструка линеарна регресија је статистичка метода која се користи за моделирање односа између једне зависне променљиве и две или више независних променљивих прилагођавањем линеарне једначине посматраним подацима. Вишеструка линеарна регресија објашњава како неколико предиктора истовремено утиче на исходну променљиву.
Главне компоненте вишеструке линеарне регресије:
- Зависна променљива (Y): Ово је променљива коју желимо да предвидимо. Често се назива и „циљна променљива“ или „одговор“.
- Независне променљиве (X1, X2, ..., Xn): Ово су променљиве које користимо за предвиђање зависне променљиве. Често се називају и „предикторима“ или „објашњавајућим променљивама“.
- Модел регресије: Једначина вишеструке линеарне регресије има следећи облик:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
где је:
Y је зависна променљива. X1, X2, ..., Xn су независне променљиве.
beta_0 је константа (пресец). бета_1, бета_2, ..., бета_н су коефицијенти регресије који указују на утицај одговарајућих независних променљивих на зависну променљиву.
Примене: - Економија (предвиђање прихода); - Здравство (анализа фактора ризика); - Инжењерство; - Друштвене науке; - Пословно прогнозирање.
Пример: Предвиђање цене куће на основу: - Величине куће; - Броја спаваћих соба; - Старости куће
У апликацији, сваки објекат Објекат_к (објекат_1, објекат_2 ... објекат_м) је описан независним променљивим (Xki – карактеристике, i = 1...n) и једном зависном променљивом (Yk - циљ). Метода као што је метод обичних најмањих квадрата (OLS) се користи за израчунавање оптималних вредности коефицијената (бета_0, бета_1, бета_2, ..., бета_н). Циљна вредност се израчунава на следећи начин:
Y = бета_0 + бета_01* P1 + бета_2 *P2 + ... + бета_н* Pn
где су: P1, P2...Pn предиктори циља.
Апликација чува податке за вишеструке регресионе моделе у бази података (БД) типа SQLite под називом AppMultipleLinearRegression.db. Регресиони модели се разликују по имену. Почетни екран апликације (App Multiple Linear Regression Solver) приказује листу узорака регресионих модела (у ротирајућој листи) и дугмад за омогућавање функција за креирање (New sample), учитавање (Load), чување (Save), чување као (Save as), израчунавање (Calculate) и брисање (Delete) узорака регресионих модела. Са главног екрана, преко елемената менија, можете приступити и функцијама као што су избор језика, чување и копирање базе података, иницијализација базе података са узорцима података и помоћним функцијама као што су помоћ за апликацију, подешавања и линк до веб странице са описом свих апликација од стране аутора. Функције за креирање (New sample) укључују дијалог за унос величине матрице где се уносе подаци новог узорка – број редова (број укључених редова за предвиђене податке P1, P2...Pn – последњи ред) и број колона (број укључених колона за зависне податке Y1, Y2,...Yk – последња колона). Затим се генерише табела за унос релевантних података. Попуњена табела мора бити именована пре чувања. Функција „Учитај“ обрише табелу. Стара сачувана табела може се приказати изабраном са листе. Приказана табела се може израчунати и решење се појављује у дијалогу „Резултати апликације“. Функција „Штампај“ може се извршити из овог дијалога у датотеци AppMultipleLinearRegressionSolver.txt. Активност „Штампај“ укључује активност „Сачувај базу података/Сачувај датотеку“ тако што се бира фасцикла у коју ће се датотека сачувати. Након избора фасцикле, појављује се дугме за чување. Из исте активности може се приказати садржај изабране датотеке, преименовати датотеку или фасциклу, креирати нову фасциклу и такође обрисати изабрану датотеку. Вишеструка линеарна регресија је моћан алат за анализу података, али се мора користити са опрезом и разумевањем њених ограничења. Недостаци: Осетљива на мултиколинеарност (јака корелација између независних променљивих). Не обухвата увек нелинеарне односе. Захтева пажљиву валидацију и проверу претпоставки.