La regressió lineal múltiple és un mètode estadístic que s'utilitza per modelar la relació entre una variable dependent i dues o més variables independents ajustant una equació lineal a les dades observades. La regressió lineal múltiple explica com diversos predictors afecten simultàniament una variable de resultat.
Components principals de la regressió lineal múltiple:
- Variable dependent (Y): Aquesta és la variable que volem predir. Sovint també s'anomena "variable objectiu" o "resposta".
- Variables independents (X1, X2, ..., Xn): Aquestes són les variables que fem servir per predir la variable dependent. Sovint també s'anomenen "predictors" o "variables explicatives".
- Model de regressió: L'equació de la regressió lineal múltiple té la forma següent:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
on:
Y és la variable dependent. X1, X2, ..., Xn són les variables independents.
beta_0 és la constant (intersecció). beta_1, beta_2, ..., beta_n són els coeficients de regressió que indiquen la influència de les variables independents corresponents sobre la variable dependent.
Aplicacions: - Economia (predicció d'ingressos); - Sanitat (anàlisi de factors de risc); - Enginyeria; - Ciències socials; - Previsió empresarial.
Exemple: Predicció del preu de l'habitatge en funció de: - Mida de l'habitatge; - Nombre d'habitacions; - Edat de l'habitatge
A l'aplicació, cada objecte Object_k (objecte_1, objecte_2... objecte_m) es descriu mitjançant variables independents (Xki – característiques, i = 1...n) i una variable dependent (Yk - objectiu). S'utilitza un mètode com ara els mínims quadrats ordinaris (MQO) per calcular els valors òptims dels coeficients (beta_0, beta_1, beta_2, ..., beta_n). El valor objectiu es calcula mitjançant:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
on: P1, P2...Pn són predictors de l'objectiu. L'aplicació desa les dades per a models de regressió múltiples en una base de dades (DB) de tipus SQLite anomenada AppMultipleLinearRegression.db. Els models de regressió es distingeixen pel seu nom.
La pantalla d'inici de l'aplicació (App Multiple Linear Regression Solver) mostra una llista d'exemples de models de regressió (en una llista giratòria) i botons per habilitar les funcions per crear (Nou exemple), carregar (Carregar), desar (Desar), desar com a (Desar com a), calcular (Calcular) i suprimir (Suprimir) exemples de models de regressió. Des de la pantalla principal, a través dels elements del menú, també podeu accedir a funcions com ara la selecció d'idioma, desar i copiar la base de dades, inicialitzar la base de dades amb dades d'exemple i funcions auxiliars com ara l'ajuda de l'aplicació, la configuració i un enllaç al lloc web amb una descripció de totes les aplicacions per part dels autors. Les funcions per crear (Nova mostra) inclouen el diàleg per introduir la mida de la matriu on s'introdueixen les dades de la nova mostra: nombre de files (el nombre de files incloses per a les dades predites P1, P2...Pn – última fila) i nombre de columnes (el nombre de columna inclosa per a les dades dependents Y1, Y2,...Yk – última columna). A continuació, es genera una taula per introduir les dades rellevants. La taula emplenada s'ha de nomenar abans de desar-la. La funció Carrega esborra la taula.
La taula desada antiga es pot mostrar seleccionada de la llista giratòria. La taula que es mostra es pot calcular i la solució apareix al diàleg Resultats de l'aplicació. La funció Imprimeix es pot executar des d'aquest diàleg al fitxer AppMultipleLinearRegressionSolver.txt. L'activitat Imprimeix inclogui Desa la base de dades/Desa el fitxer selecciona la carpeta on es desa el fitxer. Després de seleccionar la carpeta, apareix el botó per desar. Des de la mateixa activitat es pot mostrar el contingut del fitxer seleccionat, canviar el nom del fitxer o la carpeta, crear una carpeta nova i també suprimir el fitxer seleccionat.
La regressió lineal múltiple és una eina potent d'anàlisi de dades, però s'ha d'utilitzar amb precaució i comprenent les seves limitacions.
Desavantatges: Sensible a la multicol·linealitat (forta correlació entre variables independents). No sempre captura les relacions no lineals. Requereix una validació i comprovació acurada de les suposicions.
Data d'actualització:
6 de març 2026