La regressione lineare multipla è un metodo statistico utilizzato per modellare la relazione tra una variabile dipendente e due o più variabili indipendenti, adattando un'equazione lineare ai dati osservati. La regressione lineare multipla spiega come diversi predittori influenzino simultaneamente una variabile di risultato.
Componenti principali della regressione lineare multipla:
- Variabile dipendente (Y): questa è la variabile che vogliamo prevedere. È spesso chiamata anche "variabile target" o "risposta".
- Variabili indipendenti (X1, X2, ..., Xn): queste sono le variabili che utilizziamo per prevedere la variabile dipendente. Sono spesso chiamate anche "predittori" o "variabili esplicative".
- Modello di regressione: l'equazione della regressione lineare multipla ha la seguente forma:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
dove:
Y è la variabile dipendente. X1, X2, ..., Xn sono le variabili indipendenti.
beta_0 è la costante (intercetta). beta_1, beta_2, ..., beta_n sono i coefficienti di regressione che indicano l'influenza delle variabili indipendenti corrispondenti sulla variabile dipendente.
Applicazioni: - Economia (previsione del reddito); - Sanità (analisi dei fattori di rischio); - Ingegneria; - Scienze sociali; - Previsioni aziendali.
Esempio: Previsione del prezzo di una casa in base a: - Dimensioni della casa; - Numero di camere da letto; - Età della casa
Nell'app, ogni oggetto Object_k (object_1, object_2 ... object_m) è descritto da variabili indipendenti (Xki - caratteristiche, i = 1...n) e una variabile dipendente (Yk - obiettivo). Un metodo come i minimi quadrati ordinari (OLS) viene utilizzato per calcolare i valori ottimali dei coefficienti (beta_0, beta_1, beta_2, ..., beta_n). Il valore target viene calcolato come segue:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
dove: P1, P2...Pn sono i predittori del target.
L'applicazione salva i dati per i modelli di regressione multipla in un database (DB) di tipo SQLite denominato AppMultipleLinearRegression.db. I modelli di regressione sono distinti per nome.
La schermata iniziale dell'applicazione (App Multiple Linear Regression Solver) mostra un elenco di campioni di modelli di regressione (nell'elenco a discesa) e pulsanti per abilitare le funzioni di creazione (Nuovo campione), caricamento (Carica), salvataggio (Salva), salvataggio con nome (Salva con nome), calcolo (Calcola) ed eliminazione (Elimina) campioni di modelli di regressione. Dalla schermata principale, tramite gli elementi del menu, è inoltre possibile accedere a funzioni come la selezione della lingua, il salvataggio e la copia del database, l'inizializzazione del database con dati campione e funzioni ausiliarie come la guida dell'applicazione, le impostazioni e un collegamento al sito web con una descrizione di tutte le applicazioni da parte degli autori.
Le funzioni per la creazione (Nuovo campione) includono la finestra di dialogo per l'inserimento della dimensione della matrice in cui inserire i dati del nuovo campione: numero di righe (il numero include le righe per i dati previsti P1, P2...Pn - ultima riga) e numero di colonne (il numero include le colonne per i dati dipendenti Y1, Y2,...Yk - ultima colonna). Quindi viene generata una tabella per l'inserimento dei dati rilevanti. La tabella compilata deve essere nominata prima del salvataggio. La funzione "Carica" cancella la tabella.
La vecchia tabella salvata potrebbe essere visualizzata selezionandola dall'elenco a discesa. La tabella visualizzata può essere calcolata e la soluzione appare nella finestra di dialogo "Risultati dell'app". La funzione "Stampa" può essere eseguita da questa finestra di dialogo nel file "AppMultipleLinearRegressionSolver.txt". L'attività "Stampa" include "Salva database/Salva file" selezionando la cartella in cui salvare il file. Dopo aver selezionato la cartella, appare il pulsante per salvare. Dalla stessa attività è possibile visualizzare il contenuto del file selezionato, rinominare il file o la cartella, creare una nuova cartella e anche eliminare il file selezionato.
La regressione lineare multipla è un potente strumento di analisi dei dati, ma deve essere utilizzato con cautela e con la consapevolezza dei suoi limiti.
Svantaggi: Sensibile alla multicollinearità (forte correlazione tra variabili indipendenti). Non sempre cattura le relazioni non lineari. Richiede un'attenta convalida e verifica delle ipotesi.
Ultimo aggiornamento
6 mar 2026