Di seguito è riportata una guida pratica alla regressione logistica binaria multipla (multivariata), ovvero alla previsione di un risultato binario (0/1) a partire da più caratteristiche.
La regressione logistica binomiale (solitamente chiamata semplicemente regressione logistica) è un metodo statistico utilizzato per modellare la relazione tra una o più variabili indipendenti e un risultato binario (a due categorie).
Bina: target y∈{0,1}
Multipla (multivariata): più di una caratteristica di input x_1, x_2, ..., x_n
Modello:
p(y=1∣x)=1/(1+e^{−z}), dove z=w_0+w_1*x_1+⋯+w_n*x_n
e w_0, w_1...w_n sono pesi calcolati da x_1, x_2, ..., x_n e dagli errori tra y e le previsioni.
Invece di prevedere i valori direttamente, la regressione logistica prevede i log-odds utilizzando una combinazione lineare di predittori z. I log-odds vengono quindi trasformati utilizzando la funzione logistica (sigmoide) per produrre probabilità comprese tra 0 e 1.
La regressione logistica binaria è un modello di classificazione probabilistica che utilizza la funzione sigmoide per prevedere la probabilità di uno tra due risultati, rendendolo ampiamente utilizzato in statistica, data science e machine learning per processi decisionali binari interpretabili.
I parametri del modello vengono stimati utilizzando la stima di massima verosimiglianza (MLE). Un valore soglia (solitamente 0,5) viene utilizzato per classificare i risultati (se P ≥ 0,5 → classe 1; se P < 0,5 → classe 0).
La regressione logistica multinomiale è un metodo statistico e di machine learning utilizzato per modellare la relazione tra un insieme di variabili indipendenti (predittori) e una variabile dipendente categoriale con più di due possibili risultati, dove le categorie non hanno un ordinamento naturale.
Modello: Per la classe k:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x dove j=1,2...K
Dove: - x = vettore delle feature
w_k = pesi per la classe k
K = numero di classi
Nell'app, ogni oggetto Object_k (object_1, object_2 ... object_m) è descritto da variabili indipendenti (X_ki - feature, i = 1...n) e una variabile dipendente (Y_k - target). Un metodo come i minimi quadrati ordinari (OLS) viene utilizzato per calcolare i valori ottimali dei coefficienti (beta_0, beta_1, beta_2, ..., beta_n). Il valore target è calcolato come:
Y = beta_0 + beta_01* P_1 + beta_2 *P_2 + ... + beta_n* P_n
dove: P_1, P_2...P_n sono predittori del target.
L'applicazione salva i dati per più modelli di regressione logistica in un database (DB) di tipo SQLite denominato AppMultiNomialLogisticRegression.db. I modelli di regressione sono distinti per nome.
La schermata iniziale dell'applicazione (App Multinomial Linear Logistic Regression Solver) mostra un elenco di campioni di modelli di regressione (in un elenco a discesa) e pulsanti per abilitare le funzioni di creazione (Nuovo campione), caricamento (Carica), salvataggio (Salva), salvataggio con nome (Salva con nome), calcolo (Calcola) ed eliminazione (Elimina) di campioni di modelli di regressione. Dalla schermata principale, tramite gli elementi del menu, è inoltre possibile accedere a funzioni come la selezione della lingua, il salvataggio e la copia del database, l'inizializzazione del database con dati campione e funzioni ausiliarie come la guida dell'applicazione, le impostazioni e un collegamento al sito web con una descrizione di tutte le applicazioni da parte degli autori.
Le funzioni per la creazione (Nuovo campione) includono la finestra di dialogo per l'inserimento della dimensione della matrice in cui inserire i dati del nuovo campione: numero di righe (il numero include le righe per i dati previsti P_1, P_2...P_n - ultima riga) e numero di colonne (il numero include le colonne per i dati dipendenti Y_1, Y_2,...Y_k - ultima colonna). Quindi viene generata una tabella per l'inserimento dei dati rilevanti. La tabella compilata deve essere nominata prima del salvataggio. La funzione Carica cancella la tabella.
La vecchia tabella salvata potrebbe essere visualizzata selezionandola dall'elenco a discesa. La tabella visualizzata può essere calcolata e la soluzione appare nella finestra di dialogo Risultati dell'app. La funzione Stampa può essere eseguita da questa finestra di dialogo nel file AppMultipleLogisticRegressionSolver.txt. L'attività Stampa include Salva Db/Salva file selezionando la cartella in cui salvare il file. Dopo aver selezionato la cartella, appare il pulsante per salvare. Dalla stessa attività è possibile visualizzare il contenuto del file selezionato e anche eliminare il file selezionato.
Ultimo aggiornamento
6 mar 2026