Nachfolgend finden Sie eine praktische Anleitung zur multiplen (multivariaten) binären logistischen Regression – d. h. zur Vorhersage eines binären Ergebnisses (0/1) anhand mehrerer Merkmale.
Die binäre logistische Regression (üblicherweise einfach logistische Regression genannt) ist ein statistisches Verfahren zur Modellierung des Zusammenhangs zwischen einer oder mehreren unabhängigen Variablen und einem binären (zweikategorialen) Ergebnis.
Binär: Zielvariable y ∈ {0,1}
Multivariat: mehr als ein Eingabemerkmal x_1, x_2, ..., x_n
Modell:
p(y=1|x) = 1/(1+e^{−z}), wobei z = w_0 + w_1*x_1 + ... + w_n*x_n
w_0, w_1...w_n sind Gewichte, die anhand von x_1, x_2, ..., x_n und den Fehlern zwischen y und den vorhergesagten Werten berechnet werden.
Anstatt Werte direkt vorherzusagen, berechnet die logistische Regression Log-Odds mithilfe einer linearen Kombination von Prädiktoren z. Die Log-Odds werden anschließend mithilfe der logistischen (Sigmoid-)Funktion transformiert, um Wahrscheinlichkeiten zwischen 0 und 1 zu erhalten.
Die binäre logistische Regression ist ein probabilistisches Klassifikationsmodell, das die Sigmoid-Funktion verwendet, um die Wahrscheinlichkeit eines von zwei Ergebnissen vorherzusagen. Daher findet sie breite Anwendung in Statistik, Data Science und maschinellem Lernen für interpretierbare binäre Entscheidungen.
Die Modellparameter werden mittels Maximum-Likelihood-Schätzung (MLE) geschätzt. Ein Schwellenwert (üblicherweise 0,5) dient zur Klassifizierung der Ergebnisse (wenn P ≥ 0,5 → Klasse 1; wenn P < 0,5 → Klasse 0).
Die multinomiale logistische Regression ist eine statistische und maschinelle Lernmethode zur Modellierung des Zusammenhangs zwischen einer Menge unabhängiger Variablen (Prädiktoren) und einer kategorialen abhängigen Variable mit mehr als zwei möglichen Ausprägungen, wobei die Kategorien keine natürliche Reihenfolge aufweisen. Modell: Für Klasse k:
P(y=k|x)=e^w_k⋅x / ∑e^w_j⋅x, wobei j=1,2...K
Dabei: - x = Merkmalsvektor
w_k = Gewichte für Klasse k
K = Anzahl der Klassen
In der Anwendung wird jedes Objekt Object_k (object_1, object_2, ..., object_m) durch unabhängige Variablen (X_ki – Merkmale, i = 1...n) und eine abhängige Variable (Y_k – Zielvariable) beschrieben. Zur Berechnung der optimalen Werte der Koeffizienten (beta_0, beta_1, beta_2, ..., beta_n) wird beispielsweise die Methode der kleinsten Quadrate (OLS) verwendet. Der Zielwert wird wie folgt berechnet:
Y = beta_0 + beta_01*P_1 + beta_2*P_2 + ... + beta_n*P_n
wobei P_1, P_2, ..., P_n Prädiktoren der Zielvariable sind.
Die Anwendung speichert Daten für mehrere logistische Regressionsmodelle in einer SQLite-Datenbank namens AppMultiNomialLogisticRegression.db. Die Regressionsmodelle werden anhand ihres Namens unterschieden.
Der Startbildschirm der Anwendung (App Multinomial Linear Logistic Regression Solver) zeigt eine Liste mit Beispielen für Regressionsmodelle (in einem Auswahlmenü) sowie Schaltflächen zum Erstellen (Neues Beispiel), Laden (Laden), Speichern (Speichern unter), Berechnen (Berechnen) und Löschen (Löschen) von Beispielen für Regressionsmodelle. Über die Menüelemente des Hauptbildschirms können Sie außerdem auf Funktionen wie die Sprachauswahl, das Speichern und Kopieren der Datenbank, das Initialisieren der Datenbank mit Beispieldaten sowie auf Hilfsfunktionen wie die Anwendungshilfe, die Einstellungen und einen Link zur Website mit einer Beschreibung aller Anwendungen der Entwickler zugreifen.
Die Funktionen zum Erstellen einer neuen Stichprobe umfassen einen Dialog zur Eingabe der Matrixgröße für die Daten der neuen Stichprobe – Anzahl der Zeilen (einschließlich der Zeilen für die vorhergesagten Daten P_1, P_2, ..., P_n bis zur letzten Zeile) und Anzahl der Spalten (einschließlich der Spalten für die abhängigen Daten Y_1, Y_2, ..., Y_k bis zur letzten Spalte). Anschließend wird eine Tabelle zur Eingabe der relevanten Daten generiert. Die gefüllte Tabelle muss vor dem Speichern benannt werden. Die Funktion „Laden“ löscht die Tabelle.
Die zuvor gespeicherte Tabelle kann über eine Auswahlliste angezeigt werden. Die angezeigte Tabelle kann berechnet werden, und die Ergebnisse werden im Dialogfeld „App-Ergebnisse“ angezeigt. Die Funktion „Drucken“ kann über diesen Dialog in die Datei „AppMultipleLogisticRegressionSolver.txt“ ausgeführt werden. Die Druckfunktion beinhaltet die Aktivität „Datenbank speichern/Datei speichern“, bei der der Speicherort für die Datei ausgewählt wird. Nach der Auswahl des Ordners erscheint eine Schaltfläche zum Speichern. Über dieselbe Aktivität kann der Inhalt der ausgewählten Datei angezeigt und die Datei auch gelöscht werden.
Aktualisiert am
06.03.2026