Παρακάτω είναι ένας πρακτικός οδηγός για την Πολλαπλή (πολυμεταβλητή) Δυαδική Λογιστική Παλινδρόμηση — δηλαδή, την πρόβλεψη ενός δυαδικού αποτελέσματος (0/1) από πολλαπλά χαρακτηριστικά.
Η Διωνυμική Λογιστική Παλινδρόμηση (συνήθως ονομάζεται απλώς λογιστική παλινδρόμηση) είναι μια στατιστική μέθοδος που χρησιμοποιείται για τη μοντελοποίηση της σχέσης μεταξύ μίας ή περισσότερων ανεξάρτητων μεταβλητών και ενός δυαδικού (δύο κατηγοριών) αποτελέσματος.
Δυαδικό: στόχος y∈{0,1}
Πολλαπλό (πολυμεταβλητό): περισσότερα από ένα χαρακτηριστικά εισόδου x_1, x_2, ..., x_n
Μοντέλο:
p(y=1∣x)=1/(1+e^{−z}), όπου z=w_0+w_1*x_1+⋯+w_n*x_n
και w_0, w_1...w_n είναι βάρη που υπολογίζονται από τα x_1, x_2, ..., x_n και σφάλματα μεταξύ y και προβλέψεων.
Αντί να προβλέπει τιμές απευθείας, η λογιστική παλινδρόμηση προβλέπει λογαριθμικές πιθανότητες χρησιμοποιώντας έναν γραμμικό συνδυασμό προγνωστικών z. Οι λογαριθμικές πιθανότητες στη συνέχεια μετασχηματίζονται χρησιμοποιώντας τη λογιστική (σιγμοειδή) συνάρτηση για να παράγουν πιθανότητες μεταξύ 0 και 1.
Η Δυαδική Λογιστική Παλινδρόμηση είναι ένα πιθανοτικό μοντέλο ταξινόμησης που χρησιμοποιεί τη σιγμοειδή συνάρτηση για να προβλέψει την πιθανότητα ενός από τα δύο αποτελέσματα, καθιστώντας την ευρέως χρησιμοποιούμενη στη στατιστική, την επιστήμη δεδομένων και τη μηχανική μάθηση για ερμηνεύσιμη δυαδική λήψη αποφάσεων.
Οι παράμετροι του μοντέλου εκτιμώνται χρησιμοποιώντας την Εκτίμηση Μέγιστης Πιθανότητας (MLE). Μια τιμή κατωφλίου (συνήθως 0,5) χρησιμοποιείται για την ταξινόμηση των αποτελεσμάτων (Εάν P≥0,5 → κλάση 1· Εάν P<0,5 → κλάση 0).
Η πολυωνυμική λογιστική παλινδρόμηση είναι μια στατιστική και μηχανική μέθοδος μάθησης που χρησιμοποιείται για τη μοντελοποίηση της σχέσης μεταξύ ενός συνόλου ανεξάρτητων μεταβλητών (προγνωστικών) και μιας κατηγορικής εξαρτημένης μεταβλητής με περισσότερα από δύο πιθανά αποτελέσματα, όπου οι κατηγορίες δεν έχουν φυσική διάταξη.
Μοντέλο: Για την κλάση k:
P(y=k∣x)=e^w_k⋅x / ∑e^w_j⋅x όπου j=1,2...K
Όπου: - x = διάνυσμα χαρακτηριστικών
w_k = βάρη για την κλάση k
K = αριθμός κλάσεων
Στην εφαρμογή, κάθε αντικείμενο Object_k(object_1, object_2 ... object_m) περιγράφεται από ανεξάρτητες μεταβλητές (X_ki – χαρακτηριστικά, i = 1...n) και μία εξαρτημένη μεταβλητή (Y_k -στόχος). Χρησιμοποιείται μια μέθοδος όπως η μέθοδος των συνηθισμένων ελαχίστων τετραγώνων (OLS) για τον υπολογισμό των βέλτιστων τιμών των συντελεστών (βήτα_0, βήτα_1, βήτα_2, ..., βήτα_n). Η τιμή-στόχος υπολογίζεται από τον τύπο:
Y = βήτα_0 + βήτα_01* P_1 + βήτα_2 *P_2 + ... + βήτα_n* P_n
όπου: P_1, P_2...P_n είναι προγνωστικοί παράγοντες του στόχου. Η εφαρμογή αποθηκεύει δεδομένα για πολλαπλά μοντέλα λογιστικής παλινδρόμησης σε βάση δεδομένων (DB) τύπου SQLite με την ονομασία AppMultiNomialLogisticRegression.db. Τα μοντέλα παλινδρόμησης διακρίνονται με βάση το όνομα.
Η οθόνη εκκίνησης της εφαρμογής (App Multinomial Linear Logistic Regression Solver) εμφανίζει μια λίστα δειγμάτων μοντέλων παλινδρόμησης (στη λίστα περιστροφής) και κουμπιά για την ενεργοποίηση των λειτουργιών δημιουργίας (Νέο δείγμα), φόρτωσης (Φόρτωση), αποθήκευσης (Αποθήκευση), αποθήκευσης ως (Αποθήκευση ως), υπολογισμού (Υπολογισμός) και διαγραφής (Διαγραφή) δειγμάτων μοντέλων παλινδρόμησης. Από την κύρια οθόνη, μέσω των στοιχείων του μενού, μπορείτε επίσης να αποκτήσετε πρόσβαση σε λειτουργίες όπως επιλογή γλώσσας, αποθήκευση και αντιγραφή της βάσης δεδομένων, αρχικοποίηση της βάσης δεδομένων με δείγματα δεδομένων και βοηθητικές λειτουργίες όπως βοήθεια για την εφαρμογή, ρυθμίσεις και σύνδεσμο προς τον ιστότοπο με περιγραφή όλων των εφαρμογών από τους δημιουργούς.
Οι συναρτήσεις για τη δημιουργία (Νέο δείγμα) περιλαμβάνουν το παράθυρο διαλόγου για την εισαγωγή του μεγέθους του πίνακα όπου εισάγονται δεδομένα νέου δείγματος - αριθμός γραμμών (ο αριθμός των γραμμών που περιλαμβάνονται για τα προβλεπόμενα δεδομένα P_1, P_2...P_n - τελευταία γραμμή) και αριθμός στηλών (ο αριθμός των στηλών που περιλαμβάνονται για τα εξαρτώμενα δεδομένα Y_1, Y_2,...Y_k - τελευταία στήλη). Στη συνέχεια, δημιουργείται πίνακας για την εισαγωγή σχετικών δεδομένων. Ο συμπληρωμένος πίνακας πρέπει να ονομαστεί πριν αποθηκευτεί. Η συνάρτηση Load διαγράφει τον πίνακα.
Ο παλιός αποθηκευμένος πίνακας μπορεί να εμφανιστεί επιλέγοντας από τη λίστα περιστροφής. Ο εμφανιζόμενος πίνακας μπορεί να υπολογιστεί και η λύση εμφανίζεται στο παράθυρο διαλόγου App results. Η συνάρτηση Print μπορεί να εκτελεστεί από αυτό το παράθυρο διαλόγου στο αρχείο AppMultipleLogisticRegressionSolver.txt. Η δραστηριότητα Print include Save Db/Save file (Εκτύπωση συμπερίληψης Αποθήκευση βάσης δεδομένων/Αποθήκευση αρχείου) επιλέγει τον φάκελο στον οποίο θα αποθηκευτεί το αρχείο. Μετά την επιλογή του φακέλου εμφανίζεται το κουμπί για αποθήκευση. Από την ίδια δραστηριότητα μπορεί να εμφανιστεί το περιεχόμενο του επιλεγμένου αρχείου, καθώς και να διαγραφεί το επιλεγμένο αρχείο.
Ενημερώθηκε στις
6 Μαρ 2026