Η Λογιστική Παλινδρόμηση είναι μία τεχνική σχεδιασμένη για την πραγματοποίηση ανάλυσης δεδομένων που αφορούν την μελέτη και την πρόβλεψη τιμών κάποιας κατηγορικής εξαρτημένης μεταβλητής και χρησιμοποιεί ποσοτικές και ποιοτικές ανεξάρτητες μεταβλητές .
Η μελέτη της σχέσης της κατηγορικής εξαρτημένης μεταβλητής δεν μπορεί να πραγματοποιηθεί μέσω του αλγορίθμου της Γραμμικής Παλινδρόμησης για δύο βασικούς λόγους.
• Πρώτον, όταν προβλέπουμε τις τιμές μία κατηγορικής εξαρτημένης μεταβλητής, στην ουσία υπολογίζουμε την πιθανότητα με την οποία η εξαρτημένη μεταβλητή θα λάβει κάποια συγκεκριμένη τιμή. Η τιμή της πιθανότητας αυτής θα πρέπει, εξ ορισμού, να παίρνει τιμές μεταξύ του 0 και του 1. Με την χρήση της Γραμμικής Πολλαπλής Παλινδρόμησης μπορεί να υπολογιστούν τιμές πιθανότητας μεγαλύτερες του 1 ή μικρότερες του 0, δηλαδή άτοπο .
• Δεύτερον, η πολλαπλή γραμμική παλινδρόμηση θα πρέπει να ικανοποιεί την υπόθεση της ισότητας των διακυμάνσεων. Ωστόσο, στην περίπτωση που η εξαρτημένη μεταβλητή είναι διχοτομική, έχει τυπική απόκλιση (St dev ) ( p)(1− p) , όπου ρ είναι η μέση τιμή της μεταβλητής. Λόγω της συναρτησιακής σχέσης της τυπικής απόκλισης με την μέση τιμή, η ομοιογένεια της διακύμανσης των τιμών της εξαρτημένης μεταβλητής δεν είναι δυνατόν να ικανοποιείται.

Η εξίσωση της Λογιστικής Παλινδρόμησης

Το δεξί μέρος της εξίσωσης δημιουργείται από ένα γραμμικό συνδυασμό των ανεξάρτητων μεταβλητών που συμμετέχουν στο μοντέλο της παλινδρόμησης.
Το αριστερό μέρος περιέχει τις τιμές της εξαρτημένης μεταβλητής με την μορφή του λογαρίθμου των odd δηλαδή, του λογαρίθμου της σχέσης: odds = prob/(1-prob) .
Το odds εναλλακτικά ονομάζεται logt και ο όρος Prob εκφράζει την πιθανότητα να συμβεί το γεγονός που έχει ορισθεί σαν επιτυχία του πειράματος.
Οι συντελεστές των ανεξάρτητων μεταβλητών στην εξίσωση της παλινδρόμησης εκτιμούνται βάση της μεθόδου Μέγιστης Πιθανοφάνειας βάση της μεθόδου αυτής η τιμή των συντελεστών των ανεξάρτητων μεταβλητών είναι αυτή που κάνει τις παρατηρηθήσες τιμές της εξαρτημένης μεταβλητής πιο πιθανές, βάση του σετ των ανεξάρτητων μεταβλητών.
12.3 Βήματα δημιουργίας του μοντέλου της Λογ. Παλινδρ/σης
Τα βήματα κατασκευής του μοντέλου της Λογιστικής Παλινδρόμησης είναι ανάλογα αυτών της γραμμικής παλινδρόμησης.
• Προσδιορίζουμε το μέγεθος του ενδιαφέροντος (εξαρτημένη μεταβλητή) και το σετ των ανεξάρτητων μεταβλητών που θα συμμετέχουν στην παλινδρόμηση.
• Διερευνούμε τα δεδομένα για τυχόν ύπαρξη ασυνήθιστων κινήσεων όπως, ακραίες τιμές, ελλείπουσες τιμές κ. λ. π.
• Ελέγχουμε την ικανοποίηση των υποθέσεων για την σωστή εφαρμογή της Λογιστικής Παλινδρόμησης.
• Δημιουργούμε την εξίσωσης της παλινδρόμησης.
• Μελετάμε την επίδραση κάθε ανεξάρτητης μεταβλητής στο μοντέλο.
• Εξετάζουμε την ικανοποίηση των υποθέσεων της Τεχνικής και διερευνούμε την πιθανότητα κάποια συγκεκριμένη τιμή να επηρεάζει υπερβολικά τα αποτελέσματα.
Στο σημείο αυτό θα πρέπει να αναφερθεί ότι η Λογιστική Παλινδρόμηση, για την σωστή εφαρμογή της απαιτεί μεγάλο δείγμα, προκειμένου να παράγει αξιόπιστο αποτέλεσμα. ‘Ένας εμπειρικός κανόνας αναφέρει ότι το δείγμα θα πρέπει να είναι 30 φορές μεγαλύτερο από το αριθμό των παραμέτρων που εκτιμά το μοντέλο.
Επιπλέον, σε περίπτωση που ενδιαφερόμαστε να χρησιμοποιήσουμε το μοντέλο για πρόβλεψη θα πρέπει να αξιολογήσουμε την αποτελεσματικότητά του. Αυτό σημαίνει ότι δημιουργούμε την εξίσωση σε ένα μέρος των δεδομένων και σε ένα επόμενο βήμα ελέγξουμε την αποτελεσματικότητά της, στο υπόλοιπο δείγμα.