Ένας από τους πολλούς τρόπους με τους οποίους οι μεταβλητές στο στατιστική μπορεί να ταξινομηθεί είναι να ληφθούν υπόψη οι διαφορές μεταξύ των επεξηγηματικών και των μεταβλητών απόκρισης. Αν και αυτές οι μεταβλητές σχετίζονται, υπάρχουν σημαντικές διαφορές μεταξύ τους. Αφού ορίσουμε αυτούς τους τύπους μεταβλητών, θα δούμε ότι η σωστή αναγνώριση αυτών των μεταβλητών έχει άμεση επίδραση σε άλλες πτυχές των στατιστικών, όπως η κατασκευή ενός scatterplot και του κλίση μιας γραμμής παλινδρόμησης.
Ορισμοί της επεξηγηματικής και της απάντησης
Αρχίζουμε εξετάζοντας τους ορισμούς αυτών των τύπων μεταβλητών. Μια μεταβλητή απόκρισης είναι μια συγκεκριμένη ποσότητα στην οποία υποβάλλουμε μια ερώτηση στη μελέτη μας. Μια επεξηγηματική μεταβλητή είναι οποιοσδήποτε παράγοντας που μπορεί να επηρεάσει τη μεταβλητή απόκρισης. Ενώ μπορεί να υπάρχουν πολλές επεξηγηματικές μεταβλητές, θα ασχοληθούμε πρωτίστως με μία μόνο ερμηνευτική μεταβλητή.
Μια μεταβλητή απόκρισης μπορεί να μην υπάρχει σε μια μελέτη. Η ονομασία αυτού του τύπου μεταβλητής εξαρτάται από τα ερωτήματα που θέτει ένας ερευνητής. Η διεξαγωγή μιας μελέτης παρατήρησης θα ήταν ένα παράδειγμα μιας περίπτωσης όταν δεν υπάρχει μεταβλητή απόκρισης. Ένα πείραμα θα έχει μεταβλητή απόκρισης. Ο προσεκτικός σχεδιασμός ενός πειράματος προσπαθεί να αποδείξει ότι οι μεταβολές μιας μεταβλητής απόκρισης προκαλούνται άμεσα από αλλαγές στις επεξηγηματικές μεταβλητές.
Παράδειγμα 1
Για να διερευνήσουμε αυτές τις έννοιες, θα εξετάσουμε μερικά παραδείγματα. Για το πρώτο παράδειγμα, υποθέστε ότι ένας ερευνητής ενδιαφέρεται να μελετήσει τη διάθεση και τις στάσεις μιας ομάδας πρωτοετών φοιτητών. Όλοι οι φοιτητές του πρώτου έτους λαμβάνουν μια σειρά ερωτήσεων. Αυτά τα ερωτήματα αποσκοπούν στην εκτίμηση του βαθμού νοσηρότητας ενός σπουδαστή. Οι σπουδαστές αναφέρουν επίσης στην έρευνα πόσο μακριά είναι το κολέγιο τους από το σπίτι.
Ένας ερευνητής που εξετάζει τα δεδομένα αυτά μπορεί να ενδιαφέρεται μόνο για τους τύπους απαντήσεων των φοιτητών. Ίσως ο λόγος για αυτό είναι να έχουμε μια γενική αίσθηση για τη σύνθεση ενός νέου πρωτοεμφανιζόμενου. Σε αυτήν την περίπτωση, δεν υπάρχει μεταβλητή απόκρισης. Αυτό συμβαίνει επειδή κανείς δεν βλέπει εάν η τιμή μιας μεταβλητής επηρεάζει την αξία ενός άλλου.
Ένας άλλος ερευνητής θα μπορούσε να χρησιμοποιήσει τα ίδια δεδομένα για να προσπαθήσει να απαντήσει αν οι σπουδαστές που ήρθαν από μακριά είχαν μεγαλύτερο βαθμό νοσταλγίας. Σε αυτή την περίπτωση, τα δεδομένα που αφορούν τα ερωτήματα περί νοικοκυριών είναι οι τιμές μιας μεταβλητής απόκρισης και τα δεδομένα που υποδηλώνουν την απόσταση από το σπίτι αποτελούν την ερμηνευτική μεταβλητή.
Παράδειγμα 2
Για το δεύτερο παράδειγμα, ίσως να είμαστε περίεργοι αν ο αριθμός των ωρών που ξοδεύονται για να κάνετε την εργασία έχει επιπτώσεις στην βαθμολογία που ένας φοιτητής κερδίζει σε μια εξέταση. Σε αυτή την περίπτωση, επειδή δείχνουμε ότι η τιμή μιας μεταβλητής αλλάζει την τιμή ενός άλλου, υπάρχει μια επεξηγηματική και μια μεταβλητή απόκρισης. Ο αριθμός των ωρών που μελετήθηκαν είναι η επεξηγηματική μεταβλητή και η βαθμολογία για τη δοκιμή είναι η μεταβλητή απόκρισης.
Scatterplots και μεταβλητές
Όταν συνεργαζόμαστε συνδυασμένα ποσοτικά δεδομένα, είναι σκόπιμο να χρησιμοποιήσετε ένα scatterplot. Σκοπός αυτού του είδους του γραφήματος είναι να καταδείξει τις σχέσεις και τις τάσεις μέσα στα ζευγαρωμένα δεδομένα. Δεν χρειάζεται να έχουμε τόσο επεξηγηματική όσο και μεταβλητή απόκρισης. Αν συμβαίνει αυτό, τότε οποιαδήποτε από τις μεταβλητές μπορεί να γραφεί σε κάθε άξονα. Ωστόσο, σε περίπτωση που υπάρχει μια απάντηση και επεξηγηματική μεταβλητή, τότε η επεξηγηματική μεταβλητή είναι πάντα γραφική παράσταση κατά μήκος της Χ ή οριζόντιο άξονα ενός καρτεσιανού συστήματος συντεταγμένων. Στη συνέχεια, η μεταβλητή απόκρισης απεικονίζεται κατά μήκος του y άξονας.
Ανεξάρτητη και εξαρτώμενη
Η διάκριση ανάμεσα στις επεξηγηματικές και τις μεταβλητές απόκρισης είναι παρόμοια με άλλη ταξινόμηση. Μερικές φορές αναφερόμαστε στις μεταβλητές ως ανεξάρτητα ή εξαρτώμενα. Η τιμή του a εξαρτημένη μεταβλητή βασίζεται σε αυτό ενός ανεξάρτητη μεταβλητή. Έτσι, μια μεταβλητή απόκρισης αντιστοιχεί σε μια εξαρτώμενη μεταβλητή ενώ μια επεξηγηματική μεταβλητή αντιστοιχεί σε μια ανεξάρτητη μεταβλητή. Αυτή η ορολογία τυπικά δεν χρησιμοποιείται στα στατιστικά στοιχεία, επειδή η επεξηγηματική μεταβλητή δεν είναι πραγματικά ανεξάρτητη. Αντ 'αυτού, η μεταβλητή λαμβάνει μόνο τις τιμές που παρατηρούνται. Μπορεί να μην έχουμε έλεγχο επί των τιμών μιας επεξηγηματικής μεταβλητής.