Τι είναι τα ζεύγη δεδομένων στα στατιστικά στοιχεία;

Τα ζευγαρωμένα δεδομένα στα στατιστικά στοιχεία, συχνά αναφερόμενα ως ταξινομημένα ζεύγη, αναφέρονται σε δύο μεταβλητές στα άτομα ενός πληθυσμού που συνδέονται μεταξύ τους προκειμένου να προσδιοριστεί η συσχέτιση μεταξύ τους. Για να θεωρηθεί ένα σύνολο δεδομένων ως ζεύγη δεδομένων, και οι δύο αυτές τιμές δεδομένων πρέπει να προσαρτηθούν ή να συνδεθούν μεταξύ τους και να μην εξεταστούν χωριστά.

Η ιδέα των ζευγαρωμένων δεδομένων αντιπαραβάλλεται με τη συνηθισμένη σύνδεση ενός αριθμού σε κάθε σημείο δεδομένων όπως και σε άλλα ποσοτικά δεδομένα ορίζει ότι κάθε μεμονωμένο σημείο δεδομένων συνδέεται με δύο αριθμούς, παρέχοντας ένα γράφημα που επιτρέπει στους στατιστικούς να τηρούν τη σχέση μεταξύ αυτών των μεταβλητών σε έναν πληθυσμό.

Αυτή η μέθοδος συνδυασμένων δεδομένων χρησιμοποιείται όταν μια μελέτη ελπίζει να συγκρίνει δύο μεταβλητές σε άτομα του πληθυσμού για να βγάλει κάποιο συμπέρασμα σχετικά με τον παρατηρούμενο συσχετισμό. Όταν παρατηρούμε αυτά τα σημεία δεδομένων, η σειρά της αντιστοίχισης είναι σημαντική επειδή ο πρώτος αριθμός είναι ένα μέτρο ενός πράγματος ενώ το δεύτερο είναι ένα μέτρο εντελώς διαφορετικό.

instagram viewer

Παράδειγμα ζευγαρωμένων δεδομένων

Για να δείτε ένα παράδειγμα ζευγαρωμένων δεδομένων, ας υποθέσουμε ότι ένας δάσκαλος μετράει τον αριθμό των εργασιών για κάθε εργασία ενεργοποιήθηκε για μια συγκεκριμένη μονάδα και στη συνέχεια ζεύγη αυτού του αριθμού με το ποσοστό κάθε σπουδαστή στη δοκιμή μονάδας. Τα ζεύγη είναι τα εξής:

  • Ένα άτομο που ολοκλήρωσε 10 αποστολές κέρδισε το 95% της δοκιμής του. (10, 95%)
  • Ένα άτομο που ολοκλήρωσε 5 αποστολές κέρδισε το 80% της δοκιμής του. (5, 80%)
  • Ένα άτομο που ολοκλήρωσε 9 αποστολές κέρδισε το 85% της δοκιμής του. (9, 85%)
  • Ένα άτομο που ολοκλήρωσε 2 αποστολές κέρδισε το 50% της δοκιμής του. (2, 50%)
  • Ένα άτομο που ολοκλήρωσε 5 αποστολές κέρδισε το 60% της δοκιμής του. (5, 60%)
  • Ένα άτομο που ολοκλήρωσε 3 αποστολές κέρδισε το 70% της δοκιμής του. (3, 70%)

Σε κάθε ένα από αυτά τα σύνολα ζευγαρωμένων δεδομένων, μπορούμε να δούμε ότι ο αριθμός των αναθέσεων είναι πάντα πρώτος στην ενώ το ποσοστό επιτυχίας στη δοκιμή έρχεται δεύτερο, όπως φαίνεται στην πρώτη περίπτωση (10, 95%).

Ενώ μια στατιστική ανάλυση αυτών των δεδομένων θα μπορούσε επίσης να χρησιμοποιηθεί για τον υπολογισμό του μέσου αριθμού των οι εργασίες που έχουν ολοκληρωθεί στο σπίτι ή η μέση βαθμολογία της δοκιμής, μπορεί να υπάρχουν άλλες ερωτήσεις για να ρωτήσετε τα δεδομένα. Σε αυτή την περίπτωση, ο δάσκαλος θέλει να μάθει αν υπάρχει κάποια σχέση μεταξύ του αριθμού των αναθέσεων εργασίας και ο εκπαιδευτικός θα πρέπει να διατηρήσει τα δεδομένα σε συνδυασμό για να απαντήσει σε αυτό ερώτηση.

Ανάλυση ζευγαρωμένων δεδομένων

ο στατιστικές τεχνικές του συσχέτιση και η παλινδρόμηση χρησιμοποιούνται για την ανάλυση των ζευγαρωμένων δεδομένων όπου το συντελεστής συσχέτισης προσδιορίζει πόσο στενά τα δεδομένα βρίσκονται σε ευθεία γραμμή και μετρά τη δύναμη της γραμμικής σχέσης.

Η παλινδρόμηση, από την άλλη πλευρά, χρησιμοποιείται για διάφορες εφαρμογές, συμπεριλαμβανομένου του προσδιορισμού της γραμμής που ταιριάζει καλύτερα για το σύνολο των δεδομένων μας. Αυτή η γραμμή μπορεί με τη σειρά της να χρησιμοποιηθεί για την εκτίμηση ή την πρόβλεψη y τιμές για τιμές του Χ που δεν ήταν μέρος του αρχικού μας συνόλου δεδομένων.

Υπάρχει ένας ειδικός τύπος γραφήματος που είναι ιδιαίτερα κατάλληλος για ζευγαρωμένα δεδομένα που ονομάζονται scatterplot. Σε αυτό τύπο γραφήματος, ένας άξονας συντεταγμένων αντιπροσωπεύει μία ποσότητα των ζευγαρωμένων δεδομένων ενώ ο άλλος άξονας συντεταγμένων αντιπροσωπεύει την άλλη ποσότητα των ζευγαρωμένων δεδομένων.

Ένα scatterplot για τα παραπάνω δεδομένα θα έχει τον άξονα x να υποδηλώνει τον αριθμό των αναθέσεων που έχουν μετατραπεί, ενώ ο άξονας y θα υποδηλώνει τις βαθμολογίες στη δοκιμή μονάδας.