Ορισμός και παραδείγματα της δευτερογενούς ανάλυσης δεδομένων

Η δευτερογενής ανάλυση δεδομένων είναι η ανάλυση των δεδομένων που συλλέχθηκαν από κάποιον άλλο. Παρακάτω, θα εξετάσουμε τον ορισμό των δευτερευόντων δεδομένων, τον τρόπο με τον οποίο μπορούν να χρησιμοποιηθούν από τους ερευνητές και τα πλεονεκτήματα και τα μειονεκτήματα αυτού του τύπου έρευνας.

Λέξεις κλειδιά: Δευτερογενής ανάλυση δεδομένων

  • Τα πρωταρχικά δεδομένα αναφέρονται σε δεδομένα που έχουν συλλέξει οι ερευνητές, ενώ δευτερεύοντα δεδομένα αφορούν δεδομένα που συλλέχθηκαν από κάποιον άλλο.
  • Δευτερεύοντα δεδομένα διατίθενται από διάφορες πηγές, όπως κυβερνήσεις και ερευνητικά ιδρύματα.
  • Ενώ η χρήση δευτερογενών δεδομένων μπορεί να είναι πιο οικονομική, τα υπάρχοντα σύνολα δεδομένων ενδέχεται να μην απαντούν σε όλες τις ερωτήσεις ενός ερευνητή.

Σύγκριση πρωτογενών και δευτερογενών δεδομένων

Στην έρευνα των κοινωνικών επιστημών, οι όροι πρωτογενή δεδομένα και δευτερεύοντα δεδομένα είναι κοινά. Τα πρωταρχικά δεδομένα συλλέγονται από ερευνητή ή ομάδα ερευνητών για τον συγκεκριμένο σκοπό ή την ανάλυση που εξετάζεται. Εδώ, μια ερευνητική ομάδα σχεδιάζει και αναπτύσσει ένα ερευνητικό έργο, αποφασίζει α

instagram viewer
τεχνική δειγματοληψίας, συλλέγει δεδομένα που έχουν σχεδιαστεί για την αντιμετώπιση συγκεκριμένων ερωτήσεων και εκτελεί τις δικές τους αναλύσεις των δεδομένων που συλλέγει. Σε αυτή την περίπτωση, οι άνθρωποι που συμμετέχουν στην ανάλυση δεδομένων είναι εξοικειωμένοι με τη διαδικασία σχεδιασμού και συλλογής δεδομένων.

Δευτερεύουσα ανάλυση δεδομένων, από την άλλη πλευρά, είναι η χρήση των δεδομένων που συλλέχθηκε από κάποιον άλλο για κάποιο άλλο σκοπό. Σε αυτή την περίπτωση, ο ερευνητής θέτει ερωτήματα που αντιμετωπίζονται μέσω της ανάλυσης ενός συνόλου δεδομένων που δεν συμμετέχουν στη συλλογή. Τα δεδομένα δεν συλλέχθηκαν για να απαντήσουν στις συγκεκριμένες ερευνητικές ερωτήσεις του ερευνητή και συλλέχθηκαν για άλλο σκοπό. Αυτό σημαίνει ότι το ίδιο σύνολο δεδομένων μπορεί στην πραγματικότητα να είναι ένα πρωτεύον σύνολο δεδομένων για έναν ερευνητή και ένα δευτερεύον σύνολο δεδομένων σε ένα διαφορετικό.

Χρησιμοποιώντας δευτερεύοντα δεδομένα

Υπάρχουν ορισμένα σημαντικά πράγματα που πρέπει να γίνουν πριν χρησιμοποιήσετε δευτερεύοντα δεδομένα σε μια ανάλυση. Δεδομένου ότι ο ερευνητής δεν συγκέντρωσε τα δεδομένα, είναι σημαντικό για αυτούς να εξοικειωθούν με το σύνολο δεδομένων: πώς συλλέχθηκαν τα δεδομένα, ποιες είναι οι κατηγορίες απόκρισης για κάθε το ερώτημα κατά πόσο πρέπει ή όχι να εφαρμοστούν βάρη κατά την ανάλυση, ανεξάρτητα από το εάν πρέπει να ληφθούν υπόψη οι συστάδες ή η στρωματοποίηση, ποιος ήταν ο πληθυσμός της μελέτης και περισσότερο.

Υπάρχουν πολλοί δευτερεύοντες πόροι και σύνολα δεδομένων διατίθενται για κοινωνιολογική έρευνα, πολλά από τα οποία είναι δημόσια και εύκολα προσβάσιμα. ο Απογραφή Ηνωμένων Πολιτειών, ο Γενική Κοινωνική Έρευνα, και το American Community Survey είναι μερικά από τα πιο συχνά χρησιμοποιούμενα δευτερεύοντα σύνολα δεδομένων διαθέσιμα.

Πλεονεκτήματα της δευτερογενούς ανάλυσης δεδομένων

Το μεγαλύτερο πλεονέκτημα της χρήσης δευτερευόντων δεδομένων είναι ότι μπορεί να είναι πιο οικονομικό. Κάποιος άλλος έχει ήδη συλλέξει τα δεδομένα, οπότε ο ερευνητής δεν χρειάζεται να αφιερώσει χρήματα, χρόνο, ενέργεια και πόρους σε αυτή τη φάση της έρευνας. Μερικές φορές το δευτερεύον σύνολο δεδομένων πρέπει να αγοραστεί, αλλά το κόστος είναι σχεδόν πάντοτε χαμηλότερο από το κόστος συλλογής παρόμοιου το σύνολο δεδομένων από το μηδέν, το οποίο συνήθως συνεπάγεται μισθούς, ταξίδια και μεταφορές, χώρους γραφείων, εξοπλισμό και άλλα γενικά έξοδα δικαστικά έξοδα. Επιπλέον, δεδομένου ότι τα δεδομένα έχουν ήδη συλλεχθεί και συνήθως καθαρίζονται και αποθηκεύονται σε ηλεκτρονική μορφή, ο ερευνητής μπορεί να δαπανήσει το μεγαλύτερο μέρος του χρόνου τους ανάλυση των δεδομένων αντί να πάρει τα δεδομένα έτοιμα για ανάλυση.

Ένα δεύτερο σημαντικό πλεονέκτημα της χρήσης δευτερογενών δεδομένων είναι το εύρος των διαθέσιμων δεδομένων. Η ομοσπονδιακή κυβέρνηση διεξάγει πολυάριθμες μελέτες σε μεγάλη, εθνική κλίμακα, που οι μεμονωμένοι ερευνητές θα έχουν έναν δύσκολο χρόνο συλλογής. Πολλά από αυτά τα σύνολα δεδομένων είναι επίσης γεωγραφικού μήκους, πράγμα που σημαίνει ότι τα ίδια δεδομένα έχουν συλλεχθεί από τον ίδιο πληθυσμό σε διάφορες χρονικές περιόδους. Αυτό επιτρέπει στους ερευνητές να εξετάζουν τις τάσεις και τις αλλαγές των φαινομένων με την πάροδο του χρόνου.

Ένα τρίτο σημαντικό πλεονέκτημα της χρήσης δευτερογενούς δεδομένων είναι ότι η διαδικασία συλλογής δεδομένων διατηρεί συχνά ένα επίπεδο της εμπειρογνωμοσύνης και του επαγγελματισμού που ενδέχεται να μην είναι παρόντες με μεμονωμένους ερευνητές ή μικρά ερευνητικά προγράμματα. Για παράδειγμα, η συλλογή δεδομένων για πολλά ομοσπονδιακά σύνολα δεδομένων εκτελείται συχνά από μέλη του προσωπικού που ειδικεύονται σε ορισμένα καθήκοντα και έχει πολυετή εμπειρία σε αυτόν τον συγκεκριμένο τομέα και με τη συγκεκριμένη έρευνα. Πολλά μικρότερα ερευνητικά προγράμματα δεν διαθέτουν αυτό το επίπεδο εμπειρογνωμοσύνης, καθώς πολλά δεδομένα συλλέγονται από μαθητές που εργάζονται με μερική απασχόληση.

Μειονεκτήματα της δευτερογενούς ανάλυσης δεδομένων

Ένα σημαντικό μειονέκτημα της χρήσης δευτερογενών δεδομένων είναι ότι μπορεί να μην απαντήσει στις συγκεκριμένες ερευνητικές ερωτήσεις του ερευνητή ή να περιέχει συγκεκριμένες πληροφορίες που ο ερευνητής θα ήθελε να έχει. Μπορεί επίσης να μην έχει συγκεντρωθεί στη γεωγραφική περιοχή ή κατά τη διάρκεια των επιθυμητών ετών ή με τον συγκεκριμένο πληθυσμό που ενδιαφέρεται να μελετήσει ο ερευνητής. Για παράδειγμα, ένας ερευνητής που ενδιαφέρεται να σπουδάσει εφήβους μπορεί να διαπιστώσει ότι το δευτερεύον σύνολο δεδομένων περιλαμβάνει μόνο νέους ενήλικες.

Επιπλέον, δεδομένου ότι ο ερευνητής δεν συγκέντρωσε τα δεδομένα, δεν έχει κανένα έλεγχο επί του περιεχομένου του συνόλου δεδομένων. Συχνά αυτό μπορεί να περιορίσει την ανάλυση ή να αλλάξει τις αρχικές ερωτήσεις που ο ερευνητής προσπάθησε να απαντήσει. Για παράδειγμα, ένας ερευνητής που μελετά την ευτυχία και την αισιοδοξία μπορεί να διαπιστώσει ότι ένα δευτερεύον σύνολο δεδομένων περιλαμβάνει μόνο ένα από αυτά μεταβλητές, αλλά όχι και οι δύο.

Ένα σχετικό πρόβλημα είναι ότι οι μεταβλητές μπορεί να ήταν ορίζονται ή ταξινομούνται διαφορετικά από τον ερευνητή που θα επέλεγε. Για παράδειγμα, η ηλικία μπορεί να έχει συλλεχθεί σε κατηγορίες και όχι ως συνεχής μεταβλητή ή η φυλή μπορεί να οριστεί ως "λευκό" και "άλλη" αντί να περιέχει κατηγορίες για κάθε μείζονα φυλή.

Ένα άλλο σημαντικό μειονέκτημα της χρήσης δευτερογενών δεδομένων είναι ότι ο ερευνητής δεν γνωρίζει ακριβώς πώς έγινε η διαδικασία συλλογής δεδομένων ή πόσο καλά διεξήχθη. Ο ερευνητής δεν είναι συνήθως ενημερωμένος σχετικά με το πόσο σοβαρά τα δεδομένα επηρεάζονται από προβλήματα όπως το χαμηλό ποσοστό ανταπόκρισης ή την παρερμηνεία των συγκεκριμένων ερωτημάτων της έρευνας. Μερικές φορές αυτές οι πληροφορίες είναι άμεσα διαθέσιμες, όπως συμβαίνει με πολλά ομοσπονδιακά σύνολα δεδομένων. Ωστόσο, πολλά άλλα δευτερεύοντα σύνολα δεδομένων δεν συνοδεύονται από αυτόν τον τύπο πληροφοριών και ο αναλυτής πρέπει να μάθει να διαβάζει μεταξύ των γραμμών για να αποκαλύψει τυχόν δυνητικούς περιορισμούς των δεδομένων.

instagram story viewer