Με δεδομένο ένα ακολουθία δεδομένων, μια ερώτηση που μπορεί να αναρωτηθεί είναι εάν η ακολουθία προέκυψε από τυχαία φαινόμενα ή αν τα δεδομένα δεν είναι τυχαία. Η τυχαιότητα είναι δύσκολο να προσδιοριστεί, καθώς είναι πολύ δύσκολο να κοιτάξουμε απλά τα δεδομένα και να καθορίσουμε εάν ή όχι παράγεται τυχαία μόνο. Μία μέθοδος που μπορεί να χρησιμοποιηθεί για να προσδιορίσει εάν μια ακολουθία αληθινά συμβαίνει τυχαία καλείται δοκιμή εκτέλεσης.
Η δοκιμή των δοκιμών είναι μια δοκιμασία σπουδαιότητας ή δοκιμή υποθέσεων. Η διαδικασία για αυτή τη δοκιμή βασίζεται σε ένα τρέξιμο ή μια ακολουθία δεδομένων που έχουν ένα ιδιαίτερο χαρακτηριστικό. Για να κατανοήσουμε πώς λειτουργεί το τεστ δοκιμής, πρέπει πρώτα να εξετάσουμε την έννοια της εκτέλεσης.
Ακολουθίες δεδομένων
Θα ξεκινήσουμε εξετάζοντας ένα παράδειγμα διαδρομών. Εξετάστε την ακόλουθη ακολουθία τυχαίων ψηφίων:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5
Ένας τρόπος για να ταξινομήσετε αυτά τα ψηφία είναι να τα χωρίσετε σε δύο κατηγορίες, ακόμη και (συμπεριλαμβανομένων των ψηφίων 0, 2, 4, 6 και 8) ή περιττές (συμπεριλαμβανομένων των ψηφίων 1, 3, 5, 7 και 9). Θα δούμε την ακολουθία των τυχαίων ψηφίων και θα υποδηλώσουμε τους ζυγούς αριθμούς ως E και τους μονούς αριθμούς ως O:
Σ Υ Μ Ε Ρ Ι Ο Σ Ε Ζ Η Σ Ε Ζ Η Σ Ε Ζ
Οι διαδρομές είναι ευκολότερες να δούμε εάν το ξαναγράψουμε έτσι ώστε όλοι οι Os να είναι μαζί και όλοι οι Es είναι μαζί:
EE OE EE OO E OEEEE OE OO
Καταμετράμε τον αριθμό των ζωνών με ζυγούς ή αριθμούς και βλέπουμε ότι υπάρχουν συνολικά δέκα διαδρομές για τα δεδομένα. Τέσσερις διαδρομές έχουν μήκος ένα, πέντε έχουν μήκος δύο και ένα μήκος πέντε
Συνθήκες
Με οποιαδήποτε δοκιμασία σπουδαιότητας, είναι σημαντικό να γνωρίζουμε ποιες προϋποθέσεις είναι απαραίτητες για τη διεξαγωγή της δοκιμής. Για τη δοκιμή λειτουργίας, θα μπορέσουμε να ταξινομήσουμε κάθε τιμή δεδομένων από το δείγμα σε μία από τις δύο κατηγορίες. Θα υπολογίσουμε τον συνολικό αριθμό διαδρομών σε σχέση με τον αριθμό του αριθμού των τιμών δεδομένων που εμπίπτουν σε κάθε κατηγορία.
Η δοκιμή θα είναι a δοκιμή δύο όψεων. Ο λόγος για αυτό είναι ότι πολύ λίγες διαδρομές σημαίνουν ότι πιθανόν δεν υπάρχουν αρκετές παραλλαγές και ο αριθμός των διαδρομών που θα προέκυπταν από μια τυχαία διαδικασία. Πολλές διαδρομές θα προκύψουν όταν μια διαδικασία εναλλάσσεται μεταξύ των κατηγοριών πολύ συχνά για να περιγραφεί τυχαία.
Υποθέσεις και Ρ-τιμές
Κάθε δοκιμή σπουδαιότητας έχει ένα null και μια εναλλακτική υπόθεση. Για τη δοκιμή λειτουργίας, η μηδενική υπόθεση είναι ότι η ακολουθία είναι μια τυχαία ακολουθία. Η εναλλακτική υπόθεση είναι ότι η ακολουθία δειγμάτων δεν είναι τυχαία.
Το στατιστικό λογισμικό μπορεί να υπολογίσει το p-value που αντιστοιχεί σε ένα συγκεκριμένο στατιστικό αποτέλεσμα της δοκιμής. Υπάρχουν επίσης πίνακες που δίνουν ορισμένους κρίσιμους αριθμούς επίπεδο σπουδαιότητας για τον συνολικό αριθμό διαδρομών.
Λειτουργεί παράδειγμα δοκιμής
Θα εργαστούμε μέσω του παρακάτω παραδείγματος για να δούμε πώς λειτουργεί το τεστ δοκιμών. Ας υποθέσουμε ότι για μια εργασία ένας μαθητής καλείται να αναστρέψει ένα νόμισμα 16 φορές και να σημειώσει τη σειρά των κεφαλών και ουρών που εμφανίστηκαν. Αν καταλήξουμε σε αυτό το σύνολο δεδομένων:
H H H H T T H T H H H H H H
Μπορούμε να ρωτήσουμε αν ο σπουδαστής έκανε την εργασία του, ή εξαπατούσε και γράφει μια σειρά H και T που έμοιαζαν τυχαία; Η δοκιμή των δοκιμών μπορεί να μας βοηθήσει. Οι υποθέσεις πληρούνται για τη δοκιμή των δοκιμών δεδομένου ότι τα δεδομένα μπορούν να ταξινομηθούν σε δύο ομάδες, είτε ως κεφάλι είτε ως ουρά. Συνεχίζουμε με τον υπολογισμό του αριθμού των διαδρομών. Με τη συγκέντρωση, βλέπουμε τα εξής:
H T HHH TT H TT H H H H HH
Υπάρχουν δέκα διαδρομές για τα δεδομένα μας με επτά ουρές είναι εννέα κεφαλές.
Η μηδενική υπόθεση είναι ότι τα δεδομένα είναι τυχαία. Η εναλλακτική λύση είναι ότι δεν είναι τυχαία. Για ένα επίπεδο σημασίας άλφα ίσο προς 0,05, βλέπουμε διαβουλεύοντας με τον κατάλληλο πίνακα ότι απορρίπτουμε τη μηδενική υπόθεση όταν ο αριθμός των διαδρομών είναι είτε μικρότερος του 4 είτε μεγαλύτερος του 16. Δεδομένου ότι υπάρχουν 10 διαδρομές στα δεδομένα μας, εμείς αποτυγχάνουν να απορρίψουν η μηδενική υπόθεση H0.
Κανονική προσέγγιση
Η δοκιμή λειτουργίας είναι ένα χρήσιμο εργαλείο για να προσδιορίσετε αν μια ακολουθία είναι πιθανό να είναι τυχαία ή όχι. Για ένα μεγάλο σύνολο δεδομένων, είναι μερικές φορές δυνατή η χρήση κανονικής προσέγγισης. Αυτή η κανονική προσέγγιση απαιτεί να χρησιμοποιήσουμε τον αριθμό των στοιχείων σε κάθε κατηγορία και στη συνέχεια να υπολογίσουμε τη μέση και την τυπική απόκλιση της κατάλληλης κανονική κατανομή.