Τυπικό σφάλμα
Το τυπικό σφάλμα είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής ενός στατιστικού στοιχείου. Ο όρος μπορεί επίσης να χρησιμοποιηθεί για μια εκτίμηση (καλή εικασία) αυτής της τυπικής απόκλισης που λαμβάνεται από ένα δείγμα ολόκληρης της ομάδας.
Ο μέσος όρος κάποιου μέρους μιας ομάδας (που ονομάζεται δείγμα) είναι ο συνήθης τρόπος για την εκτίμηση του μέσου όρου για ολόκληρη την ομάδα. Συχνά είναι πολύ δύσκολο ή κοστίζει πολλά χρήματα να μετρηθεί ολόκληρη η ομάδα. Αν όμως μετρηθεί ένα διαφορετικό δείγμα, αυτό θα έχει μέσο όρο που θα διαφέρει λίγο από το πρώτο δείγμα. Το τυπικό σφάλμα του μέσου όρου είναι ένας τρόπος για να γνωρίζουμε πόσο κοντά είναι ο μέσος όρος του δείγματος στο μέσο όρο ολόκληρης της ομάδας. Είναι ένας τρόπος για να γνωρίζετε πόσο σίγουροι μπορείτε να είστε για τον μέσο όρο από το δείγμα.
Σε πραγματικές μετρήσεις, η πραγματική τιμή της τυπικής απόκλισης του μέσου όρου για ολόκληρη την ομάδα δεν είναι συνήθως γνωστή. Έτσι, ο όρος τυπικό σφάλμα χρησιμοποιείται συχνά για να υποδηλώσει μια κοντινή εκτίμηση του πραγματικού αριθμού για ολόκληρη την ομάδα. Όσο περισσότερες μετρήσεις υπάρχουν σε ένα δείγμα, τόσο πιο κοντά στον πραγματικό αριθμό για ολόκληρη την ομάδα θα είναι η εικασία.
Για μια τιμή που λαμβάνεται δειγματοληπτικά με αμερόληπτο σφάλμα κανονικής κατανομής, το παραπάνω απεικονίζει το ποσοστό των δειγμάτων που θα εμπίπτουν μεταξύ 0, 1, 2 και 3 τυπικών αποκλίσεων πάνω και κάτω από την πραγματική τιμή.
Πώς να βρείτε το τυπικό σφάλμα του μέσου όρου
Ένας τρόπος για να βρείτε το τυπικό σφάλμα του μέσου όρου είναι να έχετε πολλά δείγματα. Αρχικά, βρίσκεται ο μέσος όρος για κάθε δείγμα. Στη συνέχεια, βρίσκεται ο μέσος όρος και η τυπική απόκλιση αυτών των μέσων όρων των δειγμάτων. Η τυπική απόκλιση για όλους τους μέσους όρους των δειγμάτων είναι το τυπικό σφάλμα του μέσου όρου. Αυτό μπορεί να είναι πολλή δουλειά. Μερικές φορές είναι πολύ δύσκολο ή κοστίζει πολλά χρήματα να έχουμε πολλά δείγματα.
Ένας άλλος τρόπος για να βρείτε το τυπικό σφάλμα του μέσου όρου είναι να χρησιμοποιήσετε μια εξίσωση που χρειάζεται μόνο ένα δείγμα. Το τυπικό σφάλμα του μέσου όρου εκτιμάται συνήθως από την τυπική απόκλιση για ένα δείγμα από το σύνολο της ομάδας (τυπική απόκλιση δείγματος) διαιρεμένη με την τετραγωνική ρίζα του μεγέθους του δείγματος.
S E x ¯ = s n {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}
όπου
s είναι η τυπική απόκλιση του δείγματος (δηλαδή η εκτίμηση της τυπικής απόκλισης του πληθυσμού με βάση το δείγμα), και
n είναι ο αριθμός των μετρήσεων στο δείγμα.
Πόσο μεγάλο πρέπει να είναι το δείγμα ώστε η εκτίμηση του τυπικού σφάλματος του μέσου όρου να είναι κοντά στο πραγματικό τυπικό σφάλμα του μέσου όρου για το σύνολο της ομάδας; Πρέπει να υπάρχουν τουλάχιστον έξι μετρήσεις σε ένα δείγμα. Τότε το τυπικό σφάλμα του μέσου όρου για το δείγμα θα είναι εντός του 5% του τυπικού σφάλματος του μέσου όρου αν είχε μετρηθεί ολόκληρη η ομάδα.
Διορθώσεις για ορισμένες περιπτώσεις
Υπάρχει μια άλλη εξίσωση που πρέπει να χρησιμοποιηθεί εάν ο αριθμός των μετρήσεων αφορά το 5% ή περισσότερο του συνόλου της ομάδας:
Υπάρχουν ειδικές εξισώσεις που πρέπει να χρησιμοποιούνται εάν ένα δείγμα έχει λιγότερες από 20 μετρήσεις.
Μερικές φορές ένα δείγμα προέρχεται από ένα μέρος, παρόλο που ολόκληρη η ομάδα μπορεί να είναι διασκορπισμένη. Επίσης, μερικές φορές ένα δείγμα μπορεί να γίνει σε σύντομο χρονικό διάστημα, ενώ ολόκληρη η ομάδα καλύπτει μεγαλύτερο χρονικό διάστημα. Στην περίπτωση αυτή, οι αριθμοί του δείγματος δεν είναι ανεξάρτητοι. Τότε χρησιμοποιούνται ειδικές εξισώσεις που προσπαθούν να διορθώσουν αυτό το γεγονός.
Χρησιμότητα
Ένα πρακτικό αποτέλεσμα: Μπορεί κανείς να γίνει πιο σίγουρος για μια μέση τιμή έχοντας περισσότερες μετρήσεις σε ένα δείγμα. Τότε το τυπικό σφάλμα του μέσου όρου θα είναι μικρότερο επειδή η τυπική απόκλιση διαιρείται με μεγαλύτερο αριθμό. Ωστόσο, για να γίνει η αβεβαιότητα (τυπικό σφάλμα του μέσου όρου) σε μια μέση τιμή μισή, το μέγεθος του δείγματος (n) πρέπει να είναι τέσσερις φορές μεγαλύτερο. Αυτό συμβαίνει επειδή η τυπική απόκλιση διαιρείται με την τετραγωνική ρίζα του μεγέθους του δείγματος. Για να γίνει η αβεβαιότητα το ένα δέκατο τόσο μεγάλη, το μέγεθος του δείγματος (n) πρέπει να είναι εκατό φορές μεγαλύτερο!
Τα τυπικά σφάλματα είναι εύκολο να υπολογιστούν και χρησιμοποιούνται συχνά επειδή:
- Εάν είναι γνωστό το τυπικό σφάλμα πολλών μεμονωμένων ποσοτήτων, τότε το τυπικό σφάλμα κάποιας συνάρτησης των ποσοτήτων μπορεί εύκολα να υπολογιστεί σε πολλές περιπτώσεις,
- Όταν η κατανομή πιθανότητας της τιμής είναι γνωστή, μπορεί να χρησιμοποιηθεί για τον υπολογισμό μιας καλής προσέγγισης ενός ακριβούς διαστήματος εμπιστοσύνης- και
- Όταν η κατανομή πιθανοτήτων δεν είναι γνωστή, μπορούν να χρησιμοποιηθούν άλλες εξισώσεις για την εκτίμηση ενός διαστήματος εμπιστοσύνης.
- Καθώς το μέγεθος του δείγματος γίνεται πολύ μεγάλο, η αρχή του κεντρικού οριακού θεωρήματος δείχνει ότι οι αριθμοί στο δείγμα μοιάζουν πολύ με τους αριθμούς στο σύνολο της ομάδας (έχουν κανονική κατανομή).
Σχετικό τυπικό σφάλμα
Το σχετικό τυπικό σφάλμα (RSE) είναι το τυπικό σφάλμα διαιρεμένο με το μέσο όρο. Ο αριθμός αυτός είναι μικρότερος από τη μονάδα. Ο πολλαπλασιασμός του με το 100% το δίνει ως ποσοστό του μέσου όρου. Αυτό βοηθά να δείξει αν η αβεβαιότητα είναι σημαντική ή όχι. Για παράδειγμα, θεωρήστε δύο έρευνες για το εισόδημα των νοικοκυριών που και οι δύο καταλήγουν σε έναν δειγματικό μέσο όρο 50.000 δολαρίων. Εάν η μία έρευνα έχει τυπικό σφάλμα 10.000 δολάρια και η άλλη έχει τυπικό σφάλμα 5.000 δολάρια, τότε τα σχετικά τυπικά σφάλματα είναι 20% και 10% αντίστοιχα. Η έρευνα με το μικρότερο σχετικό τυπικό σφάλμα είναι καλύτερη επειδή έχει ακριβέστερη μέτρηση (η αβεβαιότητα είναι μικρότερη).
Στην πραγματικότητα, οι άνθρωποι που πρέπει να γνωρίζουν τις μέσες τιμές συχνά αποφασίζουν πόσο μικρή πρέπει να είναι η αβεβαιότητα πριν αποφασίσουν να χρησιμοποιήσουν την πληροφορία. Για παράδειγμα, το Εθνικό Κέντρο Στατιστικών Υγείας των ΗΠΑ δεν αναφέρει έναν μέσο όρο εάν το σχετικό τυπικό σφάλμα υπερβαίνει το 30%. Το NCHS απαιτεί επίσης τουλάχιστον 30 παρατηρήσεις για να αναφερθεί μια εκτίμηση. []
Παράδειγμα
Για παράδειγμα, υπάρχουν πολλά κοκκινόψαρα στα νερά του Κόλπου του Μεξικού. Για να μάθετε πόσο ζυγίζει κατά μέσο όρο ένα κοκκινόψαρο μήκους 42 εκατοστών, δεν είναι δυνατόν να μετρήσετε όλα τα κοκκινόψαρα που έχουν μήκος 42 εκατοστών. Αντ' αυτού, είναι δυνατόν να μετρήσετε ορισμένα από αυτά. Τα ψάρια που πραγματικά μετριούνται ονομάζονται δείγμα. Ο πίνακας δείχνει τα βάρη για δύο δείγματα κοκκινόψαρου, όλα μήκους 42 cm. Το μέσο βάρος του πρώτου δείγματος είναι 0,741 kg. Το μέσο (μέσο) βάρος του δεύτερου δείγματος είναι 0,735 kg, λίγο διαφορετικό από το πρώτο δείγμα. Κάθε ένας από αυτούς τους μέσους όρους διαφέρει λίγο από τον μέσο όρο που θα προέκυπτε από τη μέτρηση κάθε κοκκινόψαρου μήκους 42 cm (η οποία δεν είναι δυνατή ούτως ή άλλως).
Η αβεβαιότητα του μέσου όρου μπορεί να χρησιμοποιηθεί για να γνωρίζουμε πόσο κοντά βρίσκεται ο μέσος όρος των δειγμάτων στο μέσο όρο που θα προέκυπτε από τη μέτρηση ολόκληρης της ομάδας. Η αβεβαιότητα του μέσου όρου εκτιμάται ως η τυπική απόκλιση για το δείγμα, διαιρούμενη με την τετραγωνική ρίζα του αριθμού των δειγμάτων μείον ένα. Ο πίνακας δείχνει ότι οι αβεβαιότητες στους μέσους όρους για τα δύο δείγματα είναι πολύ κοντά η μία στην άλλη. Επίσης, η σχετική αβεβαιότητα είναι η αβεβαιότητα στο μέσο διαιρούμενη με το μέσο, επί 100%. Η σχετική αβεβαιότητα σε αυτό το παράδειγμα είναι 2,38% και 2,50% για τα δύο δείγματα.
Γνωρίζοντας την αβεβαιότητα του μέσου όρου, μπορεί κανείς να γνωρίζει πόσο κοντά βρίσκεται ο μέσος όρος του δείγματος στο μέσο όρο που θα προέκυπτε από τη μέτρηση ολόκληρης της ομάδας. Ο μέσος όρος για ολόκληρη την ομάδα βρίσκεται μεταξύ α) του μέσου όρου του δείγματος συν την αβεβαιότητα του μέσου όρου και β) του μέσου όρου του δείγματος μείον την αβεβαιότητα του μέσου όρου. Σε αυτό το παράδειγμα, το μέσο βάρος για το σύνολο των κοκκινόψαρων μήκους 42 cm στον Κόλπο του Μεξικού αναμένεται να είναι 0,723-0,759 kg με βάση το πρώτο δείγμα και 0,717-0,753 με βάση το δεύτερο δείγμα.
Παράδειγμα κοκκινόψαρου (επίσης γνωστού ως red drum, Sciaenops ocellatus) που χρησιμοποιείται στο παράδειγμα.
Ερωτήσεις και απαντήσεις
Ερ: Ποιο είναι το τυπικό σφάλμα;
A: Το τυπικό σφάλμα είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής ενός στατιστικού στοιχείου.
Ερ: Μπορεί ο όρος τυπικό σφάλμα να χρησιμοποιηθεί για μια εκτίμηση της τυπικής απόκλισης;
A: Ναι, ο όρος τυπικό σφάλμα μπορεί να χρησιμοποιηθεί για μια εκτίμηση (καλή εικασία) αυτής της τυπικής απόκλισης που λαμβάνεται από ένα δείγμα ολόκληρης της ομάδας.
Ερ: Πώς μπορεί κανείς να εκτιμήσει το μέσο όρο για μια ολόκληρη ομάδα;
Α: Ο μέσος όρος κάποιου μέρους μιας ομάδας (που ονομάζεται δείγμα) είναι ο συνήθης τρόπος εκτίμησης του μέσου όρου για ολόκληρη την ομάδα.
Ερ: Γιατί είναι δύσκολο να μετρηθεί η συνολική ομάδα;
Α: Συχνά είναι πολύ δύσκολο ή πολύ δαπανηρό να μετρηθεί ολόκληρη η ομάδα.
Ερ: Τι είναι το τυπικό σφάλμα του μέσου όρου και τι προσδιορίζει;
Α: Το τυπικό σφάλμα του μέσου όρου είναι ένας τρόπος για να γνωρίζουμε πόσο κοντά βρίσκεται ο μέσος όρος του δείγματος στο μέσο όρο ολόκληρης της ομάδας. Είναι ένας τρόπος να γνωρίζουμε πόσο σίγουροι μπορούμε να είμαστε για τον μέσο όρο από το δείγμα.
Ερ: Είναι συνήθως γνωστή η πραγματική τιμή της τυπικής απόκλισης του μέσου όρου σε πραγματικές μετρήσεις;
Α: Όχι, η πραγματική τιμή της τυπικής απόκλισης του μέσου όρου για ολόκληρη την ομάδα δεν είναι συνήθως γνωστή σε πραγματικές μετρήσεις.
Ερ: Πώς επηρεάζει ο αριθμός των μετρήσεων σε ένα δείγμα την ακρίβεια της εκτίμησης;
Α: Όσο περισσότερες μετρήσεις υπάρχουν σε ένα δείγμα, τόσο πιο κοντά θα είναι η εκτίμηση στον πραγματικό αριθμό για ολόκληρη την ομάδα.