Διάστημα εμπιστοσύνης

Στη στατιστική το διάστημα εμπιστοσύνης είναι μια ειδική μορφή εκτίμησης μιας συγκεκριμένης παραμέτρου. Με τη μέθοδο αυτή, δίνεται ένα ολόκληρο διάστημα αποδεκτών τιμών για την παράμετρο αντί για μία μόνο τιμή, μαζί με την πιθανότητα η πραγματική (άγνωστη) τιμή της παραμέτρου να βρίσκεται μέσα στο διάστημα. Το διάστημα εμπιστοσύνης βασίζεται στις παρατηρήσεις από ένα δείγμα και, ως εκ τούτου, διαφέρει από δείγμα σε δείγμα. Η πιθανότητα ότι η παράμετρος θα βρίσκεται στο διάστημα ονομάζεται επίπεδο εμπιστοσύνης. Πολύ συχνά, αυτό δίνεται ως ποσοστό. Το διάστημα εμπιστοσύνης δίνεται πάντα μαζί με το επίπεδο εμπιστοσύνης. Οι άνθρωποι μπορεί να μιλούν για το "διάστημα εμπιστοσύνης 95%". Τα τελικά σημεία του διαστήματος εμπιστοσύνης αναφέρονται ως όρια εμπιστοσύνης. Για μια δεδομένη διαδικασία εκτίμησης σε μια δεδομένη κατάσταση, όσο υψηλότερο είναι το επίπεδο εμπιστοσύνης, τόσο ευρύτερο θα είναι το διάστημα εμπιστοσύνης.

Ο υπολογισμός ενός διαστήματος εμπιστοσύνης απαιτεί γενικά παραδοχές σχετικά με τη φύση της διαδικασίας εκτίμησης - πρόκειται κυρίως για μια παραμετρική μέθοδο. Μια κοινή υπόθεση είναι ότι η κατανομή του πληθυσμού από τον οποίο προήλθε το δείγμα είναι κανονική. Ως εκ τούτου, τα διαστήματα εμπιστοσύνης, όπως συζητούνται παρακάτω, δεν είναι εύρωστα στατιστικά στοιχεία, αν και μπορούν να γίνουν αλλαγές για να προστεθεί η ευστάθεια.

Σημασία του όρου "εμπιστοσύνη"

Ο όρος εμπιστοσύνη έχει παρόμοια σημασία στη στατιστική, όπως και στην κοινή χρήση. Στην κοινή χρήση, ο ισχυρισμός ότι υπάρχει 95% εμπιστοσύνη σε κάτι θεωρείται συνήθως ότι υποδηλώνει σχεδόν βεβαιότητα. Στη στατιστική, ο ισχυρισμός εμπιστοσύνης 95% σημαίνει απλώς ότι ο ερευνητής έχει δει ένα πιθανό διάστημα από ένα μεγάλο αριθμό πιθανών διαστημάτων, από τα οποία τα δεκαεννέα στα είκοσι διαστήματα περιέχουν την πραγματική τιμή της παραμέτρου.

Πρακτικό παράδειγμα

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Ένα μηχάνημα γεμίζει κύπελλα με μαργαρίνη. Για το παράδειγμα, η μηχανή ρυθμίζεται έτσι ώστε το περιεχόμενο των ποτηριών να είναι 250 γραμμάρια μαργαρίνης. Καθώς η μηχανή δεν μπορεί να γεμίσει κάθε φλιτζάνι με ακριβώς 250 γραμμάρια, το περιεχόμενο που προστίθεται σε μεμονωμένα φλιτζάνια παρουσιάζει κάποια διακύμανση και θεωρείται τυχαία μεταβλητή Χ. Η διακύμανση αυτή θεωρείται ότι κατανέμεται κανονικά γύρω από τον επιθυμητό μέσο όρο των 250 γραμμαρίων, με τυπική απόκλιση 2,5 γραμμάρια. Για να διαπιστωθεί αν η μηχανή είναι επαρκώς βαθμονομημένη, επιλέγεται τυχαία ένα δείγμα n = 25 φλιτζανιών μαργαρίνης και τα φλιτζάνια ζυγίζονται. Τα βάρη της μαργαρίνης είναι X1, ..., X25, ένα τυχαίο δείγμα από το X.

Για να αποκτήσουμε μια εντύπωση της προσδοκίας μ, αρκεί να δώσουμε μια εκτίμηση. Ο κατάλληλος εκτιμητής είναι ο δειγματικός μέσος όρος:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Το δείγμα δείχνει τα πραγματικά βάρη x1, ...,x25, με μέσο όρο:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 γραμμάρια . {\displaystyle {\bar {x}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Αν πάρουμε ένα άλλο δείγμα 25 φλιτζανιών, θα μπορούσαμε εύκολα να περιμένουμε να βρούμε τιμές όπως 250,4 ή 251,1 γραμμάρια. Ωστόσο, μια μέση τιμή δείγματος 280 γραμμαρίων θα ήταν εξαιρετικά σπάνια, εάν η μέση περιεκτικότητα των φλιτζανιών είναι πράγματι κοντά στα 250 γραμμάρια. Υπάρχει ένα ολόκληρο διάστημα γύρω από την παρατηρούμενη τιμή 250,2 του δειγματικού μέσου όρου, εντός του οποίου, αν ο συνολικός μέσος όρος του πληθυσμού λάβει πράγματι μια τιμή σε αυτό το εύρος, τα παρατηρούμενα δεδομένα δεν θα θεωρούνταν ιδιαίτερα ασυνήθιστα. Ένα τέτοιο διάστημα ονομάζεται διάστημα εμπιστοσύνης για την παράμετρο μ. Πώς υπολογίζουμε ένα τέτοιο διάστημα; Τα ακραία σημεία του διαστήματος πρέπει να υπολογιστούν από το δείγμα, άρα είναι στατιστικά στοιχεία, συναρτήσεις του δείγματος X1, ..., X25 και συνεπώς οι ίδιες τυχαίες μεταβλητές.

Στην περίπτωσή μας μπορούμε να προσδιορίσουμε τα τελικά σημεία θεωρώντας ότι ο δειγματικός μέσος Χ από ένα κανονικά κατανεμημένο δείγμα είναι επίσης κανονικά κατανεμημένος, με την ίδια προσδοκία μ, αλλά με τυπικό σφάλμα σ/√n = 0,5 (grams). Με την τυποποίηση παίρνουμε μια τυχαία μεταβλητή

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

που εξαρτάται από την προς εκτίμηση παράμετρο μ, αλλά με τυπική κανονική κατανομή ανεξάρτητη από την παράμετρο μ. Ως εκ τούτου, είναι δυνατόν να βρεθούν αριθμοί -z και z, ανεξάρτητοι από το μ, όπου το Z βρίσκεται στο ενδιάμεσο με πιθανότητα 1 - α, ένα μέτρο του πόσο σίγουροι θέλουμε να είμαστε. Παίρνουμε 1 - α = 0,95. Έτσι έχουμε:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Ο αριθμός z προκύπτει από την αθροιστική συνάρτηση κατανομής:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975, z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

και παίρνουμε:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ X ¯ + 0.98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Αυτό μπορεί να ερμηνευθεί ως εξής: με πιθανότητα 0,95 θα βρούμε ένα διάστημα εμπιστοσύνης στο οποίο θα συναντήσουμε την παράμετρο μ μεταξύ των στοχαστικών τελικών σημείων

X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

και

X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Αυτό δεν σημαίνει ότι υπάρχει πιθανότητα 0,95 να συναντηθεί η παράμετρος μ στο υπολογιζόμενο διάστημα. Κάθε φορά που επαναλαμβάνονται οι μετρήσεις, θα υπάρχει μια άλλη τιμή για το μέσο Χ του δείγματος. Στο 95% των περιπτώσεων το μ θα βρίσκεται μεταξύ των τελικών σημείων που υπολογίζονται από αυτόν τον μέσο όρο, αλλά στο 5% των περιπτώσεων δεν θα βρίσκεται. Το πραγματικό διάστημα εμπιστοσύνης υπολογίζεται εισάγοντας τα μετρούμενα βάρη στον τύπο. Το δικό μας διάστημα εμπιστοσύνης 0,95 γίνεται:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Δεδομένου ότι η επιθυμητή τιμή 250 του μ βρίσκεται εντός του διαστήματος εμπιστοσύνης που προέκυψε, δεν υπάρχει λόγος να πιστεύουμε ότι το μηχάνημα είναι λανθασμένα βαθμονομημένο.

Το υπολογιζόμενο διάστημα έχει σταθερά τελικά σημεία, όπου το μ μπορεί να βρίσκεται ενδιάμεσα (ή όχι). Συνεπώς, το γεγονός αυτό έχει πιθανότητα είτε 0 είτε 1. Δεν μπορούμε να πούμε: "με πιθανότητα (1 - α) η παράμετρος μ βρίσκεται στο διάστημα εμπιστοσύνης". Γνωρίζουμε μόνο ότι με επανάληψη στο 100(1 - α) % των περιπτώσεων το μ θα βρίσκεται στο υπολογιζόμενο διάστημα. Στο 100α % των περιπτώσεων όμως δεν βρίσκεται. Και δυστυχώς δεν γνωρίζουμε σε ποιες από τις περιπτώσεις συμβαίνει αυτό. Γι' αυτό και λέμε: "Η επανάληψη της επανάληψης δεν είναι το ίδιο με την επανάληψη της επανάληψης": "με επίπεδο εμπιστοσύνης 100(1 - α) %, το μ βρίσκεται στο διάστημα εμπιστοσύνης. "

Το σχήμα στα δεξιά δείχνει 50 υλοποιήσεις ενός διαστήματος εμπιστοσύνης για μια δεδομένη μέση τιμή του πληθυσμού μ. Αν επιλέξουμε τυχαία μια υλοποίηση, η πιθανότητα είναι 95% να καταλήξουμε να έχουμε επιλέξει ένα διάστημα που περιέχει την παράμετρο- ωστόσο μπορεί να είμαστε άτυχοι και να έχουμε επιλέξει τη λάθος υλοποίηση. Ποτέ δεν θα το μάθουμε- είμαστε κολλημένοι με το διάστημά μας.

Τα κατακόρυφα γραμμικά τμήματα αντιπροσωπεύουν 50 υλοποιήσεις ενός διαστήματος εμπιστοσύνης για το μ.Zoom
Τα κατακόρυφα γραμμικά τμήματα αντιπροσωπεύουν 50 υλοποιήσεις ενός διαστήματος εμπιστοσύνης για το μ.

Ερωτήσεις και απαντήσεις

Ερ: Τι είναι το διάστημα εμπιστοσύνης στη στατιστική;


A: Το διάστημα εμπιστοσύνης είναι ένα ειδικό διάστημα που χρησιμοποιείται για την εκτίμηση μιας παραμέτρου, όπως ο μέσος όρος του πληθυσμού, δίνοντας ένα εύρος αποδεκτών τιμών για την παράμετρο αντί για μια μόνο τιμή.

Ερ: Γιατί χρησιμοποιείται ένα διάστημα εμπιστοσύνης αντί για μία μόνο τιμή;


Α: Ένα διάστημα εμπιστοσύνης χρησιμοποιείται αντί για μια μεμονωμένη τιμή για να ληφθεί υπόψη η αβεβαιότητα της εκτίμησης μιας παραμέτρου με βάση ένα δείγμα και για να δοθεί μια πιθανότητα ότι η πραγματική τιμή της παραμέτρου βρίσκεται εντός του διαστήματος.

Ερ: Τι είναι το επίπεδο εμπιστοσύνης;


Α: Το επίπεδο εμπιστοσύνης είναι η πιθανότητα η εκτιμώμενη παράμετρος να βρίσκεται εντός του διαστήματος εμπιστοσύνης και συχνά δίνεται ως ποσοστό (π.χ. 95% διάστημα εμπιστοσύνης).

Ε: Τι είναι τα όρια εμπιστοσύνης;


Α: Τα όρια εμπιστοσύνης είναι τα τελικά σημεία ενός διαστήματος εμπιστοσύνης, τα οποία καθορίζουν το εύρος των αποδεκτών τιμών για την υπό εκτίμηση παράμετρο.

Ερ: Πώς επηρεάζει το επίπεδο εμπιστοσύνης το διάστημα εμπιστοσύνης;


Α: Σε μια δεδομένη διαδικασία εκτίμησης, όσο υψηλότερο είναι το επίπεδο εμπιστοσύνης, τόσο ευρύτερο θα είναι το διάστημα εμπιστοσύνης.

Ερ: Ποιες παραδοχές απαιτούνται για τον υπολογισμό ενός διαστήματος εμπιστοσύνης;


Α: Ο υπολογισμός ενός διαστήματος εμπιστοσύνης απαιτεί γενικά υποθέσεις σχετικά με τη φύση της διαδικασίας εκτίμησης, όπως η υπόθεση ότι η κατανομή του πληθυσμού από τον οποίο προήλθε το δείγμα είναι κανονική.

Ερ: Τα διαστήματα εμπιστοσύνης είναι εύρωστα στατιστικά στοιχεία;


Α: Τα διαστήματα εμπιστοσύνης, όπως αναλύεται παρακάτω, δεν είναι εύρωστα στατιστικά στοιχεία, αν και μπορούν να γίνουν προσαρμογές για να προστεθεί ευστάθεια.

AlegsaOnline.com - 2020 / 2023 - License CC3