Συντελεστής συσχέτισης Spearman

Στα μαθηματικά και τη στατιστική, ο συντελεστής συσχέτισης Spearman είναι ένα μέτρο συσχέτισης, το οποίο πήρε το όνομά του από τον δημιουργό του, Charles Spearman. Γράφεται εν συντομία ως το ελληνικό γράμμα rho ( ρ {\displaystyle \rho } {\displaystyle \rho }) ή μερικές φορές ως r s {\displaystyle r_{s}} {\displaystyle r_{s}}. Είναι ένας αριθμός που δείχνει πόσο στενά συνδέονται δύο σύνολα δεδομένων. Μπορεί να χρησιμοποιηθεί μόνο για δεδομένα που μπορούν να τεθούν σε σειρά, όπως το υψηλότερο προς το χαμηλότερο.

Ο γενικός τύπος για το r s {\displaystyle r_{s}}{\displaystyle r_{s}} είναι ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

Για παράδειγμα, αν έχετε δεδομένα για το πόσο ακριβοί είναι οι διάφοροι υπολογιστές και δεδομένα για το πόσο γρήγοροι είναι οι υπολογιστές, θα μπορούσατε να δείτε αν συνδέονται και πόσο στενά συνδέονται, χρησιμοποιώντας r s {\displaystyle r_{s}} {\displaystyle r_{s}}.

Επεξεργασία

Βήμα πρώτο

Για να υπολογίσετε το r s {\displaystyle r_{s}}{\displaystyle r_{s}} πρέπει πρώτα να κατατάξετε κάθε δεδομένο. Θα χρησιμοποιήσουμε το παράδειγμα από την εισαγωγή των υπολογιστών και της ταχύτητάς τους.

Έτσι, ο υπολογιστής με τη χαμηλότερη τιμή θα βρίσκεται στην θέση. Ο υψηλότερος από αυτόν θα είχε την 2η θέση. Στη συνέχεια, ανεβαίνει μέχρι να καταταγούν όλοι στην ιεραρχία. Πρέπει να το κάνετε αυτό και στα δύο σύνολα δεδομένων.

PC

Τιμή ($)

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

Ταχύτητα (GHz)

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

A

200

1

1.80

2

B

275

2

1.60

1

C

300

3

2.20

4

D

350

4

2.10

3

E

600

5

4.00

5

Βήμα δεύτερο

Στη συνέχεια, πρέπει να βρούμε τη διαφορά μεταξύ των δύο τάξεων. Στη συνέχεια, πολλαπλασιάζουμε τη διαφορά με τον εαυτό της, το οποίο ονομάζεται τετραγωνισμός. Η διαφορά ονομάζεται d {\displaystyle d}{\displaystyle d} , και ο αριθμός που λαμβάνετε όταν τετραγωνίσετε το d {\displaystyle d}{\displaystyle d} ονομάζεται d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}.

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

d {\displaystyle d} {\displaystyle d}

d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}

1

2

-1

1

2

1

1

1

3

4

-1

1

4

3

1

1

5

5

0

0

Βήμα τρίτο

Μετρήστε πόσα δεδομένα έχουμε. Αυτά τα δεδομένα έχουν βαθμίδες από το 1 έως το 5, άρα έχουμε 5 δεδομένα. Αυτός ο αριθμός ονομάζεται n {\displaystyle n}n .

Βήμα τέταρτο

Τέλος, χρησιμοποιήστε όλα όσα έχουμε επεξεργαστεί μέχρι τώρα σε αυτόν τον τύπο: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} σημαίνει ότι παίρνουμε το σύνολο όλων των αριθμών που ήταν στη στήλη d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}. Αυτό συμβαίνει επειδή ∑ {\displaystyle \sum } {\displaystyle \sum }σημαίνει σύνολο.

Έτσι, ∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} είναι 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1}{\displaystyle 1+1+1+1} που είναι 4. Ο τύπος λέει ότι το πολλαπλασιάζουμε με 6, που είναι 24.

n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} {\displaystyle n(n^{2}-1)}είναι 5 × ( 25 - 1 ) {\displaystyle 5\times (25-1)} {\displaystyle 5\times (25-1)}που είναι 120.

Έτσι, για να βρούμε το r s {\displaystyle r_{s}} {\displaystyle r_{s}}, απλά κάνουμε 1 - 24 120 = 0.8 {\displaystyle 1-{\cfrac {24}{120}}=0.8}{\displaystyle 1-{\cfrac {24}{120}}=0.8} .

Επομένως, ο συντελεστής συσχέτισης Spearman είναι 0,8 για αυτό το σύνολο δεδομένων.

Τι σημαίνουν οι αριθμοί

r s {\displaystyle r_{s}}{\displaystyle r_{s}} δίνει πάντα μια απάντηση μεταξύ -1 και 1. Οι αριθμοί μεταξύ αυτών είναι σαν μια κλίμακα, όπου -1 είναι μια πολύ ισχυρή σύνδεση, 0 είναι καμία σύνδεση και 1 είναι επίσης μια πολύ ισχυρή σύνδεση. Η διαφορά μεταξύ 1 και -1 είναι ότι το 1 είναι θετική συσχέτιση και το -1 είναι αρνητική συσχέτιση. Μια γραφική παράσταση δεδομένων με τιμή r s {\displaystyle r_{s}}{\displaystyle r_{s}} -1 θα έμοιαζε με την απεικονιζόμενη γραφική παράσταση με τη διαφορά ότι η γραμμή και τα σημεία θα πήγαιναν από πάνω αριστερά προς τα κάτω δεξιά.

Για παράδειγμα, για τα δεδομένα που κάναμε παραπάνω, το r s {\displaystyle r_{s}}{\displaystyle r_{s}} ήταν 0,8. Αυτό λοιπόν σημαίνει ότι υπάρχει θετική συσχέτιση. Επειδή είναι κοντά στο 1, σημαίνει ότι η σύνδεση είναι ισχυρή μεταξύ των δύο συνόλων δεδομένων. Έτσι, μπορούμε να πούμε ότι αυτά τα δύο σύνολα δεδομένων συνδέονται και ανεβαίνουν μαζί. Αν ήταν -0,8, θα μπορούσαμε να πούμε ότι συνδέονται και καθώς το ένα ανεβαίνει, το άλλο πέφτει.

Zoom

Αυτό το διάγραμμα διασποράς έχει θετική συσχέτιση. Η τιμή r s {\displaystyle r_{s}}{\displaystyle r_{s}} θα ήταν κοντά στο 1 ή 0,9. Η κόκκινη γραμμή είναι η γραμμή καλύτερης προσαρμογής.

Αν δύο αριθμοί είναι ίδιοι

Μερικές φορές, κατά την κατάταξη δεδομένων, υπάρχουν δύο ή περισσότεροι αριθμοί που είναι ίδιοι. Όταν αυτό συμβαίνει στο r s {\displaystyle r_{s}} {\displaystyle r_{s}}, παίρνουμε το μέσο όρο ή το μέσο όρο των κατατάξεων που είναι ίδιες. Αυτοί οι αριθμοί ονομάζονται ισόβαθμοι. Για να το κάνουμε αυτό, κατατάσσουμε τους δεσμευμένους αριθμούς σαν να μην ήταν δεσμευμένοι. Στη συνέχεια, προσθέτουμε όλες τις τάξεις που θα είχαν, και το διαιρούμε με το πόσοι είναι. Για παράδειγμα, ας πούμε ότι κατατάσσουμε πόσο καλά τα πήγαν διάφοροι άνθρωποι σε ένα τεστ ορθογραφίας.

Βαθμολογία τεστ

Κατάταξη

Κατάταξη (με ισοπαλία)

4

1

1

6

2

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

3

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

4

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

8

5

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

8

6

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

Αυτοί οι αριθμοί χρησιμοποιούνται με τον ίδιο ακριβώς τρόπο όπως οι κανονικοί βαθμοί.

Σχετικές σελίδες

Ερωτήσεις και απαντήσεις

Ερ: Τι είναι ο συντελεστής συσχέτισης κατάταξης του Spearman;


A: Ο συντελεστής συσχέτισης κατάταξης του Spearman είναι ένα μέτρο συσχέτισης που δείχνει πόσο στενά συνδέονται δύο σύνολα δεδομένων. Μπορεί να χρησιμοποιηθεί μόνο για δεδομένα που μπορούν να τεθούν σε σειρά, όπως από το υψηλότερο προς το χαμηλότερο.

Ερ: Ποιος δημιούργησε τον συντελεστή συσχέτισης κατάταξης του Spearman;


Α: Ο Charles Spearman δημιούργησε τον συντελεστή συσχέτισης κατάταξης του Spearman.

Ερ: Πώς γράφεται ο γενικός τύπος για τον συντελεστή συσχέτισης κατάταξης του Spearman;


A: Ο γενικός τύπος για τον συντελεστή συσχέτισης κατάταξης του Spearman γράφεται ως ρ = 1 - 6∑d2/n(n2-1).

Ερ: Πότε πρέπει να χρησιμοποιείτε τον συντελεστή συσχέτισης κατάταξης του Spearman;


A: Θα πρέπει να χρησιμοποιείτε τον συντελεστή συσχέτισης κατάταξης του Spearman όταν θέλετε να δείτε πόσο στενά συνδέονται δύο σύνολα δεδομένων και αν συνδέονται καθόλου.

Ερ: Με τι είδους δεδομένα λειτουργεί;


Α: Λειτουργεί με κάθε τύπο δεδομένων που μπορούν να τεθούν σε σειρά, όπως από το υψηλότερο προς το χαμηλότερο.

Ερ: Μπορείτε να δώσετε ένα παράδειγμα όπου θα μπορούσατε να χρησιμοποιήσετε αυτό το μέτρο;



Α: Ένα παράδειγμα όπου θα μπορούσατε να χρησιμοποιήσετε αυτό το μέτρο θα μπορούσε να είναι αν έχετε δεδομένα για το πόσο ακριβοί είναι οι διάφοροι υπολογιστές και δεδομένα για το πόσο γρήγοροι είναι οι υπολογιστές, τότε θα μπορούσατε να δείτε αν συνδέονται και πόσο στενά συνδέονται χρησιμοποιώντας το r_s.

AlegsaOnline.com - 2020 / 2023 - License CC3