Współczynnik korelacji rang Spearmana

W matematyce i statystyce, współczynnik korelacji rangowej Spearmana jest miarą korelacji, nazwaną na cześć jego twórcy, Charlesa Spearmana. Jest on napisany w skrócie jako grecka litera rho ( ρ {\i1}{\displaystyle \rho }) lub czasami jako r s {\i1}{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1} {\displaystyle r_{s}}. Jest to liczba, która pokazuje, jak ściśle powiązane są dwa zestawy danych. Może być użyta tylko dla danych, które można uporządkować, np. od najwyższego do najniższego.

Ogólny wzór na r s {\i1} {\i1}displaystylu r_{s}}to{\displaystyle r_{s}} ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i1}displastylu \i1-{\i1}cfrac {\i1}sum d^{\i0}{n(n^{\i1}-1)}} {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

Na przykład, jeśli masz dane dotyczące tego, jak drogie są różne komputery i jak szybkie są to komputery, możesz zobaczyć, czy są one połączone i jak blisko siebie, używając r s {\i1}displaystylu r_{s}} {\displaystyle r_{s}}.

Opracowanie go

Krok pierwszy

Aby rozpracować r s {\i0} {\i1}styl r_s{\i0} {\i1}musisz najpierw{\displaystyle r_{s}}uszeregować każdy kawałek danych. Użyjemy przykładu z wprowadzenia komputerów i ich prędkości.

Więc, komputer z najniższą ceną miałby pierwszą pozycję. Ten wyższy od tego miałby 2. Potem idzie w górę, aż do momentu, gdy wszystko będzie w rankingu. Musisz to zrobić z obydwoma zestawami danych.

PC

Cena ($)

R a n k 1 {\i1} {\i1}Displastyla Rank_{\i0} {\displaystyle Rank_{1}}

Prędkość (GHz)

R a n k 2 {\i1} {\i1}Displastyla Rank_{\i0} {\displaystyle Rank_{2}}

A

200

1

1.80

2

B

275

2

1.60

1

C

300

3

2.20

4

D

350

4

2.10

3

E

600

5

4.00

5

Krok drugi

Dalej, musimy znaleźć różnicę między tymi dwoma szeregami. Następnie pomnożymy tę różnicę przez siebie, co nazywa się squaringiem. Różnica nazywa się d {\i1}displaystylem d} {\displaystyle d}, a numer, który dostajesz, gdy kwadrat d {\i0}displastylem d}{\displaystyle d} nazywa się d 2 {\i1}displastylem d^{\i0} {\displaystyle d^{2}}.

R a n k 1 {\i1} {\i1}Displastyla Rank_{\i0} {\displaystyle Rank_{1}}

R a n k 2 {\i1} {\i1}Displastyla Rank_{\i0} {\displaystyle Rank_{2}}

d {\i1}Displastyla d} {\displaystyle d}

d 2 {\i1}displaystyle d^{2} {\displaystyle d^{2}}

1

2

-1

1

2

1

1

1

3

4

-1

1

4

3

1

1

5

5

0

0

Krok trzeci

Policzcie, ile mamy danych. Dane te mają rangę od 1 do 5, więc mamy 5 sztuk danych. Ten numer nazywa się n {\i0} {\i1}displastyla n{\i0}n .

Krok czwarty

Wreszcie, użyj wszystkiego, co do tej pory wypracowaliśmy w tym wzorze: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i1}-{\i1}-{\i1}cfrac {\i1}sum d^{\i0}{n(n^{\i1}-1)}} {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

∑ d 2{\displaystyle \sum d^{2}} {\i1}oznacza, że bierzemy sumę wszystkich liczb, które były w kolumnie d 2 {\i1} {\displaystyle d^{2}}. {y:i}To dlatego, że {y:i}sum {\displaystyle \sum }oznacza sumę.

Więc, ∑ d 2 {\i1}styk styropianu d^{\i0}jest{\displaystyle \sum d^{2}}1 + 1 + 1 + 1 {\i1}styk styropianu 1+1+1}{\displaystyle 1+1+1+1} co jest 4. Wzór mówi, że należy go pomnożyć przez 6, co jest 24.

n ( n 2 - 1 ) {\i1}wyświetlacz n(n^{2}-1)}jest{\displaystyle n(n^{2}-1)}5 × ( 25 - 1 ) {\i1}wyświetlacz 5 razy (25-1)} {\displaystyle 5\times (25-1)}który wynosi 120.

Więc, żeby dowiedzieć się, że r s {\i0} {\displaystyle r_{s}}, po prostu robimy 1 - 24 120 = 0.8 {\i0.8}{\i1}{\displaystyle 1-{\cfrac {24}{120}}=0.8}

Dlatego też współczynnik korelacji rangowej Spearmana wynosi 0,8 dla tego zbioru danych.

Co te liczby oznaczają

r s {\i1}displaystyle r_{s}}{\displaystyle r_{s}} zawsze daje odpowiedź pomiędzy -1 a 1. Liczby pomiędzy są jak skala, gdzie -1 jest bardzo silnym ogniwem, 0 nie jest ogniwem, a 1 jest również bardzo silnym ogniwem. Różnica między 1 a -1 jest taka, że 1 jest korelacją dodatnią, a -1 jest korelacją ujemną. Wykres danych o wartości r s {\i1}wyglądałby{\displaystyle r_{s}} jak pokazany wykres, z wyjątkiem linii i punktów biegnących od góry z lewej strony do dołu z prawej.

Na przykład, dla danych, które zrobiliśmy powyżej, r s {\i1}displaystylu r_{s}}było 0.8. Więc{\displaystyle r_{s}}to oznacza, że istnieje pozytywna korelacja. Ponieważ jest ona bliska 1, oznacza to, że powiązanie jest silne pomiędzy dwoma zbiorami danych. Więc, możemy powiedzieć, że te dwa zestawy danych są połączone, i idą w górę razem. Gdyby było to -0,8, moglibyśmy powiedzieć, że są one połączone, a jak jeden idzie w górę, to drugi w dół.

Zoom

Ten wykres rozproszenia ma dodatnią korelację. Wartość r s{\displaystyle r_{s}} {\i1}stystylu r_{s}}byłaby bliska 1 lub 0,9. Czerwona linia jest linią najlepiej pasującą.

Jeśli dwie liczby są takie same

Czasami, przy danych rankingowych, są dwie lub więcej takich samych liczb. Kiedy to się dzieje w r s {\i1} {\i1}Style r_{\i0} {\displaystyle r_{s}}przyjmujemy średnią lub średnią z tych samych szeregów. Nazywa się to remisowymi szeregami. Aby to zrobić, klasyfikujemy remisowane liczby tak, jakby nie były remisowane. Następnie sumujemy wszystkie stopnie, które by mieli, i dzielimy je przez ich liczbę. Na przykład, powiedzmy, że oceniamy jak dobrze różne osoby radziły sobie w teście ortograficznym.

Wynik testu

Ranking

Ranga (z wiązanym)

4

1

1

6

2

2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

3

2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

4

2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

8

5

5 + 6 2 = 5,5 {\i1} {\i1}=5,5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

8

6

5 + 6 2 = 5,5 {\i1} {\i1}=5,5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

Liczby te są używane dokładnie w ten sam sposób, co normalne szeregi.

Powiązane strony

Pytania i odpowiedzi

P: Co to jest współczynnik korelacji rang Spearmana?


O: Współczynnik korelacji rangowej Spearmana jest miarą korelacji, która pokazuje, jak ściśle powiązane są ze sobą dwa zestawy danych. Można go stosować tylko w przypadku danych, które można uporządkować, np. od najwyższego do najniższego.

P: Kto stworzył współczynnik korelacji rangowej Spearmana?


O: Charles Spearman stworzył współczynnik korelacji rangowej Spearmana.

P: Jak się pisze ogólny wzór na współczynnik korelacji rangowej Spearmana?


O: Ogólny wzór na współczynnik korelacji rangowej Spearmana ma postać ρ = 1 - 6∑d2/n(n2-1).

P: Kiedy należy stosować współczynnik korelacji rangowej Spearmana?


O: Powinien Pan użyć współczynnika korelacji rang Spearmana, kiedy chce Pan sprawdzić, jak blisko są ze sobą powiązane dwa zestawy danych i czy w ogóle są ze sobą powiązane.

P: Z jakimi danymi współpracuje?


O: Działa z każdym rodzajem danych, które można uporządkować, np. od najwyższego do najniższego.

P: Czy może Pan podać przykład zastosowania tej miary?



O: Przykładem zastosowania tej miary może być sytuacja, w której posiada Pan dane o tym, jak drogie są różne komputery i dane o tym, jak szybkie są te komputery, wtedy może Pan sprawdzić, czy są one powiązane i jak bardzo są powiązane, używając r_s.

AlegsaOnline.com - 2020 / 2023 - License CC3