Współczynnik korelacji rang Spearmana
W matematyce i statystyce, współczynnik korelacji rangowej Spearmana jest miarą korelacji, nazwaną na cześć jego twórcy, Charlesa Spearmana. Jest on napisany w skrócie jako grecka litera rho ( ρ {\i1}) lub czasami jako r s {\i1}{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1}-{\i1} . Jest to liczba, która pokazuje, jak ściśle powiązane są dwa zestawy danych. Może być użyta tylko dla danych, które można uporządkować, np. od najwyższego do najniższego.
Ogólny wzór na r s {\i1} {\i1}displaystylu r_{s}}to ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i1}displastylu \i1-{\i1}cfrac {\i1}sum d^{\i0}{n(n^{\i1}-1)}} .
Na przykład, jeśli masz dane dotyczące tego, jak drogie są różne komputery i jak szybkie są to komputery, możesz zobaczyć, czy są one połączone i jak blisko siebie, używając r s {\i1}displaystylu r_{s}} .
Opracowanie go
Krok pierwszy
Aby rozpracować r s {\i0} {\i1}styl r_s{\i0} {\i1}musisz najpierwuszeregować każdy kawałek danych. Użyjemy przykładu z wprowadzenia komputerów i ich prędkości.
Więc, komputer z najniższą ceną miałby pierwszą pozycję. Ten wyższy od tego miałby 2. Potem idzie w górę, aż do momentu, gdy wszystko będzie w rankingu. Musisz to zrobić z obydwoma zestawami danych.
Cena ($) | R a n k 1 {\i1} {\i1}Displastyla Rank_{\i0} | Prędkość (GHz) | R a n k 2 {\i1} {\i1}Displastyla Rank_{\i0} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Krok drugi
Dalej, musimy znaleźć różnicę między tymi dwoma szeregami. Następnie pomnożymy tę różnicę przez siebie, co nazywa się squaringiem. Różnica nazywa się d {\i1}displaystylem d} , a numer, który dostajesz, gdy kwadrat d {\i0}displastylem d} nazywa się d 2 {\i1}displastylem d^{\i0} .
R a n k 1 {\i1} {\i1}Displastyla Rank_{\i0} | R a n k 2 {\i1} {\i1}Displastyla Rank_{\i0} | d {\i1}Displastyla d} | d 2 {\i1}displaystyle d^{2} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Krok trzeci
Policzcie, ile mamy danych. Dane te mają rangę od 1 do 5, więc mamy 5 sztuk danych. Ten numer nazywa się n {\i0} {\i1}displastyla n{\i0} .
Krok czwarty
Wreszcie, użyj wszystkiego, co do tej pory wypracowaliśmy w tym wzorze: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i1}-{\i1}-{\i1}cfrac {\i1}sum d^{\i0}{n(n^{\i1}-1)}} .
∑ d 2 {\i1}oznacza, że bierzemy sumę wszystkich liczb, które były w kolumnie d 2 {\i1} . {y:i}To dlatego, że {y:i}sum oznacza sumę.
Więc, ∑ d 2 {\i1}styk styropianu d^{\i0}jest1 + 1 + 1 + 1 {\i1}styk styropianu 1+1+1} co jest 4. Wzór mówi, że należy go pomnożyć przez 6, co jest 24.
n ( n 2 - 1 ) {\i1}wyświetlacz n(n^{2}-1)}jest5 × ( 25 - 1 ) {\i1}wyświetlacz 5 razy (25-1)} który wynosi 120.
Więc, żeby dowiedzieć się, że r s {\i0} , po prostu robimy 1 - 24 120 = 0.8 {\i0.8}{\i1}
Dlatego też współczynnik korelacji rangowej Spearmana wynosi 0,8 dla tego zbioru danych.
Co te liczby oznaczają
r s {\i1}displaystyle r_{s}} zawsze daje odpowiedź pomiędzy -1 a 1. Liczby pomiędzy są jak skala, gdzie -1 jest bardzo silnym ogniwem, 0 nie jest ogniwem, a 1 jest również bardzo silnym ogniwem. Różnica między 1 a -1 jest taka, że 1 jest korelacją dodatnią, a -1 jest korelacją ujemną. Wykres danych o wartości r s {\i1}wyglądałby jak pokazany wykres, z wyjątkiem linii i punktów biegnących od góry z lewej strony do dołu z prawej.
Na przykład, dla danych, które zrobiliśmy powyżej, r s {\i1}displaystylu r_{s}}było 0.8. Więcto oznacza, że istnieje pozytywna korelacja. Ponieważ jest ona bliska 1, oznacza to, że powiązanie jest silne pomiędzy dwoma zbiorami danych. Więc, możemy powiedzieć, że te dwa zestawy danych są połączone, i idą w górę razem. Gdyby było to -0,8, moglibyśmy powiedzieć, że są one połączone, a jak jeden idzie w górę, to drugi w dół.
Jeśli dwie liczby są takie same
Czasami, przy danych rankingowych, są dwie lub więcej takich samych liczb. Kiedy to się dzieje w r s {\i1} {\i1}Style r_{\i0} przyjmujemy średnią lub średnią z tych samych szeregów. Nazywa się to remisowymi szeregami. Aby to zrobić, klasyfikujemy remisowane liczby tak, jakby nie były remisowane. Następnie sumujemy wszystkie stopnie, które by mieli, i dzielimy je przez ich liczbę. Na przykład, powiedzmy, że oceniamy jak dobrze różne osoby radziły sobie w teście ortograficznym.
Wynik testu | Ranking | Ranga (z wiązanym) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} |
6 | 3 | 2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} |
6 | 4 | 2 + 3 + 4 3 = 3 {\i1} {\i1} {\i1}=3} |
8 | 5 | 5 + 6 2 = 5,5 {\i1} {\i1}=5,5} |
8 | 6 | 5 + 6 2 = 5,5 {\i1} {\i1}=5,5} |
Liczby te są używane dokładnie w ten sam sposób, co normalne szeregi.
Powiązane strony
Pytania i odpowiedzi
P: Co to jest współczynnik korelacji rang Spearmana?
O: Współczynnik korelacji rangowej Spearmana jest miarą korelacji, która pokazuje, jak ściśle powiązane są ze sobą dwa zestawy danych. Można go stosować tylko w przypadku danych, które można uporządkować, np. od najwyższego do najniższego.
P: Kto stworzył współczynnik korelacji rangowej Spearmana?
O: Charles Spearman stworzył współczynnik korelacji rangowej Spearmana.
P: Jak się pisze ogólny wzór na współczynnik korelacji rangowej Spearmana?
O: Ogólny wzór na współczynnik korelacji rangowej Spearmana ma postać ρ = 1 - 6∑d2/n(n2-1).
P: Kiedy należy stosować współczynnik korelacji rangowej Spearmana?
O: Powinien Pan użyć współczynnika korelacji rang Spearmana, kiedy chce Pan sprawdzić, jak blisko są ze sobą powiązane dwa zestawy danych i czy w ogóle są ze sobą powiązane.
P: Z jakimi danymi współpracuje?
O: Działa z każdym rodzajem danych, które można uporządkować, np. od najwyższego do najniższego.
P: Czy może Pan podać przykład zastosowania tej miary?
O: Przykładem zastosowania tej miary może być sytuacja, w której posiada Pan dane o tym, jak drogie są różne komputery i dane o tym, jak szybkie są te komputery, wtedy może Pan sprawdzić, czy są one powiązane i jak bardzo są powiązane, używając r_s.