Zależność zmiennych losowych

W statystyce i teorii prawdopodobieństwa, korelacja oznacza jak blisko siebie są dwa zestawy danych.

Korelacja nie zawsze oznacza, że jedno powoduje drugie. Jest bardzo możliwe, że w grę wchodzi jeszcze jakiś trzeci czynnik.

Korelacja ma zazwyczaj jeden z dwóch kierunków. Są to kierunek dodatni lub ujemny. Jeśli jest dodatnia, wówczas dwa zestawy idą w górę razem. Jeśli jest ujemna, wtedy jeden idzie w górę, a drugi w dół.

W różnych sytuacjach stosuje się wiele różnych miar korelacji. Na przykład, na wykresie rozrzutu, ludzie rysują linię najlepszego dopasowania, aby pokazać kierunek korelacji.

Ten wykres rozrzutu ma korelację dodatnią. Można to stwierdzić, ponieważ trend jest w górę i w prawo. Czerwona linia jest linią najlepszego dopasowania.

Wyjaśnianie korelacji

Silna i słaba to słowa używane do opisania korelacji. Jeśli istnieje silna korelacja, wtedy wszystkie punkty są blisko siebie. Jeśli korelacja jest słaba, wtedy wszystkie punkty są od siebie oddalone. Istnieją sposoby, aby liczby pokazywały, jak silna jest korelacja. Pomiary te nazywane są współczynnikami korelacji. Najbardziej znanym jest współczynnik korelacji iloczynu i momentu Pearsona. Wprowadzasz dane do formuły, a ona daje ci liczbę. Jeśli liczba ta wynosi 1 lub -1, to mamy do czynienia z silną korelacją. Jeśli odpowiedź wynosi 0, wtedy nie ma korelacji. Innym rodzajem współczynnika korelacji jest współczynnik korelacji rang Spearmana.

Korelacja a związek przyczynowy

Korelacja nie zawsze oznacza, że jedna rzecz powoduje drugą (związek przyczynowy), ponieważ coś innego mogło spowodować obie rzeczy. Na przykład, w gorące dni ludzie kupują lody, a także chodzą na plażę, gdzie niektórzy są zjadani przez rekiny. Istnieje korelacja między sprzedażą lodów a atakami rekinów (w tym przypadku obie te rzeczy rosną wraz ze wzrostem temperatury). Ale to, że sprzedaż lodów wzrasta nie oznacza, że sprzedaż lodów powoduje (przyczynowo) więcej ataków rekinów lub odwrotnie.

Ponieważ korelacja nie implikuje związku przyczynowego, naukowcy, ekonomiści itp. będą testować swoje teorie poprzez tworzenie izolowanych środowisk, w których tylko jeden czynnik jest zmieniany (tam, gdzie jest to możliwe). Jednakże politycy, sprzedawcy, serwisy informacyjne i inni często sugerują, że dana korelacja implikuje przyczynowość. Może to wynikać z niewiedzy lub chęci przekonania. W ten sposób raport informacyjny może przyciągnąć uwagę mówiąc, że ludzie, którzy częściej spożywają dany produkt mają określony problem zdrowotny, sugerując związek przyczynowy, który w rzeczywistości może być spowodowany czymś innym.

Powiązane strony

Cohen, J., Cohen P., West, S.G., & Aiken, L.S. (2003). Applied multiple regression/correlation analysis for the behavioral sciences. (3rd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates.

Pytania i odpowiedzi

P: Co to jest korelacja?

O: Korelacja to sposób na wskazanie, jak blisko powiązane są dwa zestawy danych.

P: Czy korelacja oznacza, że jeden zestaw danych powoduje drugi?

O: Nie, korelacja nie zawsze oznacza, że jeden zestaw danych powoduje drugi. W rzeczywistości często występuje trzeci czynnik.

P: Jakie są dwa kierunki korelacji?

O: Dwa kierunki korelacji są dodatnie i ujemne.

P: Co oznacza dodatnia korelacja?

O: Dodatnia korelacja oznacza, że dwa zestawy danych rosną razem.

P: Co oznacza korelacja ujemna?

Ujemna korelacja oznacza, że jeden zestaw danych rośnie, a drugi spada.

P: Czy istnieją różne miary korelacji?

O: Tak, wiele różnych miar korelacji jest używanych w różnych sytuacjach.

P: W jaki sposób ludzie często pokazują kierunek korelacji na wykresie punktowym?

O: Ludzie często rysują linię najlepszego dopasowania, aby pokazać kierunek korelacji na wykresie rozrzutu.