Korelacja to miara statystyczna, która pozwala na określenie siły i kierunku związku między dwiema zmiennymi. Z tym pojęciem spotkamy się w wielu dziedzinach życia: oczywiście w statystyce, ale również między innymi w biznesie, administracji publicznej, badaniach naukowych i edukacji. W praktyce do analizy danych najczęściej stosuje się dwa rodzaje współczynników korelacji: korelację Pearsona oraz korelację Spearmana.
W niniejszym artykule przyjrzymy się bliżej obu tym metodom, ich zastosowaniom, a także wskażemy przykłady, które pomogą Ci zrozumieć ich istotę. Zachęcamy do zapoznania się z ofertą kursów Indeksu w Kieszeni, ponieważ w pełnej wersji zawarliśmy opracowanie wszystkich niezbędnych do przyswojenia zagadnień, zarówno w formie tekstów, jak i prezentacji multimedialnych.
Współczynnik korelacji Pearsona, nazywany również liniowym współczynnikiem korelacji, jest miarą zależności liniowej pomiędzy dwiema zmiennymi. W praktyce określa w jakim stopniu zmiana wartości jednej zmiennej jest zgodna z zmianą wartości drugiej.
Wartości współczynnika Pearsona mieszczą się w przedziale od -1 do 1, gdzie:
Warto zwrócić uwagę, że współczynnik Pearsona jest miarodajny tylko w przypadku, gdy mamy do czynienia z zależnością liniową. Przykładem takiej zależności jest stosunek wynagrodzenia do liczby przepracowanych godzin: jeśli dana osoba pracuje większą liczbę godzin, otrzymuje wyższe wynagrodzenie, a relacja ta jest liniowa (wzrost liczby godzin pracy o 1 godzinę przekłada się na stały wzrost wynagrodzenia, np. 50 zł).
Źródło: www.pexels.com
Czas na kolejny przykład. Załóżmy, że chcemy sprawdzić, czy istnieje liniowa zależność między wynikami z matematyki a wynikami z fizyki wśród grupy uczniów. Zbieramy dane dotyczące ocen z obu przedmiotów dla 100 uczniów i obliczamy współczynnik korelacji Pearsona. Jeśli otrzymamy wartość r = 0.78, oznacza to, że istnieje silna, dodatnia korelacja liniowa między wynikami z matematyki i fizyki. Uczniowie, którzy osiągają dobre wyniki z matematyki, zazwyczaj również dobrze radzą sobie z fizyką.
Jednakże, jeśli związek pomiędzy zmiennymi jest nieliniowy, współczynnik Pearsona może nie być adekwatny. Przykładem zależności nieliniowej jest zależność efekt uczenia się – wydajność pracy: Na początku nauki nowej umiejętności, pracownicy mogą bardzo szybko poprawiać swoją wydajność (duży wzrost wydajności przy niewielkim wzroście doświadczenia). Jednakże, po osiągnięciu pewnego poziomu doświadczenia, dalsze zwiększanie wydajności staje się trudniejsze i następuje wolniej. Innymi słowy, tempo wzrostu nie jest stałe, w przeciwieństwie do zależności liniowej.
W takich sytuacjach lepiej sprawdzi się współczynnik korelacji Spearmana.
Współczynnik korelacji Spearmana jest miarą zależności monotonicznej między dwiema zmiennymi. Oznacza to, że bada on, czy wraz ze wzrostem jednej zmiennej, druga zmienna również rośnie lub maleje (ale niekoniecznie w sposób liniowy).
Współczynnik Spearmana, podobnie jak Pearsona, przyjmuje wartości od -1 do 1. Jego obliczenie to proces wieloetapowy – wymaga uporządkowania zmiennych według wartości i nadaniu im odpowiednich rang.
Rozważmy sytuację, w której badamy zależność pomiędzy pozycją zajętą przez zawodnika w maratonie a jego wiekiem. Zauważamy, że im starszy zawodnik, tym bardziej odległe miejsce zajmuje w maratonie, ale nie jest to zależność liniowa. Obliczając współczynnik korelacji Spearmana, który wyniósł -0.65, możemy stwierdzić, że istnieje średnio silna negatywna korelacja monotoniczna między wiekiem a wynikiem w maratonie.
Źródło: www.pexels.com
Współczynniki korelacji Pearsona i Spearmana, są ważnymi narzędziami w analizie danych. Wybór odpowiedniego współczynnika zależy od rodzaju zależności między zmiennymi oraz charakteru danych. Korelacja Pearsona sprawdzi się w przypadku zależności liniowych, podczas gdy korelacja Spearmana będzie lepszym wyborem przy związkach monotonicznych.
To już koniec tego wpisu. Mam nadzieję, że temat korelacji Pearsona i Spearmana nie kryje już przed Tobą tajemnic! Zachęcam Cię do zapisu na pełną wersję kursu Indeksu w Kieszeni, gdzie rozwiniemy poruszony w tym artykule temat w oparciu o dodatkowe zagadnienia i przykłady zadań olimpijskich.
Owocnej pracy!
Zespół Indeksu w Kieszeni
Strona przygotowana przez Zyskowni.pl