Statystyka opisowa to nie tylko średnia arytmetyczna i odchylenie standardowe. Gdy zagłębisz się w zagadnienie analizy danych, na pewno spotkasz też takie pojęcia miary asymetrii i kurtozy.
W tym artykule omówimy, czym są te miary, jak je interpretować oraz w jakich sytuacjach ich analiza jest szczególnie przydatna – również na Olimpiadzie Statystycznej. Jeśli chcesz jeszcze bardziej pogłębić temat, zachęcamy do sprawdzenia pełnej wersji kursu Indeksu w Kieszeni, gdzie pokazujemy, jak wykorzystać te wskaźniki w zadaniach olimpijskich.
www.pexels.com
Podręcznikowo asymetria (skośność) to miara opisująca symetrię rozkładu względem jego średniej. Co to oznacza w praktyce? Wyobraźmy sobie 3 zbiory danych:
A: {-2; 1; 1}
B: {-1; -1; 2}
C: {0; 0; 0}
Zauważ, że wszystkie 3 zbiory danych mają jednakową wartość średniej arytmetycznej (0) oraz zbiory A i B posiadają identyczną wartość odchylenia standardowego (2). Przeanalizujmy dokładniej te zbiory:
Oto podsumowanie powyższych informacji w formie graficznej2:
Kurtoza to skomplikowana miara, która opisuje kształt ,,szczytu’’ rozkładu. Jest to zagadnienie, które czasami pojawia się na późniejszych etapach Olimpiady. Należy jednak do zagadnień trudniejszych, dlatego tutaj omówimy je tylko pokrótce.
Kurtoza mówi nam, jak bardzo dane skupiają się wokół średniej oraz jak wiele wartości skrajnych zawiera rozkład.
Wyobraźmy sobie, że analizujemy liczbę godzin nauki uczniów przed Olimpiadą Statystyczną. Dane wyglądają następująco:
Uczeń | Liczba godzin |
---|---|
A | 5 |
B | 7 |
C | 6 |
D | 4 |
E | 20 |
F | 5 |
G | 6 |
H | 5 |
Średnia arytmetyczna to 7,25 godziny.
Mimo że większość uczniów uczyła się od 4 do 7 godzin, jeden z nich poświęcił aż 20 godzin, co może wpłynąć na asymetrię. Po obliczeniu współczynnika skośności otrzymujemy wartość dodatnią, co wskazuje na prawostronną asymetrię. Jest to zgodne z obserwacjami – zauważ, że zdecydowana większość wartości jest mniejsza niż średnia arytmetyczna.
Kurtoza tych danych również okaże się dodatnia – większość uczniów poświęcała na naukę od 4 do 7 godzin, tylko 1 poświęcił na naukę aż 20h (tylko 1 wartość „daleko” od średniej arytmetycznej).
www.pexels.com
Na Olimpiadzie mogą pojawić się pytania zarówno obliczeniowe (np. oblicz współczynnik kurtozy/współczynnik asymetrii na podstawie danych, szczególnie na poprzednich etapach), jak i koncepcyjne (np. interpretacja wykresu lub wyniku, pytanie o wskazanie wykresu o asymetrii lewostronnej/prawostronnej itp.).
Znajomość tych pojęć pomoże Ci lepiej zrozumieć dane oraz skuteczniej rozwiązywać zadania konkursowe. Jest to zagadnienie dość złożone, ale wiąże się z tym również fakt, iż stosunkowo niewielu uczestników Olimpiady ma je opanowane w stopniu wystarczającym. Znajomość miary asymetrii i kurtozy może dać Ci przewagę na Olimpiadzie Statystycznej – zwłaszcza tam, gdzie trzeba zrozumieć charakter danych, a nie tylko je przeliczyć.
To już wszystko w tym artykule! Chcesz więcej? Sprawdź ofertę naszego przygotowania do Olimpiad, gdzie przećwiczymy te zagadnienia na konkretnych przykładach zadań olimpijskich.
Strona przygotowana przez Zyskowni.pl