Średnia, mediana i dominanta - czyli czym są podstawowe miary statystyczne, czym się różnią i jak je w prosty sposób zapamiętać

27.12.2023

Jeśli planujesz pracę w analizie danych, to wcześniej czy później Twoje synapsy zagrają z Tobą w grę i zadadzą Ci pytanie: “Czy średnia jest najodpowiedniejszą metodą statystyczną, którą chcę zastosować?“. 

To nastąpi…

Aby było łatwo, lekko wprowadzę Cię w świat 3 podstawowych metod porównawczych na podstawie przykładu dotyczących WYNAGRODZEŃ, bo przecież każdego kręcą wynagrodzenia, szczególnie na początku roku, kiedy zastanawiasz się czy stać Cię na karnet na siłownie.  

Do rzeczy, jak zapamiętać podstawowe pojęcia statystyczne, takie jak średnia, mediana i dominanta

Pojęcia te każdy analityk i nie tylko powinien mieć w małym palcu. Jak je rozróżnić? 

O ile średnia w związku z wyliczaniem paska na koniec roku w szkole, była zawsze z nami na porządku dziennym, o tyle dwa pozostałe pojęcia mogą powodować gęsią skórkę. 

Dzisiaj na podstawie danych z wynagrodzeń postaram Ci je trochę przybliżyć!

Średnia, mediana i dominanta wynagrodzeń w Polsce w październiku 2022

Informacje o przeciętnym (średnim) miesięcznym wynagrodzeniu dla przedsiębiorstw publikowane są każdego miesiąca. Informacja o medianie raz na dwa lata, podobnie jak dominanta. Skąd ta różnica? 

Rzuć okiem na liczby…

Średnia, mediana i dominanta struktury wynagrodzeń w Polsce w roku 2022

Stwórzmy przykład i ogarnijmy teorię związaną z średnią, medianą i dominanta

Już pewnie zauważyłeś, każda kolejna miara spada. Czy tak jest zawsze? Czy jest to czymś uwarunkowane? 

Zrobimy to na przykładzie, gdzie 37 milionowy naród okroimy do kilkunastu osób i wytłumaczymy te trzy pojęcia. 

W największym skrócie:

  • ŚREDNIA – to przeciętna wartość każdego zbioru. Obliczamy ją poprzez zsumowanie wszystkich jej wartości i podzielimy przez liczbę wartości (ilość w zbiorze). Najprościej średnia w szkole! 
  • MEDIANA – to środkowa wartość w zbiorze uporządkowanych wartości (posortowanych). Układamy wartości w kolejności i sprawdzamy wartość w samym jej centrum i mamy mediane.
  • DOMINANTA lub MODA – to najczęściej występujący element w zbiorze. Przydatne, gdy nasze elementy są powtarzalne i chcemy dowiedzieć się, które wartości występują najczęściej.

Różnica między średnią, a medianą - niewygodne outliery, które rządzą światem!

Średnia - rozwinięcie

Gdybyśmy ograniczyli nasze wynagrodzenia do 6 osób, których wynagrodzenie przedstawiałyby się następująco:

Jak się czujesz przyglądając się obliczonej powyżej średniej? 

Średnia ma wartość zbliżoną do przedostatniej wartości, jest podobna do naszej średniej jaka występuje w gospodarce Rzeczypospolitej. Czy łatwo Ci teraz mówić o średniej, jako o przeciętnym wynagrodzeniu? 

 

Oczywiście, że nie! Jedna pensja mocno wpływa na otoczenie, mocno je zaburząjąc

Mediana

W tym celu często porównujemy średnią i medianę. 

Przed porównaniem obliczmy medianę:

 

Podoba Ci się ten artykuł?
Zapraszam Cię do dołączenia do moich subskrybentów!

MEDIANA przyjęła wartość 3750 zł, to zgoła odmienna od ŚREDNIEJ na poziomie 7250 zł. 

Duża różnica, prawda?

Jest to pierwszy moment kiedy możemy odczuć, że mamy do czynienia z OUTLIEREM.

 

Outliery

OUTLIER – obserwacja relatywnie odległa od pozostałych elementów próby. W naszym przypadku tym outlierem będzie wynagrodzenie na poziomie 20000 zł. 

Dominanta (MODA)

Przypominając DOMINANTĄ nazywamy wartości najczęściej występujące w zbiorze. Jeśli nie mamy powtarzających się wartości, to nie ma dominanty.

Lekko modyfikując nasz zbiór, aby stworzyć DOMINANTĘ wyliczamy ją na poziomie 2000 zł. 

Formuła do DOMINANTY

PS. Jeśli chciałbyś wyliczyć DOMINANTĘ w Excelu zrobisz to przy pomocy formuły =WYST.NAJCZĘŚCIEJ.WART()

Średnia, mediana, i dominanta - podsumowanie

Jak już pewnie zauważyłeś/aś, zarobki naszych 6 przykładowych osób nieznacznie różnią się od wartości podawanych przez Główny Urząd Statystyczny. 

Dodatkowo pewnie zauważyłeś/aś, że wartości te są zgoła odmienne i po dokładnym prześledzeniu mogą powodować uczucie pewną formę niesprawiedliwości! Ale, że jak to najczęściej występujące wynagrodzenie (DOMINANTA), to lekko ponad 3000 zł, a średnie wynagrodzenie to ponad 7000?!

Wpływ na to ma szereg czynników, subiektywnie oceniam, że są to: 

  • DOMINANTA jest skorelowana z wypłacaną wartością kwoty minimalnej krajowej
  • ŚREDNIA jest wywindowana przez wynagrodzenia prezesów, dyrektorów, menadżerów wysokiego szczebla i przez pewne grupy zawodowe, które zarabiają po prostu WIĘCEJ.
Mam nadzieję, że ten artykuł przybliżył Ci pokrótce trzy popularne metryki statystyczne. Dodatkowo chciałbym abyś zapamiętał/a, że porównanie ŚREDNIEJ i MEDIANY, to pierwszy krok do uświadomienia sobie, że w danym zbiorze mogą się znajdować OUTLIERY, które znacząco mogą wpływać na wartości danego zbioru.

 

Jeśli ci się podobało, to zostaw reakcję, w styczniu 2024 poniższy artykuł znajdzie się pewnie na Linkedin i Facebooku, gdzie będziesz mógł go skomentować!