Centralne miary trendów dla zgrupowanych danych

Miary centralnej tendencji zgrupowanych danych są używane w statystykach do opisania pewnych zachowań grupy dostarczonych danych, takich jak między innymi to, jaką wartość są bliskie, jaka jest średnia zebranych danych.

Gdy pobierana jest duża ilość danych, warto je pogrupować, aby uzyskać lepszą ich kolejność, a tym samym móc obliczyć pewne miary tendencji centralnej.

Wśród miar tendencji centralnej najczęściej używane są średnia arytmetyczna, mediana i tryb. Liczby te mówią o pewnych cechach danych zebranych w danym eksperymencie.

Aby użyć tych środków, należy najpierw wiedzieć, jak pogrupować zestaw danych.

Zgrupowane dane

Aby najpierw pogrupować dane, należy obliczyć zakres danych, który uzyskuje się, odejmując najwyższą wartość pomniejszoną o najniższą wartość danych.

Następnie wybierz liczbę „k”, która jest liczbą klas, w których chcesz pogrupować dane.

Kontynuujemy dzielenie zakresu między «k», aby uzyskać amplitudę grup, które mają być grupowane. Ta liczba to C = R / k.

W końcu uruchamiane jest grupowanie, dla którego wybierana jest mniejsza liczba niż najniższa wartość uzyskanych danych.

Ta liczba będzie dolną granicą pierwszej klasy. Do tego dodaje się C. Uzyskana wartość będzie górną granicą pierwszej klasy.

Następnie dodaje się C do tej wartości i uzyskuje górną granicę drugiej klasy. W ten sposób kontynuujemy, aż osiągniemy górną granicę ostatniej klasy.

Po pogrupowaniu danych można przystąpić do obliczania średniej, mediany i trybu.

Aby zilustrować sposób obliczania średniej arytmetycznej, mediany i trybu, przejdziemy do przykładu.

Przykład

Dlatego grupując dane, otrzymasz tabelę w następujący sposób:

Trzy główne główne środki tendencji

Teraz przystąpimy do obliczania średniej arytmetycznej, mediany i trybu. Poprzedni przykład zostanie użyty do zilustrowania tej procedury.

1- Średnia arytmetyczna

Średnia arytmetyczna polega na pomnożeniu każdej częstotliwości przez średnią przedziału. Następnie wszystkie te wyniki są dodawane, a na koniec są dzielone między dane całkowite.

Używając poprzedniego przykładu uzyskalibyśmy, że średnia arytmetyczna jest równa:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5, 11111

Oznacza to, że średnia wartość danych w tabeli wynosi 5.11111.

2- średni

Aby obliczyć medianę zestawu danych, najpierw wszystkie dane są uporządkowane od najmniejszej do największej. Można przedstawić dwa przypadki:

- Jeśli numer danych jest nieparzysty, mediana to dane znajdujące się dokładnie w środku.

- Jeśli numer danych jest parzysty, mediana jest średnią z dwóch danych, które pozostają w środku.

Jeśli chodzi o dane zgrupowane, obliczenie mediany odbywa się w następujący sposób:

- Oblicza się N / 2, gdzie N jest sumą danych.

- Przeszukiwany jest pierwszy przedział, w którym skumulowana częstotliwość (suma częstotliwości) jest większa niż N / 2, i wybierana jest dolna granica tego przedziału, zwana Li.

Mediana jest podana w następującym wzorze:

Me = Li + (Ls-Li) * (N / 2 - Skumulowana częstotliwość przed Li) / Częstotliwość [Li, Ls]

Ls jest górną granicą zakresu wymienionego powyżej.

Jeśli używana jest powyższa tabela danych, mamy N / 2 = 18/2 = 9. Skumulowane częstotliwości to 4, 8, 14 i 18 (po jednym dla każdego wiersza tabeli).

Dlatego należy wybrać trzeci przedział, ponieważ skumulowana częstotliwość jest większa niż N / 2 = 9.

Więc Li = 5 i Ls = 7. Stosując powyższą formułę, musisz:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.

3- Moda

Moda to wartość, która ma największą częstotliwość wśród wszystkich zgrupowanych danych; to znaczy, że jest to wartość powtarzana najczęściej w początkowym zestawie danych.

W przypadku bardzo dużej ilości danych do obliczenia trybu zgrupowanych danych służy następujący wzór:

Mo = Li + (Ls-Li) * (częstotliwość Li - Częstotliwość L (i-1)) / ((Częstotliwość Li-częstotliwość L (i-1)) + (Częstotliwość Li-częstotliwość L ( i + 1)))

Interwał [Li, Ls] jest przedziałem, w którym znajduje się najwyższa częstotliwość. Na przykład przedstawiony w tym artykule mamy tę modę:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Inną formułą używaną do uzyskania przybliżonej wartości mody jest:

Mo = Li + (Ls-Li) * (częstotliwość L (i + 1)) / (częstotliwość L (i-1) + częstotliwość L (i + 1)).

Dzięki tej formule konta są następujące:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.