Središnje mjere trenda za grupirane podatke



mjere središnje tendencije grupiranih podataka upotrebljavaju se u statistici za opisivanje određenih ponašanja grupe dostavljenih podataka, poput onoga što im je blizu, koliko je prosjek prikupljenih podataka, između ostalog.

Kada se uzme velika količina podataka, korisno je grupirati ih kako bi imali bolji redoslijed od njih i na taj način biti u mogućnosti izračunati određene mjere središnje tendencije.

Među mjerama središnje tendencije koje se najviše koriste su aritmetička sredina, medijana i način. Ovi brojevi govore određene kvalitete o podacima prikupljenim u određenom eksperimentu.

Za korištenje tih mjera potrebno je prvo znati kako grupirati skup podataka.

Grupirani podaci

Za prvo grupiranje podataka morate izračunati raspon podataka koji se dobiva oduzimanjem najveće vrijednosti minus najniže vrijednosti podataka.

Zatim odaberite broj "k", koji je broj klasa u kojima želite grupirati podatke.

Nastavljamo dijeliti raspon između "k" kako bi se dobila amplituda klasa koje treba grupirati. Ovaj broj je C = R / k.

Konačno se započinje grupiranje, za koje se odabere manji broj od najmanje vrijednosti dobivenih podataka..

Ovaj broj će biti donja granica prvog razreda. Tome se dodaje C. Dobivena vrijednost će biti gornja granica prvog razreda.

Tada se toj vrijednosti dodaje C i dobiva se gornja granica drugog razreda. Na taj način nastavljate sve dok ne dobijete gornju granicu posljednjeg razreda.

Nakon grupiranja podataka možete nastaviti izračunati srednju vrijednost, medijan i modu.

Kako bismo ilustrirali kako se računaju aritmetička sredina, medijana i način rada, nastavit ćemo s primjerom.

primjer

Stoga ćete prilikom grupiranja podataka dobiti tablicu poput sljedeće:

3 glavne mjere središnje tendencije

Sada ćemo nastaviti izračunavati aritmetičku sredinu, medijan i način. Gornji primjer će se koristiti za ilustraciju ovog postupka.

1 - Aritmetička sredina

Aritmetička sredina sastoji se od množenja svake frekvencije s prosjekom intervala. Zatim se svi ti rezultati dodaju i konačno dijele s ukupnim podacima.

Koristeći prethodni primjer, dobili bismo da je aritmetička sredina jednaka:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.111111

To pokazuje da je prosječna vrijednost podataka u tablici 5.11111.

2. Srednje

Da biste izračunali medijan skupa podataka, najprije su svi podaci naručeni od najmanjeg do najvećeg. Mogu se prikazati dva slučaja:

- Ako je broj podataka neparan, tada je medijan podatak koji je u samom središtu.

- Ako je broj podataka paran, tada je medijan prosjek dva podatka koji ostaju u središtu.

Kada je riječ o grupiranim podacima, izračun medijana se obavlja na sljedeći način:

- N / 2 se izračunava, gdje je N ukupni podatak.

- Pretražuje se prvi interval u kojem je akumulirana frekvencija (zbroj frekvencija) veća od N / 2 i odabire se donja granica tog intervala, nazvana Li..

Medijana je dana sljedećom formulom:

Me = Li + (Ls-Li) * (N / 2 - Akumulirana frekvencija prije Li) / Frekvencija [Li, Ls]

Ls je gornja granica gore navedenog raspona.

Ako se koristi gornja tablica podataka, imamo N / 2 = 18/2 = 9. Akumulirane frekvencije su 4, 8, 14 i 18 (jedna za svaki redak tablice).

Stoga treba odabrati treći interval, budući da je akumulirana frekvencija veća od N / 2 = 9.

Dakle, Li = 5 i Ls = 7. Primjenjujući gore opisanu formulu morate:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 - Moda

Moda je vrijednost koja ima najviše frekvencija među svim grupiranim podacima; to jest, to je vrijednost koja se ponavlja najviše puta u početnom skupu podataka.

Kada imate veliku količinu podataka, za izračun načina grupiranih podataka koristi se sljedeća formula:

Mo = Li + (Ls-Li) * (frekvencija L - frekvencija L (i-1)) / ((frekvencija frekvencije L (i-1)) (frekvencija Li-frekvencije L ( i + 1)))

Interval [Li, Ls] je interval u kojem se nalazi najveća frekvencija. Za primjer iznesen u ovom članku imamo taj način dajemo:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4) = 5 + 2 * 2/4 = 5 + 1 = 6.

Druga formula koja se koristi za dobivanje približne vrijednosti za modu je sljedeća:

Mo = Li + (Ls-Li) * (frekvencija L (i + 1)) / (frekvencija L (i-1) + frekvencija L (i + 1)).

S ovom formulom računi su sljedeći:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

reference

  1. Bellhouse, D.R. (2011). Abraham De Moivre: Postavljanje pozornice za klasičnu vjerojatnost i njezine primjene. CRC Press.
  2. Cifuentes, J. F. (2002). Uvod u teoriju vjerojatnosti. Nacionalni Kolumbijac.
  3. Daston, L. (1995). Klasična vjerojatnost u prosvjetiteljstvu. Princeton University Press.
  4. Larson, H. J. (1978). Uvod u teoriju vjerojatnosti i statističko zaključivanje. Uvodnik Limusa.
  5. Martel, P.J. i Vegas, F.J. (1996). Vjerojatnost i matematička statistika: primjena u kliničkoj praksi i upravljanju zdravljem. Ediciones Díaz de Santos.
  6. Vázquez, A.L. i Ortiz, F.J. (2005). Statističke metode za mjerenje, opisivanje i kontrolu varijabilnosti. Ed University of Cantabria.
  7. Vázquez, S. G. (2009). Priručnik za matematiku za pristup sveučilištu. Urednički centar studija Ramon Areces SA.