Objašnjenje, primjena i primjeri pravila



Čvrsto vlada je kriterij koji se koristi za određivanje broja klasa ili intervala koji su potrebni za grafički prikaz skupa statističkih podataka. Ovo pravilo je 1926. godine objavio njemački matematičar Herbert Sturges.

Sturges je predložio jednostavnu metodu, temeljenu na broju uzoraka x koji su omogućili pronalaženje broja klasa i njihove amplitude raspona. Pravilo Sturges se široko koristi posebno u području statistike, posebno za izgradnju frekvencijskih histograma.

indeks

  • 1 Objašnjenje
  • 2 Programi
  • 3 Primjer
  • 4 Reference

objašnjenje

Pravilo Sturges je empirijska metoda koja se široko koristi u deskriptivnoj statistici za određivanje broja klasa koje moraju postojati u histogramu frekvencije, kako bi se klasificirali skup podataka koji predstavljaju uzorak ili populaciju.

U osnovi, ovo pravilo određuje širinu grafičkih spremnika, histograme frekvencije.

Da bi uspostavio svoje pravilo, Herbert Sturges je razmatrao idealan dijagram frekvencije, koji se sastoji od K intervala, gdje i-ti interval sadrži određeni broj uzoraka (i = 0, ... k-1), predstavljenih kao:

Taj broj uzoraka daje se brojem načina na koje se podskup skupa može izdvojiti; to jest, prema binomnom koeficijentu, izraženo kako slijedi:

Da bi pojednostavio izraz, primijenio je svojstva logaritama u oba dijela jednadžbe:

Tako je Sturges utvrdio da je optimalni broj intervala k danim izrazom:

Također se može izraziti kao:

U ovom izrazu:

- k je broj klasa.

- N je ukupan broj opažanja uzorka.

- Log je zajednički logaritam baze 10.

Na primjer, za izradu frekvencijskog histograma koji izražava slučajni uzorak visine od 142 djece, broj intervala ili klasa koje će distribucija imati je:

k = 1 + 3,322 * klada10 (N)

k = 1 + 3,322* log (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Dakle, distribucija će biti u 8 intervala.

Broj intervala uvijek mora biti predstavljen cijelim brojevima. U slučajevima kada je vrijednost decimalna, mora se napraviti aproksimacija najbližeg cijelog broja.

aplikacije

Pravilo Sturgesa primjenjuje se uglavnom u statistici, jer omogućuje raspodjelu frekvencija kroz izračunavanje broja klasa (k), kao i dužine svake od njih, također poznate kao amplituda..

Amplituda je razlika između gornje i donje granice klase, podijeljena brojem klasa, i izražava se:

Postoje mnoga empirijska pravila koja dopuštaju distribuciju frekvencije. Međutim, pravilo Sturges se uobičajeno koristi jer aproksimira broj klasa, koje se obično kreću od 5 do 15.

Na taj način razmotrite vrijednost koja adekvatno predstavlja uzorak ili populaciju; to jest, aproksimacija ne predstavlja ekstremne grupacije, niti radi s prekomjernim brojem klasa koje ne dopuštaju sumiranje uzorka.

primjer

Potrebno je izvesti frekvencijski histogram prema danim podacima, koji odgovara dobi dobivenoj u pregledu muškaraca koji rade vježbe u lokalnoj teretani.

Za određivanje intervala morate znati koja je veličina uzorka ili broj opažanja; u ovom slučaju imate 30.

Onda se primjenjuje pravilo Sturges:

k = 1 + 3,322 * klada10 (N)

k = 1 + 3,322* log (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 intervala.

Iz broja intervala može se izračunati amplituda koju će imati; to jest, širina svake trake prikazane u histogramu frekvencije:

Donja granica se smatra najnižom vrijednošću podataka, a gornja granica je najveća vrijednost. Razlika između gornje i donje granice naziva se domet ili put varijable (R).

Iz tablice je da je gornja granica 46 i donja granica 13; na taj će način amplituda svake klase biti:

Intervali će se sastojati od gornje i donje granice. Da biste odredili te intervale, počnite brojati od donje granice dodajući mu amplitudu određenu pravilom (6), kako slijedi:

Tada se izračunava apsolutna frekvencija kako bi se odredio broj muškaraca koji odgovaraju svakom intervalu; u ovom slučaju to je:

- Interval 1: 13 - 18 = 9

- Interval 2: 19 - 24 = 9

- Interval 3: 25 - 30 = 5

- Interval 4: 31 - 36 = 2

- Interval 5: 37 - 42 = 2

- Interval 6: 43 - 48 = 3

Kada se dodaje apsolutna frekvencija za svaki razred, to mora biti jednako ukupnom broju uzorka; u ovom slučaju, 30.

Nakon toga se izračunava relativna učestalost svakog intervala, dijeleći apsolutnu frekvenciju tog intervala ukupnim brojem opažanja:

- Interval 1: fi = 9 = 30 = 0,30

- Interval 2: fi = 9 = 30 = 0,30

- Interval 3: fi = 5 = 30 = 0,1666

- Interval 4: fi = 2 = 30 = 0,0666

- Interval 5: fi = 2 = 30 = 0,0666

- Interval 4: fi = 3 = 30 = 0.10

Tada možete napraviti tablicu koja odražava podatke, kao i dijagram iz relativne frekvencije u odnosu na dobivene intervale, kao što se može vidjeti na sljedećim slikama:

Na taj način, pravilo Sturges omogućuje određivanje broja klasa ili intervala u kojima se uzorak može podijeliti, kako bi se sumirao uzorak podataka kroz pripremu tablica i grafova..

reference

  1. Alfonso Urquía, M. V. (2013). Modeliranje i simulacija diskretnih događaja. UNED,.
  2. Altman Naomi, M.K. (2015). "Jednostavna linearna regresija." Prirodne metode .
  3. Antúnez, R.J. (2014). Statistika u obrazovanju. Digitalni UNID.
  4. Fox, J. (1997.). Primijenjena regresijska analiza, linearni modeli i srodne metode. Publikacije SAGE.
  5. Humberto Llinás Solano, C.R. (2005). Opisna statistika i razdiobe vjerojatnosti. Sveučilište Sjever.
  6. Pantelejeva, O. V. (2005). Osnove vjerojatnosti i statistika.
  7. O. Kuehl, M. O. (2001). Dizajn eksperimenata: Statistička načela projektiranja i istraživanja. Urednici Thomsona.