Prostor, metoda i uporaba višestruke linearne regresije



višestruka linearna regresija je alat za proračun koji istražuje uzročno-posljedične veze predmeta proučavanja i testiranja složenih hipoteza.

Koristi se u matematici i statistici. Ova vrsta linearne regresije zahtijeva zavisne varijable (drugim riječima, rezultate) i nezavisne varijable (to jest, uzroke) koje slijede hijerarhijski poredak, uz druge čimbenike svojstvene različitim područjima istraživanja..

Obično je linearna regresija ona koja je predstavljena linearnom funkcijom koja se izračunava iz dvije zavisne varijable. To je njegov najvažniji slučaj u kojem istraživani fenomen ima ravnu liniju regresije.

U danom skupu podataka (x1, y1) (xn, yn) i vrijednosti koje odgovaraju paru slučajnih varijabli u izravnoj međusobnoj vezi, regresijski pravac može uzeti, za početak, oblik jednadžbe, kao y = a · x + b .

Teorijske pretpostavke proračuna u višestrukoj linearnoj regresiji

Bilo koji izračun korištenjem višestruke linearne regresije ovisit će mnogo o predmetu koji se proučava i području istraživanja, kao što je ekonomija, budući da varijable čine korištene formule složenijima koji se razlikuju prema slučaju.

To znači da što je pitanje složenije, više faktora treba uzeti u obzir, više podataka se mora prikupiti, a time i veći volumen elemenata koji treba uključiti u izračun, što će formulu učiniti većom..

Međutim, uobičajena u svim tim formulama je da postoji vertikalna os (jedna od ordinata ili Y osi) i horizontalna osa (jedna od apscisa ili X osi) koja se nakon izračunavanja grafički prikazuje pomoću kartezijanskog sustava..

Odatle se izrađuju interpretacije podataka (vidi sljedeći odjeljak) te se donose zaključci ili predviđanja. U svakom slučaju, pre-statističke prostorije mogu se koristiti za vaganje varijabli, kao što su sljedeće:

1 - Slaba egzogenost

To znači da bi se varijabla trebala pretpostaviti s fiksnom vrijednošću koja se teško može prilagoditi promjenama u svojem modelu zbog vanjskih uzroka.

2. Linearni karakter

To podrazumijeva da se vrijednosti varijabli, kao i drugih parametara i koeficijenata predviđanja, moraju prikazati kao linearna kombinacija elemenata koji se mogu prikazati u grafu, u kartezijanskom sustavu..

3 - Homocedastičnost

Ovo mora biti konstantno. Ovdje se misli da, bez obzira na prediktivne varijable, mora postojati ista varijacija grešaka za svaku različitu varijablu odgovora.

4. Neovisnost

To se odnosi samo na pogreške varijabli odgovora, koje moraju biti prikazane u izolaciji, a ne kao skupina pogrešaka koje predstavljaju definirani obrazac.

5. Nepostojanje multikolinearnosti

Koristi se za nezavisne varijable. To se događa kada pokušate nešto proučiti, ali je vrlo malo informacija dostupno, tako da može biti mnogo odgovora i stoga vrijednosti mogu imati mnogo interpretacija, koje u konačnici ne rješavaju postavljeni problem..

Postoje i druge pretpostavke koje se uzimaju u obzir, ali one koje su gore predstavljene jasno pokazuju da višestruka linearna regresija zahtijeva mnogo informacija ne samo da imaju rigorozniji, potpuniji i bez predrasuda, već da rješenje pitanja prijedlog je konkretan.

Odnosno, mora ići na točku s nečim vrlo specifičnim, specifičnim, koje se ne mogu podrediti neodređenosti i da u manjoj mjeri potiče pogreške.

Imajte na umu da višestruka linearna regresija nije nepogrešiva ​​i može biti podložna pogreškama i netočnostima u izračunu. To nije toliko zbog toga tko provodi studiju, već zato što određeni fenomen prirode nije potpuno predvidiv ili nužno proizvod određenog uzroka.

Često se događa da se bilo koji objekt može iznenada promijeniti ili da događaj proizlazi iz djelovanja (ili nedjelovanja) brojnih elemenata koji međusobno djeluju.

Tumačenje grafike

Kada se podaci izračunaju prema modelima dizajniranim u prethodnim fazama istraživanja, formule će dati vrijednosti koje se mogu prikazati u grafu.

U ovom redoslijedu ideja, kartezijanski sustav će pokazati mnogo točaka koje odgovaraju izračunatim varijablama. Neki će biti više u osi ordinata, dok će drugi biti više u osi apscisa. Neki će biti više grupirani, dok će drugi biti izoliraniji.

Kako bismo primijetili složenost tumačenja podataka grafova, možemo primijetiti, na primjer, Ascombe kvartet. U ovom kvartetu obrađuju se četiri različita skupa podataka, a svaki od njih je u odvojenom grafikonu koji stoga zaslužuje zasebnu analizu..

Linearnost ostaje, ali točke u kartezijanskom sustavu moraju se promatrati vrlo pažljivo prije nego se zna kako se komadići slagalice spajaju. Tada se mogu izvući relevantni zaključci.

Naravno, postoji nekoliko načina da se ti komadi uklope zajedno, iako slijede različite metode koje su opisane u specijaliziranim priručnicima za izračun..

Višestruka linearna regresija, kao što je već rečeno, ovisi o mnogim varijablama ovisno o predmetu proučavanja i području u kojem se primjenjuje, tako da postupci u ekonomiji nisu isti kao u medicini ili u računalnoj znanosti. Sve u svemu, da, napravljena je procjena, hipoteza koja se zatim provjerava na kraju.

Proširenja višestruke linearne regresije

Postoji nekoliko tipova linearne regresije, kao što su jednostavni i opći, ali postoji i nekoliko aspekata višestruke regresije koji se prilagođavaju različitim predmetima proučavanja, a time i potrebama znanosti..

Obično se radi s velikim brojem varijabli, tako da često možete vidjeti modele kao što su multivarijantni ili višerazinski. Svaki od njih koristi postulate i formule različite složenosti, tako da interpretacija njihovih rezultata ima tendenciju da bude od veće važnosti..

Metode procjene

Postoji širok raspon postupaka za procjenu podataka dobivenih u višestrukoj linearnoj regresiji.

Još jednom, sve će ovisiti o čvrstini korištenog modela, formulama za izračun, broju varijabli, teoretskim postavkama koje su uzete u obzir, području proučavanja, algoritmima koji su programirani u specijaliziranim računalnim programima i , par excellence, složenost objekta, fenomena ili događaja koji se analiziraju.

Svaka metoda procjene koristi potpuno različite formule. Nitko nije savršen, ali ima jedinstvene vrline koje treba koristiti u skladu s provedenom statističkom studijom.

Postoje sve vrste: instrumentalne varijable, generalizirani najmanji kvadrati, Bayesova linearna regresija, mješoviti modeli, Tyjonov regularizacija, kvantilna regresija, Theil-Senov procjenitelj i dugačak popis alata kojima se podaci mogu proučavati s većom preciznošću.. 

Praktična uporaba

Višestruka linearna regresija koristi se u različitim područjima istraživanja iu mnogim slučajevima potrebna je pomoć računalnih programa kako bi se dobili točniji podaci.

Na taj se način smanjuju granice pogreške koje mogu proizaći iz ručnog izračuna (s obzirom na prisutnost mnogih neovisnih i ovisnih varijabli, ne iznenađuje da je ova vrsta linearne regresije pogodna za pogreške, budući da postoji mnogo podataka i čimbenika obrađen).

U analizi tržišnih trendova, na primjer, ispituje se jesu li se podaci kao što su cijene proizvoda povećali i smanjili, ali prije svega kada i zašto.

Kada se analizira kada su važne varijacije brojeva u određenom vremenskom razdoblju, uglavnom ako su promjene neočekivane. Zašto tražite precizne ili vjerojatne čimbenike po kojima se taj proizvod povećavao, smanjivao ili zadržavao maloprodajnu cijenu?.

Isto tako, zdravstvene znanosti (medicina, bioanaliza, farmacija, epidemiologija, među ostalima) imaju koristi od višestruke linearne regresije, kroz koju proučavaju zdravstvene pokazatelje kao što su stopa smrtnosti, morbiditet i natalitet..

U tim slučajevima možemo krenuti od studije koja započinje promatranjem, iako se nakon toga napravi model kako bi se utvrdilo je li varijacija nekih od navedenih pokazatelja posljedica nekog specifičnog uzroka, kada i zašto.

Financije također koriste višestruku linearnu regresiju kako bi istražile prednosti i nedostatke određenih ulaganja. Ovdje je uvijek potrebno znati kada se obavljaju financijske transakcije, s kim i koje su očekivane koristi.

Razine rizika bit će više ili niže u skladu s različitim čimbenicima koji se uzimaju u obzir pri ocjenjivanju kvalitete tih ulaganja, uzimajući u obzir i volumen monetarne razmjene..

Međutim, upravo u gospodarstvu gdje se ovaj alat za izračune najviše koristi. Stoga se u ovoj znanosti koristi višestruka linearna regresija s ciljem predviđanja izdataka za potrošnju, troškova ulaganja, kupnje, izvoza, uvoza, imovine, potražnje za radnom snagom, ponuda za posao i mnogih drugih elemenata..

Sve su one vezane uz makroekonomiju i mikroekonomiju, budući da su prve varijable analize podataka u izobilju jer se nalaze globalno..

reference

  1. Baldor, Aurelio (1967). Geometrija ravnine i prostora, s uvodom u trigonometriju. Caracas: Uredništvo Cultura Venezolana, S.A..
  2. Sveučilišna bolnica Ramón y Cajal (2017.). Model višestruke linearne regresije. Madrid, Španjolska: HRC, Zajednica Madrida. Preuzeto s www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Višestruka regresija u istraživanju ponašanja: Objašnjenje i predviđanje, drugo izdanje. New York: Holt, Rinehart i Winston.
  4. Rojo Abuín, J.M. (2007). Višestruka linearna regresija Madrid, Španjolska: Centar za ljudske i društvene znanosti. Oporavio se od humanities.cchs.csic.es.
  5. Autonomno sveučilište u Madridu (2008.). Višestruka linearna regresija Madrid, Španjolska: UAM. Oporavio se od web.uam.es.
  6. Sveučilište A Coruña (2017). Model višestruke linearne regresije; Korelacija. La Coruña, Španjolska: UDK, Odjel za matematiku. Oporavio se od dm.udc.es.
  7. Uriel, E. (2017). Višestruka linearna regresija: procjena i svojstva. Valencia, Španjolska: Sveučilište u Valenciji. Oporavio se od www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel i Suriñach Caral, Jordi (2002). Model višestruke linearne regresije: specifikacija, procjena i kontrast. Katalonija: UOC Uredništvo.