Indikátory tesnosti korelácie pre model korelácie-regresie s viacerými faktormi




Blízkosť vzťahu medzi študovanými parametrami v prípade viacnásobnej korelácie sa určuje na základe rôznych koeficientov. Aby regresná rovnica adekvátne odrážala (približné) reálne simulované socioekonomické procesy alebo javy, musia byť splnené podmienky a požiadavky viacnásobnej korelačnej a regresnej analýzy.

Korelačná - regresná analýza : analytická expresia rovnice (priamočiarej, krivolejovej) regresie pre multifaktorový korelačný - regresný model. Určenie parametrov a ich interpretácia.

Blízkosť vzťahu medzi nimi sa meria pomerom rozptylu faktora k celkovému rozptylu výsledného atribútu nazývaného index určenia. Index určenia charakterizuje pomer variácie výsledného znaku pod vplyvom faktorového znaku v celkovej variabilite výsledného znaku. Ak existuje korelácia medzi znakmi, potom ako sa zvyšuje, t. čím sa zväčšuje blízkosť vzťahov medzi produktívnymi a faktormi, index určenia sa zvyšuje a klesá, pretože oslabuje. Takže index určenia charakterizuje blízkosť spojenia, blízkosť korelácie s funkčnou.

Odmocnina koreňa indexu určenia je korelačný index alebo teoretický korelačný pomer . Korelačný index alebo teoretický korelačný pomer charakterizuje blízkosť spojenia s akoukoľvek formou závislosti. Zvyšková disperzia Je potrebné vybrať najlepšiu funkciu, ktorá najviac vyrovná (aproximuje) empirickú regresnú čiaru. Približná funkcia sa volí podľa minimálnej zostatkovej disperzie s 2 OST = S (y t - ) 2 / n alebo ,

Zvláštnym prípadom indexu korelácie je lineárny korelačný koeficient r , ktorý sa používa na odhad blízkeho vzťahu s lineárnym vzťahom. Korelačný koeficient má hodnoty od -1 do +1, čo naznačuje nielen blízkosť, ale aj smer vzťahu. Znak "+" označuje priamy vzťah medzi efektívnymi a faktormi, znak "-" označuje inverzný vzťah medzi nimi. Ak r = 0, potom neexistuje žiadne spojenie medzi značkami. Čím je bližšie r , tým bližšie je spojenie medzi zvažovanými prvkami.

V lineárnej forme komunikácie je parameter rovnice priamky regresný koeficient a 1 a korelačný koeficient r prepojené nasledovne:

a 1 = rs y / s x . V prípade priameho spojenia je lineárny korelačný koeficient identický s indexom korelácie, sú číselne rovnaké: ,

Lineárny korelačný koeficient r sa používa na odhad tesnosti spojenia s lineárnym vzťahom: rovnica = a 0 + a 1 x


border=0


Na zjednodušenie výpočtov lineárneho korelačného koeficientu použite transformovaný vzorec: ,

Povaha vzťahu je určená hodnotou korelačného koeficientu:

r hodnota korelačného koeficientu komunikačný charakter
r = 0 až do 0.3 prakticky chýba
0 <r <1 0,3 - 0,5 + rovno chudobný
-1 <r <0 0,5 - 0.7 - obrátená umiernený
r = 1 0,7 - 1,0 1 - funkčný silný

Význam lineárneho korelačného koeficientu je určený kritériom t - Student. Určená vypočítanou hodnotou t calc , ktorá sa porovnáva s hodnotou tabuľky t crit . Lineárny koeficient korelácie sa považuje za významný, ak pomer: t calc > t crit .

s n s n <50.

t crit je určená v tabuľke "Hodnota kritéria t - študenta na úrovni dôležitosti 0,10, 0,05, 0,01 a stupňa voľnosti ,

Úlohou multifaktorovej korelácie - regresnej analýzy je po prvé preskúmať množstvo faktorov ovplyvňujúcich sledovaný ukazovateľ a výber najvýznamnejších faktorov; po druhé, pri určovaní stupňa vplyvu každého faktora na výsledný atribút budovaním modelu - viacnásobnej regresnej rovnice, ktorá vám umožní určiť, v akom smere a akým množstvom sa efektívny ukazovateľ zmení, keď sa zmení každý faktor vstupujúci do modelu; po tretie, v kvantitatívnom hodnotení blízkosti vzťahu medzi efektívnym označením a faktoriálnym.

Matematicky je problém nájsť analytický výraz funkcie = f (x 1 , x 2 , x 3 , ..., x n ), čo najlepšie odráža vzťah faktoriálnych znakov s výsledkom. Výsledky teoretickej analýzy a možnosti ich aplikácie v praxi závisia od správnej voľby regresnej funkcie, preto forma spojenia by mala najlepšie zodpovedať skutočne existujúcim spojeniam medzi výslednými a faktoriálnymi charakteristikami. Obtiažnosť výberu funkcie spočíva v tom, že efektívna funkcia s rôznymi faktormi môže byť v rôznych formách spojenia - rovná a krivolačná. Empirické ospravedlnenie typu funkcie pomocou grafov párových vzťahov je prakticky nevhodné pre viacnásobnú koreláciu a regresiu.



Voľba formy viacnásobnej regresnej rovnice je založená na teoretickej analýze skúmaného javu. Ak analýza vzájomných vzťahov medzi efektívnymi a faktormi neumožňuje prekonať žiadnu formu spojenia, potom sú rôzne funkcie vyriešené a optimálny je vybraný tak, aby bol vyrovnaný z hľadiska blízkosti empirických hodnôt efektívnej charakteristiky, čo však zahŕňa značnú zložitosť pri výpočte parametrov rôznych rovníc. Ak existuje špeciálny softvér, ktorý implementuje algoritmus pre iteráciu cez rôzne PCR rovnice, získame niekoľko modelov, najlepšie sa vyberie štatistickou kontrolou parametrov rovnice na základe Studentovho t-kritéria a Fisherovho F-kritéria .

Voľba formy rovnice viacnásobnej regresie sa uskutočňuje v praxi

založené na použití piatich typov modelov :

lineárne a 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

napájacie ;

exponenciálny ;

parabolický

hyperbolický

Najčastejšie sa zastavujú na lineárnych modeloch. To je vysvetlené skutočnosťou, že po prvé sú parametre lineárnych rovníc ľahko interpretované, samotné modely sú jednoduché a vhodné pre ekonomickú analýzu a po druhé, ak je to žiaduce, akákoľvek funkcia môže byť redukovaná na lineárnu formu logaritmizáciou alebo zmenou premenných.

V lineárnej regresnej rovnici v lineárnej forme ukazujú parametre a1, a2 , a3, ..., an - regresné koeficienty stupeň vplyvu príslušných faktorov na výsledný atribút, keď sú na strednej úrovni fixované ďalšie faktory, t.j. koľko y sa zmení so zvýšením zodpovedajúceho faktora o 1 bod jeho jednotky zmeny; parameter 0 je bezplatný člen, nemá ekonomický zmysel.

Parametre viacnásobnej regresnej rovnice , rovnako ako pár, sú vypočítané metódou najmenších štvorcov na základe riešenia systému normálnych rovníc. Vzhľadom na to, že regresné koeficienty sú navzájom neporovnateľné (faktory majú rozdielne meracie jednotky), nie je možné porovnať silu vplyvu každého z faktorov zahrnutých do modelu na výsledný ukazovateľ na základe regresných koeficientov. Na hodnotenie relatívnej sily vplyvu faktorov sa vypočítajú koeficienty parciálnej elasticity a b-koeficienty.

Súkromný koeficient elasticity ukazuje, koľko percent sa v priemere zmení efektívny ukazovateľ, keď sa faktor zmení o 1% a pevnú pozíciu iných faktorov a vypočíta sa osobitne pre každý faktor:

kde i je regresný koeficient pre i-t faktor; - priemerná hodnota i-tého faktora; - priemerná hodnota efektívneho ukazovateľa.

Koeficient b ukazuje, ktorá časť štandardnej odchýlky zmení výsledný atribút, keď sa zodpovedajúci faktor zmení o hodnotu jeho štandardnej odchýlky , kde s xi , s y - štandardné odchýlky i-tého faktora a výsledný znak.

Vzhľadom na skutočnosť, že ekonomické javy sú vystavené viacerým a zložitým príčinám, by sa do viacnásobnej regresnej rovnice mali zahrnúť podstatné, systematicky pôsobiace faktory, keď sa eliminuje vplyv iných faktorov. Najdôležitejšie faktory sú vybrané na základe analýzy súladu a významnosti vzťahu medzi faktormi a efektívnym ukazovateľom. V tomto prípade je podmienkou pre zahrnutie faktorov do modelu absencia veľmi úzkej korelačnej väzby medzi nimi, ktorá je blízka funkčnej. Prítomnosť veľmi blízkeho lineárneho vzťahu medzi dvomi faktormi (lineárny korelačný koeficient r presahuje absolútnu hodnotu 0,85) sa nazýva kolinearita a medzi viacerými faktormi sa hovorí multiclineárnosť .

Príčiny multicoliniarity medzi príznakmi sú po prvé, že analyzované znaky charakterizujú rovnaký aspekt javu alebo procesu (napríklad veľkosť a veľkosť podniku je charakterizovaná základným kapitálom a počtom zamestnancov) a nie je vhodné ich zahrnúť do modelu súčasne; po druhé faktory sú prvkami vzájomne sa kopírovať, alebo ich celková hodnota dáva konštantnú hodnotu (napríklad zdroj energie a pomer kapitál - práca, podiel vypožičaných a vlastných zdrojov). Ak sú do modelu zahrnuté viaceré numerické faktory, potom regresná rovnica nedostatočne odráža skutočné ekonomické vzťahy, modelové parametre budú deformované (nadhodnotené), zmení sa význam a ekonomická interpretácia regresných a korelačných koeficientov bude ťažká.

Preto pri vytváraní modelu je jeden z kolineárnych faktorov vylúčený na základe kvalitatívnej a logickej analýzy, alebo sa pôvodné faktory prejavia na nové, zväčšené. Kvalita a primeranosť modelu k skutočnému sociálno-ekonomickému fenoménu a procesu je daná optimálnosťou počtu faktorových znakov: čím viac faktorov je zahrnutých, tým lepšie model popisuje fenomén a proces, ale takýto model je ťažké implementovať; s malým počtom faktorov, model nie je dostatočne primeraný.

Problém výberu faktorových znakov a zmenšenie dimenzie modelu viacnásobnej korelácie je riešený na základe heuristických a multidimenzionálnych metód analýzy. Heuristické metódy analýzy zahŕňajú metódu znaleckých posudkov založených na intuitívno-logických predpokladoch a vecnej a kvalitatívnej analýze neparametrických indikátorov tesnosti komunikácie: koeficienty korelácie, súlad. Najčastejšie používanou metódou je postupná regresia , pozostávajúca z postupného zahrnutia faktorov do modelu a hodnotenia ich významu.

Keď sa zavádza faktor , určuje sa, koľko klesá súčet štvorcov zvyškov a ak hodnota faktora xk je zahrnutá do modelu, hodnota R sa zvyšuje a regresný koeficient ak sa nemení alebo sa mierne nezmení, potom je tento faktor významný a jeho zahrnutie do modelu potrebné.

· Celkový počet študovaných ukazovateľov by mal byť homogénny v závislosti od podmienok tvorby efektívnych a faktorových znakov (rozlišovacie pozorovania by mali byť vylúčené z celku);

· Výsledný atribút by mal dodržiavať normálny distribučný zákon, faktoriálny by mal byť blízko normálnej distribúcie. Ak je objem agregátu dostatočne veľký (n> 50), potom normálnosť distribúcie môže byť potvrdená na základe výpočtu a analýzy kritérií Pearson, Yastremsky, Kolmogorov, Boyarsky a ďalších kritérií;

· Simulovaný jav alebo proces je kvantitatívne opísaný (parametre musia mať numerický výraz) jednou alebo niekoľkými rovnicami vzťahov príčin-účinok. Odporúča sa popísať príčinné vzťahy lineárnymi alebo blízkymi lineárnymi závislosťami;

· Súlad územnej a časovej štruktúry študovanej populácie, absencia kvantitatívnych obmedzení modelových parametrov;

· Dostatočnosť počtu obyvateľov: ich počet by mal byť niekoľkonásobne vyšší ako počet faktorov zahrnutých do modelu. Každý faktor by mal mať aspoň 5 až 6 pozorovaní, t.j. počet faktorových príznakov by mal byť 5-6 krát nižší ako objem študovanej populácie.

Hlavné etapy korelačnej a regresnej analýzy sú:

· Predbežná teoretická analýza podstaty tohto javu, umožňujúca stanovenie kauzálnych vzťahov medzi znakmi, výber najdôležitejších faktorov, rozhodovanie o meraní efektívnych a faktoriálnych znakov,

· Príprava počiatočných informácií vrátane otázok primeranosti pozorovacích jednotiek, homogenity všetkých študovaných charakteristík a blízkosť ich distribúcie k normálu;

· Voľba formy vzťahu medzi funkciou výkonnosti a faktormi založenými na vyčíslení viacerých analytických funkcií;

· Štúdia o blízkosti vzťahu medzi ukazovateľom výkonnosti a faktormi, ako aj medzi faktormi založenými na konštrukcii matice párových lineárnych korelačných koeficientov a premietaním mnohorozmerných faktorov.

· Výber významných (významných) faktorov zahrnutých v multifaktorovom modeli - viacnásobná regresná rovnica, založená na zodpovedajúcich štatistických metódach;

· Výpočet parametrov viacnásobnej regresnej rovnice a hodnotenie významnosti vybraných faktorov, korelačných a regresných koeficientov s použitím kritérií t- Student a F- Fisher ;

· Analýza výsledkov.

Vzťahy medzi znakmi sa analyzujú spravidla na základe pozorovaní vzoriek, aby sa overilo, či sú získané závislosti skôr pravidelné než náhodné, odhaduje sa významnosť (významnosť) korelačných a regresných ukazovateľov.

Korelácia - regresná analýza sa používa na hodnotenie ukazovateľov podnikateľského plánu a regulačných úrovní ekonomických ukazovateľov, odrážajúcich efektívnosť využívania výrobných zdrojov, identifikáciu existujúcich výrobných zásob, vykonanie porovnávacej analýzy, posúdenie potenciálnych schopností podnikov, krátkodobé predpovedanie vývoja výroby.

Viacnásobná regresná rovnica vám umožňuje nájsť teoretickú, možnú hodnotu efektívneho indikátora pre určité hodnoty faktorových značiek.

Parametre viacnásobnej regresnej rovnice sú vypočítané metódou najmenších štvorcov na základe riešenia systému normálnych rovníc. Pre lineárnu regresnú rovnicu s n faktormi je systém vytvorený z (n + 1) normálnych rovníc:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

Blízkosť vzťahu medzi študovanými parametrami v prípade viacnásobnej korelácie sa určuje na základe rôznych koeficientov.

Spárované korelačné koeficienty r merajú blízkosť lineárneho vzťahu medzi faktormi a medzi výslednou značkou a každým zvažovaným faktorom bez zohľadnenia ich interakcie s inými faktormi.

Čiastočné korelačné koeficienty charakterizujú stupeň vplyvu faktorov na výslednú značku za predpokladu, že ostatné faktory sú stanovené na konštantnej úrovni. V závislosti od počtu faktorov, ktorých vplyv je vylúčený, môžu byť čiastkové korelačné koeficienty prvého rádu (ak je vylúčený vplyv jedného faktora), druhého rádu (ak sú vylúčené dva faktory) atď.

Parciálny korelačný koeficient prvého rádu medzi y a x 1 s vylúčením vplyvu x 2 v dvojfaktorovom modeli sa vypočíta podľa vzorca: ,

kde r yx 1 , r yx 2 , r x1x2 - párové korelačné koeficienty medzi zodpovedajúcimi charakteristikami.

Kumulatívny viacnásobný koeficient korelácie, R, odhaduje blízkosť vzťahu medzi výsledným atribútom a všetkými faktormi. Toto je hlavný ukazovateľ lineárnej viacnásobnej korelácie. Pre dvojfaktorový model sa kumulatívny koeficient viacnásobného korelácie vypočíta podľa vzorca:

, Kumulatívny korelačný koeficient R sa pohybuje od 0 do 1. Čím menšie sú empirické hodnoty výsledného znaku než tie, ktoré sú zaradené pozdĺž mnohonásobnej regresnej čiary, tým bližší korelačný vzťah medzi študovanými parametrami a kumulatívnym koeficientom viacnásobného korelácie na jednotu.

Kumulatívny koeficient viacnásobného určenia , ktorý sa rovná R 2 , ukazuje, koľko odchýlok výsledného znaku je spôsobené vplyvom faktorov zahrnutých do modelu.

Kumulatívny index viacnásobnej korelácie charakterizuje blízkosť vzťahu medzi výslednou vlastnosťou a všetkými faktormi s krivkovým vzťahom:

= kde - rozptýlenie výsledného znaku pod vplyvom faktorov zahrnutých do modelu; - zostatková disperzia výsledného znaku spôsobená vplyvom faktorov, ktoré model nezohľadnil. V lineárnej forme komunikácie sa kumulatívny koeficient a index viacnásobnej korelácie navzájom rovnajú.

Význam viacnásobného korelačného koeficientu R je určený kritériom F - Fisher. Je určená vypočítanou hodnotou F calc , ktorá sa porovnáva s tabuľkovou hodnotou F crit . Koeficient viacnásobnej korelácie sa považuje za významný v závislosti od vzťahu: F calc > F crit .

alebo ,

n je počet pozorovaní, m je počet parametrov rovnice.

F крит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », a ,

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : ,





; Dátum pridania: 2014-01-25 ; просмотров: 37776 ; Obsahuje publikovaný materiál porušenie autorských práv? | | Ochrana osobných údajov OBJEDNAŤ PRÁCU


Nenašli ste to, čo ste hľadali? Použite vyhľadávanie:

Najlepšie povedané : Ako na pár, jeden učiteľ povedal, keď prednáška skončila - to bol koniec páru: "Niečo cíti ako koniec tu." 7461 - | 7128 - alebo prečítajte všetky ...

Pozri tiež:

border=0
2019 @ edudocs.pro

Generovanie stránky za: 0.009 s.