Példa regressziós analízis

Célok és célkitűzések regressziószámítás

A fő cél regressziós elemzés, hogy meghatározza egy analitikus kommunikációs forma, amelyben a változás a hatékony jellemző miatt hatására egy vagy több faktor változók és több más tényezők is befolyásolják pontszám attribútum vesszük állandó, és az átlagos értékeket.
Feladatok regressziós analízissel.
a) létrehozza formái függőséget. A természet és a forma közötti kapcsolat jelenségek megkülönböztetni pozitív lineáris és nemlineáris, és a negatív lineáris és nemlineáris regresszió.
b) meghatározása regressziós függvény formájában matematikai egyenletek egy adott típusú, és hozza létre a befolyása a magyarázó változók a függő változó.
c) mérése ismeretlen értékeit a függő változó. Egy regressziós függvény képes reprodukálni értékeket a függő változó közötti tartományban beállított értékek a magyarázó változók (azaz. E. Oldja meg a problémát interpoláció) vagy becsült során a folyamat egy előre meghatározott időtartam (t. E. Extrapolációs oldja meg a problémát). Az eredmény egy becsült értéket a függő változó.

Steam regresszió - az egyenlet két változó közötti kapcsolat az y és x. Ahol y - a függő változó (tüneti pontszám); X - egy független, magyarázó változó (vonás-faktor).

Különbséget tenni a lineáris és nemlineáris regresszió.
Lineáris regresszió: y = a + bx + ε
Nemlineáris regresszió két osztályba sorolhatók: regresszió, nemlineáris tekintetében tartalmazza az elemzés a magyarázó változók, de a lineáris, a becsült paraméterek és regresszió, nemlineáris, a becsült paraméterek.
Regresszió, lineáris a magyarázó változók:
  • polinomok különböző mértékű
  • egyenlő oldalú hiperbola.
Regresszió, lineáris a becsült paraméterek:
  • teljesítmény
  • exponenciális
  • exponenciális
Építése a regressziós egyenlet csökkenti a becsült paramétereit. Ahhoz, hogy megbecsüljük a regressziós paraméterek, lineáris paraméterek segítségével a legkisebb négyzetek módszerével (OLS). OLS előállítását teszi lehetővé az ilyen értékelési paramétereket, amelyek esetében a négyzetösszege eltérései az aktuális értékeit a hatékony jelleggörbének a elméleti minimális, azaz a
.
A lineáris és nemlineáris egyenletek redukálható lineáris, az alábbi rendszer megoldott tekintetében a és b:

Használhatja kész formulák származnak ezt a rendszert:

Szorítás kommunikációs jelenségek tanulmány kiértékeli lineáris korrelációs együttható a két lineáris regresszió:

és a korrelációs indexet - a nem-lineáris regresszió:

Minőségének felmérése az épített modell faktor (index) meghatározása, valamint az átlagos közelítési hiba.
Az átlagos közelítési hiba - az átlagos eltérés a számított értékek a tényleges:
.
A megengedhető határértéket - nem több, mint 8-10%.
Az átlagos rugalmassági tényező százalékos arányát jelzi az átlagos aggregált változás az eredménye, hogy középérték megváltoztatása során a X faktor 1% a középérték:
.

ANOVA-analízis feladat a függő változó diszperzió:
,
ahol - a teljes négyzetösszege eltérések;
- eltérések négyzetösszegét miatt regresszió ( „magyarázat”, vagy „faktor”);
- A maradék négyzetösszege eltérések.
A frakció a diszperzió, a magyarázott regresszió, a diszperzió teljes kapott y változó jellemzi az arány (index) meghatározása R2.

A determinációs együttható - a tér a korrelációs együttható vagy indexet.

F-teszt - a minőség értékelése a regressziós egyenlet - az a hipotézis vizsgálatára, de statisztikailag szignifikáns regressziós egyenletet, és az index közelsége a kapcsolatot. Ehhez összehasonlítja a tényleges és kritikus Ffakt (tablespace) Ftabl értékek Fischer F-teszt. Ffakt arányából határozzuk meg az a faktor értékek és a maradék varianciák számított egy szabadságfokot:
,
ahol n - az egységek számát együtt; m - a paraméterek száma a x változó.
Ftabl - a lehető legnagyobb értéke a kritérium befolyása alatt véletlenszerű tényezők ezekben szabadsági fok és szignifikanciaszint a. A szignifikancia szint a - valószínűsége elutasító helyes hipotézis, feltéve, hogy ez igaz. Általában egy veszik egyenlő, mint 0,05 vagy 0,01.
Ha Ftabl Ffakt. De a hipotézis nem kerül elutasításra, és elismert statisztikai jelentéktelenség, a megbízhatatlanság a regressziós egyenletet.
Annak megállapítására, statisztikai jelentőségét regressziós koefficiensek és korrelációs számított Student-féle t-kritérium és a konfidencia intervallumok az egyes mutatók. De egy hipotézis véletlenszerű jellege mutatók, pl nem szignifikáns különbség nulla. Értékelése jelentősége regressziós koefficiensek és korrelációs Student-féle t-tesztet végezni, ha összehasonlítjuk az értékeket az érték a véletlen hiba:
; ; .
Véletlen hibák lineáris regresszió paraméterei és a korrelációs együttható határozza meg a képletek:



Ha összehasonlítjuk a tényleges és kritikus (táblázat) értékek t-statisztika - ttabl és tfakt - mi elfogadja vagy elutasítja a feltételezést, Ho.
Közötti kommunikáció F-Fisher kritérium és Student-féle t-statisztika fejezi ki az egyenlet

Ha ttabl De tfakt a hipotézist nem kerül elutasításra, és elismerte véletlenszerű jellege kialakulását a, b, vagy.
Kiszámításához megbízhatósági intervallumok meghatározására hibahatár D mindegyik index:
, .
Formula kiszámításához megbízhatósági intervallumok a következők:
; ;
; ;
Ha a határokat a megbízhatósági intervallum megjelölve nulla, azaz Az alsó határ negatív, és a felső pozitív, a becsült paraméter értéke nulla, mivel nem tud egyszerre fogadni mind pozitív, mind negatív értékeket.
Prediktív értéket úgy határozzuk meg helyettesítésével az egyenletben a regressziós megfelelő (várható) értékek. Számítsa ki az átlagos standard hiba becslés:
,
ahol
és épít konfidenciaintervallumába előrejelzés:
; ;
hol.

például oldatokká

Feladat №1. Hét területén az Ural kerületi 199H értékeinek a két megjelölés.
1. táblázat.

Költségek vásárlására élelmiszer teljes kiadás% -kal,

Átlagos napi bére egy alkalmazottja, RUR. x

Az értékek a regressziós paraméterek a és b jelentése a következő:

Egy egyenlet:
korrelációs indexet.

Egyenlet szerinti, egyenlő oldalú hiperbola elért legmagasabb pont szűk kommunikációs (összehasonlítva egy lineáris, exponenciális, és exponenciális regresszió). marad elfogadható szinten: 8,1%


ahol F = 6.6 táblázat> F tény, ha a = 0,05.
Ezért a hipotézis, de statisztikailag nem szignifikáns paramétereket az egyenlet. Ez az eredmény azzal magyarázható, hogy a viszonylag alacsony feszesség azonosított függőségek és a kis számú megfigyelést.