11.10.2019

Standartinis nuokrypis apibrėžiamas kaip. Standartinio nuokrypio skaičiavimas programoje Microsoft Excel


Išmintingi matematikai ir statistikai sugalvojo patikimesnį rodiklį, nors ir šiek tiek kitu tikslu - vidutinis tiesinis nuokrypis. Šis rodiklis apibūdina duomenų rinkinio verčių sklaidos pagal jų vidutinę vertę matą.

Norėdami parodyti duomenų sklaidos matą, pirmiausia turite nuspręsti, pagal ką ši sklaida bus apskaičiuojama – paprastai tai yra vidutinė vertė. Tada turite apskaičiuoti, kiek analizuojamų duomenų rinkinio reikšmės yra nuo vidurkio. Aišku, kad kiekviena reikšmė atitinka tam tikrą nuokrypio reikšmę, tačiau mus domina bendras vertinimas, apimantis visą populiaciją. Todėl vidutinis nuokrypis apskaičiuojamas naudojant įprastą aritmetinio vidurkio formulę. Bet! Tačiau norint apskaičiuoti nuokrypių vidurkį, pirmiausia juos reikia pridėti. Ir jei pridėsime teigiamus ir neigiamus skaičius, jie panaikins vienas kitą ir jų suma bus linkusi į nulį. Norint to išvengti, visi nuokrypiai imami modulo, tai yra, visi neigiami skaičiai tampa teigiami. Dabar vidutinis nuokrypis parodys apibendrintą reikšmių sklaidos matą. Dėl to vidutinis tiesinis nuokrypis bus apskaičiuojamas pagal formulę:

a- vidutinis tiesinis nuokrypis,

x– analizuojamas rodiklis, brūkšneliu aukščiau – vidutinė rodiklio reikšmė,

n– reikšmių skaičius analizuojamame duomenų rinkinyje,

Tikiuosi, kad sumavimo operatorius nieko negąsdina.

Vidutinis tiesinis nuokrypis, apskaičiuotas naudojant nurodytą formulę, atspindi vidutinį absoliutų nuokrypį nuo konkrečios populiacijos vidutinės vertės.

Nuotraukoje raudona linija yra vidutinė vertė. Kiekvieno stebėjimo nuokrypiai nuo vidurkio žymimi mažomis rodyklėmis. Jie imami modulo ir sumuojami. Tada viskas padalijama iš reikšmių skaičiaus.

Norėdami užbaigti paveikslėlį, turime pateikti pavyzdį. Tarkime, yra įmonė, kuri gamina auginius kastuvams. Kiekvienas kirtimas turi būti 1,5 metro ilgio, bet dar svarbiau, kad jie visi būtų vienodi arba pagal bent jau, plius minus 5 cm. Tačiau neatsargūs darbuotojai nupjovė arba 1,2 m, arba 1,8 m. Vasaros gyventojai nepatenkinti. Įmonės direktorius nusprendė atlikti statistinę kirtimų ilgio analizę. Išsirinkau 10 vienetų ir išmatavau jų ilgį, suradau vidurkį ir paskaičiavau vidutinį tiesinį nuokrypį. Vidurkis pasirodė kaip tik tiek, kiek reikėjo - 1,5 m. Bet vidutinis tiesinis nuokrypis buvo 0,16 m. Taigi išeina, kad kiekvienas kirtimas yra ilgesnis arba trumpesnis nei reikia vidutiniškai 16 cm. Yra apie ką kalbėtis su darbininkai . Tiesą sakant, realaus šio rodiklio panaudojimo nemačiau, todėl pats sugalvojau pavyzdį. Tačiau statistikoje toks rodiklis yra.

Sklaida

Kaip ir vidutinis tiesinis nuokrypis, dispersija taip pat atspindi duomenų sklaidos apie vidutinę vertę mastą.

Dispersijos skaičiavimo formulė atrodo taip:

(variacijų serijai (svertinis dispersija))

(nesugrupuotiems duomenims (paprasta dispersija))

kur: σ 2 – dispersija, Xi– analizuojame kvadratinį rodiklį (charakteristikos reikšmę), – rodiklio vidutinę reikšmę, f i – reikšmių skaičių analizuojamame duomenų rinkinyje.

Dispersija yra vidutinis nuokrypių kvadratas.

Pirma, apskaičiuojama vidutinė vertė, tada imamas skirtumas tarp kiekvienos pradinės ir vidutinės vertės, pakeliamas kvadratas, padauginamas iš atitinkamo požymio vertės dažnio, pridedama ir padalyta iš populiacijos reikšmių skaičiaus.

Tačiau į gryna forma, pvz., aritmetinis vidurkis arba indeksas, dispersija nenaudojama. Tai veikiau pagalbinis ir tarpinis rodiklis, naudojamas kitų tipų statistinei analizei.

Supaprastintas dispersijos skaičiavimo būdas

Standartinis nuokrypis

Norint naudoti dispersiją duomenų analizei, imama dispersijos kvadratinė šaknis. Pasirodo, vadinamasis standartinis nuokrypis.

Beje, standartinis nuokrypis dar vadinamas sigma – nuo ​​jį žyminčios graikiškos raidės.

Standartinis nuokrypis, žinoma, taip pat apibūdina duomenų sklaidos matą, tačiau dabar (skirtingai nuo dispersijos) jį galima palyginti su pradiniais duomenimis. Paprastai vidutiniai kvadratiniai matai statistikoje duoda tikslesnius rezultatus nei tiesiniai. Todėl vidutinis standartinis nuokrypis yra tikslesnis duomenų sklaidos matas nei tiesinis vidutinis nuokrypis.

$X$. Pirmiausia prisiminkime šį apibrėžimą:

1 apibrėžimas

Gyventojų skaičius- atsitiktinai atrinktų tam tikro tipo objektų rinkinys, kurio stebėjimai atliekami siekiant gauti konkrečias atsitiktinio dydžio reikšmes, atliekamos pastoviomis sąlygomis tiriant vieną tam tikro tipo atsitiktinį kintamąjį.

2 apibrėžimas

Bendra dispersija- populiacijos varianto verčių nukrypimų kvadratu nuo jų vidutinės vertės aritmetinis vidurkis.

Tegul parinkties $x_1,\ x_2,\dots ,x_k$ reikšmės turi atitinkamai dažnius $n_1,\n_2,\dots ,n_k$. Tada bendroji dispersija apskaičiuojama pagal formulę:

Pasvarstykime ypatinga byla. Tegul visos parinktys $x_1,\ x_2,\dots ,x_k$ skiriasi. Šiuo atveju $n_1,\ n_2,\dots ,n_k=1$. Pastebime, kad šiuo atveju bendroji dispersija apskaičiuojama naudojant formulę:

Ši sąvoka taip pat siejama su bendrojo standartinio nuokrypio sąvoka.

3 apibrėžimas

Bendras standartinis nuokrypis

\[(\sigma )_g=\sqrt(D_g)\]

Imties dispersija

Pateikiame pavyzdinę populiaciją atsitiktinio dydžio $X$ atžvilgiu. Pirmiausia prisiminkime šį apibrėžimą:

4 apibrėžimas

Imties populiacija-- dalis atrinktų objektų iš bendrosios populiacijos.

5 apibrėžimas

Imties dispersija- imties visumos verčių aritmetinis vidurkis.

Tegul parinkties $x_1,\ x_2,\dots ,x_k$ reikšmės turi atitinkamai dažnius $n_1,\n_2,\dots ,n_k$. Tada imties dispersija apskaičiuojama pagal formulę:

Panagrinėkime ypatingą atvejį. Tegul visos parinktys $x_1,\ x_2,\dots ,x_k$ skiriasi. Šiuo atveju $n_1,\ n_2,\dots ,n_k=1$. Pastebime, kad šiuo atveju imties dispersija apskaičiuojama naudojant formulę:

Taip pat su šia sąvoka susijusi imties standartinio nuokrypio samprata.

6 apibrėžimas

Mėginio standartinis nuokrypis-- kvadratinė šaknis iš bendrosios dispersijos:

\[(\sigma )_в=\sqrt(D_в)\]

Pataisyta dispersija

Norint rasti pataisytą dispersiją $S^2$, imties dispersiją reikia padauginti iš trupmenos $\frac(n)(n-1)$, tai yra

Ši sąvoka taip pat siejama su pakoreguoto standartinio nuokrypio sąvoka, kuri randama pagal formulę:

Tuo atveju, kai variantų reikšmės nėra diskrečios, o reiškia intervalus, tada bendrųjų arba imties dispersijų skaičiavimo formulėse $x_i$ reikšmė laikoma intervalo vidurio reikšme. kuriai priklauso $x_i.$.

Problemos pavyzdys, kaip rasti dispersiją ir standartinį nuokrypį

1 pavyzdys

Imties visuma apibrėžiama pagal šią paskirstymo lentelę:

1 paveikslas.

Raskime imties dispersiją, imties standartinį nuokrypį, pataisytą dispersiją ir pataisytą standartinį nuokrypį.

Norėdami išspręsti šią problemą, pirmiausia sudarome skaičiavimo lentelę:

2 pav.

Vertė $\overline(x_в)$ (pavyzdžio vidurkis) lentelėje randama pagal formulę:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Raskime imties dispersiją naudodami formulę:

Standartinio nuokrypio pavyzdys:

\[(\sigma )_в=\sqrt(D_в)\apytiksliai 5,12\]

Pataisyta dispersija:

\[(S^2=\frac(n)(n-1)D)_в=\frac(20)(19)\cdot 26.1875\apytiksliai 27.57\]

Pataisytas standartinis nuokrypis.

Standartinis nuokrypis(sinonimai: standartinis nuokrypis, standartinis nuokrypis, kvadratinis nuokrypis; susiję terminai: standartinis nuokrypis, standartinis paplitimas) - tikimybių teorijoje ir statistikoje labiausiai paplitęs atsitiktinio dydžio reikšmių sklaidos rodiklis, palyginti su jo matematiniais lūkesčiais. Esant ribotam reikšmių imčių masyvui, vietoj matematinio lūkesčio naudojamas imčių rinkinio aritmetinis vidurkis.

Enciklopedinis „YouTube“.

  • 1 / 5

    Standartinis nuokrypis matuojamas paties atsitiktinio dydžio matavimo vienetais ir naudojamas skaičiuojant aritmetinio vidurkio standartinę paklaidą, konstruojant pasikliautinuosius intervalus, statistiškai tikrinant hipotezes, matuojant tiesinį ryšį tarp atsitiktinių dydžių. Apibrėžiama kaip atsitiktinio dydžio dispersijos kvadratinė šaknis.

    Standartinis nuokrypis:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Pastaba: Labai dažnai MSD (Šaknies kvadratinis nuokrypis) ir STD (Standartinis nuokrypis) pavadinimai neatitinka jų formulių. Pavyzdžiui, Python programavimo kalbos modulyje numPy funkcija std() apibūdinama kaip "standartinis nuokrypis", o formulė atspindi standartinį nuokrypį (dalijimą iš imties šaknies). Programoje „Excel“ funkcija STANDARDEVAL() skiriasi (padalijimas iš n-1 šaknies).

    Standartinis nuokrypis(atsitiktinio dydžio standartinio nuokrypio įvertis x palyginti su matematiniais lūkesčiais, pagrįstais nešališku jo dispersijos įvertinimu) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    Kur σ 2 (\displaystyle \sigma ^(2))- dispersija; x i (\displaystyle x_(i)) - i atrankos elementas; n (\displaystyle n)- imties dydis; - imties aritmetinis vidurkis:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ltaškai +x_(n)).

    Reikėtų pažymėti, kad abu vertinimai yra šališki. Bendruoju atveju nešališko įvertinimo sudaryti neįmanoma. Tačiau įvertinimas, pagrįstas nešališku dispersijos įvertinimu, yra nuoseklus.

    Pagal GOST R 8.736-2011 standartinis nuokrypis apskaičiuojamas pagal antrąją šio skyriaus formulę. Patikrinkite rezultatus.

    Trijų sigmų taisyklė

    Trijų sigmų taisyklė (3 σ (\displaystyle 3\sigma)) - beveik visos normaliai paskirstyto atsitiktinio dydžio reikšmės yra intervale (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Griežčiau – su apytiksle tikimybe 0,9973, normaliai paskirstyto atsitiktinio dydžio reikšmė yra nurodytame intervale (su sąlyga, kad reikšmė x ¯ (\displaystyle (\bar (x))) tiesa, o ne gauta apdorojant mėginį).

    Jei tikroji vertė x ¯ (\displaystyle (\bar (x))) nežinoma, tuomet neturėtumėte naudoti σ (\displaystyle \sigma ), A s. Taigi trijų sigmų taisyklė paverčiama trijų taisykle s .

    Standartinio nuokrypio vertės aiškinimas

    Didesnė standartinio nuokrypio vertė rodo didesnį reikšmių sklaidą pateiktame rinkinyje su vidutine rinkinio verte; atitinkamai mažesnė reikšmė rodo, kad rinkinio reikšmės yra sugrupuotos pagal vidutinę vertę.

    Pavyzdžiui, turime tris skaičių rinkinius: (0, 0, 14, 14), (0, 6, 8, 14) ir (6, 6, 8, 8). Visų trijų rinkinių vidutinės vertės yra lygios 7, o standartiniai nuokrypiai atitinkamai yra lygūs 7, 5 ir 1. Paskutinis rinkinys turi nedidelį standartinį nuokrypį, nes rinkinio reikšmės yra sugrupuotos pagal vidutinę vertę; pirmame rinkinyje yra daugiausia didelę reikšmę standartinis nuokrypis - nustatytos vertės labai skiriasi nuo vidutinės vertės.

    Bendrąja prasme standartinis nuokrypis gali būti laikomas neapibrėžtumo matu. Pavyzdžiui, fizikoje standartinis nuokrypis naudojamas tam tikro dydžio nuoseklių matavimų paklaidai nustatyti. Ši reikšmė yra labai svarbi nustatant tiriamo reiškinio tikimybę, lyginant su teorijos numatytu dydžiu: jei vidutinė matavimų vertė labai skiriasi nuo teorijos numatytų verčių (didelis standartinis nuokrypis), tada gautas vertes arba jų gavimo būdą reikia dar kartą patikrinti. identifikuojama su portfelio rizika.

    Klimatas

    Tarkime, kad yra du miestai, kurių vidutinė maksimali paros temperatūra yra vienoda, tačiau vienas yra pakrantėje, o kitas – lygumoje. Yra žinoma, kad pakrantėje esančiuose miestuose yra daug skirtingų maksimalių dienos temperatūrų, kurios yra žemesnės nei miestuose, esančiuose sausumoje. Todėl didžiausios paros temperatūros standartinis nuokrypis pakrantės miestui bus mažesnis nei antrojo miesto, nepaisant to, kad jų vidutinė vertė yra tokia pati, o tai praktiškai reiškia, kad tikimybė, kad Maksimali temperatūra kiekvienos konkrečios metų dienos oras labiau skirsis nuo vidutinės vertės, didesnis žemyno viduje esančiam miestui.

    Sportas

    Tarkime, kad yra kelios futbolo komandos, kurios vertinamos pagal tam tikrus parametrus, pavyzdžiui, įmuštų ir praleistų įvarčių skaičių, progų skaičių ir pan. Labiausiai tikėtina, kad geriausia šios grupės komanda turės geriausios vertybės pagal daugiau parametrų. Kuo mažesnis komandos standartinis nuokrypis kiekvienam iš pateiktų parametrų, tuo labiau nuspėjamas komandos rezultatas, tokios komandos yra subalansuotos. Kita vertus, komanda su Gera vertė standartinį nuokrypį sunku nuspėti rezultatą, o tai savo ruožtu paaiškinama disbalansu, pvz. stipri gynyba, bet su silpna ataka.

    Naudojant komandų parametrų standartinį nuokrypį galima vienu ar kitu laipsniu numatyti dviejų komandų rungtynių rezultatą, įvertinant stipriąsias ir silpnosios pusės komandos, taigi ir pasirinkti kovos metodai.

    Apibrėžiama kaip apibendrinanti bruožo kitimo dydžio charakteristika visumoje. Jis lygus atskirų požymio verčių vidutinio kvadratinio nuokrypio nuo aritmetinio vidurkio kvadratinei šakniai, t.y. Ir šaknis galima rasti taip:

    1. Pirminei eilutei:

    2. Variacijų serijai:

    Transformavus standartinio nuokrypio formulę, ji tampa patogesnė praktiniams skaičiavimams:

    Vidutinis standartinis nuokrypis nustato, kiek vidutiniškai konkretūs pasirinkimai nukrypsta nuo jų vidutinės vertės, taip pat yra absoliutus charakteristikos kintamumo matas ir išreiškiamas tais pačiais vienetais kaip ir opcionai, todėl yra gerai interpretuojamas.

    Standartinio nuokrypio nustatymo pavyzdžiai: ,

    Alternatyvioms charakteristikoms standartinio nuokrypio formulė atrodo taip:

    čia p – vienetų, turinčių tam tikrą požymį, dalis populiacijoje;

    q yra vienetų, kurie neturi šios charakteristikos, dalis.

    Vidutinio tiesinio nuokrypio samprata

    Vidutinis tiesinis nuokrypis apibrėžiamas kaip aritmetinis vidurkis absoliučios vertės atskirų pasirinkimų nukrypimai nuo .

    1. Pirminei eilutei:

    2. Variacijų serijai:

    kur yra suma n variacijų eilučių dažnių suma.

    Vidutinio tiesinio nuokrypio nustatymo pavyzdys:

    Vidutinio absoliutaus nuokrypio, kaip dispersijos mato svyravimo diapazone, pranašumas yra akivaizdus, ​​nes šis matas pagrįstas visų galimi nukrypimai. Tačiau šis rodiklis turi reikšmingų trūkumų. Savavališkas algebrinių nukrypimų ženklų atmetimas gali lemti tai, kad matematinės šio rodiklio savybės toli gražu nėra elementarios. Dėl to labai sunku naudoti vidutinį absoliutų nuokrypį sprendžiant problemas, susijusias su tikimybiniais skaičiavimais.

    Todėl vidutinis tiesinis nuokrypis kaip charakteristikos kitimo matas statistikos praktikoje naudojamas retai, o būtent tada, kai rodiklių sumavimas neatsižvelgiant į ženklus yra ekonomiškai prasmingas. Jo pagalba, pavyzdžiui, analizuojama užsienio prekybos apyvarta, darbuotojų sudėtis, gamybos ritmas ir kt.

    Vidutinis kvadratas

    Taikomas vidutinis kvadratas, pavyzdžiui, apskaičiuoti vidutinį n kvadratinių sekcijų kraštinių dydį, vidutinius kamienų, vamzdžių skersmenis ir kt. Jis skirstomas į du tipus.

    Paprastas vidutinis kvadratas. Jei pakeičiant individualias charakteristikos reikšmes į Vidutinė vertė Jei reikia, kad pradinių verčių kvadratų suma būtų pastovi, tada vidurkis bus kvadratinis vidurkis.

    Tai yra kvadratinė šaknis iš atskirų atributų verčių kvadratų sumos dalijimo iš jų skaičiaus:

    Svertinis vidutinis kvadratas apskaičiuojamas pagal formulę:

    kur f yra svorio ženklas.

    Vidutinis kub

    Taikomas vidutinis kub, pavyzdžiui, nustatant vidutinį kraštinės ir kubelių ilgį. Jis skirstomas į du tipus.
    Vidutinis kubinis paprastas:

    Skaičiuojant vidutines vertes ir dispersiją intervalų pasiskirstymo eilutėse, tikrosios atributo reikšmės pakeičiamos centrinėmis intervalų reikšmėmis, kurios skiriasi nuo vidutinių. aritmetinės reikšmėsįtraukta į intervalą. Dėl to skaičiuojant dispersiją atsiranda sisteminė klaida. V.F. Sheppard tai nusprendė dispersijos skaičiavimo klaida, kurį sukelia sugrupuotų duomenų naudojimas, yra 1/12 intervalo kvadrato tiek dispersijos aukštyn, tiek žemyn kryptimi.

    Sheppard pataisa turėtų būti naudojamas, jei pasiskirstymas yra artimas normaliam, yra susijęs su charakteristika, kurios kitimas yra nuolatinis, ir yra pagrįstas dideliu pradinių duomenų kiekiu (n > 500). Tačiau remiantis tuo, kad kai kuriais atvejais abi klaidos, veikiančios skirtingomis kryptimis, viena kitą kompensuoja, kartais galima atsisakyti įvesti pataisas.

    Kuo mažesnė dispersija ir standartinis nuokrypis, tuo populiacija homogeniškesnė ir vidurkis bus tipiškesnis.
    Statistikos praktikoje dažnai reikia lyginti variantus įvairių ženklų. Pavyzdžiui, labai įdomu palyginti darbuotojų amžiaus ir jų kvalifikacijos, darbo stažo ir dydžio svyravimus darbo užmokesčio, sąnaudos ir pelnas, darbo stažas ir darbo našumas ir kt. Tokiems palyginimams netinka absoliutaus charakteristikų kintamumo rodikliai: neįmanoma palyginti darbo stažo kintamumo, išreikšto metais, su darbo užmokesčio kitimu rubliais.

    Tokiems palyginimams atlikti, taip pat tos pačios charakteristikos kintamumo palyginimui keliose populiacijose su skirtingais aritmetiniais vidurkiais, naudojamas santykinis rodiklis variacija – variacijos koeficientas.

    Struktūriniai vidurkiai

    Centrinei statistinių skirstinių tendencijai apibūdinti dažnai racionalu kartu su aritmetiniu vidurkiu naudoti tam tikrą charakteristikos X reikšmę, kuri dėl tam tikrų jos vietos skirstinio eilutėje ypatybių gali apibūdinti jos lygį.

    Tai ypač svarbu, kai pasiskirstymo serijoje charakteristikos kraštutinės reikšmės turi neaiškias ribas. Dėl to tikslus apibrėžimas Aritmetinis vidurkis paprastai yra neįmanomas arba labai sunkus. Tokiais atvejais vidutinis lygis gali būti nustatytas, pavyzdžiui, imant ypatybės reikšmę, esančią dažnių serijos viduryje arba kuri dažniausiai pasitaiko dabartinėse serijose.

    Tokios reikšmės priklauso tik nuo dažnių pobūdžio, t.y. nuo pasiskirstymo struktūros. Jie yra tipiški vietoje dažnių serijoje, todėl tokios vertės laikomos pasiskirstymo centro charakteristikomis ir todėl gavo struktūrinių vidurkių apibrėžimą. Jie naudojami studijuoti vidinė struktūra ir atributų reikšmių paskirstymo serijos struktūra. Tokie rodikliai apima:

    Tobuliausia variacijos charakteristika yra vidutinis kvadratinis nuokrypis, vadinamas standartiniu (arba standartiniu nuokrypiu). Standartinis nuokrypis() yra lygus atskirų požymio reikšmių vidutinio kvadratinio nuokrypio nuo aritmetinio vidurkio kvadratinei šaknei:

    Standartinis nuokrypis yra paprastas:

    Svertinis standartinis nuokrypis taikomas sugrupuotiems duomenims:

    Tarp vidutinių kvadratinių ir vidutinių tiesinių nuokrypių normaliojo pasiskirstymo sąlygomis susidaro toks santykis: ~ 1,25.

    Standartinis nuokrypis, kaip pagrindinis absoliutus kitimo matas, naudojamas nustatant normalaus pasiskirstymo kreivės ordinačių vertes, atliekant skaičiavimus, susijusius su mėginių stebėjimo organizavimu ir imties charakteristikų tikslumo nustatymu, taip pat vertinant charakteristikos kitimo ribos homogeninėje populiacijoje.

    Dispersija, jos rūšys, standartinis nuokrypis.

    Atsitiktinio dydžio dispersija— tam tikro atsitiktinio dydžio sklaidos matas, t.y. jo nuokrypis nuo matematinio lūkesčio. Statistikoje dažnai naudojamas žymėjimas arba. Kvadratinė šaknis dispersijos dydis vadinamas standartiniu nuokrypiu, standartiniu nuokrypiu arba standartiniu sklaida.

    Bendra dispersija (σ 2) matuoja viso bruožo kitimą, veikiant visiems šį pokytį sukėlusiems veiksniams. Tuo pačiu metu grupavimo metodo dėka galima nustatyti ir išmatuoti kitimą dėl grupavimo charakteristikos ir kitimą, atsirandantį veikiant neatsižvelgtiems veiksniams.

    Tarpgrupinė dispersija (σ 2 m.gr) apibūdina sistemingą kitimą, t.y. tiriamos charakteristikos vertės skirtumus, atsirandančius veikiant požymiui – veiksniui, kuris sudaro grupės pagrindą.

    Standartinis nuokrypis(sinonimai: standartinis nuokrypis, standartinis nuokrypis, kvadratinis nuokrypis; susiję terminai: standartinis nuokrypis, standartinis sklaida) - tikimybių teorijoje ir statistikoje labiausiai paplitęs atsitiktinio dydžio reikšmių sklaidos rodiklis, palyginti su jo matematiniais lūkesčiais. Esant ribotam reikšmių imčių masyvui, vietoj matematinio lūkesčio naudojamas imčių rinkinio aritmetinis vidurkis.

    Standartinis nuokrypis matuojamas paties atsitiktinio dydžio vienetais ir naudojamas skaičiuojant aritmetinio vidurkio standartinę paklaidą, konstruojant pasikliautinuosius intervalus, statistiškai tikrinant hipotezes, matuojant tiesinį ryšį tarp atsitiktinių dydžių. Apibrėžiama kaip atsitiktinio dydžio dispersijos kvadratinė šaknis.


    Standartinis nuokrypis:

    Standartinis nuokrypis(atsitiktinio dydžio standartinio nuokrypio įvertis x palyginti su jo matematiniais lūkesčiais, pagrįstais nešališku jo dispersijos įvertinimu):

    kur yra dispersija; — i atrankos elementas; - imties dydis; — imties aritmetinis vidurkis:

    Reikėtų pažymėti, kad abu vertinimai yra šališki. Bendruoju atveju nešališko įvertinimo sudaryti neįmanoma. Tačiau įvertinimas, pagrįstas nešališku dispersijos įvertinimu, yra nuoseklus.

    Režimo ir medianos nustatymo esmė, apimtis ir procedūra.

    Be galios vidurkių statistikoje, santykiniam kintamos charakteristikos vertės ir pasiskirstymo eilučių struktūros apibūdinimui naudojami struktūriniai vidurkiai, kuriuos daugiausia vaizduoja mada ir mediana.

    Mada– Tai labiausiai paplitęs serijos variantas. Mada pasitelkiama, pavyzdžiui, nustatant labiausiai pirkėjų paklausių drabužių ir batų dydį. Atskiros serijos režimas yra tas, kurio dažnis yra didžiausias. Skaičiuodami intervalo variacijų serijos režimą, pirmiausia turite nustatyti modalinį intervalą (pagal maksimalus dažnis), o tada - modalinės atributo reikšmės vertė pagal formulę:

    - - mados vertė

    - — apatinė modalinio intervalo riba

    - - intervalo dydis

    - — modalinio intervalo dažnis

    - — intervalo prieš modalą dažnis

    - — intervalo po modalo dažnis

    Mediana – tai yra atributo, kuriuo grindžiama reitinguojama serija ir kuris padalija šią seriją į dvi lygias dalis, reikšmė.

    Norėdami nustatyti medianą diskrečioje eilutėje esant dažniams, pirmiausia apskaičiuokite pusę dažnių sumos ir tada nustatykite, kuri varianto vertė patenka į ją. (Jei surūšiuotoje serijoje yra nelyginis funkcijų skaičius, mediana apskaičiuojama pagal formulę:

    M e = (n (iš viso elementų skaičius) + 1)/2,

    esant lyginiam požymių skaičiui, mediana bus lygi dviejų ypatybių vidurkiui eilutės viduryje).

    Skaičiuojant medianos intervalo variacijų serijai pirmiausia nustatykite vidutinį intervalą, kuriame yra mediana, tada nustatykite medianos reikšmę naudodami formulę:

    - — reikiama mediana

    - - apatinė intervalo riba, kurioje yra mediana

    - - intervalo dydis

    - — dažnių suma arba serijos terminų skaičius

    Sukauptų intervalų dažnių prieš medianą suma

    - — vidutinio intervalo dažnis

    Pavyzdys. Raskite režimą ir medianą.

    Sprendimas:
    Šiame pavyzdyje modalinis intervalas yra 25–30 metų amžiaus grupėje, nes šis intervalas yra didžiausias (1054).

    Apskaičiuokime režimo dydį:

    Tai reiškia, kad modalinis studentų amžius yra 27 metai.

    Apskaičiuokime medianą. Vidutinis intervalas yra Amžiaus grupė 25–30 metų, nes šiame intervale yra galimybė padalyti populiaciją į dvi lygias dalis (Σf i /2 = 3462/2 = 1731). Toliau formulėje pakeičiame reikiamus skaitinius duomenis ir gauname vidutinę reikšmę:

    Tai reiškia, kad pusė studentų yra jaunesni nei 27,4 metų, o kita pusė – vyresni nei 27,4 metų.

    Be režimo ir medianos, galima naudoti tokius rodiklius kaip kvartiliai, padalijantys reitinguotą seriją į 4 lygias dalis, decilių- 10 dalių ir procentilių - 100 dalių.

    Atrankinio stebėjimo samprata ir jos apimtis.

    Atrankinis stebėjimas taikoma, kai naudojamas nuolatinis stebėjimas fiziškai neįmanoma dėl didelio duomenų kiekio arba ekonomiškai netikslinga. Fizinis negalimumas atsiranda, pavyzdžiui, tiriant keleivių srautus, rinkos kainas, šeimos biudžetų. Ekonominis netikslumas atsiranda vertinant su jų sunaikinimu susijusių prekių kokybę, pavyzdžiui, ragaujant, tikrinant plytų stiprumą ir pan.

    Stebėjimui atrinkti statistiniai vienetai sudaro atrankos rėmą arba imtį, o visas jų masyvas sudaro bendrąją aibę (GS). Šiuo atveju vienetų skaičius imtyje žymimas n, ir visoje HS - N. Požiūris n/N vadinamas santykiniu imties dydžiu arba proporcija.

    Imties stebėjimo rezultatų kokybė priklauso nuo imties reprezentatyvumo, tai yra nuo to, kiek ji reprezentatyvi GS. Siekiant užtikrinti imties reprezentatyvumą, būtina laikytis atsitiktinio vienetų atrankos principas, kuri daro prielaidą, kad HS vieneto įtraukimui į imtį negali turėti įtakos joks kitas veiksnys, išskyrus atsitiktinumą.

    Egzistuoja 4 atsitiktinės atrankos būdai pavyzdiui:

    1. Tiesą sakant, atsitiktinai atranka arba „loto metodas“, kai priskiriamos statistinės reikšmės serijos numeriai, dedami ant tam tikrų objektų (pavyzdžiui, statinių), kurie vėliau sumaišomi kokiame nors inde (pavyzdžiui, maišelyje) ir parenkami atsitiktinai. Praktiškai šis metodas atliekamas naudojant atsitiktinių skaičių generatorių arba matematines atsitiktinių skaičių lenteles.
    2. Mechaninis pasirinkimas pagal kurį kiekvienas ( N/n)-oji visumos reikšmė. Pavyzdžiui, jei jame yra 100 000 reikšmių ir jums reikia pasirinkti 1 000, tada kiekviena 100 000 / 1000 = 100 vertė bus įtraukta į pavyzdį. Be to, jei jie nėra reitinguojami, pirmasis atsitiktinai atrenkamas iš pirmojo šimto, o kitų skaičiai bus šimtu didesni. Pavyzdžiui, jei pirmasis vienetas buvo Nr. 19, tai kitas turėtų būti Nr. 119, tada Nr. 219, tada Nr. 319 ir t.t. Jei gyventojų vienetai reitinguojami, tada pirmiausia pasirenkamas Nr.50, po to Nr.150, po to Nr.250 ir t.t.
    3. Atliekamas reikšmių pasirinkimas iš nevienalyčių duomenų masyvo stratifikuotas(sluoksniuotas) metodas, kai pirmiausia populiacija suskirstoma į vienarūšes grupes, kurioms taikoma atsitiktinė arba mechaninė atranka.
    4. Specialus mėginių ėmimo metodas yra serijinis atranka, kurios metu jie atsitiktinai arba mechaniškai parenka ne atskiras reikšmes, o jų eilutes (sekos nuo kokio nors skaičiaus iki tam tikro skaičiaus iš eilės), kurių ribose atliekamas nuolatinis stebėjimas.

    Imties stebėjimų kokybė taip pat priklauso nuo mėginio tipas: kartojo arba nepakartojama.

    At perrinkimasĮ imtį įtrauktos statistinės reikšmės ar jų serijos po panaudojimo grąžinamos į bendrą populiaciją, turint galimybę būti įtrauktos į naują imtį. Be to, visos populiacijos reikšmės turi vienodą tikimybę būti įtrauktos į imtį.

    Besikartojantis pasirinkimas reiškia, kad į imtį įtrauktos statistinės reikšmės ar jų serijos po panaudojimo negrįžta į bendrą aibę, todėl likusioms pastarosios reikšmėms tikimybė patekti į kitą imtį padidėja.

    Nekartojantis mėginių ėmimas duoda tikslesnius rezultatus, todėl naudojamas dažniau. Bet pasitaiko situacijų, kai jo negalima pritaikyti (tyrinėti keleivių srautus, vartotojų paklausą ir pan.) ir tada atliekama pakartotinė atranka.

    Didžiausia stebėjimo atrankos paklaida, vidutinė atrankos paklaida, jų skaičiavimo tvarka.

    Išsamiai apsvarstykime pirmiau išvardytus imties visumos formavimo būdus ir klaidas, kurios atsiranda tai darant. reprezentatyvumas .
    Tinkamai atsitiktinai atranka grindžiama vienetų atrinkimu iš populiacijos atsitiktinai be jokių sisteminių elementų. Techniškai tikroji atsitiktinė atranka vykdoma burtų keliu (pavyzdžiui, loterijose) arba naudojant atsitiktinių skaičių lentelę.

    Tinkama atsitiktinė atranka „gryna forma“ atrankinio stebėjimo praktikoje naudojama retai, tačiau ji yra originali tarp kitų atrankos rūšių, įgyvendinanti pagrindinius atrankinio stebėjimo principus. Panagrinėkime keletą atrankos metodo teorijos ir paprastos atsitiktinės imties paklaidos formulės klausimų.

    Atrankos šališkumas yra skirtumas tarp parametro reikšmės bendrojoje aibėje ir jo reikšmės, apskaičiuotos pagal imties stebėjimo rezultatus. Vidutinės kiekybinės charakteristikos atrankos paklaida nustatoma pagal

    Rodiklis vadinamas ribine atrankos klaida.
    Imties vidurkis yra atsitiktinis kintamasis, kuris gali imti skirtingos reikšmės priklausomai nuo to, kurie vienetai buvo įtraukti į imtį. Todėl atrankos paklaidos taip pat yra atsitiktiniai dydžiai ir gali įgauti skirtingas reikšmes. Todėl nustatykite vidurkį galimos klaidos - vidutinė atrankos klaida, kuris priklauso nuo:

    Mėginio dydis: nei daugiau skaičių, tuo mažesnė vidutinė paklaida;

    Tiriamos charakteristikos kitimo laipsnis: kuo mažesnė charakteristikos variacija, taigi ir dispersija, tuo mažesnė vidutinė atrankos paklaida.

    At atsitiktinis pakartotinis pasirinkimas apskaičiuojama vidutinė paklaida:
    .
    Praktiškai bendroji dispersija nėra tiksliai žinoma, bet tikimybių teorija tai buvo įrodyta
    .
    Kadangi pakankamai didelio n reikšmė yra artima 1, galime manyti, kad . Tada galima apskaičiuoti vidutinę atrankos paklaidą:
    .
    Tačiau mažos imties atvejais (su n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
    .

    At atsitiktinė nekartojanti atranka pateiktos formulės koreguojamos reikšme . Tada vidutinė nepasikartojančios atrankos paklaida yra:
    Ir .
    Nes visada yra mažesnis, tada daugiklis () visada yra mažesnis už 1. Tai reiškia, kad vidutinė paklaida nepasikartojančios atrankos metu visada yra mažesnė nei kartotinės atrankos metu.
    Mechaninis mėginių ėmimas naudojamas, kai bendrieji gyventojai yra kokiu nors būdu surikiuoti (pavyzdžiui, abėcėliniai rinkėjų sąrašai, telefono numeriai, namų numeriai, butų numeriai). Vienetai parenkami tam tikru intervalu, kuris yra lygus atrankos procentinei atvirkštinei vertei. Taigi, naudojant 2 % imtį, atrenkami kas 50 vienetų = 1/0,02, o 5 % – kas 1/0,05 = 20 bendrosios visumos vienetų.

    Atskaitos taškas pasirenkamas įvairiais būdais: atsitiktinai, nuo intervalo vidurio, pasikeitus atskaitos taškui. Svarbiausia vengti sistemingų klaidų. Pavyzdžiui, su 5% imtimi, jei pirmasis vienetas yra 13-as, tada kiti yra 33, 53, 73 ir tt.

    Kalbant apie tikslumą, mechaninė atranka yra artima faktinei atsitiktinei atrankai. Todėl mechaninės atrankos vidutinei paklaidai nustatyti naudojamos tinkamos atsitiktinės atrankos formulės.

    At tipinis pasirinkimas apklausiama populiacija preliminariai skirstoma į vienarūšes, panašias grupes. Pavyzdžiui, apklausiant įmones tai gali būti ūkio šakos, subsektoriai, tiriant populiaciją – regionai, socialinės ar amžiaus grupės. Tada nepriklausoma kiekvienos grupės atranka atliekama mechaniškai arba visiškai atsitiktinai.

    Įprastas mėginių ėmimas duoda tikslesnius rezultatus nei kiti metodai. Bendrosios visumos tipizavimas užtikrina, kad kiekviena tipologinė grupė būtų atstovaujama imtyje, o tai leidžia pašalinti tarpgrupinės dispersijos įtaką vidutinei atrankos klaidai. Vadinasi, randant tipinės imties paklaidą pagal dispersijų sudėjimo taisyklę (), reikia atsižvelgti tik į grupės dispersijų vidurkį. Tada vidutinė atrankos paklaida yra:
    perrinkus
    ,
    su nesikartojančia atranka
    ,
    Kur - imties krypčių grupės viduje vidurkis.

    Serijos (arba lizdo) pasirinkimas naudojamas, kai visuma suskirstoma į eilutes arba grupes prieš imties tyrimo pradžią. Šios serijos gali būti gatavų gaminių pakuotės, studentų grupės, komandos. Tirti serijos parenkamos mechaniškai arba grynai atsitiktinai, o serijos viduje atliekamas nuolatinis vienetų tyrimas. Todėl vidutinė atrankos paklaida priklauso tik nuo tarpgrupinės (tarpeilių) dispersijos, kuri apskaičiuojama pagal formulę:

    čia r yra pasirinktų serijų skaičius;
    - i-osios serijos vidurkis.

    Apskaičiuojama vidutinė serijinės atrankos paklaida:

    iš naujo pasirinkus:
    ,
    su nepasikartojančiu pasirinkimu:
    ,
    kur R yra bendras epizodų skaičius.

    Kombinuotas pasirinkimas yra svarstomų atrankos metodų derinys.

    Vidutinė bet kurio atrankos metodo atrankos paklaida daugiausia priklauso nuo absoliutaus imties dydžio ir, kiek mažiau, nuo imties procentinės dalies. Tarkime, kad pirmuoju atveju atliekami 225 stebėjimai iš 4500 vienetų populiacijos, o antruoju – iš 225000 vienetų populiacijos. Abiem atvejais skirtumai yra lygūs 25. Tada pirmuoju atveju, pasirinkus 5 %, atrankos klaida bus tokia:

    Antruoju atveju, pasirinkus 0,1%, jis bus lygus:


    Taigi, sumažėjus atrankos procentui 50 kartų, atrankos paklaida šiek tiek padidėjo, nes imties dydis nepasikeitė.
    Tarkime, kad imties dydis padidintas iki 625 stebėjimų. Šiuo atveju atrankos klaida yra tokia:

    Padidinus imtį 2,8 karto su tuo pačiu populiacijos dydžiu, imties paklaidos dydis sumažėja daugiau nei 1,6 karto.

    Imties populiacijos formavimo metodai ir metodai.

    Statistikoje naudojami įvairūs imtinių populiacijų formavimo metodai, kuriuos lemia tyrimo tikslai ir priklauso nuo tiriamo objekto specifikos.

    Pagrindinė atrankinio tyrimo atlikimo sąlyga – užkirsti kelią sisteminėms klaidoms, atsirandančioms pažeidus vienodų galimybių principą kiekvienam bendrosios visumos vienetui patekti į imtį. Sisteminių klaidų prevencija pasiekiama naudojant moksliškai pagrįstus imties populiacijos formavimo metodus.

    Yra šie vienetų atrankos iš populiacijos būdai:

    1) individuali atranka - imčiai parenkami atskiri vienetai;

    2) grupės atranka - imtyje yra kokybiškai vienarūšės tiriamos grupės arba vienetų serijos;

    3) kombinuota atranka – tai individualios ir grupinės atrankos derinys.
    Atrankos būdus nustato imties visumos formavimo taisyklės.

    Pavyzdys gali būti:

    • iš tikrųjų atsitiktinai susideda iš to, kad imties visuma susidaro atsitiktinai (netyčia) atrinkus atskirus vienetus iš bendrosios visumos. Tokiu atveju imties visumoje atrinktų vienetų skaičius paprastai nustatomas pagal priimtą imties proporciją. Imties proporcija – tai imties visumos n vienetų skaičiaus santykis su bendrosios visumos N vienetų skaičiumi, t.y.
    • mechaninis susideda iš to, kad imties visumos vienetai atrenkami iš bendrosios visumos, suskirstytos į vienodus intervalus (grupes). Šiuo atveju intervalo dydis populiacijoje yra lygus atvirkštinei imties proporcijai. Taigi, esant 2% mėginiui, pasirenkamas kas 50 vienetas (1:0,02), 5% - kas 20 (1:0,05) ir kt. Taigi, pagal priimtą atrankos proporciją, bendroji populiacija tarsi mechaniškai suskirstoma į vienodo dydžio grupes. Iš kiekvienos grupės imčiai parenkamas tik vienas vienetas.
    • tipiškas - kurioje bendroji populiacija pirmiausia suskirstoma į vienarūšes tipines grupes. Tada iš kiekvienos tipinės grupės vienetams į imties populiaciją atskirai atrenkama grynai atsitiktinė arba mechaninė imtis. Svarbi tipinės imties ypatybė yra ta, kad ji duoda tikslesnius rezultatus, palyginti su kitais vienetų atrankos metodais imties visumoje;
    • serijinis- kurioje bendroji populiacija suskirstyta į vienodo dydžio grupes - serijos. Į imties populiaciją atrenkamos serijos. Serijoje nuolat stebimi į seriją įtraukti vienetai;
    • sujungti- mėginių ėmimas gali būti dviejų etapų. Šiuo atveju gyventojai pirmiausia skirstomi į grupes. Tada parenkamos grupės, o pastarųjų viduje parenkami atskiri vienetai.

    Statistikoje išskiriami šie vienetų atrankos imties populiacijoje metodai::

    • vienas etapas atranka – kiekvienas pasirinktas vienetas nedelsiant tiriamas pagal tam tikrą kriterijų (tinkama atsitiktinė ir serijinė atranka);
    • daugiapakopis atranka - atrenkama iš bendrosios atskirų grupių visumos, o iš grupių parenkami atskiri vienetai (tipinė atranka su mechaniniu vienetų atrankos metodu į imties populiaciją).

    Be to, yra:

    • perrinkimas- pagal grąžinamo kamuolio schemą. Tokiu atveju kiekvienas į imtį įtrauktas vienetas arba serija grąžinama į bendrą aibę ir todėl turi galimybę vėl būti įtrauktam į imtį;
    • pakartoti pasirinkimą- pagal negrąžinto kamuolio schemą. Jis turi tikslesnius rezultatus su tuo pačiu imties dydžiu.

    Reikiamo imties dydžio nustatymas (naudojant Stjudento t lentelę).

    Vienas iš mokslinių atrankos teorijos principų yra užtikrinti, kad būtų pasirinktas pakankamas vienetų skaičius. Teoriškai šio principo atitikties poreikis pateikiamas tikimybių teorijos ribinių teoremų įrodymuose, leidžiančiuose nustatyti, kokį vienetų tūrį reikia atrinkti iš visumos, kad jos pakaktų ir būtų užtikrintas imties reprezentatyvumas.

    Standartinės atrankos paklaidos sumažėjimas, taigi ir įverčio tikslumo padidėjimas, visada yra susijęs su imties dydžio padidėjimu, todėl jau organizuojant imties stebėjimą reikia nuspręsti, kokio dydžio imties visuma turėtų būti tokia, kad būtų užtikrintas reikiamas stebėjimo rezultatų tikslumas. Reikiamo imties dydžio apskaičiavimas sudaromas naudojant formules, gautas iš didžiausių imties paklaidų (A) formulių, atitinkančių tam tikrą atrankos tipą ir metodą. Taigi, atsitiktinai pakartotinai imties dydžiui (n) turime:

    Šios formulės esmė ta, kad atsitiktinai pakartotinai pasirinkus reikiamą skaičių imties dydis yra tiesiogiai proporcingas pasikliovimo koeficiento kvadratui. (t2) ir kintamos charakteristikos dispersija (?2) ir yra atvirkščiai proporcinga didžiausios atrankos paklaidos kvadratui (?2). Visų pirma, padidinus maksimalią paklaidą du kartus, reikiamą imties dydį galima sumažinti keturis kartus. Iš trijų parametrų du (t ir?) nustato tyrėjas.

    Tuo pačiu metu tyrinėtojas, remdamasis Iš atrankinio tyrimo tikslo ir uždavinių reikia išspręsti klausimą: į kokią kiekybinę kombinaciją geriau įtraukti šiuos parametrus, kad būtų užtikrintas optimalus variantas? Vienu atveju jį labiau tenkina gautų rezultatų patikimumas (t), o ne tikslumo matas (?), kitu – atvirkščiai. Sunkiau išspręsti klausimą dėl didžiausios atrankos paklaidos reikšmės, nes tyrėjas šio rodiklio neturi imties stebėjimo projektavimo stadijoje, todėl praktikoje įprasta nustatyti didžiausios atrankos paklaidos reikšmę, t. paprastai neviršija 10 % numatomo vidutinio atributo lygio. Apskaičiuotą vidurkį galima nustatyti įvairiais būdais: naudojant panašių ankstesnių tyrimų duomenis arba naudojant imties sistemos duomenis ir atliekant nedidelę bandomąją imtį.

    Sunkiausia nustatyti projektuojant imties stebėjimą yra trečiasis (5.2) formulės parametras – imties populiacijos sklaida. Tokiu atveju būtina panaudoti visą tyrėjo turimą informaciją, gautą anksčiau atliktų panašių ir bandomųjų tyrimų metu.

    Klausimas dėl apibrėžimo reikalaujamas imties dydis tampa sudėtingesnis, jei imties tyrime tiriamos kelios imties vienetų charakteristikos. Šiuo atveju vidutiniai kiekvienos charakteristikos lygiai ir jų kitimas, kaip taisyklė, yra skirtingi, todėl nuspręsti, kuriai iš charakteristikų dispersijai teikti pirmenybę, galima tik atsižvelgiant į ypatybių paskirtį ir tikslus. apklausa.

    Planuojant imties stebėjimą, pagal konkretaus tyrimo tikslus ir išvadų, pagrįstų stebėjimo rezultatais, tikimybę, daroma prielaida iš anksto nustatyta leistinos atrankos paklaidos vertė.

    Apskritai didžiausios imties vidurkio paklaidos formulė leidžia nustatyti:

    Bendrųjų aibės rodiklių galimų nukrypimų nuo imties populiacijos rodiklių dydis;

    Reikalingas imties dydis, užtikrinantis reikiamą tikslumą, kuriam esant galimos paklaidos ribos neviršys tam tikros nurodytos reikšmės;

    Tikimybė, kad pavyzdžio klaida turės nurodytą ribą.

    Studentų paskirstymas tikimybių teorijoje tai vieno parametro absoliučiai nenutrūkstamų skirstinių šeima.

    Dinaminės serijos (intervalas, momentas), dinaminės serijos uždarymas.

    Dinamikos serija- tai yra statistinių rodiklių reikšmės, kurios pateikiamos tam tikra chronologine seka.

    Kiekvieną laiko eilutę sudaro du komponentai:

    1) laikotarpių rodikliai (metai, ketvirčiai, mėnesiai, dienos ar datos);

    2) rodikliai, apibūdinantys tiriamą objektą laikotarpiais arba atitinkamomis datomis, kurie vadinami serijų lygiais.

    Išreiškiami serijos lygiai tiek absoliučios, tiek vidutinės arba santykinės reikšmės. Atsižvelgiant į rodiklių pobūdį, sudaromos absoliučių, santykinių ir vidutinių verčių laiko eilutės. Dinaminės eilutės iš santykinių ir vidutinių verčių sudaromos remiantis išvestinėmis absoliučių verčių serijomis. Yra intervalų ir momentų dinamikos serijos.

    Dinaminės intervalų serijos yra indikatorių reikšmės tam tikram laikotarpiui. Intervalų eilutėse lygiai gali būti sumuojami, kad būtų gautas reiškinio apimtys per ilgesnį laikotarpį arba vadinamosios sukauptos sumos.

    Dinaminių akimirkų serija atspindi rodiklių reikšmes tam tikru laiko momentu (laiko datą). Momentų serijose tyrėją gali dominti tik reiškinių skirtumas, atspindintis serijos lygio pokytį tarp tam tikrų datų, nes lygių suma čia neturi realaus turinio. Suminės sumos čia neskaičiuojamos.

    Svarbiausia teisingos laiko eilučių sudarymo sąlyga yra skirtingiems laikotarpiams priklausančių eilučių lygių palyginamumas. Lygiai turi būti pateikti vienarūšiais kiekiais, o skirtingos reiškinio dalys turi būti vienodai išsamios.

    Tam, kad Siekiant išvengti realios dinamikos iškraipymo, statistiniame tyrime atliekami preliminarūs skaičiavimai (uždaromos dinamikos eilutės), kurie yra prieš statistinę laiko eilučių analizę. Dinaminių eilučių uždarymas suprantamas kaip sujungimas į vieną dviejų ar daugiau eilučių seriją, kurių lygiai apskaičiuojami taikant skirtingą metodiką arba neatitinka teritorinių ribų ir pan. Dinamikos serijų uždarymas taip pat gali reikšti, kad absoliučiai dinamikos eilučių lygiai bus sujungti į bendrą pagrindą, o tai neutralizuoja dinamikos eilučių lygių nepalyginamumą.

    Dinamikos eilučių, koeficientų, augimo ir augimo tempų palyginamumo samprata.

    Dinamikos serija- tai yra eilė statistinių rodiklių, apibūdinančių gamtos ir socialinių reiškinių raidą laikui bėgant. Rusijos valstybinio statistikos komiteto paskelbtuose statistikos rinkiniuose yra daug dinamikos eilučių lentelės pavidalu. Dinaminės serijos leidžia nustatyti tiriamų reiškinių raidos modelius.

    Dinamikos serijose yra dviejų tipų indikatoriai. Laiko rodikliai(metai, ketvirčiai, mėnesiai ir kt.) arba laiko momentai (metų pradžioje, kiekvieno mėnesio pradžioje ir pan.). Eilučių lygio indikatoriai. Dinamikos eilučių lygių rodikliai gali būti išreikšti absoliučiomis vertėmis (produkto gamyba tonomis arba rubliais), santykinėmis vertėmis (miesto gyventojų dalis procentais) ir vidutinėmis reikšmėmis (pramonės darbuotojų vidutinis darbo užmokestis pagal metus). ir tt). Lentelės pavidalu laiko eilutėje yra du stulpeliai arba dvi eilutės.

    Norint teisingai sudaryti laiko eilutes, reikia įvykdyti keletą reikalavimų:

    1. visi dinamikos serijos rodikliai turi būti moksliškai pagrįsti ir patikimi;
    2. dinamikos serijos rodikliai turi būti palyginami laikui bėgant, t.y. turi būti skaičiuojami už tą patį laikotarpį arba tomis pačiomis datomis;
    3. tam tikros dinamikos rodikliai turi būti palyginami visoje teritorijoje;
    4. dinamikos serijos rodikliai turi būti palyginami turiniu, t.y. apskaičiuojamas pagal vieną metodiką, vienodai;
    5. Daugelio dinamikos rodikliai turėtų būti palyginami visuose ūkiuose, į kuriuos atsižvelgiama. Visi dinamikos serijos rodikliai turi būti pateikti tais pačiais matavimo vienetais.

    Statistiniai rodikliai gali apibūdinti arba tiriamo proceso rezultatus per tam tikrą laikotarpį, arba tiriamo reiškinio būseną tam tikru laiko momentu, t.y. rodikliai gali būti intervaliniai (periodiniai) ir momentiniai. Atitinkamai, iš pradžių dinamikos eilutės gali būti intervalas arba momentas. Momentų dinamikos eilutės savo ruožtu gali būti su vienodais arba nevienodais laiko intervalais.

    Pradinė dinamikos serija gali būti paversta vidutinių verčių ir santykinių verčių serijomis (grandine ir bazine). Tokios laiko eilutės vadinamos išvestinėmis laiko eilutėmis.

    Vidutinio lygio dinamikos eilutėse apskaičiavimo metodika yra skirtinga, priklausomai nuo dinamikos eilučių tipo. Naudodamiesi pavyzdžiais, mes apsvarstysime dinamikos eilučių tipus ir vidutinio lygio skaičiavimo formules.

    Absoliutus padidėjimas (Δy) parodykite, kiek vienetų pasikeitė paskesnis serijos lygis, palyginti su ankstesniu (gr. 3. - grandinės absoliutus padidėjimas) arba lyginant su pradiniu lygiu (gr. 4. - pagrindinis absoliutus padidėjimas). Skaičiavimo formules galima parašyti taip:

    Kai absoliučios serijos vertės mažės, bus atitinkamai „sumažėjimas“ arba „sumažėjimas“.

    Absoliutaus augimo rodikliai rodo, kad, pavyzdžiui, 1998 m. produkto „A“ gamyba, palyginti su 1997 m., išaugo 4 tūkst. tonų, o lyginant su 1994 m. – 34 tūkst. tonų; kitus metus žr. lentelę. 11,5 gr. 3 ir 4.

    Augimo tempas rodo, kiek kartų pasikeitė eilutės lygis, palyginti su ankstesniu (gr. 5 - grandininiai augimo arba nuosmukio koeficientai) arba lyginant su pradiniu lygiu (gr. 6 - pagrindiniai augimo arba nuosmukio koeficientai). Skaičiavimo formules galima parašyti taip:

    Augimo tempai parodykite, kiek procentų yra kitas serijos lygis, lyginant su ankstesniu (7 gr. – grandinės augimo tempai) arba lyginant su pradiniu lygiu (gr. 8 – baziniai augimo tempai). Skaičiavimo formules galima parašyti taip:

    Taigi, pavyzdžiui, 1997 m. produkto „A“ gamybos apimtis, palyginti su 1996 m., buvo 105,5% (

    Augimo tempas parodykite, kiek procentų padidėjo ataskaitinio laikotarpio lygis, palyginti su ankstesniu (9 stulpelis - grandinės augimo tempai) arba palyginti su pradiniu lygiu (10 stulpelis - baziniai augimo tempai). Skaičiavimo formules galima parašyti taip:

    T pr = T r - 100 % arba T pr = absoliutus augimas / ankstesnio laikotarpio lygis * 100 %

    Taigi, pavyzdžiui, 1996 m., palyginti su 1995 m., produkto „A“ buvo pagaminta 3,8% (103,8% - 100%) arba (8:210)x100% daugiau, o palyginti su 1994 m. - 9% (109% - 100%).

    Jei absoliutūs lygiai eilutėje mažėja, rodiklis bus mažesnis nei 100% ir atitinkamai bus mažėjimo greitis (augimo greitis su minuso ženklu).

    Absoliuti vertė padidėja 1%.(11 stulpelis) rodo, kiek vienetų turi būti pagaminta per tam tikrą laikotarpį, kad praėjusio laikotarpio lygis padidėtų 1 proc. Mūsų pavyzdyje 1995 metais reikėjo pagaminti 2,0 tūkst.t, o 1998 metais - 2,3 tūkst.t, t.y. daug didesnis.

    Absoliučią 1% augimo vertę galima nustatyti dviem būdais:

    Ankstesnio laikotarpio lygis dalinamas iš 100;

    Grandinės absoliutus padidėjimas yra padalintas iš atitinkamų grandinės augimo tempų.

    Absoliuti 1 % padidėjimo vertė =

    Dinamikoje, ypač per ilgą laikotarpį, svarbi bendra augimo tempo analizė su kiekvieno procentinio padidėjimo ar sumažėjimo turiniu.

    Atkreipkite dėmesį, kad nagrinėjama laiko eilučių analizės metodika taikytina tiek laiko eilutėms, kurių lygiai išreiškiami absoliučiomis reikšmėmis (t, tūkst. rublių, darbuotojų skaičius ir kt.), tiek laiko eilutėms, kurių lygiai išreiškiami santykiniais rodikliais (procentais defektų, pelenų procentais anglies ir kt.) arba vidutinėmis reikšmėmis (vidutinis derlius c/ha, vidutinis darbo užmokestis ir kt.).

    Kartu su nagrinėjamais analitiniais rodikliais, skaičiuojamais kiekvieniems metams, lyginant su ankstesniu arba pradiniu lygiu, analizuojant dinamikos eilutes, reikia apskaičiuoti ir vidutinius laikotarpio analitinius rodiklius: vidutinį eilučių lygį, vidutinį metinį absoliutų padidėjimą. (sumažėjimas) ir vidutinis metinis augimo tempas ir augimo tempas.

    Vidutinio dinamikos serijos lygio apskaičiavimo metodai buvo aptarti aukščiau. Mūsų nagrinėjamose intervalų dinamikos eilutėse vidutinis eilučių lygis apskaičiuojamas naudojant paprastą aritmetinio vidurkio formulę:

    Vidutinė metinė produkto gamybos apimtis 1994-1998 m. t siekė 218,4 tūkst.

    Vidutinis metinis absoliutus augimas taip pat apskaičiuojamas naudojant paprastą aritmetinio vidurkio formulę:

    Metinis absoliutus padidėjimas per metus svyravo nuo 4 iki 12 tūkst. tonų (žr. 3 stulpelį), o vidutinis metinis gamybos padidėjimas 1995-1998 m. tonų siekė 8,5 tūkst.

    Reikia išsamiau apsvarstyti vidutinio augimo greičio ir vidutinio augimo greičio apskaičiavimo metodus. Panagrinėkime juos naudodami lentelėje pateiktą metinių eilučių lygio rodiklių pavyzdį.

    Vidutinis dinamikos serijos lygis.

    Dinaminė eilutė (arba laiko eilutė)- tai tam tikro statistinio rodiklio skaitinės reikšmės nuosekliais momentais ar laikotarpiais (t. y., išdėstytos chronologine tvarka).

    Vadinamos vieno ar kito statistinio rodiklio, sudarančio dinamikos eilutes, skaitinės reikšmės serijos lygiai ir dažniausiai žymimas raide y. Pirmoji serijos dalis y 1 vadinamas pradiniu arba Pagrindinis lygis, ir paskutinis y n - galutinis. Momentai arba laikotarpiai, su kuriais susiję lygiai, yra pažymėti t.

    Dinamikos eilutės paprastai pateikiamos lentelės arba grafiko pavidalu, o laiko skalė sudaroma išilgai abscisių ašies t, o išilgai ordinačių ašies – serijų lygių skalė y.

    Vidutiniai dinamikos eilučių rodikliai

    Kiekviena dinamikos serija gali būti laikoma tam tikra rinkiniu n laike kintantys rodikliai, kuriuos galima apibendrinti kaip vidurkius. Tokie apibendrinti (vidutiniai) rodikliai ypač reikalingi lyginant konkretaus rodiklio pokyčius skirtingais laikotarpiais, skirtingose ​​šalyse ir pan.

    Apibendrinta dinamikos serijos charakteristika gali pasitarnauti, visų pirma, vidurinės eilės lygis. Vidutinio lygio apskaičiavimo metodas priklauso nuo to, ar serija yra momentinė, ar intervalinė (periodinė).

    Kada intervalas serijos, jos vidutinis lygis nustatomas pagal paprastojo aritmetinio eilučių lygių vidurkio formulę, t.y.

    =
    Jei galima momentas eilutė, kurioje yra n lygiai ( y1, y2, …, yn) su vienodais intervalais tarp datų (laikų), tada tokią eilutę galima nesunkiai konvertuoti į vidutinių verčių eilę. Tokiu atveju rodiklis (lygis) kiekvieno laikotarpio pradžioje kartu yra ir praėjusio laikotarpio pabaigos rodiklis. Tada vidutinė kiekvieno laikotarpio rodiklio reikšmė (intervalas tarp datų) gali būti apskaičiuojama kaip pusė reikšmių sumos adresu laikotarpio pradžioje ir pabaigoje, t.y. Kaip. Tokių vidurkių skaičius bus . Kaip minėta anksčiau, vidutinių verčių serijoms vidutinis lygis apskaičiuojamas naudojant aritmetinį vidurkį.

    Todėl galime rašyti:
    .
    Pakeitę skaitiklį, gauname:
    ,

    Kur Y1 Ir Yn— pirmasis ir paskutinis eilės lygiai; Yi— tarpiniai lygiai.

    Šis vidurkis statistikoje žinomas kaip vidutinis chronologinis akimirkų serijai. Jis gavo pavadinimą iš žodžio „cronos“ (laikas, lotynų kalba), nes jis apskaičiuojamas pagal laikui bėgant kintančius rodiklius.

    Esant nelygiam intervalai tarp datų, momentų serijos chronologinis vidurkis gali būti apskaičiuojamas kaip kiekvienos momentų poros lygių vidutinių verčių aritmetinis vidurkis, pasvertas atstumais (laiko intervalais) tarp datų, t.y.
    .
    Tokiu atveju daroma prielaida, kad intervalais tarp datų lygiai įgavo skirtingas reikšmes, ir mes esame vienas iš dviejų žinomų ( yi Ir yi+1) nustatome vidurkius, iš kurių vėliau apskaičiuojame bendrą viso analizuojamo laikotarpio vidurkį.
    Jei daroma prielaida, kad kiekviena reikšmė yi lieka nepakitęs iki kito (i+ 1)- akimirka, t.y. Jei yra žinoma tiksli lygių pasikeitimo data, tada skaičiavimą galima atlikti naudojant svertinio aritmetinio vidurkio formulę:
    ,

    kur yra laikas, per kurį lygis nepakito.

    Be vidutinio lygio dinamikos eilutėse, skaičiuojami ir kiti vidutiniai rodikliai - vidutinis eilučių lygių pokytis (pagrindinis ir grandininis metodai), vidutinis kitimo greitis.

    Pradinė padėtis reiškia absoliutų pokytį yra paskutinio pagrindinio absoliutaus pokyčio koeficientas, padalytas iš pakeitimų skaičiaus. Tai yra

    Grandinė reiškia absoliutų pasikeitimą eilutės lygiai yra visų grandinės absoliučių pokyčių sumos dalijimas iš pakeitimų skaičiaus, tai yra

    Vidutinių absoliučių pokyčių ženklas taip pat naudojamas sprendžiant apie reiškinio pokyčio pobūdį vidutiniškai: augimą, mažėjimą ar stabilumą.

    Iš pagrindinių ir grandininių absoliučių pokyčių valdymo taisyklės išplaukia, kad pagrindiniai ir grandinės vidurkio pokyčiai turi būti vienodi.

    Kartu su vidutiniu absoliučiu pokyčiu, naudojant pagrindinį ir grandininį metodą, apskaičiuojamas ir santykinis vidurkis.

    Pradinis vidutinis santykinis pokytis nustatoma pagal formulę:

    Grandinės vidutinis santykinis pokytis nustatoma pagal formulę:

    Natūralu, kad baziniai ir grandininiai vidutiniai santykiniai pokyčiai turi būti vienodi, o juos palyginus su 1 kriterijaus reikšme, daroma išvada apie reiškinio kitimo pobūdį vidutiniškai: augimas, mažėjimas ar stabilumas.
    Iš bazinio arba grandinės vidutinio santykinio pokyčio atėmus 1, atitinkamas vidutinis pokyčio greitis, pagal kurio ženklą galima spręsti ir apie tiriamo reiškinio kitimo pobūdį, kurį atspindi ši dinamikos serija.

    Sezoniniai svyravimai ir sezoniškumo indeksai.

    Sezoniniai svyravimai yra stabilūs metiniai svyravimai.

    Pagrindinis valdymo principas siekiant maksimalaus efekto yra maksimaliai padidinti pajamas ir sumažinti išlaidas. Tiriant sezoninius svyravimus, maksimalios lygties problema išsprendžiama kiekviename metų lygyje.

    Tiriant sezoninius svyravimus, išsprendžiamos dvi tarpusavyje susijusios problemos:

    1. Reiškinio raidos specifikos tarpmetinėje dinamikoje nustatymas;

    2. Sezoninių svyravimų matavimas sudarant sezoninių bangų modelį;

    Norint išmatuoti sezoninius pokyčius, paprastai skaičiuojami sezoniniai kalakutai. Paprastai jas lemia pradinių dinamikos eilučių lygčių santykis su teorinėmis lygtimis, kurios veikia kaip palyginimo pagrindas.

    Kadangi atsitiktiniai nuokrypiai yra uždėti sezoniniams svyravimams, sezoniškumo indeksai apskaičiuojami, siekiant juos pašalinti.

    Šiuo atveju kiekvienam metinio ciklo laikotarpiui apibendrinti rodikliai nustatomi vidutinių sezoninių indeksų forma:

    Vidutiniai sezoninių svyravimų indeksai nėra veikiami atsitiktinių pagrindinės raidos tendencijos nukrypimų.

    Atsižvelgiant į tendencijos pobūdį, vidutinio sezoniškumo indekso formulė gali būti tokia:

    1.Kasmetinės dinamikos serijoms su aiškiai išreikšta pagrindine vystymosi tendencija:

    2. Metinės dinamikos serijoms, kuriose nėra didėjimo ar mažėjimo tendencijos arba jos yra nereikšmingos:

    Kur yra bendras vidurkis;

    Pagrindinės tendencijos analizės metodai.

    Reiškinių raidą laikui bėgant įtakoja skirtingo pobūdžio ir įtakos stiprumo veiksniai. Kai kurie iš jų yra atsitiktinio pobūdžio, kiti turi beveik nuolatinį poveikį ir formuoja tam tikrą dinamikos vystymosi tendenciją.

    Svarbus statistikos uždavinys – identifikuoti tendencijų dinamiką serijomis, išlaisvintomis nuo įvairių atsitiktinių veiksnių įtakos. Šiuo tikslu laiko eilutės apdorojamos intervalų didinimo, slankiojo vidurkio ir analitinio niveliavimo metodais ir kt.

    Intervalinio didinimo metodas remiasi laikotarpių išplėtimu, į kurį įeina eilės dinamikos lygiai, t.y. yra su nedideliais laikotarpiais susijusių duomenų pakeitimas didesnių laikotarpių duomenimis. Tai ypač efektyvu, kai pradiniai serijos lygiai yra susiję su trumpu laikotarpiu. Pavyzdžiui, su kasdieniais įvykiais susijusių rodiklių serijos pakeičiamos serijomis, susijusiomis su savaitės, mėnesio ir pan. Tai parodys aiškiau „reiškinio vystymosi ašis“. Vidurkis, skaičiuojamas padidintais intervalais, leidžia nustatyti pagrindinės plėtros tendencijos kryptį ir pobūdį (augimo pagreitį ar sulėtėjimą).

    Slenkančio vidurkio metodas panašus į ankstesnį, tačiau šiuo atveju faktiniai lygiai pakeičiami vidutiniais lygiais, apskaičiuotais nuosekliai judantiems (slenkamiems) padidintiems intervalams, apimantiems m serijos lygiai.

    Pavyzdžiui, jei priimsime m = 3, tada pirmiausia apskaičiuojamas pirmųjų trijų serijos lygių vidurkis, tada - nuo to paties lygių skaičiaus, bet pradedant nuo antrojo, tada - pradedant nuo trečio ir t.t. Taigi vidurkis „slenka“ išilgai dinamikos eilučių, judėdamas vienu terminu. Skaičiuojama nuo m nariai, slenkamieji vidurkiai nurodo kiekvieno intervalo vidurį (centrą).

    Šis metodas pašalina tik atsitiktinius svyravimus. Jei serijoje yra sezoninė banga, ji išliks net ir išlyginus slankiojo vidurkio metodą.

    Analitinis derinimas. Siekiant pašalinti atsitiktinius svyravimus ir nustatyti tendenciją, naudojamas eilučių lygių niveliavimas naudojant analitines formules (arba analitinis niveliavimas). Jo esmė yra pakeisti empirinius (faktinius) lygius teoriniais, kurie apskaičiuojami naudojant tam tikrą lygtį, priimtą kaip matematinį tendencijų modelį, kur teoriniai lygiai laikomi laiko funkcija: . Šiuo atveju kiekvienas faktinis lygis laikomas dviejų komponentų suma: , kur yra sisteminis komponentas ir išreiškiamas tam tikra lygtimi, ir yra atsitiktinis kintamasis, sukeliantis tendencijos svyravimus.

    Analitinio derinimo užduotis yra tokia:

    1. Remiantis faktiniais duomenimis, hipotetinės funkcijos tipo, galinčio adekvačiausiai atspindėti tiriamojo rodiklio raidos tendenciją, nustatymas.

    2. Nurodytos funkcijos (lygties) parametrų radimas iš empirinių duomenų

    3. Skaičiavimas naudojant rastą teorinių (išlygintų) lygčių lygtį.

    Konkrečios funkcijos pasirinkimas, kaip taisyklė, atliekamas remiantis empirinių duomenų grafiniu vaizdu.

    Modeliai yra regresijos lygtys, kurių parametrai apskaičiuojami mažiausių kvadratų metodu

    Žemiau pateikiamos dažniausiai naudojamos regresijos lygtys laiko eilutėms derinti, nurodančios, kokias konkrečias raidos tendencijas jos tinkamiausios atspindėti.

    Norint rasti aukščiau pateiktų lygčių parametrus, yra specialūs algoritmai ir kompiuterinės programos. Visų pirma, norint rasti tiesios lygties parametrus, galima naudoti šį algoritmą:

    Jei laikotarpiai arba laiko momentai sunumeruoti taip, kad St = 0, aukščiau pateikti algoritmai bus žymiai supaprastinti ir pavirs į

    Išlyginti lygiai diagramoje bus išdėstyti vienoje tiesioje linijoje, artimiausiu atstumu nuo tikrųjų šios dinaminės serijos lygių. Kvadratų nuokrypių suma yra atsitiktinių veiksnių įtakos atspindys.

    Naudodamiesi juo apskaičiuojame lygties vidutinę (standartinę) paklaidą:

    Čia n yra stebėjimų skaičius, o m yra lygties parametrų skaičius (jų turime du - b 1 ir b 0).

    Pagrindinė tendencija (tendencija) parodo, kaip sisteminiai veiksniai įtakoja dinamikos eilės lygius, o lygių svyravimas aplink tendenciją () yra liekamųjų veiksnių įtakos matas.

    Jis taip pat naudojamas norint įvertinti naudojamo laiko eilučių modelio kokybę Fišerio F testas. Tai dviejų dispersijų santykis, būtent regresijos sukeltos dispersijos santykis, t.y. tiriamas veiksnys, į atsitiktinių priežasčių sukeltą dispersiją, t.y. likutinė dispersija:

    Išplėstoje formoje šio kriterijaus formulė gali būti pateikta taip:

    kur n yra stebėjimų skaičius, t.y. eilučių lygių skaičius,

    m yra lygties parametrų skaičius, y yra tikrasis serijos lygis,

    Sulygiuotas eilutės lygis – vidurinės eilutės lygis.

    Modelis, kuris yra sėkmingesnis už kitus, ne visada gali būti pakankamai patenkintas. Jis gali būti pripažintas tokiu tik tuo atveju, kai jo kriterijus F kerta žinomą kritinę ribą. Ši riba nustatoma naudojant F paskirstymo lenteles.

    Indeksų esmė ir klasifikacija.

    Statistikoje indeksas suprantamas kaip santykinis rodiklis, apibūdinantis reiškinio dydžio kitimą laike, erdvėje arba lyginant su kokiu nors standartu.

    Pagrindinis indekso ryšio elementas yra indeksuota vertė. Indeksuota reikšmė suprantama kaip statistinės visumos charakteristikos reikšmė, kurios kitimas yra tyrimo objektas.

    Naudojant indeksus, išsprendžiamos trys pagrindinės užduotys:

    1) kompleksinio reiškinio pokyčių įvertinimas;

    2) atskirų veiksnių įtakos kompleksinio reiškinio pokyčiams nustatymas;

    3) reiškinio masto palyginimas su praėjusio laikotarpio dydžiu, kitos teritorijos dydžiu, taip pat su standartais, planais, prognozėmis.

    Indeksai klasifikuojami pagal 3 kriterijus:

    2) pagal populiacijos elementų aprėpties laipsnį;

    3) pagal bendrųjų indeksų skaičiavimo metodus.

    Pagal turinį indeksuotus kiekius, indeksai skirstomi į kiekybinių (tūrio) rodiklių ir kokybinių rodiklių indeksus. Kiekybinių rodiklių indeksai - pramonės gaminių fizinės apimties, fizinės pardavimo apimties, darbuotojų skaičiaus ir kt. Kokybinių rodiklių indeksai - kainų, kaštų, darbo našumo, vidutinio darbo užmokesčio ir kt.

    Pagal gyventojų vienetų aprėpties laipsnį indeksai skirstomi į dvi klases: individualius ir bendruosius. Norėdami juos apibūdinti, pristatome šias konvencijas, priimtas naudojant indekso metodą:

    q- bet kurio produkto kiekis (tūris) fizine išraiška ; R- vieneto kaina; z- vieneto gamybos savikaina; t— laikas, praleistas gaminant produkto vienetą (darbo intensyvumas) ; w- gaminių gamyba verte per laiko vienetą; v- gamybos produkcija fizine išraiška per laiko vienetą; T— bendras praleistas laikas arba darbuotojų skaičius.

    Norint atskirti, kuriam periodui ar objektui priklauso indeksuoti kiekiai, įprasta atitinkamo simbolio apačioje dešinėje dėti apatinius indeksus. Taigi, pavyzdžiui, dinamikos indeksuose, kaip taisyklė, indeksas 1 naudojamas lyginamiems laikotarpiams (dabartinis, ataskaitinis) ir laikotarpiams, su kuriais lyginamas,

    Individualūs indeksai padeda apibūdinti atskirų sudėtingo reiškinio elementų pokyčius (pavyzdžiui, vienos rūšies produkto gamybos apimties pokytį). Jie atspindi santykines dinamikos vertes, įsipareigojimų vykdymą, indeksuotų verčių palyginimą.

    Nustatomas individualus produktų fizinės apimties indeksas

    Analitiniu požiūriu pateikti individualūs dinamikos indeksai yra panašūs į augimo koeficientus (normas) ir apibūdina indeksuotos vertės pokytį einamuoju laikotarpiu, palyginti su baziniu laikotarpiu, t.y. parodo, kiek kartų ji padidėjo (sumažėjo) arba kiek procentų tai yra augimas (sumažėjimas). Indekso reikšmės išreiškiamos koeficientais arba procentais.

    Bendrasis (sudėtinis) indeksas atspindi visų kompleksinio reiškinio elementų pokyčius.

    Bendras indeksas yra pagrindinė indekso forma. Jis vadinamas agregatu, nes jo skaitiklis ir vardiklis yra „agregatų“ rinkinys.

    Vidutiniai indeksai, jų apibrėžimas.

    Be suvestinių indeksų, statistikoje naudojama ir kita jų forma – svertiniai indeksai. Jų skaičiavimas imamasi tada, kai turima informacija neleidžia apskaičiuoti bendrojo suvestinio indekso. Taigi, jei nėra duomenų apie kainas, bet yra informacija apie einamojo laikotarpio gaminių savikainą ir yra žinomi kiekvienos prekės individualūs kainų indeksai, tai bendras kainų indeksas negali būti nustatytas kaip suvestinis, bet galimas apskaičiuoti jį kaip atskirų vidurkį. Lygiai taip pat, jei atskirų rūšių pagamintų produktų kiekiai nėra žinomi, bet žinomi atskiri indeksai ir bazinio laikotarpio gamybos savikaina, tai bendrasis fizinės gamybos apimties indeksas gali būti nustatytas kaip svertinis vidurkis. vertė.

    Vidutinis indeksas – Tai indeksas, apskaičiuojamas kaip atskirų indeksų vidurkis. Suvestinis indeksas yra pagrindinė bendrojo indekso forma, todėl vidutinis indeksas turi būti identiškas suvestiniam indeksui. Skaičiuojant vidutinius indeksus, naudojamos dvi vidurkių formos: aritmetinė ir harmoninė.

    Aritmetinio vidurkio indeksas yra identiškas suvestiniam indeksui, jei atskirų indeksų svoriai yra jungtinio indekso vardiklio sąlygos. Tik šiuo atveju indekso reikšmė, apskaičiuota pagal aritmetinio vidurkio formulę, bus lygi suvestiniam indeksui.