11.10.2019

Smerodajná odchýlka je definovaná ako. Výpočet smerodajnej odchýlky v programe Microsoft Excel


Múdri matematici a štatistici prišli so spoľahlivejším ukazovateľom, aj keď s trochu iným účelom - stredná lineárna odchýlka. Tento ukazovateľ charakterizuje mieru rozšírenia hodnôt súboru údajov okolo ich priemernej hodnoty.

Aby ste ukázali mieru rozptylu údajov, musíte najprv určiť, k čomu sa bude tento rozptyl považovať relatívne – zvyčajne je to priemerná hodnota. Ďalej musíte vypočítať, ako ďaleko sú hodnoty analyzovaného súboru údajov ďaleko od priemeru. Je jasné, že každá hodnota zodpovedá určitej odchýlke, ale zaujíma nás aj všeobecný odhad pokrývajúci celú populáciu. Preto sa priemerná odchýlka vypočíta pomocou vzorca zvyčajného aritmetického priemeru. Ale! Aby sme však mohli vypočítať priemer odchýlok, musia sa najprv spočítať. A ak spočítame kladné a záporné čísla, navzájom sa vyrušia a ich súčet bude mať tendenciu k nule. Aby sa tomu zabránilo, všetky odchýlky sa berú modulo, to znamená, že všetky záporné čísla sa stanú kladnými. Teraz bude priemerná odchýlka ukazovať všeobecnú mieru rozptylu hodnôt. V dôsledku toho sa priemerná lineárna odchýlka vypočíta podľa vzorca:

a je priemerná lineárna odchýlka,

X- analyzovaný ukazovateľ s pomlčkou navrchu - priemerná hodnota ukazovateľa,

n je počet hodnôt v analyzovanom súbore údajov,

operátor sumácie, dúfam, nikoho nevystraší.

Priemerná lineárna odchýlka vypočítaná pomocou špecifikovaného vzorca odráža priemernú absolútnu odchýlku od priemernej hodnoty pre túto populáciu.

Červená čiara na obrázku je priemerná hodnota. Odchýlky každého pozorovania od priemeru sú označené malými šípkami. Sú vzaté modulo a sčítané. Potom sa všetko vydelí počtom hodnôt.

Aby bol obraz úplný, treba uviesť ešte jeden príklad. Povedzme, že existuje spoločnosť, ktorá vyrába odrezky na lopaty. Každý odrezok musí byť dlhý 1,5 metra, ale čo je dôležitejšie, všetky musia byť rovnaké resp. najmenej, plus mínus 5 cm.Nedbalí robotníci však odpília buď 1,2 m alebo 1,8 m. Letní obyvatelia sú nespokojní. Riaditeľ spoločnosti sa rozhodol vykonať štatistickú analýzu dĺžky odrezkov. Vybral som 10 kusov a zmeral ich dĺžku, našiel priemer a vypočítal priemernú lineárnu odchýlku. Priemer vyšiel tak akurát - 1,5 m. Ale priemerná lineárna odchýlka bola 0,16 m. Takže sa ukazuje, že každý rez je dlhší alebo kratší ako je potrebné v priemere o 16 cm. Je o čom hovoriť s robotníkmi. V skutočnosti som nevidel reálne využitie tohto indikátora, tak som si vymyslel príklad sám. V štatistikách však takýto ukazovateľ existuje.

Disperzia

Rovnako ako priemerná lineárna odchýlka, rozptyl tiež odráža rozsah, v akom sa údaje šíria okolo priemeru.

Vzorec na výpočet rozptylu vyzerá takto:

(pre variačné série (vážený rozptyl))

(pre nezoskupené údaje (jednoduchý rozptyl))

Kde: σ 2 - disperzia, Xi– analyzujeme ukazovateľ sq (hodnota vlastnosti), – priemernú hodnotu ukazovateľa, f i – počet hodnôt v analyzovanom súbore údajov.

Rozptyl je stredná druhá mocnina odchýlok.

Najprv sa vypočíta priemer, potom sa vezme rozdiel medzi každou základnou líniou a priemerom, umocní sa na druhú, vynásobí sa frekvenciou zodpovedajúcej hodnoty funkcie, pridá sa a potom sa vydelí počtom hodnôt v populácii.

Avšak v čistej forme, ako je aritmetický priemer alebo index, rozptyl sa nepoužíva. Je to skôr pomocný a prechodný ukazovateľ, ktorý sa používa pre iné typy štatistických analýz.

Zjednodušený spôsob výpočtu rozptylu

smerodajná odchýlka

Na použitie rozptylu na analýzu údajov sa z neho vyberie druhá odmocnina. Ukazuje sa tzv smerodajná odchýlka.

Mimochodom, štandardná odchýlka sa tiež nazýva sigma - z gréckeho písmena, ktoré ju označuje.

Smerodajná odchýlka samozrejme charakterizuje aj mieru rozptylu údajov, no teraz ju (na rozdiel od rozptylu) možno porovnať s pôvodnými údajmi. Stredné štvorcové ukazovatele v štatistike spravidla poskytujú presnejšie výsledky ako lineárne. Preto priemer smerodajná odchýlka je presnejšia miera rozptylu údajov ako priemerná lineárna odchýlka.

$ X $. Najprv si pripomeňme nasledujúcu definíciu:

Definícia 1

Populácia- súbor náhodne vybraných objektov daného typu, nad ktorými sa vykonávajú pozorovania s cieľom získať konkrétne hodnoty náhodnej premennej, uskutočňované za nezmenených podmienok pri štúdiu jednej náhodnej premennej daného typu.

Definícia 2

Všeobecný rozptyl- aritmetický priemer kvadrátov odchýlok hodnôt variantu všeobecnej populácie od ich strednej hodnoty.

Nech hodnoty variantu $x_1,\ x_2,\bodky ,x_k$ majú frekvencie $n_1,\ n_2,\bodky ,n_k$. Potom sa všeobecný rozptyl vypočíta podľa vzorca:

Zvážte špeciálny prípad. Nech sú všetky varianty $x_1,\ x_2,\bodky ,x_k$ odlišné. V tomto prípade $n_1,\ n_2,\bodky ,n_k=1$. Dostávame, že v tomto prípade sa všeobecný rozptyl vypočíta podľa vzorca:

S týmto pojmom súvisí aj pojem všeobecnej smerodajnej odchýlky.

Definícia 3

Všeobecná štandardná odchýlka

\[(\sigma )_r=\sqrt(D_r)\]

Ukážkový rozptyl

Dostaneme vzorovú množinu s ohľadom na náhodnú premennú $X$. Najprv si pripomeňme nasledujúcu definíciu:

Definícia 4

Vzorová populácia-- časť vybraných objektov z bežnej populácie.

Definícia 5

Ukážkový rozptyl-- aritmetický priemer hodnôt variantu vzorky populácie.

Nech hodnoty variantu $x_1,\ x_2,\bodky ,x_k$ majú frekvencie $n_1,\ n_2,\bodky ,n_k$. Potom sa rozptyl vzorky vypočíta podľa vzorca:

Uvažujme o špeciálnom prípade. Nech sú všetky varianty $x_1,\ x_2,\bodky ,x_k$ odlišné. V tomto prípade $n_1,\ n_2,\bodky ,n_k=1$. Dostávame, že v tomto prípade sa rozptyl vzorky vypočíta podľa vzorca:

S týmto pojmom súvisí aj pojem výberová smerodajná odchýlka.

Definícia 6

Štandardná odchýlka vzorky-- druhá odmocnina zo všeobecného rozptylu:

\[(\sigma )_v=\sqrt(D_v)\]

Opravený rozptyl

Pre nájdenie korigovaného rozptylu $S^2$ je potrebné vynásobiť výberový rozptyl zlomkom $\frac(n)(n-1)$, t.j.

Tento koncept je tiež spojený s konceptom korigovanej smerodajnej odchýlky, ktorá sa nachádza podľa vzorca:

V prípade, že hodnota variantu nie je diskrétna, ale ide o intervaly, potom sa vo vzorcoch na výpočet všeobecných alebo výberových rozptylov hodnota $x_i$ berie ako hodnota stredu intervalu, ku ktorému $ x_i.$ patrí

Príklad problému na nájdenie rozptylu a štandardnej odchýlky

Príklad 1

Vzorová populácia je daná nasledujúcou distribučnou tabuľkou:

Obrázok 1.

Nájdite pre ňu výberový rozptyl, výberovú smerodajnú odchýlku, opravený rozptyl a opravenú smerodajnú odchýlku.

Na vyriešenie tohto problému najskôr vytvoríme výpočtovú tabuľku:

Obrázok 2

Hodnota $\overline(x_v)$ (priemer vzorky) v tabuľke sa zistí podľa vzorca:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Nájdite rozptyl vzorky pomocou vzorca:

Vzorová štandardná odchýlka:

\[(\sigma )_v=\sqrt(D_v)\približne 5,12\]

Opravený rozptyl:

\[(S^2=\frac(n)(n-1)D)_v=\frac(20)(19)\cdot 26.1875\približne 27.57\]

Opravená štandardná odchýlka.

smerodajná odchýlka(synonymá: smerodajná odchýlka, smerodajná odchýlka, smerodajná odchýlka; súvisiace výrazy: smerodajná odchýlka, štandardný spread) - v teórii a štatistike pravdepodobnosti najbežnejší ukazovateľ rozptylu hodnôt náhodnej premennej vo vzťahu k jej matematickému očakávaniu. Pri obmedzených poliach vzoriek hodnôt sa namiesto matematického očakávania používa aritmetický priemer súboru vzoriek.

Encyklopedický YouTube

  • 1 / 5

    Smerodajná odchýlka sa meria v jednotkách merania samotnej náhodnej premennej a používa sa pri výpočte smerodajnej chyby aritmetického priemeru, pri konštrukcii intervalov spoľahlivosti, pri štatistickom overovaní hypotéz, pri meraní lineárneho vzťahu medzi náhodnými premennými. Je definovaná ako druhá odmocnina rozptylu náhodnej premennej.

    štandardná odchýlka:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\suma _( i=1)^(n)\vľavo(x_(i)-(\bar (x))\vpravo)^(2)));)
    • Poznámka: Veľmi často sa vyskytujú nezrovnalosti v názvoch RMS (štandardná odchýlka) a SRT (štandardná odchýlka) s ich vzorcami. Napríklad v module numPy programovacieho jazyka Python je funkcia std() opísaná ako "štandardná odchýlka", zatiaľ čo vzorec odráža smerodajnú odchýlku (delenú odmocninou vzorky). V Exceli je funkcia STDEV() iná (delená druhou odmocninou z n-1).

    Smerodajná odchýlka(odhad štandardnej odchýlky náhodnej premennej X v porovnaní s jeho matematickým očakávaním na základe nezaujatého odhadu jeho rozptylu) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    Kde σ 2 (\displaystyle \sigma ^(2))- disperzia; x i (\displaystyle x_(i)) - i-ty prvok vzorky; n (\displaystyle n)- veľkosť vzorky; - aritmetický priemer vzorky:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

    V súlade s GOST R 8.736-2011 sa štandardná odchýlka vypočíta podľa druhého vzorca tejto časti. Skontrolujte svoje výsledky.

    pravidlo troch sigma

    pravidlo troch sigma (3 σ (\displaystyle 3\sigma )) - takmer všetky hodnoty normálne rozloženej náhodnej premennej ležia v intervale (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Presnejšie - približne s pravdepodobnosťou 0,9973 leží hodnota normálne rozloženej náhodnej premennej v určenom intervale (za predpokladu, že hodnota x ¯ (\displaystyle (\bar (x))) pravdivé a nezískané ako výsledok spracovania vzorky).

    Ak je skutočná hodnota x ¯ (\displaystyle (\bar (x))) neznáme, potom by ste mali použiť σ (\displaystyle \sigma ), A s. Pravidlo troch sigma sa teda transformuje na pravidlo troch s .

    Interpretácia hodnoty smerodajnej odchýlky

    Väčšia hodnota štandardnej odchýlky indikuje väčší rozptyl hodnôt v prezentovanom súbore s priemerom súboru; menšia hodnota znamená, že hodnoty v súbore sú zoskupené okolo priemernej hodnoty.

    Napríklad máme tri sady čísel: (0, 0, 14, 14), (0, 6, 8, 14) a (6, 6, 8, 8). Všetky tri súbory majú stredné hodnoty 7 a smerodajné odchýlky 7, 5 a 1. Posledný súbor má malú smerodajnú odchýlku, pretože hodnoty v súbore sú zoskupené okolo priemeru; prvá sada má najviac veľký významštandardná odchýlka - hodnoty v rámci súboru sa výrazne líšia od strednej hodnoty.

    Vo všeobecnom zmysle možno štandardnú odchýlku považovať za mieru neistoty. Napríklad vo fyzike sa štandardná odchýlka používa na určenie chyby série po sebe idúcich meraní nejakej veličiny. Táto hodnota je veľmi dôležitá na určenie hodnovernosti skúmaného javu v porovnaní s hodnotou predpovedanou teóriou: ak je stredná hodnota meraní veľmi odlišná od hodnôt predpovedaných teóriou (veľká smerodajná odchýlka), potom získané hodnoty alebo spôsob ich získania by sa mali znova skontrolovať. je identifikovaný s portfóliovým rizikom.

    Klíma

    Predpokladajme, že existujú dve mestá s rovnakou priemernou maximálnou dennou teplotou, ale jedno sa nachádza na pobreží a druhé na rovine. Je známe, že pobrežné mestá majú mnoho rôznych denných maximálnych teplôt nižšie ako vnútrozemské mestá. Preto bude smerodajná odchýlka maximálnych denných teplôt pre pobrežné mesto menšia ako pre druhé mesto, napriek tomu, že majú rovnakú priemernú hodnotu tejto hodnoty, čo v praxi znamená, že pravdepodobnosť, že Maximálna teplota vzduch každého konkrétneho dňa v roku sa bude viac líšiť od priemernej hodnoty, vyššej pre mesto nachádzajúce sa na kontinente.

    Šport

    Predpokladajme, že existuje niekoľko futbalových tímov, ktoré sú zoradené podľa určitého súboru parametrov, napríklad podľa počtu strelených a inkasovaných gólov, šancí na skórovanie atď. Je veľmi pravdepodobné, že najlepší tím v tejto skupine bude mať najlepšie hodnoty pre viac možností. Čím menšia je štandardná odchýlka tímu pre každý z prezentovaných parametrov, tým je výsledok tímu predvídateľnejší, takéto tímy sú vyrovnané. Na druhej strane tým s veľkú hodnotu smerodajná odchýlka je ťažké predpovedať výsledok, čo sa zase vysvetľuje nerovnováhou, napr. silná obrana, ale slabý útok.

    Použitie štandardnej odchýlky parametrov tímu umožňuje do určitej miery predpovedať výsledok zápasu medzi dvoma tímami, hodnotiť silné stránky a slabé stránky príkazy, a teda aj zvolené metódy boja.

    Je definovaná ako zovšeobecňujúca charakteristika veľkosti variácie znaku v súhrne. Rovná sa druhej odmocnine priemerného štvorca odchýlok jednotlivých hodnôt znaku od aritmetického priemeru, t.j. koreň a možno nájsť takto:

    1. Pre primárny riadok:

    2. Pre sériu variácií:

    Transformácia vzorca smerodajnej odchýlky ho vedie k forme vhodnejšej pre praktické výpočty:

    Priemerná smerodajná odchýlka určuje, o koľko sa v priemere konkrétne opcie odchyľujú od svojej priemernej hodnoty, a okrem toho je to absolútna miera fluktuácie vlastnosti a vyjadruje sa v rovnakých jednotkách ako opcie, a preto sa dobre interpretuje.

    Príklady zisťovania štandardnej odchýlky: ,

    Pre alternatívne funkcie vyzerá vzorec pre štandardnú odchýlku takto:

    kde p je podiel jednotiek v populácii, ktoré majú určitý atribút;

    q - podiel jednotiek, ktoré túto vlastnosť nemajú.

    Pojem strednej lineárnej odchýlky

    Priemerná lineárna odchýlka definovaný ako aritmetický priemer absolútne hodnoty odchýlky jednotlivých možností od .

    1. Pre primárny riadok:

    2. Pre sériu variácií:

    kde je súčet n súčet frekvencií variačných radov.

    Príklad nájdenia priemernej lineárnej odchýlky:

    Výhoda strednej absolútnej odchýlky ako miery rozptylu v rozsahu variácie je zrejmá, pretože táto miera je založená na zohľadnení všetkých možné odchýlky. Tento ukazovateľ má však značné nevýhody. Svojvoľné odmietnutie algebraických znakov odchýlok môže viesť k tomu, že matematické vlastnosti tohto ukazovateľa nie sú ani zďaleka elementárne. To značne komplikuje použitie strednej absolútnej odchýlky pri riešení problémov súvisiacich s pravdepodobnostnými výpočtami.

    Preto sa priemerná lineárna odchýlka ako miera variácie znaku v štatistickej praxi používa len zriedka, najmä ak súčet ukazovateľov bez zohľadnenia znamienok dáva ekonomický zmysel. S jeho pomocou sa analyzuje napríklad obrat zahraničného obchodu, zloženie zamestnancov, rytmus výroby a pod.

    odmocnina stredná štvorec

    Bola použitá RMS, napríklad na výpočet priemernej veľkosti strán n štvorcových sekcií, priemerných priemerov kmeňov, rúr atď. Rozdeľuje sa na dva typy.

    Stredná odmocnina je jednoduchá. Ak pri nahradení jednotlivých hodnôt funkcie s priemerná hodnota je potrebné udržiavať súčet druhých mocnín pôvodných hodnôt konštantný, potom bude priemer kvadratickým priemerom.

    Je to druhá odmocnina kvocientu súčtu druhých mocnín jednotlivých hodnôt vlastností delená ich počtom:

    Priemerná štvorcová váha sa vypočíta podľa vzorca:

    kde f je znak hmotnosti.

    Priemerný kubický

    Priemerná kubická použitá, napríklad pri určovaní priemernej dĺžky strany a kociek. Delí sa na dva typy.
    Priemerná kubická jednoduchá:

    Pri výpočte stredných hodnôt a rozptylu v sérii intervalového rozdelenia sú skutočné hodnoty atribútu nahradené centrálnymi hodnotami intervalov, ktoré sa líšia od priemeru aritmetické hodnoty zahrnuté v intervale. To vedie k systematickej chybe vo výpočte rozptylu. V.F. Sheppard to určil chyba vo výpočte rozptylu, spôsobená aplikáciou zoskupených údajov, je 1/12 druhej mocniny hodnoty intervalu, a to smerom nahor aj nadol vo veľkosti rozptylu.

    Sheppardov dodatok by sa malo použiť, ak je distribúcia blízko normálu, vzťahuje sa na vlastnosť s nepretržitým charakterom variácie, ktorá je založená na významnom množstve počiatočných údajov (n> 500). Na základe skutočnosti, že v mnohých prípadoch sa obe chyby, pôsobiace rôznymi smermi, navzájom kompenzujú, je niekedy možné odmietnuť predloženie zmien.

    Čím menší je rozptyl a smerodajná odchýlka, tým je populácia homogénnejšia a tým typickejší bude priemer.
    V praxi štatistiky je často potrebné porovnávať variácie rôzne znaky. Napríklad je veľmi zaujímavé porovnať rozdiely vo veku pracovníkov a ich kvalifikáciu, dĺžku služby a veľkosť mzdy, náklady a zisk, dĺžka služby a produktivita práce a pod. Pre takéto porovnania sú ukazovatele absolútnej variability charakteristík nevhodné: nemožno porovnávať variabilitu pracovných skúseností vyjadrenú v rokoch s variáciou miezd vyjadrenou v rubľoch.

    Na uskutočnenie takýchto porovnaní, ako aj porovnania fluktuácie toho istého atribútu vo viacerých populáciách s rôznym aritmetickým priemerom používame relatívny ukazovateľ variácia - variačný koeficient.

    Štrukturálne priemery

    Na charakterizáciu centrálneho trendu v štatistických rozdeleniach je často racionálne použiť spolu s aritmetickým priemerom určitú hodnotu atribútu X, ktorá vzhľadom na určité znaky jeho umiestnenia v distribučnom rade môže charakterizovať jeho úroveň.

    Toto je obzvlášť dôležité, keď extrémne hodnoty prvku v distribučnom rade majú neostré hranice. Kvôli tomuto presná definícia aritmetický priemer je spravidla nemožný alebo veľmi ťažký. V takých prípadoch priemerná úroveň možno určiť napríklad tak, že sa vezme hodnota prvku, ktorý sa nachádza v strede frekvenčného radu alebo ktorý sa v aktuálnom rade vyskytuje najčastejšie.

    Takéto hodnoty závisia iba od povahy frekvencií, t.j. od štruktúry distribúcie. Sú typické z hľadiska umiestnenia vo frekvenčnom rade, preto sa takéto hodnoty považujú za charakteristiky distribučného centra, a preto boli definované ako štrukturálne priemery. Používajú sa na štúdium vnútorná štruktúra a štruktúra série distribúcie hodnôt atribútov. Tieto ukazovatele zahŕňajú .

    Najdokonalejšou charakteristikou variácie je štandardná odchýlka, ktorá sa nazýva štandard (alebo štandardná odchýlka). Smerodajná odchýlka() sa rovná druhej odmocnine stredného štvorca odchýlok hodnôt jednotlivých znakov od aritmetického priemeru:

    Štandardná odchýlka je jednoduchá:

    Vážená štandardná odchýlka sa použije na zoskupené údaje:

    Medzi strednou kvadratickou a strednou lineárnou odchýlkou ​​v podmienkach normálneho rozdelenia platí nasledujúci vzťah: ~ 1,25.

    Štandardná odchýlka, ktorá je hlavnou absolútnou mierou variácie, sa používa pri určovaní hodnôt ordinát normálnej distribučnej krivky, vo výpočtoch súvisiacich s organizáciou pozorovania vzorky a stanovením presnosti charakteristík vzorky, ako aj pri posúdenie hraníc variácie znaku v homogénnej populácii.

    Disperzia, jej typy, smerodajná odchýlka.

    Rozptyl náhodnej premennej- miera šírenia danej náhodnej veličiny, teda jej odchýlky od matematického očakávania. V štatistike sa často používa označenie alebo. Odmocnina rozptylu sa nazýva štandardná odchýlka, smerodajná odchýlka alebo štandardné rozpätie.

    Celkový rozptyl (σ2) meria variáciu vlastnosti v celej populácii pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobili. Zároveň je vďaka metóde zoskupovania možné izolovať a merať odchýlky v dôsledku funkcie zoskupovania a odchýlky, ktoré sa vyskytujú pod vplyvom nezohľadnených faktorov.

    Medziskupinový rozptyl (σ 2 m.g) charakterizuje systematickú variáciu, t. j. rozdiely vo veľkosti študovaného znaku vznikajúce pod vplyvom znaku – faktora, ktorý je základom zoskupenia.

    smerodajná odchýlka(synonymá: smerodajná odchýlka, smerodajná odchýlka, smerodajná odchýlka; podobné výrazy: smerodajná odchýlka, štandardné rozpätie) - v teórii pravdepodobnosti a štatistike najbežnejší ukazovateľ rozptylu hodnôt náhodnej premennej vo vzťahu k jej matematickému očakávaniu. Pri obmedzených poliach vzoriek hodnôt sa namiesto matematického očakávania používa aritmetický priemer súboru vzoriek.

    Smerodajná odchýlka sa meria v jednotkách samotnej náhodnej premennej a používa sa pri výpočte štandardnej chyby aritmetického priemeru, pri konštrukcii intervalov spoľahlivosti, pri štatistickom testovaní hypotéz a pri meraní lineárneho vzťahu medzi náhodnými premennými. Je definovaná ako druhá odmocnina rozptylu náhodnej premennej.


    štandardná odchýlka:

    Smerodajná odchýlka(odhad štandardnej odchýlky náhodnej premennej X v porovnaní s jeho matematickým očakávaním na základe nezaujatého odhadu jeho rozptylu):

    kde je disperzia; — i-ty prvok vzorky; - veľkosť vzorky; - aritmetický priemer vzorky:

    Treba poznamenať, že oba odhady sú skreslené. Vo všeobecnom prípade nie je možné vytvoriť nezaujatý odhad. Odhad založený na nezaujatom odhade rozptylu je však konzistentný.

    Podstata, rozsah a postup určenia módu a mediánu.

    Okrem mocninových priemerov v štatistike sa pre relatívnu charakteristiku veľkosti premenlivého znaku a vnútornej štruktúry distribučných radov používajú štrukturálne priemery, ktoré sú reprezentované najmä režim a medián.

    Móda- Toto je najbežnejší variant série. Móda sa používa napríklad pri určovaní veľkosti oblečenia, obuvi, o ktoré je medzi kupujúcimi najväčší dopyt. Režim pre diskrétnu sériu je variant s najvyššou frekvenciou. Pri výpočte režimu pre sériu variácií intervalov musíte najprv určiť modálny interval (podľa maximálna frekvencia), a potom - hodnotu modálnej hodnoty atribútu podľa vzorca:

    - - módna hodnota

    - - dolná hranica modálneho intervalu

    - - hodnota intervalu

    - - frekvencia modálnych intervalov

    - - frekvencia intervalu pred modálom

    - - frekvencia intervalu nasledujúceho po spôsobe

    Medián - toto je hodnota funkcie, ktorá je základom hodnotenej série a rozdeľuje túto sériu na dve časti s rovnakým počtom.

    Ak chcete určiť medián v diskrétnej sérii za prítomnosti frekvencií, najskôr vypočítajte polovičný súčet frekvencií a potom určte, aká hodnota variantu na ňu pripadá. (Ak zoradený riadok obsahuje nepárny počet prvkov, potom sa stredný počet vypočíta podľa vzorca:

    M e \u003d (n (počet prvkov v súhrne) + 1) / 2,

    v prípade párneho počtu prvkov sa medián bude rovnať priemeru dvoch prvkov v strede riadku).

    Pri výpočte mediány pre sériu intervalových variácií najprv určte medián intervalu, v ktorom sa medián nachádza, a potom hodnotu mediánu podľa vzorca:

    - je požadovaný medián

    - je spodná hranica intervalu, ktorý obsahuje medián

    - - hodnota intervalu

    - - súčet frekvencií alebo počtu členov série

    Súčet akumulovaných frekvencií intervalov predchádzajúcich mediánu

    - je frekvencia stredného intervalu

    Príklad. Nájdite režim a medián.

    Riešenie:
    V tomto príklade je modálny interval vo vekovej skupine 25-30 rokov, pretože tento interval predstavuje najvyššiu frekvenciu (1054).

    Vypočítajme hodnotu režimu:

    To znamená, že modálny vek študentov je 27 rokov.

    Vypočítajte medián. Stredný interval je pri veková skupina 25-30 rokov, keďže v rámci tohto intervalu existuje variant, ktorý rozdeľuje populáciu na dve rovnaké časti (Σf i /2 = 3462/2 = 1731). Ďalej do vzorca dosadíme potrebné číselné údaje a získame hodnotu mediánu:

    To znamená, že polovica študentov má menej ako 27,4 rokov a druhá polovica má viac ako 27,4 rokov.

    Okrem režimu a mediánu je možné použiť ukazovatele, ako sú kvartily, ktoré rozdeľujú zoradené série na 4 rovnaké časti, decilov- 10 dielov a percentilov - na 100 dielov.

    Pojem selektívneho pozorovania a jeho rozsah.

    Selektívne pozorovanie platí pri aplikácii nepretržitého pozorovania fyzicky nemožné z dôvodu veľkého množstva dát resp ekonomicky nepraktické. Fyzická nemožnosť nastáva napríklad pri skúmaní tokov cestujúcich, trhových cien, rodinné rozpočty. Ekonomická neúčelnosť nastáva pri posudzovaní kvality tovaru spojeného s jeho zničením, napríklad pri ochutnávaní, skúšaní tehál na pevnosť atď.

    Štatistické jednotky vybrané na pozorovanie tvoria vzorku alebo vzorku a celé ich pole - všeobecnú populáciu (GS). V tomto prípade počet jednotiek vo vzorke označuje n a v celom HS - N. Postoj n/n nazývaná relatívna veľkosť alebo podiel vzorky.

    Kvalita výsledkov odberu vzoriek závisí od reprezentatívnosti vzorky, t. j. jej reprezentatívnosti v HS. Na zabezpečenie reprezentatívnosti vzorky je potrebné pozorovať princíp náhodného výberu jednotiek, ktorý predpokladá, že zaradenie jednotky HS do vzorky nemôže ovplyvniť žiadny iný faktor ako náhoda.

    Existuje 4 spôsoby náhodného výberu vzorkovať:

    1. Vlastne náhodne výber alebo „metóda loto“ pri priraďovaní štatistík poradové čísla, prinesené na určité predmety (napríklad sudy), ktoré sa potom zmiešajú v určitej nádobe (napríklad vo vrecku) a náhodne vyberú. V praxi sa táto metóda vykonáva pomocou generátora náhodných čísel alebo matematických tabuliek náhodných čísel.
    2. Mechanický výber, podľa ktorého každý ( N/n)-tá hodnota bežnej populácie. Ak napríklad obsahuje 100 000 hodnôt a chcete vybrať 1 000, do vzorky bude spadať každá 100 000 / 1 000 = 100. hodnota. Navyše, ak nie sú zoradené, potom sa prvý náhodne vyberie z prvej stovky a čísla ostatných budú o sto viac. Napríklad, ak bola jednotka číslo 19 prvá, potom by malo nasledovať číslo 119, potom číslo 219, potom číslo 319 atď. Ak sú jednotky populácie zoradené, potom sa najprv vyberie #50, potom #150, potom #250 atď.
    3. Vykoná sa výber hodnôt z heterogénneho dátového poľa stratifikované(stratifikovaná) metóda, kedy je všeobecná populácia predtým rozdelená do homogénnych skupín, na ktoré sa uplatňuje náhodný alebo mechanický výber.
    4. Špeciálna metóda odberu vzoriek je sériový selekcia, pri ktorej sa náhodne alebo mechanicky nevyberajú jednotlivé veličiny, ale ich série (sekvencie od nejakého čísla po nejaké za sebou), v rámci ktorej sa uskutočňuje nepretržité pozorovanie.

    Kvalita pozorovaní vzoriek závisí aj od typ odberu vzoriek: opakované alebo neopakovateľné.

    O opätovný výberštatistické hodnoty alebo ich série, ktoré spadli do vzorky, sa po použití vrátia bežnej populácii a majú šancu dostať sa do novej vzorky. Všetky hodnoty bežnej populácie majú zároveň rovnakú pravdepodobnosť, že budú zahrnuté do vzorky.

    Neopakujúci sa výber znamená, že štatistické hodnoty alebo ich série zahrnuté vo vzorke sa po použití nevracajú bežnej populácii, a preto sa zvyšuje pravdepodobnosť, že sa dostanú do ďalšej vzorky pre zostávajúce hodnoty.

    Neopakovateľné vzorkovanie poskytuje presnejšie výsledky, preto sa používa častejšie. Sú však situácie, keď sa to nedá použiť (štúdia tokov cestujúcich, dopyt spotrebiteľov atď.) a potom sa vykoná opätovný výber.

    Hraničná chyba pozorovanej vzorky, priemerná chyba vzorky, poradie, v ktorom sú vypočítané.

    Pozrime sa podrobne na vyššie uvedené metódy tvorby vzorky populácie a na chyby, ktoré v tomto prípade vznikajú. reprezentatívnosť .
    Vlastne-náhodne vzorka je založená na náhodnom výbere jednotiek zo všeobecnej populácie bez akýchkoľvek prvkov konzistentnosti. Technicky sa správny náhodný výber vykonáva žrebovaním (napríklad lotérie) alebo tabuľkou náhodných čísel.

    V skutočnosti sa náhodný výber "vo svojej čistej forme" v praxi selektívneho pozorovania používa zriedka, ale je prvým medzi ostatnými typmi výberu, implementuje základné princípy selektívneho pozorovania. Uvažujme o niektorých otázkach teórie metódy výberu vzoriek a chybového vzorca pre jednoduchú náhodnú vzorku.

    Chyba pri odbere vzoriek- ide o rozdiel medzi hodnotou parametra v bežnej populácii a jeho hodnotou vypočítanou z výsledkov výberového pozorovania. Pre priemernú kvantitatívnu charakteristiku je výberová chyba určená

    Ukazovateľ sa nazýva hraničná výberová chyba.
    Priemer vzorky je náhodná premenná, ktorá môže trvať rôzne významy v závislosti od toho, ktoré jednotky boli zahrnuté do vzorky. Preto sú výberové chyby tiež náhodné premenné a môžu nadobudnúť rôzne hodnoty. Preto sa určuje priemer možné chyby - stredná vzorkovacia chyba, ktorá závisí od:

    Veľkosť vzorky: než viac sily, čím menšia je hodnota priemernej chyby;

    Stupeň zmeny študovaného znaku: čím menšia je variácia znaku a následne aj rozptyl, tým menšia je priemerná výberová chyba.

    O náhodný opätovný výber vypočíta sa priemerná chyba:
    .
    V praxi nie je všeobecný rozptyl presne známy, ale v teória pravdepodobnosti dokázal to
    .
    Keďže hodnota pre dostatočne veľké n je blízka 1, môžeme predpokladať, že . Potom sa môže vypočítať stredná vzorkovacia chyba:
    .
    Ale v prípadoch malej vzorky (pre n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
    .

    O náhodné vzorkovanie uvedené vzorce sú opravené o hodnotu . Potom je priemerná chyba bez vzorkovania:
    A .
    Pretože je vždy menšia ako , potom je faktor () vždy menší ako 1. To znamená, že priemerná chyba pri neopakovanom výbere je vždy menšia ako pri opakovanom výbere.
    Mechanický odber vzoriek sa používa vtedy, keď je všeobecná populácia nejakým spôsobom zoradená (napríklad zoznamy voličov v abecednom poradí, telefónne čísla, čísla domov, bytov). Výber jednotiek sa vykonáva v určitom intervale, ktorý sa rovná prevrátenej hodnote percenta vzorky. Takže pri 2 % vzorke sa vyberie každých 50 jednotiek = 1 / 0,02, pri 5 % sa vyberie každá 1 / 0,05 = 20 jednotiek všeobecnej populácie.

    Počiatok sa vyberá rôznymi spôsobmi: náhodne, od stredu intervalu, so zmenou pôvodu. Hlavnou vecou je vyhnúť sa systematickým chybám. Napríklad pri 5 % vzorke, ak sa ako prvá jednotka vyberie 13., potom ďalších 33, 53, 73 atď.

    Z hľadiska presnosti je mechanický výber blízky správnemu náhodnému vzorkovaniu. Preto sa na určenie priemernej chyby mechanického odberu vzoriek používajú vzorce správneho náhodného výberu.

    O typický výber skúmaná populácia je predbežne rozdelená do homogénnych, jednotypových skupín. Napríklad pri prieskume podnikov to môžu byť odvetvia, pododvetvia, pričom sa študuje populácia – oblasti, sociálne alebo vekové skupiny. Potom sa uskutoční nezávislý výber z každej skupiny mechanickým alebo správnym náhodným spôsobom.

    Typický odber vzoriek poskytuje presnejšie výsledky ako iné metódy. Typifikácia všeobecnej populácie zabezpečuje zastúpenie každej typologickej skupiny vo vzorke, čo umožňuje vylúčiť vplyv medziskupinového rozptylu na priemernú výberovú chybu. Preto pri hľadaní chyby typickej vzorky podľa pravidla sčítania rozptylov () je potrebné brať do úvahy len priemer skupinových rozptylov. Potom je stredná vzorkovacia chyba:
    v opätovnom výbere
    ,
    s neopakujúcim sa výberom
    ,
    Kde je priemer vnútroskupinových rozptylov vo vzorke.

    Sériový (alebo vnorený) výber používa sa, keď je populácia rozdelená do sérií alebo skupín pred začiatkom výberového zisťovania. Tieto série môžu byť balíčky hotových výrobkov, študentské skupiny, tímy. Série na vyšetrenie sa vyberajú mechanicky alebo náhodne av rámci série sa vykonáva kompletný prieskum jednotiek. Preto priemerná výberová chyba závisí iba od medziskupinového (medzisériového) rozptylu, ktorý sa vypočíta podľa vzorca:

    kde r je počet vybraných sérií;
    - priemer i-tej série.

    Priemerná sériová vzorkovacia chyba sa vypočíta:

    pri opätovnom výbere:
    ,
    s jednorazovým výberom:
    ,
    kde R je celkový počet sérií.

    Kombinované výber je kombináciou uvažovaných metód výberu.

    Priemerná výberová chyba pre ktorúkoľvek metódu výberu závisí hlavne od absolútnej veľkosti vzorky a v menšej miere od percenta vzorky. Predpokladajme, že 225 pozorovaní sa uskutoční v prvom prípade z populácie 4 500 jednotiek a v druhom prípade z 225 000 jednotiek. Odchýlky v oboch prípadoch sa rovnajú 25. Potom, v prvom prípade, pri 5% výbere, bude výberová chyba:

    V druhom prípade sa pri výbere 0,1 % bude rovnať:


    Teda, s poklesom percenta vzorky o 50-krát sa výberová chyba mierne zvýšila, pretože veľkosť vzorky sa nezmenila.
    Predpokladajme, že veľkosť vzorky sa zväčší na 625 pozorovaní. V tomto prípade je vzorkovacia chyba:

    Nárast vzorky o 2,8-násobok pri rovnakej veľkosti všeobecnej populácie znižuje veľkosť výberovej chyby viac ako 1,6-krát.

    Metódy a prostriedky tvorby výberovej populácie.

    V štatistike sa používajú rôzne metódy tvorby súborov vzoriek, čo je určené cieľmi štúdie a závisí od špecifík predmetu štúdia.

    Hlavnou podmienkou vykonania výberového zisťovania je zamedzenie vzniku systematických chýb vyplývajúcich z porušenia princípu rovnosti príležitostí vstupu každej jednotky bežnej populácie do výberového súboru. Predchádzanie systematickým chybám je dosiahnuté použitím vedecky podložených metód na vytvorenie vzorky populácie.

    Existujú nasledujúce spôsoby výberu jednotiek z bežnej populácie:

    1) individuálny výber - vo vzorke sú vybrané jednotlivé jednotky;

    2) skupinový výber – do vzorky spadajú kvalitatívne homogénne skupiny alebo série skúmaných jednotiek;

    3) kombinovaný výber je kombináciou individuálneho a skupinového výberu.
    Spôsoby výberu sú určené pravidlami pre tvorbu výberovej populácie.

    Vzorka môže byť:

    • správna náhoda spočíva v tom, že vzorka vzniká ako výsledok náhodného (neúmyselného) výberu jednotlivých jednotiek z bežnej populácie. V tomto prípade sa počet jednotiek vybraných v súbore vzoriek zvyčajne určuje na základe akceptovaného podielu vzorky. Podiel vzorky je pomer počtu jednotiek vo výberovej populácii n k počtu jednotiek vo všeobecnej populácii N, t.j.
    • mechanický spočíva v tom, že výber jednotiek vo vzorke sa robí zo všeobecnej populácie, rozdelenej do rovnakých intervalov (skupín). V tomto prípade sa veľkosť intervalu vo všeobecnej populácii rovná prevrátenej hodnote podielu vzorky. Takže pri 2% vzorke sa vyberie každá 50. jednotka (1:0,02), pri 5% vzorke každá 20. jednotka (1:0,05) atď. Všeobecná populácia je teda v súlade s akceptovaným podielom selekcie akoby mechanicky rozdelená do rovnakých skupín. Z každej skupiny vo vzorke je vybratá len jedna jednotka.
    • typické - v ktorých sa všeobecná populácia najskôr rozdelí na homogénne typické skupiny. Potom sa z každej typickej skupiny uskutoční individuálny výber jednotiek do vzorky náhodnou alebo mechanickou vzorkou. Dôležitou vlastnosťou typickej vzorky je, že poskytuje presnejšie výsledky v porovnaní s inými metódami výberu jednotiek vo vzorke;
    • sériový- v ktorých je všeobecná populácia rozdelená do rovnako veľkých skupín - rad. Séria sa vyberá vo vzorovom súbore. V rámci série sa vykonáva nepretržité pozorovanie jednotiek, ktoré spadajú do série;
    • kombinované- odber vzoriek môže byť dvojstupňový. V tomto prípade je všeobecná populácia najskôr rozdelená do skupín. Potom sa vyberú skupiny a v rámci nich sa vyberú jednotlivé jednotky.

    V štatistike sa rozlišujú tieto metódy výberu jednotiek vo vzorke::

    • jednostupňový vzorka - každá vybraná jednotka je okamžite podrobená štúdiu na danom základe (v skutočnosti náhodné a sériové vzorky);
    • viacstupňový odber vzoriek - výber sa uskutočňuje zo všeobecnej populácie jednotlivých skupín a zo skupín sa vyberajú jednotlivé jednotky (typická vzorka s mechanickou metódou výberu jednotiek v populácii vzorky).

    Okrem toho existujú:

    • opätovný výber- podľa schémy vrátenej lopty. V tomto prípade sa každá jednotka alebo séria, ktorá spadla do vzorky, vráti do všeobecnej populácie, a preto má šancu byť opäť zahrnutá do vzorky;
    • neopakovateľný výber- podľa schémy nevrátenej lopty. Má presnejšie výsledky pre rovnakú veľkosť vzorky.

    Stanovenie požadovanej veľkosti vzorky (pomocou Študentovej tabuľky).

    Jedným z vedeckých princípov v teórii vzorkovania je zabezpečiť výber dostatočného počtu jednotiek. Teoreticky je potreba dodržania tohto princípu prezentovaná v dôkazoch limitných teorémov teórie pravdepodobnosti, ktoré umožňujú stanoviť, koľko jednotiek by sa malo vybrať zo všeobecnej populácie, aby to bolo dostatočné a zabezpečilo reprezentatívnosť vzorky.

    Zníženie štandardnej chyby vzorky a následne zvýšenie presnosti odhadu je vždy spojené so zvýšením veľkosti vzorky, preto je potrebné už vo fáze organizovania pozorovania vzorky rozhodnúť aká by mala byť veľkosť vzorky, aby sa zabezpečila požadovaná presnosť výsledkov pozorovania. Výpočet požadovanej veľkosti vzorky sa zostavuje pomocou vzorcov odvodených zo vzorcov pre hraničné výberové chyby (A), ktoré zodpovedajú jednému alebo druhému typu a metóde výberu. Takže pre náhodnú opakovanú veľkosť vzorky (n) máme:

    Podstatou tohto vzorca je, že pri náhodnom opätovnom výbere požadovaného počtu je veľkosť vzorky priamo úmerná druhej mocnine koeficientu spoľahlivosti (t2) a rozptyl variačného znaku (~2) a je nepriamo úmerný druhej mocnine medznej výberovej chyby (~2). Najmä zdvojnásobením medznej chyby možno štvornásobne znížiť požadovanú veľkosť vzorky. Z troch parametrov dva (t a?) nastavuje výskumník.

    Zároveň výskumník Pre účely výberového zisťovania by sa mala rozhodnúť otázka: v akej kvantitatívnej kombinácii je lepšie tieto parametre zahrnúť, aby bol poskytnutý optimálny variant? V jednom prípade môže byť spokojnejší so spoľahlivosťou získaných výsledkov (t) ako s mierou presnosti (?), v druhom - naopak. Problém týkajúci sa hodnoty hraničnej výberovej chyby je ťažšie vyriešiť, keďže výskumník tento ukazovateľ v štádiu návrhu výberového pozorovania nemá, preto je v praxi zvykom nastaviť hraničnú výberovú chybu, napr. pravidlo, do 10 % očakávanej priemernej úrovne vlastnosti. K stanoveniu predpokladanej priemernej úrovne možno pristupovať rôznymi spôsobmi: použitím údajov z podobných predchádzajúcich prieskumov alebo použitím údajov z rámca vzorkovania a odberom malej pilotnej vzorky.

    Najťažšie na stanovenie pri navrhovaní pozorovania vzorky je tretí parameter vo vzorci (5.2) – rozptyl populácie vzorky. V tomto prípade je potrebné využiť všetky informácie dostupné vyšetrovateľovi, získané z predchádzajúcich podobných a pilotných prieskumov.

    Otázka definície Požadovaná veľkosť vzorky sa skomplikuje, ak výberové zisťovanie zahŕňa štúdium viacerých znakov výberových jednotiek. V tomto prípade sú priemerné úrovne každej z charakteristík a ich variácie spravidla rôzne, a preto je možné rozhodnúť, ktorému rozptylu ktorej z charakteristík dať prednosť, len s prihliadnutím na účel a ciele prieskum.

    Pri navrhovaní výberového pozorovania sa predpokladá vopred stanovená hodnota prípustnej výberovej chyby v súlade s cieľmi konkrétnej štúdie a pravdepodobnosťou záverov na základe výsledkov pozorovania.

    Vo všeobecnosti vám vzorec pre hraničnú chybu priemernej hodnoty vzorky umožňuje určiť:

    Veľkosť možných odchýlok ukazovateľov všeobecnej populácie od ukazovateľov výberovej populácie;

    Požadovaná veľkosť vzorky poskytujúca požadovanú presnosť, v ktorej hranice možnej chyby nepresiahnu určitú špecifikovanú hodnotu;

    Pravdepodobnosť, že chyba vo vzorke bude mať daný limit.

    Študentská distribúcia v teórii pravdepodobnosti je to jednoparametrová rodina absolútne spojitých rozdelení.

    Rad dynamiky (interval, moment), uzavretie radu dynamiky.

    Séria dynamiky- sú to hodnoty štatistických ukazovateľov, ktoré sú prezentované v určitej chronologickej postupnosti.

    Každý časový rad obsahuje dve zložky:

    1) ukazovatele časových období (roky, štvrťroky, mesiace, dni alebo dátumy);

    2) ukazovatele charakterizujúce skúmaný objekt za časové obdobia alebo zodpovedajúce dátumy, ktoré sa nazývajú úrovne série.

    Úrovne série sú vyjadrené absolútne aj priemerné alebo relatívne hodnoty. V závislosti od povahy ukazovateľov sa vytvárajú dynamické série absolútnych, relatívnych a priemerných hodnôt. Dynamické rady relatívnych a priemerných hodnôt sú postavené na základe derivačných radov absolútnych hodnôt. Existujú intervalové a momentové série dynamiky.

    Dynamický intervalový rad obsahuje hodnoty ukazovateľov za určité časové obdobia. V intervalových radoch možno hladiny sčítať, čím sa získa objem javu za dlhšie obdobie, alebo takzvané akumulované súčty.

    Dynamické momentové série odráža hodnoty ukazovateľov v určitom časovom okamihu (dátum času). V momentových radoch môže výskumníka zaujímať iba rozdiel javov, odrážajúci zmenu úrovne radu medzi určitými dátumami, keďže súčet úrovní tu nemá skutočný obsah. Tu sa nepočítajú kumulatívne súčty.

    Najdôležitejšou podmienkou pre správnu konštrukciu dynamických radov je porovnateľnosť úrovní radov týkajúcich sa rôznych období. Úrovne by mali byť prezentované v homogénnych množstvách, mala by existovať rovnaká úplnosť pokrytia rôznych častí javu.

    Za účelom Aby sa predišlo skresleniu skutočnej dynamiky, v štatistickej štúdii (uzávierka časového radu) sa vykonávajú predbežné výpočty, ktoré predchádzajú štatistickej analýze časového radu. Uzávierkou časových radov sa rozumie spojenie dvoch alebo viacerých radov do jedného radu, ktorých úrovne sú vypočítané podľa inej metodiky alebo nezodpovedajú územným hraniciam a pod. Uzavretie série dynamiky môže tiež znamenať redukciu absolútnych úrovní série dynamiky na spoločný základ, čím sa eliminuje nekompatibilita úrovní série dynamiky.

    Koncept porovnateľnosti časových radov, koeficienty, rast a tempo rastu.

    Séria dynamiky- sú to série štatistických ukazovateľov charakterizujúcich vývoj prírodných a spoločenských javov v čase. Štatistické zbierky vydané Štátnym štatistickým výborom Ruska obsahujú veľké množstvo časových radov v tabuľkovej forme. Séria dynamiky umožňuje odhaliť zákonitosti vývoja skúmaných javov.

    Časové rady obsahujú dva typy ukazovateľov. Časové ukazovatele(roky, štvrťroky, mesiace atď.) alebo časové body (na začiatku roka, na začiatku každého mesiaca atď.). Indikátory úrovne riadkov. Ukazovatele úrovní časových radov možno vyjadriť v absolútnych hodnotách (výroba produktu v tonách alebo rubľoch), relatívnych hodnotách (podiel mestskej populácie v %) a priemerných hodnotách (priemerné mzdy pracovníkov v priemysle podľa rokov atď.). V tabuľkovej forme obsahuje časový rad dva stĺpce alebo dva riadky.

    Správna konštrukcia časových radov zahŕňa splnenie niekoľkých požiadaviek:

    1. všetky ukazovatele série dynamiky musia byť vedecky podložené, spoľahlivé;
    2. ukazovatele série dynamiky by mali byť porovnateľné v čase, t.j. musia byť vypočítané pre rovnaké časové obdobia alebo v rovnakých dátumoch;
    3. ukazovatele množstva dynamiky by mali byť porovnateľné na celom území;
    4. ukazovatele radu dynamiky by mali byť obsahovo porovnateľné, t.j. vypočítané podľa jednotnej metodiky rovnakým spôsobom;
    5. ukazovatele série dynamiky by mali byť porovnateľné v rámci celého radu uvažovaných fariem. Všetky ukazovatele série dynamiky by sa mali uvádzať v rovnakých meracích jednotkách.

    Štatistické ukazovatele môže charakterizovať buď výsledky skúmaného procesu za určité časové obdobie, alebo stav skúmaného javu v určitom časovom bode, t.j. indikátory môžu byť intervalové (periodické) a okamžité. V súlade s tým môže byť spočiatku séria dynamiky buď intervalová alebo momentová. Momentový rad dynamiky zase môže byť s rovnakými a nerovnakými časovými intervalmi.

    Počiatočnú sériu dynamiky je možné previesť na sériu priemerných hodnôt a sériu relatívnych hodnôt (reťazec a základňa). Takéto časové rady sa nazývajú odvodené časové rady.

    Spôsob výpočtu priemernej úrovne v rade dynamiky je odlišný, vzhľadom na typ série dynamiky. Pomocou príkladov zvážte typy časových radov a vzorce na výpočet priemernej úrovne.

    Absolútne zisky (Δy) ukazujú, o koľko jednotiek sa zmenila následná úroveň série v porovnaní s predchádzajúcou (stĺpec 3. - reťazové absolútne prírastky) alebo v porovnaní s počiatočnou úrovňou (stĺpec 4. - základné absolútne prírastky). Výpočtové vzorce možno zapísať takto:

    S poklesom absolútnych hodnôt série dôjde k „zníženiu“, „poklesu“, resp.

    Ukazovatele absolútneho rastu naznačujú, že napríklad v roku 1998 vzrástla produkcia produktu „A“ oproti roku 1997 o 4 000 ton a v porovnaní s rokom 1994 o 34 000 ton; pre ostatné roky, pozri tabuľku. 11,5 g. 3 a 4.

    Rastový faktor ukazuje, koľkokrát sa úroveň série zmenila v porovnaní s predchádzajúcou (stĺpec 5 - reťazcové faktory rastu alebo poklesu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 6 - základné faktory rastu alebo poklesu). Výpočtové vzorce možno zapísať takto:

    Miery rastu ukázať, o koľko percent je ďalšia úroveň série v porovnaní s predchádzajúcou (stĺpec 7 - reťazcové miery rastu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 8 - základné miery rastu). Výpočtové vzorce možno zapísať takto:

    Takže napríklad v roku 1997 bol objem výroby produktu „A“ v porovnaní s rokom 1996 105,5 % (

    Tempo rastu ukazujú, o koľko percent sa úroveň vykazovaného obdobia zvýšila v porovnaní s predchádzajúcim (stĺpec 9 - reťazcové miery rastu) alebo v porovnaní s počiatočnou úrovňou (stĺpec 10 - základné miery rastu). Výpočtové vzorce možno zapísať takto:

    T pr \u003d Tp - 100 % alebo T pr \u003d absolútny nárast / úroveň predchádzajúceho obdobia * 100 %

    Takže napríklad v roku 1996 sa v porovnaní s rokom 1995 vyrobil produkt „A“ viac o 3,8 % (103,8 % - 100 %) alebo (8:210) x 100 % a v porovnaní s rokom 1994. - o 9 % ( 109 % - 100 %).

    Ak sa absolútne úrovne v rade znížia, potom bude miera nižšia ako 100 % a podľa toho bude miera poklesu (miera rastu so znamienkom mínus).

    Absolútna hodnota nárastu o 1 %.(stĺpec 11) ukazuje, koľko kusov sa musí vyrobiť v danom období, aby sa úroveň predchádzajúceho obdobia zvýšila o 1 %. V našom príklade bolo v roku 1995 potrebné vyrobiť 2,0 tisíc ton a v roku 1998 - 2,3 tisíc ton, t.j. oveľa väčší.

    Existujú dva spôsoby, ako určiť veľkosť absolútnej hodnoty 1% rastu:

    Vydeľte úroveň predchádzajúceho obdobia 100;

    Vydeľte absolútne miery rastu reťazca zodpovedajúcimi mierami rastu reťazca.

    Absolútna hodnota 1% nárastu =

    V dynamike, najmä počas dlhého obdobia, je dôležité spoločne analyzovať tempo rastu s obsahom každého percentuálneho nárastu alebo poklesu.

    Upozorňujeme, že uvažovaná metodika analýzy časových radov je použiteľná pre časové rady, ktorých úrovne sú vyjadrené v absolútnych hodnotách (t, tisíc rubľov, počet zamestnancov atď.), ako aj pre časové rady úrovne ktoré sú vyjadrené v relatívnych ukazovateľoch (% šrotu, % popolnatosti uhlia atď.) alebo priemernými hodnotami (priemerná úroda v c/ha, priemerné mzdy atď.).

    Spolu s uvažovanými analytickými ukazovateľmi vypočítanými pre každý rok v porovnaní s predchádzajúcou alebo počiatočnou úrovňou je pri analýze časového radu potrebné vypočítať priemerné analytické ukazovatele za obdobie: priemerná úroveň radu, priemerný ročný absolútny nárast (pokles) a priemernú ročnú mieru rastu a mieru rastu.

    Metódy na výpočet priemernej úrovne série dynamiky boli diskutované vyššie. V intervalovom rade dynamiky, ktorý uvažujeme, sa priemerná úroveň radu vypočíta podľa vzorca jednoduchého aritmetického priemeru:

    Priemerná ročná produkcia produktu za roky 1994-1998. predstavoval 218,4 tisíc ton.

    Priemerný ročný absolútny prírastok sa tiež vypočíta podľa vzorca jednoduchého aritmetického priemeru:

    Ročné absolútne prírastky sa v priebehu rokov pohybovali od 4 do 12 tisíc ton (pozri gr. 3) a priemerný ročný nárast produkcie za obdobie 1995 - 1998. predstavoval 8,5 tisíc ton.

    Metódy na výpočet priemernej miery rastu a priemernej miery rastu si vyžadujú podrobnejšie zváženie. Zoberme si ich na príklade ročných ukazovateľov úrovne radu uvedených v tabuľke.

    Stredná úroveň rozsahu dynamiky.

    Rad dynamiky (alebo časový rad)- sú to číselné hodnoty určitého štatistického ukazovateľa v po sebe nasledujúcich okamihoch alebo časových úsekoch (t. j. usporiadané v chronologickom poradí).

    Nazývajú sa číselné hodnoty konkrétneho štatistického ukazovateľa, ktorý tvorí sériu dynamiky úrovne čísla a zvyčajne sa označuje písmenom r. Prvý člen série y 1 nazývané počiatočné resp základná línia, a posledný y n - Konečný. Momenty alebo časové obdobia, na ktoré sa úrovne vzťahujú, sú označené t.

    Dynamické rady sú spravidla prezentované vo forme tabuľky alebo grafu a časová mierka je zostavená pozdĺž osi x t a pozdĺž zvislej osi - mierka úrovní série r.

    Priemerné ukazovatele série dynamiky

    Každú sériu dynamiky možno považovať za určitý súbor nčasovo premenné ukazovatele, ktoré možno zhrnúť ako priemery. Takéto zovšeobecnené (priemerné) ukazovatele sú potrebné najmä pri porovnávaní zmien jedného alebo druhého ukazovateľa v rôznych obdobiach, v rôznych krajinách atď.

    Všeobecnou charakteristikou série dynamiky môže byť predovšetkým priemerná úroveň riadkov. Spôsob výpočtu priemernej úrovne závisí od toho, či ide o momentový rad alebo intervalový (dobový) rad.

    Kedy interval radu, jeho priemernú úroveň určíme vzorcom jednoduchého aritmetického priemeru úrovní radu, t.j.

    =
    Ak je k dispozícii moment riadok obsahujúci núrovne ( y1, y2, …, yn) s rovnakými intervalmi medzi dátumami (časovými bodmi), potom je možné takýto rad jednoducho previesť na sériu priemerných hodnôt. Zároveň ukazovateľ (úroveň) na začiatku každého obdobia je súčasne ukazovateľom na konci predchádzajúceho obdobia. Potom je možné vypočítať priemernú hodnotu ukazovateľa pre každé obdobie (interval medzi dátumami) ako polovičný súčet hodnôt pri na začiatku a na konci obdobia, t.j. Ako . Počet takýchto priemerov bude . Ako už bolo spomenuté, pre série priemerov sa priemerná úroveň vypočítava z aritmetického priemeru.

    Preto môžeme napísať:
    .
    Po prevode čitateľa dostaneme:
    ,

    Kde Y1 A Yn- prvá a posledná úroveň série; Yi- stredné úrovne.

    Tento priemer je v štatistike známy ako priemerne chronologicky pre momentové série. Tento názov dostala od slova „cronos“ (čas, lat.), keďže sa vypočítava z ukazovateľov, ktoré sa časom menia.

    V prípade nerovnakého intervaloch medzi dátumami možno chronologický priemer pre momentovú sériu vypočítať ako aritmetický priemer priemerných hodnôt úrovní pre každú dvojicu momentov, vážený vzdialenosťami (časovými intervalmi) medzi dátumami, t.j.
    .
    V tomto prípade predpokladá sa, že v intervaloch medzi dátumami nadobudli úrovne rôzne hodnoty a sme z dvoch známych ( yi A yi+1) určíme priemery, z ktorých potom vypočítame celkový priemer za celé analyzované obdobie.
    Ak sa predpokladá, že každá hodnota yi zostáva nezmenená až do nasledujúceho (i+ 1)- moment, t.j. je známy presný dátum zmeny úrovní, potom je možné vykonať výpočet pomocou vzorca váženého aritmetického priemeru:
    ,

    kde je čas, počas ktorého hladina zostala nezmenená.

    Okrem priemernej úrovne v rade dynamiky sa počítajú aj ďalšie priemerné ukazovatele - priemerná zmena úrovní radu (základné a reťazové metódy), priemerná miera zmeny.

    Základná hodnota znamená absolútnu zmenu je podiel poslednej základnej absolútnej zmeny vydelený počtom zmien. Teda

    Reťaz znamená absolútnu zmenu úrovne radu je kvocient delenia súčtu všetkých reťazových absolútnych zmien počtom zmien, t.j.

    Podľa znamienka priemerných absolútnych zmien sa priemerne posudzuje aj charakter zmeny javu: rast, pokles alebo stabilita.

    Z pravidla pre riadenie základných a reťazových absolútnych zmien vyplýva, že základné a reťazové priemerné zmeny sa musia rovnať.

    Spolu s priemernou absolútnou zmenou sa pomocou základnej a reťazovej metódy vypočíta aj priemerná relatívna.

    Základná priemerná relatívna zmena sa určuje podľa vzorca:

    Reťaz znamená relatívnu zmenu sa určuje podľa vzorca:

    Prirodzene, základné a reťazové priemerné relatívne zmeny by mali byť rovnaké a ich porovnaním s hodnotou kritéria 1 sa urobí záver o povahe priemernej zmeny javu: rast, pokles alebo stabilita.
    Odčítaním 1 od základnej alebo reťazovej priemernej relatívnej zmeny, zodpovedajúca priemerná miera zmeny, podľa znaku ktorého možno posudzovať aj povahu zmeny skúmaného javu, ktorá sa odráža v tomto rade dynamiky.

    Sezónne výkyvy a sezónne indexy.

    Sezónne výkyvy sú stabilné medziročné výkyvy.

    Základným princípom riadenia pre dosiahnutie maximálneho efektu je maximalizácia príjmov a minimalizácia nákladov. Štúdiom sezónnych výkyvov sa rieši problém maximálnej rovnice v každej úrovni roka.

    Pri štúdiu sezónnych výkyvov sa riešia dve vzájomne súvisiace úlohy:

    1. Identifikácia špecifík vývoja javu v medziročnej dynamike;

    2. Meranie sezónnych výkyvov s konštrukciou modelu sezónnych vĺn;

    Na meranie sezónnosti sa zvyčajne počítajú sezónne morky. Vo všeobecnosti sú určené pomerom pôvodných rovníc série dynamiky k teoretickým rovniciam, ktoré slúžia ako základ pre porovnanie.

    Keďže náhodné odchýlky sa prekrývajú so sezónnymi výkyvmi, indexy sezónnosti sa spriemerujú, aby sa odstránili.

    V tomto prípade sa pre každé obdobie ročného cyklu stanovujú zovšeobecnené ukazovatele vo forme priemerných sezónnych indexov:

    Priemerné indexy sezónnych výkyvov sú bez vplyvu náhodných odchýlok hlavného vývojového trendu.

    V závislosti od povahy trendu môže mať vzorec pre priemerný index sezónnosti tieto formy:

    1.Pre série medziročnej dynamiky s výrazným hlavným vývojovým trendom:

    2. Pre sériu medziročnej dynamiky, v ktorej neexistuje stúpajúci alebo klesajúci trend alebo je nevýznamná:

    Kde je všeobecný priemer;

    Metódy analýzy hlavného trendu.

    Vývoj javov v čase ovplyvňujú faktory rôzneho charakteru a sily vplyvu. Niektoré z nich sú náhodného charakteru, iné pôsobia takmer neustále a tvoria určitý vývojový trend v rade dynamiky.

    Dôležitou úlohou štatistiky je identifikovať trend v sérii dynamiky, oslobodený od pôsobenia rôznych náhodných faktorov. Na tento účel sa časové rady spracovávajú metódami zväčšovania intervalov, kĺzavého priemeru a analytického zarovnania atď.

    Metóda intervalového zhrubnutia je založená na zväčšovaní časových úsekov, ktoré zahŕňajú úrovne série dynamiky, t.j. je nahradenie údajov týkajúcich sa malých časových období údajmi z väčších období. Je to obzvlášť účinné, keď sú počiatočné úrovne série na krátke časové obdobia. Napríklad série ukazovateľov súvisiacich s dennými udalosťami sú nahradené sériami týkajúcimi sa týždenných, mesačných atď. To sa ukáže jasnejšie "Os rozvoja fenoménu". Priemer vypočítaný na základe zväčšených intervalov umožňuje identifikovať smer a charakter (zrýchlenie alebo spomalenie rastu) hlavného vývojového trendu.

    metóda kĺzavého priemeru podobne ako v predchádzajúcom, ale v tomto prípade sú skutočné hladiny nahradené priemernými hladinami vypočítanými pre postupne sa pohybujúce (kĺzavé) rozšírené intervaly pokrývajúce múrovne riadkov.

    Napríklad ak bude prijatý m=3, potom sa najprv vypočíta priemer prvých troch úrovní série, potom - z rovnakého počtu úrovní, ale počnúc od druhej v rade, potom - od tretej atď. Priemer teda akoby „kĺzal“ po sérii dynamiky a pohyboval sa po dobu jedného obdobia. Vypočítané z mčleny kĺzavých priemerov sa vzťahujú na stred (stred) každého intervalu.

    Táto metóda eliminuje iba náhodné výkyvy. Ak má séria sezónnu vlnu, zostane po vyhladení metódou kĺzavého priemeru.

    Analytické zarovnanie. Aby sa eliminovali náhodné výkyvy a identifikoval trend, úrovne radov sú zarovnané podľa analytických vzorcov (alebo analytického zarovnania). Jej podstatou je nahradenie empirických (aktuálnych) úrovní teoretickými, ktoré sú vypočítané podľa určitej rovnice branej ako matematický model trendu, kde teoretické úrovne sú uvažované ako funkcia času: . V tomto prípade sa každá aktuálna úroveň považuje za súčet dvoch zložiek: , kde je systematická zložka a je vyjadrená určitou rovnicou a je náhodnou premennou, ktorá spôsobuje výkyvy okolo trendu.

    Úloha analytického zarovnania je nasledovná:

    1. Na základe aktuálnych údajov určiť typ hypotetickej funkcie, ktorá môže čo najprimeranejšie odrážať trend vývoja skúmaného ukazovateľa.

    2. Nájdenie parametrov zadanej funkcie (rovnice) z empirických údajov

    3. Výpočet podľa nájdenej rovnice teoretických (nivelizovaných) úrovní.

    Voľba konkrétnej funkcie sa spravidla uskutočňuje na základe grafického znázornenia empirických údajov.

    Modely sú regresné rovnice, ktorých parametre sú vypočítané metódou najmenších štvorcov

    Nižšie sú uvedené najbežnejšie používané regresné rovnice na vyrovnávanie časových radov, ktoré naznačujú, ktoré vývojové trendy sú najvhodnejšie na vyjadrenie.

    Na nájdenie parametrov vyššie uvedených rovníc existujú špeciálne algoritmy a počítačové programy. Najmä na nájdenie parametrov rovnice priamky možno použiť nasledujúci algoritmus:

    Ak sú periódy alebo časové okamihy očíslované tak, že sa získa St = 0, potom sa vyššie uvedené algoritmy výrazne zjednodušia a zmenia sa na

    Zarovnané úrovne na grafe budú umiestnené na jednej priamke prechádzajúcej v najbližšej vzdialenosti od skutočných úrovní tohto dynamického radu. Súčet štvorcových odchýlok je odrazom vplyvu náhodných faktorov.

    S jeho pomocou vypočítame priemernú (štandardnú) chybu rovnice:

    Tu n je počet pozorovaní a m je počet parametrov v rovnici (máme dva z nich - b 1 a b 0).

    Hlavný trend (trend) ukazuje, ako systematické faktory ovplyvňujú úrovne série dynamiky, a kolísanie úrovní okolo trendu () slúži ako miera vplyvu reziduálnych faktorov.

    Používa sa aj na posúdenie kvality použitého modelu časových radov Fisherov F test. Je to pomer dvoch rozptylov, a to pomer rozptylu spôsobeného regresiou, t.j. študovaný faktor, k rozptylu spôsobenému náhodnými príčinami, t.j. zvyškový rozptyl:

    V rozšírenej forme môže byť vzorec pre toto kritérium reprezentovaný takto:

    kde n je počet pozorovaní, t.j. počet úrovní riadkov,

    m je počet parametrov v rovnici, y je skutočná úroveň radu,

    Zarovnaná úroveň riadku, - priemerná úroveň riadku.

    Úspešnejší ako ostatné, model nemusí byť vždy dostatočne uspokojivý. Môže byť uznaná ako taká, iba ak kritérium F pre ňu prekročí určitú kritickú hranicu. Táto hranica je nastavená pomocou F distribučných tabuliek.

    Podstata a klasifikácia indexov.

    Index v štatistike sa chápe ako relatívny ukazovateľ, ktorý charakterizuje zmenu veľkosti javu v čase, priestore alebo v porovnaní s akoukoľvek normou.

    Hlavným prvkom vzťahu indexu je indexovaná hodnota. Indexovanou hodnotou sa rozumie hodnota znaku štatistickej populácie, ktorej zmena je predmetom skúmania.

    Indexy slúžia na tri hlavné účely:

    1) posúdenie zmien v komplexnom jave;

    2) určenie vplyvu jednotlivých faktorov na zmenu komplexného javu;

    3) porovnanie veľkosti nejakého javu s veľkosťou minulého obdobia, veľkosťou iného územia, ako aj s normami, plánmi, prognózami.

    Indexy sú klasifikované podľa 3 kritérií:

    2) podľa stupňa pokrytia zložiek obyvateľstva;

    3) metódami výpočtu všeobecných indexov.

    Podľa obsahu indexovaných hodnôt sa indexy delia na indexy kvantitatívnych (objemových) ukazovateľov a indexy kvalitatívnych ukazovateľov. Indexy kvantitatívnych ukazovateľov - indexy fyzického objemu priemyselnej výroby, fyzického objemu tržieb, počtu a pod. Indexy kvalitatívnych ukazovateľov - indexy cien, nákladov, produktivity práce, priemerných miezd a pod.

    Podľa stupňa pokrytia jednotiek obyvateľstva sú indexy rozdelené do dvoch tried: individuálne a všeobecné. Na ich charakterizáciu uvádzame nasledujúce konvencie prijaté v praxi aplikácie indexovej metódy:

    q- množstvo (objem) akéhokoľvek naturálneho produktu ; R- jednotková cena výroby; z- jednotkové výrobné náklady; t- čas strávený výrobou jednotky výstupu (náročnosť práce) ; w- produkcia v hodnote za jednotku času; v- výstup vo fyzickom vyjadrení za jednotku času; T- celkový čas strávený alebo počet zamestnancov.

    Aby bolo možné rozlíšiť, ku ktorému obdobiu alebo objektu patria indexované hodnoty, je zvykom vkladať dolné indexy za príslušný symbol vpravo dole. Napríklad v indexoch dynamiky sa spravidla pre porovnávané (bežné, vykazované) obdobia používa dolný index 1 a pre obdobia, s ktorými sa porovnáva,

    Jednotlivé indexy slúžia na charakterizáciu zmeny jednotlivých prvkov komplexného javu (napríklad zmena objemu produkcie jedného druhu produktu). Predstavujú relatívne hodnoty dynamiky, plnenia záväzkov, porovnanie indexovaných hodnôt.

    Stanoví sa individuálny index fyzického objemu produkcie

    Z analytického hľadiska sú uvedené jednotlivé indexy dynamiky podobné koeficientom (tempám) rastu a charakterizujú zmenu indexovanej hodnoty v aktuálnom období oproti základnej, t. j. ukazujú, koľkokrát sa zvýšila (poklesla). ) alebo o koľko percent ide o rast (pokles). Hodnoty indexu sú vyjadrené v koeficientoch alebo percentách.

    Všeobecný (zložený) index odráža zmenu všetkých prvkov komplexného javu.

    Súhrnný index je základná forma indexu. Nazýva sa agregát, pretože jeho čitateľ a menovateľ sú množinou „agregátov“

    Priemerné indexy, ich definícia.

    Okrem agregovaných indexov sa v štatistike používa ich ďalšia forma – indexy váženého priemeru. K ich výpočtu sa pristupuje vtedy, keď dostupné informácie neumožňujú vypočítať všeobecný súhrnný index. Ak teda neexistujú údaje o cenách, ale existujú informácie o nákladoch na produkty v bežnom období a sú známe individuálne cenové indexy pre každý produkt, potom všeobecný cenový index nemožno určiť ako súhrnný, ale je možné vypočítať ako priemer jednotlivých. Rovnako, ak nie sú známe množstvá jednotlivých vyrobených výrobkov, ale sú známe jednotlivé indexy a výrobné náklady základného obdobia, potom je možné celkový index fyzického objemu výroby určiť ako vážený priemer.

    Priemerný index - Toto index vypočítaný ako priemer jednotlivých indexov. Agregovaný index je základnou formou všeobecného indexu, preto musí byť priemerný index totožný s agregovaným indexom. Pri výpočte priemerných indexov sa používajú dve formy priemerov: aritmetické a harmonické.

    Index aritmetického priemeru je totožný so súhrnným indexom, ak váhy jednotlivých indexov sú členmi menovateľa súhrnného indexu. Iba v tomto prípade sa hodnota indexu vypočítaná vzorcom aritmetického priemeru bude rovnať súhrnnému indexu.