11.10.2019

يتم تعريف الانحراف المعياري على أنه. حساب الانحراف المعياري في Microsoft Excel


توصل علماء الرياضيات والإحصائيون الحكيمون إلى مؤشر أكثر موثوقية، على الرغم من أن الغرض مختلف قليلاً - متوسط ​​الانحراف الخطي. يصف هذا المؤشر مقياس تشتت قيم مجموعة البيانات حول قيمتها المتوسطة.

من أجل إظهار مقياس تبعثر البيانات، يجب عليك أولاً تحديد ما سيتم حساب هذا تبعثره - عادةً ما تكون هذه هي القيمة المتوسطة. بعد ذلك، تحتاج إلى حساب مدى ابتعاد قيم مجموعة البيانات التي تم تحليلها عن المتوسط. ومن الواضح أن كل قيمة تقابل قيمة انحراف معينة، لكننا مهتمون بالتقييم الشامل الذي يشمل جميع السكان. ولذلك، يتم حساب متوسط ​​الانحراف باستخدام صيغة المتوسط ​​الحسابي المعتادة. لكن! ولكن من أجل حساب متوسط ​​الانحرافات، يجب أولا إضافتها. وإذا جمعنا أعدادًا موجبة وسالبة، فسوف يلغي كل منهما الآخر وسيصبح مجموعهما صفرًا. لتجنب ذلك، يتم أخذ جميع الانحرافات modulo، أي أن جميع الأرقام السالبة تصبح موجبة. الآن سيُظهر متوسط ​​الانحراف مقياسًا عامًا لانتشار القيم. ونتيجة لذلك، سيتم حساب متوسط ​​الانحراف الخطي باستخدام الصيغة:

أ- متوسط ​​الانحراف الخطي،

س– المؤشر الذي تم تحليله، مع شرطة أعلاه – متوسط ​​قيمة المؤشر،

ن- عدد القيم في مجموعة البيانات التي تم تحليلها،

آمل ألا يخيف عامل الجمع أحداً.

يعكس متوسط ​​الانحراف الخطي المحسوب باستخدام الصيغة المحددة متوسط ​​الانحراف المطلق عن متوسط ​​القيمة لمجموعة سكانية معينة.

في الصورة، الخط الأحمر هو القيمة المتوسطة. تتم الإشارة إلى انحرافات كل ملاحظة عن المتوسط ​​بواسطة أسهم صغيرة. يتم أخذها modulo وتلخيصها. ثم يتم تقسيم كل شيء على عدد القيم.

لإكمال الصورة، علينا أن نعطي مثالا. لنفترض أن هناك شركة تنتج قصاصات للمجارف. يجب أن يبلغ طول كل قطعة 1.5 مترًا، ولكن الأهم من ذلك، يجب أن تكون جميعها متماثلة أو وفقًا لـ على الأقل، زائد أو ناقص 5 سم ومع ذلك، فإن العمال المهملين إما قطعوا 1.2 م أو 1.8 م، سكان الصيف غير راضين. قرر مدير الشركة إجراء تحليل إحصائي لطول القصاصات. قمت باختيار 10 قطع وقمت بقياس طولها، ووجدت المتوسط ​​وحسبت متوسط ​​الانحراف الخطي. تبين أن المتوسط ​​هو بالضبط ما هو مطلوب - 1.5 م، لكن متوسط ​​الانحراف الخطي كان 0.16 م، لذلك اتضح أن كل قطعة أطول أو أقصر من المطلوب بمتوسط ​​16 سم، هناك شيء يمكن الحديث عنه مع عمال . في الواقع، لم أر أي استخدام حقيقي لهذا المؤشر، لذلك توصلت إلى مثال بنفسي. ومع ذلك، هناك مثل هذا المؤشر في الإحصاءات.

تشتت

مثل متوسط ​​الانحراف الخطي، يعكس التباين أيضًا مدى انتشار البيانات حول القيمة المتوسطة.

تبدو صيغة حساب التباين كما يلي:

(بالنسبة لسلسلة التباين (التباين الموزون))

(للبيانات غير المجمعة (تباين بسيط))

حيث: σ 2 - التشتت، شي- نقوم بتحليل المؤشر المربع (قيمة الخاصية)، - متوسط ​​قيمة المؤشر، f i - عدد القيم في مجموعة البيانات التي تم تحليلها.

التشتت هو متوسط ​​مربع الانحرافات.

أولاً، يتم حساب متوسط ​​القيمة، ثم يتم أخذ الفرق بين كل قيمة أصلية ومتوسطة، ويتم تربيعه وضربه في تكرار قيمة السمة المقابلة، ثم إضافته ثم قسمته على عدد القيم في المجتمع.

ومع ذلك، في شكل نقي، مثل الوسط الحسابي، أو الفهرس، ولا يتم استخدام التباين. إنه بالأحرى مؤشر مساعد ومتوسط ​​يستخدم لأنواع أخرى من التحليل الإحصائي.

طريقة مبسطة لحساب التباين

الانحراف المعياري

لاستخدام التباين لتحليل البيانات، يتم أخذ الجذر التربيعي للتباين. اتضح ما يسمى الانحراف المعياري.

بالمناسبة، يُسمى الانحراف المعياري أيضًا سيجما - من الحرف اليوناني الذي يشير إليه.

من الواضح أن الانحراف المعياري يميز أيضًا مقياس تشتت البيانات، ولكن الآن (على عكس التباين) يمكن مقارنته بالبيانات الأصلية. كقاعدة عامة، تعطي قياسات الجذر التربيعي المتوسط ​​في الإحصائيات نتائج أكثر دقة من النتائج الخطية. ولذلك فإن المتوسط الانحراف المعياريهو مقياس أكثر دقة لتشتت البيانات من انحراف المتوسط ​​الخطي.

$X$. في البداية، دعونا نذكر التعريف التالي:

التعريف 1

سكان-- مجموعة من الكائنات المختارة عشوائيا من نوع معين، والتي يتم إجراء الملاحظات عليها من أجل الحصول على قيم محددة لمتغير عشوائي، يتم إجراؤها في ظل ظروف ثابتة عند دراسة متغير عشوائي واحد من نوع معين.

التعريف 2

التباين العام- الوسط الحسابي لمربعات انحرافات قيم متغير السكان عن قيمتها المتوسطة.

دع قيم الخيار $x_1,\ x_2,\dots ,x_k$ لها ترددات $n_1,\n_2,\dots ,n_k$ على التوالي. ثم يتم حساب التباين العام باستخدام الصيغة:

دعونا نفكر حالة خاصة. اجعل جميع الخيارات $x_1,\ x_2,\dots ,x_k$ مختلفة. في هذه الحالة $n_1,\ n_2,\dots ,n_k=1$. ونجد أنه في هذه الحالة يتم حساب التباين العام باستخدام الصيغة:

ويرتبط هذا المفهوم أيضًا بمفهوم الانحراف المعياري العام.

التعريف 3

الانحراف المعياري العام

\[(\sigma )_g=\sqrt(D_g)\]

تباين العينة

دعونا نعطي عينة من السكان فيما يتعلق بالمتغير العشوائي $X$. في البداية، دعونا نذكر التعريف التالي:

التعريف 4

عينة السكان- جزء من كائنات مختارة من عامة السكان.

التعريف 5

تباين العينة- الوسط الحسابي لقيم مجتمع العينة.

دع قيم الخيار $x_1,\ x_2,\dots ,x_k$ لها ترددات $n_1,\n_2,\dots ,n_k$ على التوالي. ثم يتم حساب تباين العينة باستخدام الصيغة:

دعونا نفكر في حالة خاصة. اجعل جميع الخيارات $x_1,\ x_2,\dots ,x_k$ مختلفة. في هذه الحالة $n_1,\ n_2,\dots ,n_k=1$. ونجد أنه في هذه الحالة يتم حساب تباين العينة بالصيغة:

ويرتبط أيضًا بهذا المفهوم مفهوم الانحراف المعياري للعينة.

التعريف 6

الانحراف المعياري للعينة- الجذر التربيعي للتباين العام :

\[(\سيجما )_в=\sqrt(D_в)\]

التباين المصحح

للعثور على التباين المصحح $S^2$، من الضروري ضرب تباين العينة بالكسر $\frac(n)(n-1)$، أي

ويرتبط هذا المفهوم أيضًا بمفهوم الانحراف المعياري المصحح والذي يوجد بالصيغة:

في الحالة التي تكون فيها قيم المتغيرات غير منفصلة، ​​ولكنها تمثل فترات، ثم في صيغ حساب التباينات العامة أو تباينات العينة، يتم اعتبار قيمة $x_i$ هي قيمة منتصف الفاصل الزمني إلى الذي ينتمي إليه $x_i.$.

مثال على مشكلة إيجاد التباين والانحراف المعياري

مثال 1

يتم تحديد مجتمع العينة من خلال جدول التوزيع التالي:

الصورة 1.

دعونا نجد لها تباين العينة والانحراف المعياري للعينة والتباين المصحح والانحراف المعياري المصحح.

لحل هذه المشكلة، نقوم أولاً بعمل جدول حسابي:

الشكل 2.

تم العثور على القيمة $\overline(x_в)$ (متوسط ​​العينة) في الجدول بواسطة الصيغة:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15.25\]

دعونا نجد تباين العينة باستخدام الصيغة:

الانحراف المعياري للعينة:

\[(\sigma )_в=\sqrt(D_в)\حوالي 5.12\]

التباين المصحح:

\[(S^2=\frac(n)(n-1)D)_в=\frac(20)(19)\cdot 26.1875\حوالي 27.57\]

تصحيح الانحراف المعياري.

الانحراف المعياري(مرادفات: الانحراف المعياري, الانحراف المعياري, انحراف مربع; المصطلحات ذات الصلة: الانحراف المعياري, انتشار قياسي) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعا لتشتت قيم المتغير العشوائي نسبة إلى توقعه الرياضي. مع صفائف محدودة من عينات القيم، بدلا من التوقع الرياضي، يتم استخدام الوسط الحسابي لمجموعة العينات.

يوتيوب الموسوعي

  • 1 / 5

    يتم قياس الانحراف المعياري بوحدات قياس المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند بناء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.

    الانحراف المعياري:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • ملاحظة: في كثير من الأحيان توجد اختلافات في أسماء MSD (الانحراف الجذري لمتوسط ​​المربع) وSTD (الانحراف المعياري) مع صيغهما. على سبيل المثال، في وحدة numPy في لغة البرمجة Python، توصف الدالة std() بأنها "الانحراف المعياري"، بينما تعكس الصيغة الانحراف المعياري (القسمة على جذر العينة). في Excel، تختلف الدالة STANDARDEVAL() (القسمة على جذر n-1).

    الانحراف المعياري(تقدير الانحراف المعياري للمتغير العشوائي سمقارنة بتوقعها الرياضي المبني على تقدير غير متحيز لتباينها) س (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    أين σ 2 (\displaystyle \sigma ^(2))- تشتت؛ س ط (\displaystyle x_(i)) - أناالعنصر الرابع من الاختيار؛ ن (\displaystyle n)- حجم العينة؛ - الوسط الحسابي للعينة:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. ومع ذلك، فإن التقدير المبني على تقدير التباين غير المتحيز ثابت.

    وفقًا لـ GOST R 8.736-2011، يتم حساب الانحراف المعياري باستخدام الصيغة الثانية من هذا القسم. يرجى التحقق من النتائج.

    قاعدة ثلاثة سيجما

    قاعدة ثلاثة سيجما (3 σ (\displaystyle 3\سيجما )) - تقع جميع قيم المتغير العشوائي الموزع بشكل طبيعي تقريبًا في الفاصل الزمني (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). بشكل أكثر دقة - مع احتمال تقريبي 0.9973، تقع قيمة المتغير العشوائي الموزع بشكل طبيعي في الفاصل الزمني المحدد (شريطة أن تكون القيمة س ¯ (\displaystyle (\bar (x)))صحيح، ولم يتم الحصول عليه نتيجة لمعالجة العينات).

    إذا كانت القيمة الحقيقية س ¯ (\displaystyle (\bar (x)))غير معروف، فلا يجب عليك استخدامه σ (\displaystyle \sigma )، أ س. وهكذا تتحول قاعدة الثلاثة سيجما إلى قاعدة الثلاثة س .

    تفسير قيمة الانحراف المعياري

    تُظهر قيمة الانحراف المعياري الأكبر انتشارًا أكبر للقيم في المجموعة المقدمة مع متوسط ​​قيمة المجموعة؛ وبالتالي، فإن القيمة الأصغر توضح أن القيم الموجودة في المجموعة مجمعة حول القيمة المتوسطة.

    على سبيل المثال، لدينا ثلاث مجموعات أرقام: (0، 0، 14، 14)، (0، 6، 8، 14) و (6، 6، 8، 8). جميع المجموعات الثلاث لها قيم متوسطة تساوي 7، والانحرافات المعيارية، على التوالي، تساوي 7 و 5 و 1. المجموعة الأخيرة لها انحراف معياري صغير، حيث يتم تجميع القيم في المجموعة حول القيمة المتوسطة؛ المجموعة الأولى لديها أكبر قيمة للانحراف المعياري - القيم داخل المجموعة تتباعد بشكل كبير عن القيمة المتوسطة.

    وبمعنى عام، يمكن اعتبار الانحراف المعياري مقياسا لعدم اليقين. على سبيل المثال، في الفيزياء، يتم استخدام الانحراف المعياري لتحديد خطأ سلسلة من القياسات المتعاقبة لبعض الكمية. هذه القيمة مهمة جداً لتحديد مدى معقولية الظاهرة قيد الدراسة بالمقارنة مع القيمة التي تنبأت بها النظرية: إذا كان متوسط ​​قيمة القياسات يختلف كثيراً عن القيم التي تنبأت بها النظرية (انحراف معياري كبير)، ثم يجب إعادة فحص القيم التي تم الحصول عليها أو طريقة الحصول عليها. المحددة بمخاطر المحفظة.

    مناخ

    لنفترض أن هناك مدينتين لهما نفس متوسط ​​درجة الحرارة اليومية القصوى، لكن إحداهما تقع على الساحل والأخرى على السهل. من المعروف أن المدن الواقعة على الساحل لديها العديد من درجات الحرارة القصوى المختلفة أثناء النهار والتي تكون أقل من المدن الواقعة في الداخل. ولذلك فإن الانحراف المعياري لدرجات الحرارة القصوى اليومية لمدينة ساحلية سيكون أقل منه لمدينة ثانية، على الرغم من أن متوسط ​​قيمتها هو نفسه، وهو ما يعني عمليا أن احتمال ذلك درجة الحرارة القصوىسيختلف الهواء في كل يوم محدد من السنة بقوة أكبر عن متوسط ​​القيمة، وهو أعلى بالنسبة لمدينة تقع داخل القارة.

    رياضة

    لنفترض أن هناك العديد من فرق كرة القدم التي يتم تقييمها وفقًا لمجموعة معينة من المعايير، على سبيل المثال، عدد الأهداف المسجلة والمستقبلة، وفرص التسجيل، وما إلى ذلك. من المرجح أن أفضل فريق في هذه المجموعة سيحصل على أفضل القيموفقا لمزيد من المعلمات. كلما كان الانحراف المعياري للفريق أصغر لكل من المعلمات المقدمة، كلما كانت نتيجة الفريق أكثر قابلية للتنبؤ بها؛ مثل هذه الفرق متوازنة. ومن ناحية أخرى، شارك الفريق مع قيمة عظيمةالانحراف المعياري يصعب التنبؤ بالنتيجة، وهو ما يفسر بدوره عدم التوازن، على سبيل المثال، دفاع قويولكن بهجوم ضعيف.

    إن استخدام الانحراف المعياري لمعلمات الفريق يجعل من الممكن، بدرجة أو بأخرى، التنبؤ بنتيجة المباراة بين فريقين، وتقييم نقاط القوة ونقاط القوة. الجوانب الضعيفةالأوامر، وبالتالي الأساليب المختارة للنضال.

    يتم تعريفها على أنها خاصية عامة لحجم الاختلاف في السمة في المجموع. وهو يساوي الجذر التربيعي لمتوسط ​​الانحراف المربع للقيم الفردية للسمة من الوسط الحسابي، أي. يمكن العثور على جذر مثل هذا:

    1. بالنسبة للصف الأساسي:

    2. بالنسبة لسلسلة التباين:

    إن تحويل صيغة الانحراف المعياري يجعلها في شكل أكثر ملاءمة للحسابات العملية:

    متوسط الانحراف المعياري يحدد مقدار انحراف الخيارات المحددة في المتوسط ​​عن متوسط ​​قيمتها، وهو أيضًا مقياس مطلق لتغير إحدى الخصائص ويتم التعبير عنه بنفس وحدات الخيارات، وبالتالي يتم تفسيره جيدًا.

    أمثلة لإيجاد الانحراف المعياري: ,

    بالنسبة للخصائص البديلة، تبدو صيغة الانحراف المعياري كما يلي:

    حيث p هي نسبة الوحدات في السكان التي لها خاصية معينة؛

    q هي نسبة الوحدات التي لا تمتلك هذه الخاصية.

    مفهوم متوسط ​​الانحراف الخطي

    متوسط ​​الانحراف الخطييتم تعريفه على أنه الوسط الحسابي القيم المطلقةانحرافات الخيارات الفردية عن .

    1. بالنسبة للصف الأساسي:

    2. بالنسبة لسلسلة التباين:

    حيث يكون المبلغ n مجموع ترددات سلسلة الاختلاف.

    مثال لإيجاد متوسط ​​الانحراف الخطي:

    إن ميزة متوسط ​​الانحراف المطلق كمقياس للتشتت على مدى التباين واضحة، لأن هذا المقياس يعتمد على مراعاة جميع الانحرافات المحتملة. لكن هذا المؤشر له عيوب كبيرة. يمكن أن يؤدي الرفض التعسفي لعلامات الانحرافات الجبرية إلى حقيقة أن الخصائص الرياضية لهذا المؤشر بعيدة كل البعد عن كونها أولية. وهذا يجعل من الصعب جدًا استخدام متوسط ​​الانحراف المطلق عند حل المشكلات التي تتضمن حسابات احتمالية.

    لذلك، نادرًا ما يستخدم متوسط ​​الانحراف الخطي كمقياس لتغير إحدى الخصائص في الممارسة الإحصائية، أي عندما يكون جمع المؤشرات دون مراعاة العلامات أمرًا منطقيًا من الناحية الاقتصادية. وبمساعدتها، على سبيل المثال، يتم تحليل معدل دوران التجارة الخارجية، وتكوين العمال، وإيقاع الإنتاج، وما إلى ذلك.

    يعني مربع

    تم تطبيق متوسط ​​المربع، على سبيل المثال، لحساب متوسط ​​حجم جوانب المقاطع المربعة n، ومتوسط ​​أقطار الجذوع والأنابيب وما إلى ذلك. وهي مقسمة إلى نوعين.

    مربع متوسط ​​بسيط. إذا، عند استبدال القيم الفردية للخاصية بـ متوسط ​​القيمةإذا كان من الضروري الحفاظ على مجموع مربعات القيم الأصلية ثابتًا، فسيكون المتوسط ​​قيمة متوسطة تربيعية.

    وهو الجذر التربيعي لحاصل قسمة مجموع مربعات قيم السمات الفردية على عددها:

    يتم حساب مربع المتوسط ​​​​المرجح باستخدام الصيغة:

    حيث f هي علامة الوزن.

    مكعب متوسط

    ينطبق متوسط ​​مكعبعلى سبيل المثال، عند تحديد متوسط ​​طول الضلع والمكعبات. وهي مقسمة إلى نوعين.
    متوسط ​​مكعب بسيط:

    عند حساب القيم المتوسطة والتشتت في سلسلة التوزيع الفاصلة، يتم استبدال القيم الحقيقية للسمة بالقيم المركزية للفواصل الزمنية، والتي تختلف عن المتوسط القيم الحسابيةالمدرجة في الفاصل الزمني. وهذا يؤدي إلى خطأ منهجي عند حساب التباين. ف.ف. قرر شيبارد ذلك خطأ في حساب التباين، الناتجة عن استخدام البيانات المجمعة، هي 1/12 من مربع الفاصل الزمني في كلا الاتجاهين العلوي والسفلي للتباين.

    تعديل شيبارديجب استخدامه إذا كان التوزيع قريبًا من الطبيعي، ويتعلق بخاصية ذات طبيعة تباين مستمرة، ويستند إلى كمية كبيرة من البيانات الأولية (ن > 500). ومع ذلك، استنادا إلى حقيقة أنه في بعض الحالات كلا الخطأين، اللذين يتصرفان في اتجاهات مختلفة، يعوضان بعضهما البعض، فمن الممكن في بعض الأحيان رفض إدخال التصحيحات.

    كيف قيمة أقلالتباين والانحراف المعياري، كلما كان المجتمع أكثر تجانسا وكان المتوسط ​​أكثر نموذجية.
    في ممارسة الإحصاء، غالبًا ما تكون هناك حاجة لمقارنة الاختلافات علامات مختلفة. على سبيل المثال، من المفيد جدًا مقارنة الاختلافات في أعمار العاملين ومؤهلاتهم ومدة الخدمة وحجمهم أجوروالتكلفة والأرباح ومدة الخدمة وإنتاجية العمل وما إلى ذلك. بالنسبة لمثل هذه المقارنات، فإن مؤشرات التباين المطلق للخصائص غير مناسبة: فمن المستحيل مقارنة تقلب خبرة العمل، المعبر عنها بالسنوات، مع تباين الأجور، المعبر عنها بالروبل.

    لإجراء مثل هذه المقارنات، وكذلك مقارنات التباين لنفس الخاصية في العديد من المجموعات السكانية ذات المتوسطات الحسابية المختلفة، يتم استخدامها المؤشر النسبيالاختلاف - معامل الاختلاف.

    المتوسطات الهيكلية

    لتوصيف الاتجاه المركزي في التوزيعات الإحصائية، غالبًا ما يكون من العقلاني استخدام قيمة معينة للخاصية X، جنبًا إلى جنب مع الوسط الحسابي، والتي، بسبب ميزات معينة لموقعها في سلسلة التوزيع، يمكن أن تميز مستواها.

    وهذا مهم بشكل خاص عندما تكون القيم المتطرفة للخاصية في سلسلة التوزيع لها حدود غير واضحة. ونتيجة لهذا تعريف دقيقعادة ما يكون الوسط الحسابي مستحيلا أو صعبا للغاية. في حالات كهذه مستوى متوسطيمكن تحديدها من خلال أخذ، على سبيل المثال، قيمة الميزة الموجودة في منتصف سلسلة التردد أو التي تحدث غالبًا في السلسلة الحالية.

    وتعتمد هذه القيم فقط على طبيعة الترددات، أي على بنية التوزيع. وهي نموذجية في موقعها في سلسلة من الترددات، ولذلك تعتبر هذه القيم من خصائص مركز التوزيع ولذلك حصلت على تعريف المتوسطات الهيكلية. يتم استخدامها للدراسة الهيكل الداخليوهيكل سلسلة توزيع قيم السمات. وتشمل هذه المؤشرات ما يلي:

    إن الخاصية المثالية للتباين هي متوسط ​​انحراف المربع، والذي يسمى المعيار (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي لمتوسط ​​الانحراف المربع للقيم الفردية للسمة من الوسط الحسابي:

    الانحراف المعياري بسيط:

    يتم تطبيق الانحراف المعياري المرجح على البيانات المجمعة:

    بين جذر متوسط ​​المربعات ومتوسط ​​الانحرافات الخطية في ظل ظروف التوزيع الطبيعي تحدث النسبة التالية: ~ 1.25.

    يُستخدم الانحراف المعياري، باعتباره المقياس المطلق الرئيسي للتباين، في تحديد القيم الإحداثية لمنحنى التوزيع الطبيعي، وفي الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة، وكذلك في تقييم حدود الاختلاف في خاصية ما في مجتمع متجانس.

    التشتت، أنواعه، الانحراف المعياري.

    تباين متغير عشوائي- مقياس لانتشار متغير عشوائي معين، أي انحرافه عن التوقع الرياضي. في الإحصائيات، غالبًا ما يتم استخدام التدوين أو. الجذر التربيعيويسمى التباين الانحراف المعياري، أو الانحراف المعياري، أو الانتشار المعياري.

    التباين الكلي (σ 2) يقيس تباين السمة بأكملها تحت تأثير جميع العوامل التي تسببت في هذا التباين. وفي الوقت نفسه، وبفضل طريقة التجميع، من الممكن تحديد وقياس التباين الناتج عن خاصية التجميع والتباين الناشئ تحت تأثير العوامل غير المحسوبة.

    التباين بين المجموعات (σ 2 م.ج) يميز التباين المنهجي، أي الاختلافات في قيمة الخاصية التي تتم دراستها والتي تنشأ تحت تأثير الخاصية - العامل الذي يشكل أساس المجموعة.

    الانحراف المعياري(مرادفات: الانحراف المعياري، الانحراف المعياري، الانحراف المربع؛ المصطلحات ذات الصلة: الانحراف المعياري، الانتشار المعياري) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعًا لتشتت قيم المتغير العشوائي بالنسبة لتوقعه الرياضي. مع صفائف محدودة من عينات القيم، بدلا من التوقع الرياضي، يتم استخدام الوسط الحسابي لمجموعة العينات.

    يتم قياس الانحراف المعياري بوحدات المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند إنشاء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.


    الانحراف المعياري:

    الانحراف المعياري(تقدير الانحراف المعياري للمتغير العشوائي سبالنسبة إلى توقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

    أين التشتت؟ — أناالعنصر الرابع من الاختيار؛ - حجم العينة؛ - الوسط الحسابي للعينة:

    وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. ومع ذلك، فإن التقدير المبني على تقدير التباين غير المتحيز ثابت.

    جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

    بالإضافة إلى متوسطات القوة في الإحصائيات، للتوصيف النسبي لقيمة الخصائص المتغيرة والبنية الداخلية لسلسلة التوزيع، يتم استخدام المتوسطات الهيكلية، والتي يتم تمثيلها بشكل أساسي بواسطة الموضة والوسيط.

    موضة- هذا هو الشكل الأكثر شيوعًا في السلسلة. تُستخدم الموضة، على سبيل المثال، في تحديد مقاسات الملابس والأحذية الأكثر طلبًا بين المشترين. وضع السلسلة المنفصلة هو الوضع ذو التردد الأعلى. عند حساب الوضع لسلسلة تباين الفاصل الزمني، يجب عليك أولاً تحديد الفاصل الزمني المشروط (بواسطة الحد الأقصى للتردد)، ثم - قيمة القيمة المشروطة للسمة وفقًا للصيغة:

    - - قيمة الموضة

    - — الحد الأدنى للفاصل الزمني

    - — حجم الفاصل الزمني

    - — تردد الفاصل الزمني

    - — تردد الفترة التي تسبق الشكل

    - — تردد الفترة التي تلي الشكل

    الوسيط -هذه هي قيمة السمة التي تكمن وراء السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين.

    لتحديد الوسيط في سلسلة منفصلة في وجود ترددات، قم أولاً بحساب نصف مجموع الترددات ثم حدد قيمة المتغير التي تقع عليه. (إذا كانت السلسلة التي تم فرزها تحتوي على عدد فردي من الميزات، فسيتم حساب الرقم المتوسط ​​باستخدام الصيغة:

    M e = (n (إجمالي عدد الميزات) + 1)/2,

    وفي حالة وجود عدد زوجي من المعالم، سيكون الوسيط مساويًا لمتوسط ​​المعلمتين الموجودتين في منتصف الصف).

    عند الحساب الوسطاءبالنسبة لسلسلة تباين الفاصل الزمني، حدد أولاً الفاصل الزمني المتوسط ​​الذي يقع فيه الوسيط، ثم حدد قيمة الوسيط باستخدام الصيغة:

    - - الوسيط المطلوب

    - - الحد الأدنى للفاصل الزمني الذي يحتوي على الوسيط

    - — حجم الفاصل الزمني

    - — مجموع التكرارات أو عدد مصطلحات السلسلة

    مجموع التكرارات المتراكمة للفترات التي تسبق الوسيط

    - — تردد الفاصل الزمني المتوسط

    مثال. العثور على الوضع والوسيط.

    حل:
    في هذا المثال، يقع الفاصل المشروط ضمن الفئة العمرية 25-30 عامًا، نظرًا لأن هذا الفاصل الزمني له أعلى تكرار (1054).

    دعونا نحسب حجم الوضع:

    وهذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

    دعونا نحسب الوسيط. الفاصل الزمني المتوسط ​​موجود الفئة العمرية 25-30 سنة، حيث يوجد ضمن هذه الفترة خيار يقسم السكان إلى قسمين متساويين (Σf i /2 = 3462/2 = 1731). بعد ذلك، نستبدل البيانات الرقمية اللازمة في الصيغة ونحصل على القيمة المتوسطة:

    وهذا يعني أن نصف الطلاب أقل من 27.4 عامًا، والنصف الآخر أكبر من 27.4 عامًا.

    بالإضافة إلى المنوال والوسيط، يمكن استخدام مؤشرات مثل الربعيات، وتقسيم السلسلة المرتبة إلى 4 أجزاء متساوية، أعشارية- 10 أجزاء ونسب مئوية - لكل 100 جزء.

    مفهوم المراقبة الانتقائية ونطاقها.

    مراقبة انتقائيةينطبق عند استخدام المراقبة المستمرة مستحيل جسديابسبب كمية كبيرة من البيانات أو غير مجدية اقتصاديا. وتحدث الاستحالة المادية، على سبيل المثال، عند دراسة تدفقات الركاب، وأسعار السوق، ميزانيات الأسرة. يحدث عدم الجدوى الاقتصادية عند تقييم جودة السلع المرتبطة بتدميرها، على سبيل المثال، التذوق، واختبار الطوب للقوة، وما إلى ذلك.

    تشكل الوحدات الإحصائية المختارة للمراقبة إطار أخذ العينات أو العينة، وتشكل مجموعتها بأكملها المجتمع العام (GS). في هذه الحالة، يتم الإشارة إلى عدد الوحدات في العينة بواسطة ن، وفي النظام المنسق بأكمله - ن. سلوك ن / نيسمى الحجم النسبي أو نسبة العينة.

    تعتمد جودة نتائج مراقبة العينة على تمثيلية العينة، أي على مدى تمثيلها في قطاع غزة. لضمان تمثيل العينة، فمن الضروري الامتثال مبدأ الاختيار العشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الصدفة.

    موجود 4 طرق للاختيار العشوائيلأخذ عينات:

    1. في الواقع عشوائيةالاختيار أو "طريقة اليانصيب"، عندما يتم تعيين قيم إحصائية الأرقام التسلسلية، يتم وضعها على أشياء معينة (على سبيل المثال، البراميل)، والتي يتم خلطها بعد ذلك في بعض الحاويات (على سبيل المثال، في كيس) واختيارها بشكل عشوائي. ومن الناحية العملية، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائية أو جداول رياضية للأرقام العشوائية.
    2. ميكانيكيالاختيار وفقا لكل ( لا/ن)-القيمة الرابعة لعامة السكان. على سبيل المثال، إذا كانت تحتوي على 100000 قيمة، وتحتاج إلى تحديد 1000، فسيتم تضمين كل 100000 / 1000 = القيمة رقم 100 في العينة. علاوة على ذلك، إذا لم يتم ترتيبهم، فسيتم اختيار الأول عشوائيًا من المائة الأولى، وستكون أعداد الآخرين أعلى بمائة. فمثلاً، إذا كانت الوحدة الأولى رقم 19، فيجب أن تكون الوحدة التالية رقم 119، ثم رقم 219، ثم رقم 319، وهكذا. وفي حالة ترتيب الوحدات السكانية، يتم اختيار رقم 50 أولاً، ثم رقم 150، ثم رقم 250، وهكذا.
    3. يتم اختيار القيم من مجموعة بيانات غير متجانسة طبقيةالطريقة (الطبقية)، عندما يتم تقسيم السكان أولاً إلى مجموعات متجانسة يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
    4. وهناك طريقة خاصة لأخذ العينات مسلسلالاختيار، حيث لا يختارون بشكل عشوائي أو ميكانيكي القيم الفردية، ولكن سلسلتهم (تسلسلات من رقم ما إلى رقم ما على التوالي)، والتي يتم من خلالها إجراء المراقبة المستمرة.

    تعتمد جودة ملاحظات العينة أيضًا على نوع العينة: معادأو غير قابل للتكرار.

    في إعادة الاختياريتم إرجاع القيم الإحصائية أو سلاسلها المتضمنة في العينة إلى عامة السكان بعد استخدامها، مع وجود فرصة لإدراجها في عينة جديدة. علاوة على ذلك، فإن جميع القيم في المجتمع لها نفس احتمالية إدراجها في العينة.

    اختيار لا يتكرريعني أن القيم الإحصائية أو سلسلتها المتضمنة في العينة لا تعود إلى عموم السكان بعد استخدامها، وبالتالي بالنسبة للقيم المتبقية للأخيرة يزداد احتمال إدراجها في العينة التالية.

    ويعطي أخذ العينات غير المتكررة نتائج أكثر دقة، لذلك يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب، وطلب المستهلكين، وما إلى ذلك) ثم يتم إجراء الاختيار المتكرر.

    الحد الأقصى لخطأ أخذ عينات المراقبة، ومتوسط ​​خطأ أخذ العينات، وإجراءات حسابها.

    دعونا نفكر بالتفصيل في طرق تكوين عينة السكان المذكورة أعلاه والأخطاء التي تنشأ عند القيام بذلك. التمثيل .
    عشوائية بشكل صحيحتعتمد عملية أخذ العينات على اختيار وحدات من المجتمع بشكل عشوائي دون أي عناصر منهجية. من الناحية الفنية، يتم الاختيار العشوائي الفعلي عن طريق القرعة (على سبيل المثال، اليانصيب) أو باستخدام جدول أرقام عشوائية.

    ونادرا ما يستخدم الاختيار العشوائي السليم “في شكله النقي” في ممارسة الملاحظة الانتقائية، ولكنه الأصل بين أنواع الاختيار الأخرى، فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض الأسئلة المتعلقة بنظرية طريقة أخذ العينات وصيغة الخطأ لعينة عشوائية بسيطة.

    أخذ العينات التحيزهو الفرق بين قيمة المعلمة في عموم السكان وقيمتها المحسوبة من نتائج ملاحظة العينة. بالنسبة للخاصية الكمية المتوسطة، يتم تحديد خطأ أخذ العينات بواسطة

    ويسمى المؤشر خطأ أخذ العينات الهامشي.
    متوسط ​​العينة هو متغير عشوائي يمكن أن يأخذ معان مختلفةاعتمادا على الوحدات التي شملتها العينة. ولذلك، فإن أخطاء أخذ العينات هي أيضًا متغيرات عشوائية ويمكن أن تأخذ قيمًا مختلفة. وبالتالي تحديد المتوسط الأخطاء المحتملة - متوسط ​​خطأ أخذ العينات، والذي يعتمد على:

    حجم العينة: من المزيد من الأرقامكلما كان متوسط ​​الخطأ أصغر؛

    درجة التغير في الخاصية محل الدراسة: كلما كان التغير في الخاصية أصغر، وبالتالي التشتت، كلما قل متوسط ​​خطأ العينة.

    في إعادة الاختيار العشوائييتم حساب متوسط ​​الخطأ:
    .
    ومن الناحية العملية، فإن التباين العام ليس معروفا بدقة، ولكن في نظرية الاحتمالاتلقد ثبت ذلك
    .
    وبما أن قيمة n كبيرة بما فيه الكفاية قريبة من 1، يمكننا أن نفترض ذلك. ومن ثم يمكن حساب متوسط ​​خطأ أخذ العينات:
    .
    ولكن في حالات عينة صغيرة (مع ن<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
    .

    في أخذ العينات العشوائية غير التكراريةيتم تعديل الصيغ المعطاة بالقيمة. ومن ثم فإن متوسط ​​خطأ أخذ العينات غير التكراري هو:
    و .
    لأن دائمًا أقل، فإن المضاعف () دائمًا أقل من 1. وهذا يعني أن متوسط ​​الخطأ أثناء الاختيار غير المتكرر يكون دائمًا أقل منه أثناء الاختيار المتكرر.
    أخذ العينات الميكانيكيةيتم استخدامه عندما يتم ترتيب إجمالي عدد السكان بطريقة ما (على سبيل المثال، قوائم الناخبين أبجديًا، وأرقام الهواتف، وأرقام المنازل، وأرقام الشقق). ويتم اختيار الوحدات في فترة زمنية معينة، وهي تساوي معكوس النسبة المئوية لأخذ العينات. لذا، مع عينة 2%، يتم اختيار كل 50 وحدة = 1/0.02، مع عينة 5%، كل 1/0.05 = 20 وحدة من عموم السكان.

    يتم تحديد النقطة المرجعية بطرق مختلفة: بشكل عشوائي، من منتصف الفاصل الزمني، مع تغيير النقطة المرجعية. الشيء الرئيسي هو تجنب الخطأ المنهجي. على سبيل المثال، في عينة 5%، إذا كانت الوحدة الأولى هي الثالثة عشر، فإن الوحدات التالية هي 33، 53، 73، إلخ.

    من حيث الدقة، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائية الفعلية. ولذلك، لتحديد متوسط ​​الخطأ في أخذ العينات الميكانيكية، يتم استخدام صيغ الاختيار العشوائي المناسبة.

    في اختيار نموذجي يتم تقسيم السكان الذين يتم استطلاعهم بشكل مبدئي إلى مجموعات متجانسة ومتشابهة. على سبيل المثال، عند مسح المؤسسات، يمكن أن تكون هذه الصناعات أو القطاعات الفرعية، وعند دراسة السكان، يمكن أن تكون هذه المناطق أو الفئات الاجتماعية أو العمرية. ثم يتم إجراء اختيار مستقل من كل مجموعة بطريقة ميكانيكية أو عشوائية بحتة.

    يؤدي أخذ العينات النموذجي إلى نتائج أكثر دقة من الطرق الأخرى. تضمن كتابة المجتمع العام تمثيل كل مجموعة نمطية في العينة، مما يجعل من الممكن التخلص من تأثير التباين بين المجموعات على متوسط ​​خطأ أخذ العينات. وبالتالي، عند العثور على خطأ عينة نموذجية وفقا لقاعدة إضافة التباينات ()، من الضروري أن نأخذ في الاعتبار فقط متوسط ​​تباينات المجموعة. ثم متوسط ​​خطأ أخذ العينات هو:
    عند إعادة الاختيار
    ,
    مع عدم التكرار في الاختيار
    ,
    أين - متوسط ​​التباينات داخل المجموعة في العينة.

    اختيار المسلسل (أو العش). يستخدم عندما يتم تقسيم السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. يمكن أن تكون هذه السلسلة عبارة عن عبوات للمنتجات النهائية ومجموعات الطلاب والفرق. يتم اختيار السلاسل للفحص ميكانيكياً أو عشوائياً بحتاً، وضمن السلاسل يتم إجراء فحص مستمر للوحدات. ولذلك، فإن متوسط ​​خطأ أخذ العينات يعتمد فقط على التباين بين المجموعات (السلاسل البينية)، والذي يتم حسابه بواسطة الصيغة:

    حيث r هو عدد السلاسل المحددة؛
    - متوسط ​​السلسلة i-th.

    يتم حساب متوسط ​​خطأ أخذ العينات التسلسلي:

    عند إعادة الاختيار:
    ,
    مع اختيار غير متكرر:
    ,
    حيث R هو العدد الإجمالي للحلقات.

    مجموعاختيارهو مزيج من طرق الاختيار المدروسة.

    يعتمد متوسط ​​خطأ أخذ العينات لأي طريقة من طرق أخذ العينات بشكل أساسي على الحجم المطلق للعينة، وبدرجة أقل، على النسبة المئوية للعينة. لنفترض أنه تم إجراء 225 ملاحظة في الحالة الأولى من عدد سكان يبلغ 4500 وحدة وفي الحالة الثانية من عدد سكان يبلغ 225000 وحدة. التباينات في الحالتين تساوي 25. ففي الحالة الأولى، مع اختيار 5%، سيكون خطأ المعاينة:

    في الحالة الثانية، مع اختيار 0.1%، سيكون مساوياً لـ:


    هكذاومع انخفاض نسبة أخذ العينات بمقدار 50 مرة، زاد خطأ أخذ العينات بشكل طفيف، حيث لم يتغير حجم العينة.
    لنفترض أن حجم العينة قد زاد إلى 625 ملاحظة. وفي هذه الحالة يكون خطأ أخذ العينات كما يلي:

    إن زيادة العينة بمقدار 2.8 مرة بنفس حجم السكان يقلل من حجم خطأ العينة بأكثر من 1.6 مرة.

    طرق وأساليب تكوين مجتمع العينة.

    في الإحصاء، يتم استخدام طرق مختلفة لتشكيل مجتمعات العينة، والتي تحددها أهداف الدراسة وتعتمد على تفاصيل موضوع الدراسة.

    الشرط الأساسي لإجراء مسح العينة هو منع حدوث أخطاء منهجية ناشئة عن انتهاك مبدأ تكافؤ الفرص لكل وحدة من عموم السكان المراد تضمينهم في العينة. يتم منع الأخطاء المنهجية من خلال استخدام الأساليب العلمية لتشكيل مجتمع العينة.

    هناك الطرق التالية لاختيار الوحدات من السكان:

    1) الاختيار الفردي - يتم اختيار الوحدات الفردية للعينة؛

    2) اختيار المجموعة - تتضمن العينة مجموعات متجانسة نوعيا أو سلسلة من الوحدات قيد الدراسة؛

    3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي.
    يتم تحديد طرق الاختيار من خلال قواعد تشكيل عينة السكان.

    يمكن أن تكون العينة:

    • عشوائية في الواقعيتمثل في حقيقة أن مجتمع العينة يتكون نتيجة الاختيار العشوائي (غير المقصود) للوحدات الفردية من عامة السكان. وفي هذه الحالة، عادة ما يتم تحديد عدد الوحدات المختارة في مجتمع العينة على أساس نسبة العينة المقبولة. نسبة العينة هي نسبة عدد الوحدات في مجتمع العينة n إلى عدد الوحدات في عموم السكان N، أي.
    • ميكانيكييتكون من حقيقة أن اختيار الوحدات في عينة السكان يتم من عامة السكان، مقسمة إلى فترات (مجموعات) متساوية. وفي هذه الحالة، يكون حجم الفاصل الزمني في المجتمع يساوي معكوس نسبة العينة. لذلك، مع عينة 2%، يتم اختيار كل وحدة 50 (1:0.02)، مع عينة 5%، كل وحدة 20 (1:0.05)، إلخ. وبالتالي، وفقًا لنسبة الاختيار المقبولة، يتم تقسيم عامة السكان ميكانيكيًا إلى مجموعات متساوية الحجم. ويتم اختيار وحدة واحدة فقط من كل مجموعة للعينة.
    • عادي -حيث يتم تقسيم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. ثم، من كل مجموعة نموذجية، يتم استخدام عينة عشوائية أو ميكانيكية بحتة لاختيار الوحدات بشكل فردي في مجتمع العينة. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في مجتمع العينة؛
    • مسلسل- حيث يتم تقسيم عامة السكان إلى مجموعات متساوية الحجم - سلسلة. يتم اختيار السلسلة في عينة السكان. ضمن السلسلة، يتم إجراء المراقبة المستمرة للوحدات المتضمنة في السلسلة؛
    • مجموع- يمكن أن يكون أخذ العينات على مرحلتين. في هذه الحالة، يتم تقسيم السكان أولاً إلى مجموعات. ثم يتم اختيار المجموعات، وضمن الأخيرة يتم اختيار الوحدات الفردية.

    في الإحصاء، يتم تمييز الطرق التالية لاختيار الوحدات في عينة السكان::

    • مرحلة واحدةأخذ العينات - تخضع كل وحدة مختارة للدراسة على الفور وفقا لمعيار معين (أخذ العينات العشوائية والتسلسلية المناسبة)؛
    • متعدد المراحلأخذ العينات - يتم الاختيار من إجمالي عدد السكان للمجموعات الفردية، ويتم اختيار الوحدات الفردية من المجموعات (أخذ عينات نموذجية بطريقة ميكانيكية لاختيار الوحدات في مجتمع العينة).

    بالإضافة إلى ذلك، هناك:

    • إعادة الاختيار- حسب مخطط الكرة المرتجعة. في هذه الحالة، يتم إرجاع كل وحدة أو سلسلة مدرجة في العينة إلى عامة السكان، وبالتالي يكون لديها فرصة لإدراجها في العينة مرة أخرى؛
    • كرر الاختيار- حسب مخطط الكرة غير المرتجعة. لديها نتائج أكثر دقة بنفس حجم العينة.

    تحديد حجم العينة المطلوبة (باستخدام جدول t الخاص بالطالب).

    أحد المبادئ العلمية في نظرية أخذ العينات هو التأكد من اختيار عدد كاف من الوحدات. من الناحية النظرية، يتم عرض الحاجة إلى الامتثال لهذا المبدأ في أدلة نظريات الحد في نظرية الاحتمالات، والتي تجعل من الممكن تحديد حجم الوحدات التي ينبغي اختيارها من السكان بحيث تكون كافية وتضمن تمثيل العينة.

    إن الانخفاض في خطأ أخذ العينات المعياري، وبالتالي زيادة دقة التقدير، يرتبط دائمًا بزيادة في حجم العينة، لذلك، بالفعل في مرحلة تنظيم مراقبة العينة، من الضروري تحديد حجم العينة يجب أن يكون مجتمع العينة من أجل ضمان الدقة المطلوبة لنتائج المراقبة. ويتم حساب حجم العينة المطلوب باستخدام صيغ مشتقة من صيغ الحد الأقصى لأخطاء أخذ العينات (A)، التي تتوافق مع نوع معين وطريقة اختيار معينة. لذلك، بالنسبة لحجم العينة العشوائي المتكرر (n) لدينا:

    وجوهر هذه الصيغة هو أنه مع الاختيار العشوائي المتكرر للعدد المطلوب يتناسب حجم العينة طرديا مع مربع معامل الثقة (ت2)وتباين الخاصية التباينية (?2) ويتناسب عكسياً مع مربع الحد الأقصى لخطأ المعاينة (?2). وعلى وجه الخصوص، مع زيادة الحد الأقصى للخطأ بعامل اثنين، يمكن تقليل حجم العينة المطلوب بعامل أربعة. من بين المعلمات الثلاثة، تم تعيين اثنين (t و؟) من قبل الباحث.

    وفي الوقت نفسه، استنادا إلى الباحثمن غرض وأهداف مسح العينة، يجب حل السؤال: في أي مجموعة كمية من الأفضل تضمين هذه المعلمات لضمان الخيار الأمثل؟ في إحدى الحالات، قد يكون راضيًا عن موثوقية النتائج التي تم الحصول عليها (t) أكثر من رضاه عن مقياس الدقة (؟)، وفي حالة أخرى - والعكس صحيح. من الأصعب حل المشكلة المتعلقة بقيمة الحد الأقصى لخطأ المعاينة، حيث أن الباحث لا يملك هذا المؤشر في مرحلة تصميم ملاحظة العينة، لذلك من الناحية العملية جرت العادة على تحديد قيمة الحد الأقصى لخطأ المعاينة، عادة في حدود 10% من متوسط ​​المستوى المتوقع للسمة. يمكن الوصول إلى تحديد المتوسط ​​المقدر بطرق مختلفة: استخدام البيانات من المسوحات السابقة المماثلة، أو استخدام البيانات من إطار أخذ العينات وإجراء عينة تجريبية صغيرة.

    إن أصعب ما يمكن تحديده عند تصميم عينة المراقبة هو المعلمة الثالثة في الصيغة (5.2) - تشتت مجتمع العينة. وفي هذه الحالة، من الضروري استخدام جميع المعلومات الموجودة تحت تصرف الباحث، والتي تم الحصول عليها في المسوحات المماثلة والتجريبية التي أجريت سابقًا.

    سؤال حول التعريفويصبح حجم العينة المطلوب أكثر تعقيدا إذا كان مسح العينات يتضمن دراسة عدة خصائص لوحدات المعاينة. في هذه الحالة، يكون متوسط ​​مستويات كل من الخصائص وتنوعها، كقاعدة عامة، مختلفًا، وبالتالي فإن تحديد التباين في أي من الخصائص التي يجب تفضيلها لا يمكن تحقيقه إلا مع مراعاة غرض وأهداف استطلاع.

    عند تصميم عينة المراقبة، يتم افتراض قيمة محددة مسبقًا لخطأ العينة المسموح به وفقًا لأهداف دراسة معينة واحتمالية الاستنتاجات بناءً على نتائج الملاحظة.

    بشكل عام، تسمح لنا صيغة الحد الأقصى للخطأ في متوسط ​​العينة بتحديد:

    حجم الانحرافات المحتملة للمؤشرات السكانية العامة عن المؤشرات السكانية للعينة؛

    حجم العينة المطلوب، بما يضمن الدقة المطلوبة، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة معينة محددة؛

    احتمال أن يكون للخطأ في العينة حد محدد.

    توزيع الطلابفي نظرية الاحتمالات، هي عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

    السلسلة الديناميكية (الفاصل الزمني، العزم)، السلسلة الديناميكية الختامية.

    سلسلة ديناميات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها بتسلسل زمني معين.

    تحتوي كل سلسلة زمنية على عنصرين:

    1) مؤشرات الفترات الزمنية (السنوات أو الأرباع أو الأشهر أو الأيام أو التواريخ)؛

    2) المؤشرات المميزة للكائن قيد الدراسة لفترات زمنية أو في تواريخ مقابلة والتي تسمى بمستويات السلسلة.

    يتم التعبير عن مستويات السلسلةكلا من القيم المطلقة والمتوسطة أو النسبية. اعتمادا على طبيعة المؤشرات، يتم إنشاء سلاسل زمنية من القيم المطلقة والنسبية والمتوسطة. يتم إنشاء السلسلة الديناميكية من القيم النسبية والمتوسطة على أساس سلسلة مشتقة من القيم المطلقة. هناك سلسلة زمنية ولحظية من الديناميكيات.

    سلسلة الفاصل الديناميكييحتوي على قيم المؤشرات لفترات زمنية معينة. وفي سلسلة فواصل زمنية يمكن جمع المستويات للحصول على حجم الظاهرة على مدى فترة أطول، أو ما يسمى بالمجاميع المتراكمة.

    سلسلة اللحظات الديناميكيةيعكس قيم المؤشرات في وقت معين (التاريخ الزمني). وفي المتسلسلة العزومية قد يهتم الباحث فقط باختلاف الظواهر التي تعكس التغير في مستوى المتسلسلة بين تواريخ معينة، حيث أن مجموع المستويات هنا ليس له محتوى حقيقي. لا يتم احتساب المجاميع التراكمية هنا.

    الشرط الأكثر أهمية للبناء الصحيح للسلاسل الزمنية هو مقارنة مستويات السلسلة التي تنتمي إلى فترات مختلفة. ويجب تقديم المستويات بكميات متجانسة، كما يجب أن يكون هناك اكتمال متساوي لتغطية الأجزاء المختلفة من الظاهرة.

    بغرضلتجنب تشويه الديناميكيات الحقيقية، يتم إجراء حسابات أولية في الدراسة الإحصائية (إغلاق سلسلة الديناميكيات)، والتي تسبق التحليل الإحصائي للسلسلة الزمنية. يُفهم إغلاق السلسلة الديناميكية على أنه مزيج من سلسلتين أو أكثر في سلسلة واحدة، يتم حساب مستوياتها باستخدام منهجية مختلفة أو لا تتوافق مع الحدود الإقليمية، وما إلى ذلك. قد يعني إغلاق سلسلة الديناميكيات أيضًا جلب المستويات المطلقة لسلسلة الديناميكيات إلى أساس مشترك، مما يحيد عدم إمكانية المقارنة بين مستويات سلسلة الديناميكيات.

    مفهوم المقارنة بين المتسلسلة الديناميكية والمعاملات والنمو ومعدلات النمو.

    سلسلة ديناميات- هذه سلسلة من المؤشرات الإحصائية التي تميز تطور الظواهر الطبيعية والاجتماعية مع مرور الوقت. تحتوي المجموعات الإحصائية التي نشرتها لجنة الدولة للإحصاء في روسيا على عدد كبير من سلاسل الديناميكيات في شكل جدول. تتيح السلسلة الديناميكية تحديد أنماط تطور الظواهر قيد الدراسة.

    تحتوي سلسلة الديناميكيات على نوعين من المؤشرات. مؤشرات الوقت(سنوات، أرباع، أشهر، إلخ) أو نقاط زمنية (في بداية العام، في بداية كل شهر، إلخ). مؤشرات مستوى الصف. يمكن التعبير عن مؤشرات مستويات سلسلة الديناميكيات بالقيم المطلقة (إنتاج المنتجات بالطن أو الروبل)، والقيم النسبية (نسبة سكان الحضر في المائة) والقيم المتوسطة (متوسط ​​أجور عمال الصناعة حسب السنة ، إلخ.). في شكل جدول، تحتوي السلسلة الزمنية على عمودين أو صفين.

    يتطلب البناء الصحيح للسلاسل الزمنية استيفاء عدد من المتطلبات:

    1. يجب أن تكون جميع مؤشرات سلسلة الديناميكيات مبنية على أسس علمية وموثوقة؛
    2. يجب أن تكون مؤشرات سلسلة من الديناميكيات قابلة للمقارنة مع مرور الوقت، أي. يجب أن يتم حسابها لنفس الفترات الزمنية أو في نفس التواريخ؛
    3. ويجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في جميع أنحاء الإقليم؛
    4. يجب أن تكون مؤشرات سلسلة الديناميكيات قابلة للمقارنة في المحتوى، أي. وتحسب وفق منهجية واحدة وبنفس الطريقة؛
    5. وينبغي أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر نطاق المزارع التي تؤخذ في الاعتبار. يجب إعطاء جميع مؤشرات سلسلة الديناميكيات في نفس وحدات القياس.

    المؤشرات الإحصائيةيمكن وصف نتائج العملية قيد الدراسة على مدى فترة من الزمن، أو حالة الظاهرة قيد الدراسة في نقطة زمنية معينة، أي. يمكن أن تكون المؤشرات فاصلة (دورية) ولحظية. وبناء على ذلك، في البداية يمكن أن تكون سلسلة الديناميكيات إما فاصلة أو لحظة. يمكن لسلسلة ديناميكيات العزوم بدورها أن تكون ذات فترات زمنية متساوية أو غير متساوية.

    يمكن تحويل سلسلة الديناميكيات الأصلية إلى سلسلة من القيم المتوسطة وسلسلة من القيم النسبية (السلسلة والأساسية). تسمى هذه السلاسل الزمنية بالسلاسل الزمنية المشتقة.

    تختلف منهجية حساب المستوى المتوسط ​​في السلسلة الديناميكية اعتمادًا على نوع السلسلة الديناميكية. باستخدام الأمثلة، سننظر في أنواع السلاسل الديناميكية والصيغ لحساب المستوى المتوسط.

    الزيادات المطلقة (Δy) أظهر عدد الوحدات التي تغير فيها المستوى اللاحق للسلسلة مقارنة بالمستوى السابق (gr. 3. - الزيادات المطلقة للسلسلة) أو مقارنة بالمستوى الأولي (gr. 4. - الزيادات المطلقة الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

    عندما تنخفض القيم المطلقة للسلسلة، سيكون هناك "نقصان" أو "نقصان"، على التوالي.

    وتشير مؤشرات النمو المطلق إلى أنه على سبيل المثال، ارتفع إنتاج المنتج "أ" عام 1998 بمقدار 4 آلاف طن مقارنة بعام 1997، وبنحو 34 ألف طن مقارنة بعام 1994؛ لسنوات أخرى، انظر الجدول. 11.5 جرام. 3 و 4.

    معدل النمويوضح عدد المرات التي تغير فيها مستوى السلسلة مقارنة بالمستوى السابق (جرام 5 - معاملات السلسلة للنمو أو الانخفاض) أو مقارنة بالمستوى الأولي (جرام 6 - المعاملات الأساسية للنمو أو الانخفاض). يمكن كتابة صيغ الحساب على النحو التالي:

    معدلات النموأظهر النسبة المئوية للمستوى التالي من السلسلة مقارنة بالمستوى السابق (جرام 7 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (جرام 8 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

    لذلك، على سبيل المثال، في عام 1997، كان حجم إنتاج المنتج "أ" مقارنة بعام 1996 هو 105.5% (

    معدل النموأظهر النسبة المئوية التي ارتفع بها مستوى الفترة المشمولة بالتقرير مقارنة بالمستوى السابق (العمود 9 - معدلات نمو السلسلة) أو مقارنة بالمستوى الأولي (العمود 10 - معدلات النمو الأساسية). يمكن كتابة صيغ الحساب على النحو التالي:

    T pr = T r - 100% أو T pr = النمو المطلق / مستوى الفترة السابقة * 100%

    لذلك، على سبيل المثال، في عام 1996، مقارنة بعام 1995، تم إنتاج المنتج "أ" بنسبة 3.8٪ (103.8٪ - 100٪) أو (8:210)×100٪ أكثر، ومقارنة بعام 1994 - بنسبة 9٪ (109٪ - 100%).

    إذا انخفضت المستويات المطلقة في السلسلة فإن المعدل سيكون أقل من 100%، وبالتالي سيكون هناك معدل الانخفاض (معدل الزيادة بعلامة الطرح).

    القيمة المطلقة للزيادة 1%(العمود 11) يوضح عدد الوحدات التي يجب إنتاجها في فترة معينة بحيث يرتفع مستوى الفترة السابقة بنسبة 1%. في مثالنا، في عام 1995، كان من الضروري إنتاج 2.0 ألف طن، وفي عام 1998 - 2.3 ألف طن، أي. أكبر بكثير.

    يمكن تحديد القيمة المطلقة للنمو بنسبة 1% بطريقتين:

    مستوى الفترة السابقة مقسم على 100؛

    اقسم الزيادات المطلقة في السلسلة على معدلات نمو السلسلة المقابلة.

    القيمة المطلقة للزيادة 1% =

    في الديناميكيات، خاصة على مدى فترة طويلة، من المهم إجراء تحليل مشترك لمعدل النمو مع محتوى كل نسبة زيادة أو نقصان.

    لاحظ أن المنهجية المدروسة لتحليل السلاسل الزمنية تنطبق على السلاسل الزمنية، التي يتم التعبير عن مستوياتها بالقيم المطلقة (ر، ألف روبل، عدد الموظفين، وما إلى ذلك)، وعلى السلاسل الزمنية، مستوياتها يتم التعبير عنها بمؤشرات نسبية (% من العيوب، % من محتوى الرماد في الفحم، وما إلى ذلك) أو القيم المتوسطة (متوسط ​​العائد بالسنتيمتر/هكتار، ومتوسط ​​الأجر، وما إلى ذلك).

    إلى جانب المؤشرات التحليلية المدروسة، والتي يتم حسابها لكل عام مقارنة بالمستوى السابق أو الأولي، عند تحليل سلسلة الديناميكيات، من الضروري حساب متوسط ​​المؤشرات التحليلية للفترة: متوسط ​​مستوى السلسلة، متوسط ​​الزيادة السنوية المطلقة (النقصان) ومتوسط ​​معدل النمو السنوي ومعدل النمو.

    تمت مناقشة طرق حساب المستوى المتوسط ​​لسلسلة من الديناميكيات أعلاه. في سلسلة ديناميكيات الفاصل التي ندرسها، يتم حساب المستوى المتوسط ​​للسلسلة باستخدام صيغة المتوسط ​​الحسابي البسيط:

    متوسط ​​حجم الإنتاج السنوي للمنتج للأعوام 1994-1998. بلغت 218.4 ألف طن.

    يتم حساب متوسط ​​النمو المطلق السنوي أيضًا باستخدام صيغة المتوسط ​​الحسابي البسيط:

    وتراوحت الزيادات المطلقة السنوية على مر السنين من 4 إلى 12 ألف طن (أنظر العمود 3)، ومتوسط ​​الزيادة السنوية في الإنتاج خلال الفترة 1995 - 1998. بلغت 8.5 ألف طن.

    تتطلب طرق حساب متوسط ​​معدل النمو ومتوسط ​​معدل النمو دراسة أكثر تفصيلاً. دعونا ننظر فيها باستخدام مثال مؤشرات مستوى السلسلة السنوية الواردة في الجدول.

    المستوى المتوسط ​​للسلسلة الديناميكية.

    السلسلة الديناميكية (أو السلسلة الزمنية)- هذه هي القيم العددية لمؤشر إحصائي معين في لحظات أو فترات زمنية متتالية (أي مرتبة حسب الترتيب الزمني).

    يتم استدعاء القيم العددية لمؤشر إحصائي أو آخر تشكل سلسلة الديناميكيات مستويات السلسلةوعادة ما يتم الإشارة إليه بالحرف ذ. الترم الأول من السلسلة ذ 1يسمى الأولي أو مستوى أساسي، وآخر واحد ذ ن - أخير. يتم تحديد اللحظات أو الفترات الزمنية التي تتعلق بها المستويات ر.

    يتم عرض المتسلسلة الديناميكية عادة في شكل جدول أو رسم بياني، ويتم إنشاء مقياس زمني على طول محور الإحداثي السيني روعلى طول المحور الإحداثي - مقياس مستويات السلسلة ذ.

    متوسط ​​مؤشرات سلسلة الديناميكيات

    يمكن اعتبار كل سلسلة من الديناميكيات بمثابة مجموعة معينة نالمؤشرات المتغيرة بمرور الوقت والتي يمكن تلخيصها كمتوسطات. تعتبر هذه المؤشرات المعممة (المتوسطة) ضرورية بشكل خاص عند مقارنة التغيرات في مؤشر معين خلال فترات مختلفة، في بلدان مختلفة، وما إلى ذلك.

    إن الخاصية العامة للسلسلة الديناميكية يمكن أن تخدم، أولاً وقبل كل شيء، مستوى الصف الأوسط. تعتمد طريقة حساب المستوى المتوسط ​​على ما إذا كانت السلسلة لحظية أم فاصلة (دورية).

    متى فاصلةلسلسلة، يتم تحديد المستوى المتوسط ​​لها من خلال صيغة المتوسط ​​الحسابي البسيط لمستويات السلسلة، أي.

    =
    إذا كان متاحا لحظةصف يحتوي على نمستويات ( ص1، ص2، …، ص) مع فواصل زمنية متساوية بين التواريخ (الأوقات)، فيمكن تحويل هذه السلسلة بسهولة إلى سلسلة من القيم المتوسطة. وفي هذه الحالة يكون المؤشر (المستوى) في بداية كل فترة هو في نفس الوقت المؤشر في نهاية الفترة السابقة. ومن ثم يمكن حساب متوسط ​​قيمة المؤشر لكل فترة (الفاصل الزمني بين التواريخ) على أنه نصف مجموع القيم فيفي بداية ونهاية الفترة، أي. كيف . سيكون عدد هذه المتوسطات . كما ذكرنا سابقًا، بالنسبة لسلسلة القيم المتوسطة، يتم حساب المستوى المتوسط ​​باستخدام المتوسط ​​الحسابي.

    ولذلك يمكننا أن نكتب:
    .
    بعد تحويل البسط نحصل على:
    ,

    أين Y1و ين— المستويين الأول والأخير من الصف؛ يي- المستويات المتوسطة .

    ويعرف هذا المتوسط ​​في الإحصائيات باسم متوسط ​​زمنيلمسلسل لحظة. وقد حصلت على اسمها من كلمة "كرونوس" (الوقت، اللاتينية)، حيث يتم حسابها من المؤشرات التي تتغير مع مرور الوقت.

    في حالة عدم المساواةالفواصل الزمنية بين التواريخ، يمكن حساب المتوسط ​​الزمني لسلسلة زمنية على أنه الوسط الحسابي لمتوسط ​​قيم المستويات لكل زوج من اللحظات، مرجحًا بالمسافات (الفترات الزمنية) بين التواريخ، أي.
    .
    في هذه الحالةمن المفترض أنه في الفترات الفاصلة بين التواريخ اتخذت المستويات قيمًا مختلفة، ونحن أحد اثنين معروفين ( ييو يي+1) نحدد المتوسطات، ومن ثم نحسب المتوسط ​​الإجمالي للفترة التي تم تحليلها بأكملها.
    فإذا افترض أن كل قيمة يييبقى دون تغيير حتى اليوم التالي (ط+ 1)- اللحظة الرابعة، أي. إذا كان التاريخ الدقيق للتغيير في المستويات معروفًا، فيمكن إجراء الحساب باستخدام صيغة المتوسط ​​الحسابي المرجح:
    ,

    أين هو الوقت الذي ظل فيه المستوى دون تغيير.

    بالإضافة إلى المستوى المتوسط ​​في سلسلة الديناميكيات، يتم حساب مؤشرات متوسطة أخرى - متوسط ​​التغير في مستويات السلسلة (الطرق الأساسية والسلسلة)، ومتوسط ​​معدل التغيير.

    خط الأساس يعني التغيير المطلقهو حاصل قسمة التغيير المطلق الأخير على عدد التغييرات. إنه

    السلسلة تعني التغيير المطلق مستويات السلسلة هي حاصل قسمة مجموع كل التغييرات المطلقة للسلسلة على عدد التغييرات، أي

    كما تستخدم علامة متوسط ​​التغيرات المطلقة للحكم على طبيعة التغير في ظاهرة ما في المتوسط: النمو أو الانخفاض أو الاستقرار.

    من قاعدة التحكم في التغييرات الأساسية والسلسلة المطلقة، يترتب على ذلك أن التغييرات الأساسية ومتوسط ​​السلسلة يجب أن تكون متساوية.

    إلى جانب متوسط ​​التغير المطلق، يتم حساب المتوسط ​​النسبي أيضًا باستخدام الطرق الأساسية والمتسلسلة.

    خط الأساس لمتوسط ​​التغير النسبيتحددها الصيغة:

    سلسلة متوسط ​​التغير النسبيتحددها الصيغة:

    ومن الطبيعي أن تكون التغيرات النسبية الأساسية والسلسلة هي نفسها، وبمقارنتها مع القيمة المعيارية 1 يتم التوصل إلى استنتاج حول طبيعة التغير في الظاهرة في المتوسط: نمو أو تراجع أو استقرار.
    عن طريق طرح 1 من القاعدة أو متوسط ​​التغير النسبي للسلسلة، يكون المقابل متوسط ​​معدل التغير، من خلال علامتها يمكن للمرء أيضًا الحكم على طبيعة التغيير في الظاهرة قيد الدراسة، والتي تنعكس في هذه السلسلة من الديناميكيات.

    التقلبات الموسمية والمؤشرات الموسمية.

    التقلبات الموسمية هي تقلبات مستقرة خلال السنة.

    المبدأ الأساسي للإدارة للحصول على أقصى قدر من التأثير هو زيادة الدخل وتقليل التكاليف. ومن خلال دراسة التقلبات الموسمية تم حل مشكلة المعادلة القصوى عند كل مستوى من مستويات السنة.

    عند دراسة التقلبات الموسمية يتم حل مشكلتين مترابطتين:

    1. تحديد تفاصيل تطور الظاهرة في الديناميكيات البينية؛

    2. قياس التقلبات الموسمية مع بناء نموذج الموجة الموسمية.

    لقياس التباين الموسمي، عادة ما يتم حساب الديوك الرومية الموسمية. بشكل عام، يتم تحديدها من خلال نسبة المعادلات الأولية لسلسلة الديناميكيات إلى المعادلات النظرية، والتي تعمل كأساس للمقارنة.

    وبما أن الانحرافات العشوائية يتم فرضها على التقلبات الموسمية، يتم حساب متوسط ​​المؤشرات الموسمية للقضاء عليها.

    في هذه الحالة، لكل فترة من الدورة السنوية، يتم تحديد المؤشرات المعممة في شكل متوسط ​​المؤشرات الموسمية:

    وتخلو مؤشرات متوسط ​​التقلبات الموسمية من تأثير الانحرافات العشوائية لاتجاه التنمية الرئيسي.

    اعتمادًا على طبيعة الاتجاه، يمكن أن تتخذ صيغة متوسط ​​المؤشر الموسمي الأشكال التالية:

    1.بالنسبة لسلسلة من الديناميكيات البينية السنوية مع اتجاه رئيسي واضح للتنمية:

    2. بالنسبة لسلسلة من الديناميكيات البينية السنوية التي لا يوجد فيها اتجاه متزايد أو متناقص أو تكون غير ذات أهمية:

    أين هو المعدل العام؟

    طرق تحليل الاتجاه الرئيسي.

    يتأثر تطور الظواهر بمرور الوقت بعوامل مختلفة الطبيعة وقوة التأثير. بعضها عشوائي بطبيعته، والبعض الآخر له تأثير ثابت تقريبًا ويشكل اتجاهًا معينًا للتنمية في الديناميكيات.

    إحدى المهام المهمة للإحصاءات هي تحديد ديناميكيات الاتجاه المتسلسلة، والتحرر من تأثير العوامل العشوائية المختلفة. ولهذا الغرض، تتم معالجة السلاسل الزمنية بطرق تكبير الفترات والمتوسط ​​المتحرك والتسوية التحليلية وما إلى ذلك.

    طريقة توسيع الفاصل الزمنييعتمد على توسيع الفترات الزمنية، والتي تشمل مستويات سلسلة من الديناميكيات، أي. هو استبدال البيانات المتعلقة بفترات زمنية صغيرة ببيانات لفترات أكبر. إنه فعال بشكل خاص عندما تتعلق المستويات الأولية للسلسلة بفترات زمنية قصيرة. على سبيل المثال، يتم استبدال سلسلة المؤشرات المرتبطة بالأحداث اليومية بسلسلة مرتبطة بالأحداث الأسبوعية والشهرية وما إلى ذلك. وهذا سوف يظهر بشكل أكثر وضوحا "محور تطور الظاهرة". ويتيح لنا المتوسط، المحسوب على فترات ممتدة، تحديد اتجاه وطبيعة (تسارع أو تباطؤ النمو) لاتجاه التنمية الرئيسي.

    طريقة المتوسط ​​المتحركمشابهة للمستوى السابق، ولكن في هذه الحالة يتم استبدال المستويات الفعلية بمستويات متوسطة محسوبة لفترات زمنية موسعة متحركة (منزلقة) بشكل تسلسلي تغطي ممستويات السلسلة.

    على سبيل المثال، إذا قبلنا م = 3،ثم يتم أولاً حساب متوسط ​​المستويات الثلاثة الأولى من السلسلة، ثم - من نفس عدد المستويات، ولكن بدءًا من الثاني، ثم - بدءًا من الثالث، وما إلى ذلك. وبالتالي، فإن متوسط ​​"الشرائح" على طول سلسلة الديناميكيات، يتحرك بمقدار مصطلح واحد. تحسب من مالأعضاء، تشير المتوسطات المتحركة إلى منتصف (وسط) كل فترة.

    هذه الطريقة تقضي فقط على التقلبات العشوائية. إذا كانت السلسلة بها موجة موسمية، فإنها ستستمر حتى بعد التجانس باستخدام طريقة المتوسط ​​المتحرك.

    المحاذاة التحليلية. من أجل القضاء على التقلبات العشوائية وتحديد الاتجاه، يتم استخدام تسوية مستويات السلسلة باستخدام الصيغ التحليلية (أو التسوية التحليلية). وجوهرها هو استبدال المستويات التجريبية (الفعلية) بمستويات نظرية، والتي يتم حسابها باستخدام معادلة معينة معتمدة كنموذج للاتجاه الرياضي، حيث تعتبر المستويات النظرية كدالة للزمن: . وفي هذه الحالة يعتبر كل مستوى فعلي بمثابة مجموع مكونين: حيث هو مكون منهجي ويعبر عنه بمعادلة معينة، وهو متغير عشوائي يسبب تقلبات حول الاتجاه.

    تتلخص مهمة المحاذاة التحليلية فيما يلي:

    1. التحديد، بناءً على البيانات الفعلية، لنوع الوظيفة الافتراضية التي يمكن أن تعكس بشكل أكثر ملاءمة اتجاه تطور المؤشر قيد الدراسة.

    2. العثور على معلمات الدالة المحددة (المعادلة) من البيانات التجريبية

    3. الحساب باستخدام المعادلة الموجودة للمستويات النظرية (المحاذاة).

    يتم اختيار وظيفة معينة، كقاعدة عامة، على أساس تمثيل رسومي للبيانات التجريبية.

    النماذج عبارة عن معادلات انحدار، يتم حساب معلماتها باستخدام طريقة المربعات الصغرى

    فيما يلي معادلات الانحدار الأكثر استخدامًا لمحاذاة السلاسل الزمنية، مع الإشارة إلى اتجاهات التطوير المحددة الأكثر ملاءمة للانعكاس.

    للعثور على معلمات المعادلات المذكورة أعلاه، هناك خوارزميات خاصة وبرامج كمبيوتر. على وجه الخصوص، للعثور على معلمات معادلة الخط المستقيم، يمكن استخدام الخوارزمية التالية:

    إذا تم ترقيم الفترات أو اللحظات الزمنية بحيث St = 0، فسيتم تبسيط الخوارزميات المذكورة أعلاه بشكل كبير وتتحول إلى

    سيتم وضع المستويات المحاذية على الرسم البياني على خط مستقيم واحد، وتمر على أقرب مسافة من المستويات الفعلية لهذه السلسلة الديناميكية. مجموع الانحرافات المربعة هو انعكاس لتأثير العوامل العشوائية.

    وباستخدامه نحسب متوسط ​​الخطأ (المعياري) للمعادلة:

    هنا n هو عدد الملاحظات، وm هو عدد المعلمات في المعادلة (لدينا اثنان منهم - b 1 و b 0).

    يوضح الاتجاه الرئيسي (الاتجاه) كيف تؤثر العوامل المنهجية على مستويات سلسلة من الديناميكيات، ويعمل تقلب المستويات حول الاتجاه () كمقياس لتأثير العوامل المتبقية.

    ولتقييم جودة نموذج السلاسل الزمنية المستخدم، يتم استخدامه أيضًا اختبار فيشر F. وهي نسبة التباينين، وهي نسبة التباين الناتج عن الانحدار، أي. العامل محل الدراسة إلى التباين الناتج عن أسباب عشوائية أي التشتت المتبقي:

    وبشكل موسع، يمكن تقديم صيغة هذا المعيار على النحو التالي:

    حيث n هو عدد الملاحظات، أي. عدد مستويات الصف،

    m هو عدد المعلمات في المعادلة، y هو المستوى الفعلي للسلسلة،

    مستوى الصف المحاذي - مستوى الصف الأوسط.

    إن النموذج الأكثر نجاحًا من النماذج الأخرى قد لا يكون دائمًا مرضيًا بدرجة كافية. ولا يمكن التعرف عليه على هذا النحو إلا في الحالة التي يتجاوز فيها معياره F الحد الحرج المعروف. يتم إنشاء هذه الحدود باستخدام جداول التوزيع F.

    جوهر وتصنيف المؤشرات.

    في الإحصاء، يُفهم المؤشر على أنه مؤشر نسبي يميز التغير في حجم ظاهرة ما في الزمان أو المكان أو بالمقارنة مع أي معيار.

    العنصر الرئيسي لعلاقة الفهرس هو القيمة المفهرسة. تُفهم القيمة المفهرسة على أنها قيمة إحدى خصائص المجتمع الإحصائي، والتي يكون تغييرها هو موضوع الدراسة.

    باستخدام الفهارس، يتم حل ثلاث مهام رئيسية:

    1) تقييم التغيرات في ظاهرة معقدة؛

    2) تحديد تأثير العوامل الفردية على التغيرات في ظاهرة معقدة؛

    3) مقارنة حجم ظاهرة ما بحجم الفترة الماضية وحجم إقليم آخر وكذلك بالمعايير والخطط والتنبؤات.

    يتم تصنيف المؤشرات وفقًا لثلاثة معايير:

    2) حسب درجة تغطية عناصر السكان؛

    3) وفقا لطرق حساب المؤشرات العامة.

    حسب المحتوىالكميات المفهرسة، وتنقسم المؤشرات إلى مؤشرات المؤشرات الكمية (الحجم) ومؤشرات المؤشرات النوعية. مؤشرات المؤشرات الكمية - مؤشرات الحجم المادي للمنتجات الصناعية، الحجم المادي للمبيعات، عدد الموظفين، إلخ. مؤشرات المؤشرات النوعية - مؤشرات الأسعار، التكاليف، إنتاجية العمل، متوسط ​​الأجور، إلخ.

    ووفقا لدرجة تغطية الوحدات السكانية، تنقسم الأرقام القياسية إلى فئتين: فردية وعامة. لتوصيفها، نقدم الاتفاقيات التالية المعتمدة في ممارسة استخدام طريقة الفهرس:

    س- الكمية (الحجم) لأي منتج من الناحية المادية ; ر- سعر الوحدة؛ ض- تكلفة وحدة الإنتاج؛ ر— الوقت المستغرق في إنتاج وحدة من المنتج (كثافة العمالة) ; ث- إنتاج المنتجات من حيث القيمة لكل وحدة زمنية؛ الخامس- مخرجات الإنتاج من الناحية المادية لكل وحدة زمنية؛ ت- إجمالي الوقت المستغرق أو عدد الموظفين.

    من أجل التمييز بين الفترة أو الكائن الذي تنتمي إليه الكميات المفهرسة، من المعتاد وضع الحروف السفلية في أسفل يمين الرمز المقابل. لذلك، على سبيل المثال، في مؤشرات الديناميكيات، كقاعدة عامة، يتم استخدام الرمز 1 للفترات التي تتم مقارنتها (الحالية، التقارير) وللفترات التي تتم المقارنة معها،

    المؤشرات الفرديةتعمل على وصف التغيرات في العناصر الفردية لظاهرة معقدة (على سبيل المثال، التغيير في حجم إنتاج نوع واحد من المنتجات). وهي تمثل القيم النسبية للديناميكيات، والوفاء بالالتزامات، ومقارنة القيم المفهرسة.

    يتم تحديد المؤشر الفردي للحجم المادي للمنتجات

    من وجهة نظر تحليلية، فإن مؤشرات الديناميكيات الفردية المعطاة تشبه معاملات (معدلات) النمو وتميز التغير في القيمة المفهرسة في الفترة الحالية مقارنة بفترة الأساس، أي أنها تظهر عدد مرات الزيادة (النقصان) أو ما هي نسبة النمو (النقصان). يتم التعبير عن قيم الفهرس بالمعاملات أو النسب المئوية.

    الفهرس العام (المركب).يعكس التغيرات في جميع عناصر ظاهرة معقدة.

    الفهرس الإجماليهو الشكل الأساسي للمؤشر. وسمي ركاماً لأن بسطه ومقامه مجموعة من الركام

    المؤشرات المتوسطة وتعريفها.

    بالإضافة إلى المؤشرات الإجمالية، يتم استخدام شكل آخر منها في الإحصائيات - مؤشرات المتوسط ​​المرجح. ويتم اللجوء إلى حسابها عندما لا تسمح المعلومات المتوفرة بحساب الرقم القياسي الإجمالي العام. وبالتالي، إذا لم تتوفر بيانات عن الأسعار، ولكن هناك معلومات عن تكلفة المنتجات في الفترة الحالية وأرقام قياسية فردية لكل منتج معروفة، فلا يمكن تحديد الرقم القياسي العام للأسعار كرقم إجمالي، ولكن من الممكن لحسابه كمتوسط ​​للأفراد. وبنفس الطريقة، إذا كانت كميات الأنواع الفردية من المنتجات المنتجة غير معروفة، ولكن المؤشرات الفردية وتكلفة الإنتاج لفترة الأساس معروفة، فيمكن تحديد المؤشر العام للحجم المادي للإنتاج كمتوسط ​​مرجح قيمة.

    متوسط ​​المؤشر -هذامؤشر يتم حسابه على أنه متوسط ​​المؤشرات الفردية. المؤشر الإجمالي هو الشكل الأساسي للمؤشر العام، لذا يجب أن يكون المؤشر المتوسط ​​مطابقًا للمؤشر الإجمالي. عند حساب المؤشرات المتوسطة، يتم استخدام شكلين من المتوسطات: الحسابي والتوافقي.

    ويكون مؤشر المتوسط ​​الحسابي مطابقا للمؤشر الكلي إذا كانت أوزان المؤشرات الفردية هي مصطلحات مقام المؤشر الكلي. فقط في هذه الحالة، ستكون قيمة المؤشر المحسوبة باستخدام صيغة المتوسط ​​الحسابي مساوية للمؤشر الإجمالي.