11.10.2019

كيفية حساب الانحراف المعياري. حساب الانحراف المعياري في Microsoft Excel


الدرس رقم 4

الموضوع: "الإحصاء الوصفي. مؤشرات تنوع السمات في المجموع "

المعايير الرئيسية لتنوع السمات في مجتمع إحصائي هي: الحد، والسعة، والمتوسط الانحراف المعياريومعامل التذبذب ومعامل الاختلاف. تمت مناقشة في الدرس السابق أن القيم المتوسطة توفر فقط خاصية عامة للخاصية التي تتم دراستها بشكل إجمالي ولا تأخذ في الاعتبار قيم متغيراتها الفردية: القيم الدنيا والقصوى، فوق المتوسط، أدناه متوسط، الخ.

مثال. متوسط ​​قيم تسلسلين رقميين مختلفين: -100؛ -20؛ 100؛ 20 و 0.1؛ -0.2; 0.1 متطابقان ومتساويان تمامًاعن.ومع ذلك، فإن النطاقات المتناثرة لبيانات التسلسل المتوسط ​​النسبي مختلفة جدًا.

يتم تحديد المعايير المدرجة لتنوع الخاصية في المقام الأول مع مراعاة قيمتها في العناصر الفردية للمجتمع الإحصائي.

مؤشرات لقياس تباين السمة هي مطلقو نسبي. تشمل مؤشرات التباين المطلقة: مدى التباين، الحد، الانحراف المعياري، التشتت. يشير معامل التباين ومعامل التذبذب إلى المقاييس النسبية للتباين.

الحد (ليم) –هذا معيار يتم تحديده من خلال القيم المتطرفة للمتغير في سلسلة التباين. بمعنى آخر، يقتصر هذا المعيار على الحد الأدنى والحد الأقصى لقيم السمة:

السعة (صباحا)أو نطاق التباين –هذا هو الفرق بين الخيارات المتطرفة. يتم حساب هذا المعيار عن طريق طرح الحد الأدنى لقيمته من الحد الأقصى لقيمة السمة، مما يسمح لنا بتقدير درجة تشتت الخيار:

عيب الحد والسعة كمعايير للتباين هو أنها تعتمد بشكل كامل على القيم المتطرفة للخاصية في سلسلة التباين. في هذه الحالة، لا تؤخذ في الاعتبار التقلبات في قيم السمات داخل السلسلة.

يتم توفير الوصف الأكثر اكتمالا لتنوع السمات في مجتمع إحصائي بواسطة الانحراف المعياري(سيجما)، وهو مقياس عام لانحراف الخيار عن قيمته المتوسطة. غالبا ما يسمى الانحراف المعياري الانحراف المعياري.

يعتمد الانحراف المعياري على مقارنة كل خيار بالمتوسط ​​الحسابي لمجموعة سكانية معينة. نظرًا لأنه في المجموع سيكون هناك دائمًا خيارات أقل وأكثر منه، سيتم إلغاء مجموع الانحرافات بعلامة "" من خلال مجموع الانحرافات بعلامة ""، أي. مجموع كل الانحرافات هو صفر. ومن أجل تجنب تأثير علامات الفروق، يتم أخذ الانحرافات عن الوسط الحسابي التربيعي، أي. . مجموع الانحرافات التربيعية لا يساوي الصفر. للحصول على معامل يمكنه قياس التباين، خذ متوسط ​​مجموع المربعات - تسمى هذه القيمة الفروق:

في جوهرها، التشتت هو متوسط ​​مربع انحرافات القيم الفردية للخاصية عن قيمتها المتوسطة. تشتت مربع الانحراف المعياري .

التباين هو كمية الأبعاد (المسمى). لذا، إذا تم التعبير عن متغيرات سلسلة الأرقام بالأمتار، فإن التباين يعطي أمتارًا مربعة؛ إذا تم التعبير عن الخيارات بالكيلوجرام، فإن التباين يعطي مربع هذا القياس (كجم 2)، وما إلى ذلك.

الانحراف المعياري– الجذر التربيعي للتباين :

ثم عند حساب التشتت والانحراف المعياري في مقام الكسر بدلاً من ذلكيجب أن توضع.

يمكن تقسيم حساب الانحراف المعياري إلى ست مراحل يجب تنفيذها بتسلسل معين:

تطبيق الانحراف المعياري:

أ) للحكم على تباين سلسلة الاختلاف و التقييم المقارننموذجية (تمثيلية) المتوسطات الحسابية. وهذا ضروري في تشخيص متباينعند تحديد ثبات السمات.

ب) لإعادة بناء سلسلة الاختلاف، أي. استعادة استجابة التردد على أساس قواعد سيجما الثلاثة. في الفاصل (م ± 3σ) 99.7% من جميع متغيرات السلسلة تقع في الفاصل الزمني (م ± 2σ) - 95.5% وفي المدى (م ± 1σ) - خيار الصف 68.3%(رسم بياني 1).

ج) لتحديد الخيارات "المنبثقة".

د) لتحديد معالم القاعدة وعلم الأمراض باستخدام تقديرات سيجما

ه) لحساب معامل الاختلاف

و) لحساب متوسط ​​خطأ الوسط الحسابي.

لتوصيف أي مجموعة سكانية لديهانوع التوزيع الطبيعي يكفي معرفة معلمتين: الوسط الحسابي والانحراف المعياري.

الشكل 1. قاعدة ثلاثة سيجما

مثال.

في طب الأطفال، يتم استخدام الانحراف المعياري لتقييم النمو البدني للأطفال من خلال مقارنة بيانات طفل معين مع المؤشرات القياسية المقابلة. يتم أخذ المتوسط ​​الحسابي للنمو البدني للأطفال الأصحاء كمعيار. تتم مقارنة المؤشرات بالمعايير باستخدام جداول خاصة يتم فيها تقديم المعايير جنبًا إلى جنب مع مقاييس سيجما المقابلة لها. من المعتقد أنه إذا كان مؤشر النمو البدني للطفل ضمن المعيار (المتوسط ​​الحسابي) ±σ، إذن التطور الجسديالطفل (حسب هذا المؤشر) يتوافق مع القاعدة. إذا كان المؤشر ضمن المعيار ±2σ، فسيكون هناك انحراف طفيف عن المعيار. إذا تجاوز المؤشر هذه الحدود، فإن النمو البدني للطفل يختلف بشكل حاد عن القاعدة (علم الأمراض ممكن).

بالإضافة إلى مؤشرات التباين المعبر عنها بالقيم المطلقة، يستخدم البحث الإحصائي مؤشرات التباين المعبر عنها بالقيم النسبية. معامل التذبذب -هذه هي نسبة نطاق التباين إلى متوسط ​​قيمة السمة. معامل الاختلاف -هذه هي نسبة الانحراف المعياري إلى متوسط ​​قيمة الخاصية. عادة، يتم التعبير عن هذه القيم كنسب مئوية.

صيغ حساب مؤشرات التباين النسبي:

من الصيغ المذكورة أعلاه يتضح أنه كلما زاد المعامل الخامس كلما كان التباين أقرب إلى الصفر، كان التباين في القيم المميزة أصغر. الاكثر الخامسكلما كانت العلامة أكثر تنوعًا.

في الممارسة الإحصائية، غالبا ما يستخدم معامل الاختلاف. يتم استخدامه ليس فقط لتقييم مقارن للتباين، ولكن أيضًا لتوصيف تجانس السكان. ويعتبر السكان متجانسين إذا كان معامل التباين لا يتجاوز 33% (للتوزيعات القريبة من الطبيعي). من الناحية الحسابية، فإن نسبة σ والوسط الحسابي تحيد تأثير القيمة المطلقة لهذه الخصائص، والنسبة المئوية تجعل معامل التباين قيمة بلا أبعاد (غير مسماة).

يتم تقدير القيمة الناتجة لمعامل التباين وفقًا للتدرجات التقريبية لدرجة تنوع السمة:

ضعيف - يصل إلى 10٪

متوسط ​​- 10 - 20%

قوي - أكثر من 20٪

يُنصح باستخدام معامل الاختلاف في الحالات التي يكون فيها من الضروري مقارنة الخصائص المختلفة في الحجم والأبعاد.

يظهر بوضوح الفرق بين معامل التباين ومعايير الانتثار الأخرى مثال.

الجدول 1

تكوين العاملين في المؤسسات الصناعية

واستنادا إلى الخصائص الإحصائية الواردة في المثال، يمكننا استخلاص استنتاج حول التجانس النسبي للتركيبة العمرية والمستوى التعليمي لموظفي المؤسسة، نظرا لانخفاض الاستقرار المهني للمجموعة التي شملتها الدراسة. ومن السهل أن نرى أن محاولة الحكم على هذه الاتجاهات الاجتماعية من خلال الانحراف المعياري من شأنه أن يؤدي إلى نتيجة خاطئة، كما أن محاولة مقارنة الخصائص المحاسبية "الخبرة العملية" و"العمر" مع المؤشر المحاسبي "التعليم" ستكون عمومًا أمرًا خاطئًا. غير صحيحة بسبب عدم تجانس هذه الخصائص.

الوسيط والنسب المئوية

بالنسبة للتوزيعات الترتيبية (الرتبة)، حيث يكون معيار منتصف السلسلة هو الوسيط، لا يمكن أن يكون الانحراف المعياري والتشتت بمثابة خصائص لتشتت المتغير.

وينطبق الشيء نفسه على سلسلة التباين المفتوحة. ويرجع هذا الظرف إلى حقيقة أن الانحرافات التي يتم حساب التباين وσ منها يتم قياسها من الوسط الحسابي، الذي لا يتم حسابه في سلسلة التباين المفتوحة وفي سلسلة توزيعات الخصائص النوعية. لذلك، للحصول على وصف مضغوط للتوزيعات، يتم استخدام معلمة مبعثرة أخرى - الكمية(مرادف - "المئوي")، مناسب لوصف الخصائص النوعية والكمية في أي شكل من أشكال توزيعها. يمكن أيضًا استخدام هذه المعلمة لتحويل الخصائص الكمية إلى خصائص نوعية. في هذه الحالة، يتم تعيين هذه التصنيفات اعتمادًا على الترتيب الكمي الذي يتوافق معه خيار معين.

في ممارسة البحوث الطبية الحيوية، يتم استخدام الكميات التالية في أغلب الأحيان:

- الوسيط؛

، - الربعيات (الأرباع)، حيث - الربع الأدنى، الربع الأعلى.

تقسم الكميات مساحة التغييرات المحتملة في سلسلة التباين إلى فترات زمنية معينة. الوسيط (الكمي) هو خيار يقع في منتصف سلسلة التباين ويقسم هذه السلسلة إلى نصفين إلى جزأين متساويين ( 0,5 و 0,5 ). يقسم الربع السلسلة إلى أربعة أجزاء: الجزء الأول (الربيع السفلي) هو خيار يفصل بين الخيارات التي لا تتجاوز قيمها العددية 25% من الحد الأقصى الممكن في سلسلة معينة؛ ما يصل إلى 50٪ من الحد الأقصى الممكن. يفصل الربع العلوي () الخيارات بما يصل إلى 75% من الحد الأقصى للقيم الممكنة.

في حالة التوزيع غير المتماثل المتغير بالنسبة للوسط الحسابي، يتم استخدام الوسيط والرباعيات لتوصيفه.وفي هذه الحالة يتم استخدام النموذج التالي لعرض القيمة المتوسطة - مه (;). على سبيل المثال، السمة المدروسة - "الفترة التي بدأ فيها الطفل المشي بشكل مستقل" - لها توزيع غير متماثل في مجموعة الدراسة. في الوقت نفسه، يتوافق الربع السفلي () مع بداية المشي - 9.5 أشهر، المتوسط ​​- 11 شهرا، الربع العلوي () - 12 شهرا. وبناء على ذلك، سيتم عرض خاصية الاتجاه المتوسط ​​للسمة المحددة على أنها 11 (9.5؛ 12) شهرًا.

تقييم الأهمية الإحصائية لنتائج الدراسة

تُفهم الأهمية الإحصائية للبيانات على أنها درجة توافقها مع الواقع المعروض، أي. البيانات ذات الأهمية الإحصائية هي تلك التي لا تشوه الواقع الموضوعي وتعكسه بشكل صحيح.

إن تقييم الأهمية الإحصائية لنتائج البحث يعني تحديد احتمالية نقل النتائج التي تم الحصول عليها من عينة السكان إلى جميع السكان. يعد تقييم الأهمية الإحصائية أمرًا ضروريًا لفهم مقدار الظاهرة التي يمكن استخدامها للحكم على الظاهرة ككل وأنماطها.

يتكون تقييم الأهمية الإحصائية لنتائج البحث من:

1. أخطاء التمثيل (أخطاء القيم المتوسطة والنسبية) - م;

2. حدود الثقة للقيم المتوسطة أو النسبية؛

3. ثبات الفرق في القيم المتوسطة أو النسبية حسب المعيار ر.

الخطأ المعياري للوسط الحسابيأو خطأ في التمثيليميز تقلبات المتوسط. وتجدر الإشارة إلى أنه كلما زاد حجم العينة، قل انتشار القيم المتوسطة. يتم حساب الخطأ المعياري للمتوسط ​​باستخدام الصيغة:

في الأدبيات العلمية الحديثة، يتم كتابة الوسط الحسابي مع الخطأ التمثيلي:

أو مع الانحراف المعياري:

على سبيل المثال، خذ بعين الاعتبار البيانات المتعلقة بـ 1500 عيادة في المدينة (عموم السكان). ويبلغ متوسط ​​عدد المرضى الذين تخدمهم العيادة 18,150 شخصًا. الاختيار العشوائي لـ 10% من المواقع (150 عيادة) يعطي متوسط ​​عدد المرضى يساوي 20,051 شخصًا. من الواضح أن خطأ أخذ العينات يرجع إلى حقيقة أنه لم يتم تضمين جميع العيادات البالغ عددها 1500 في العينة، وهو يساوي الفرق بين هذه المتوسطات - المتوسط ​​العام ( مالجين) ومتوسط ​​العينة ( مالمحدد). إذا قمنا بتكوين عينة أخرى بنفس الحجم من مجتمعنا، فستعطي قيمة خطأ مختلفة. جميع وسائل العينة هذه ذات العينات الكبيرة بما فيه الكفاية يتم توزيعها بشكل طبيعي حول المتوسط ​​العام مع العينات الكبيرة بما فيه الكفاية عدد كبيرتكرار عينة من نفس العدد من الكائنات من السكان. الخطأ المعياري للمتوسط م- هذا هو الانتشار الحتمي لمتوسطات العينة حول المتوسط ​​العام.

في حالة تقديم نتائج البحث بكميات نسبية (على سبيل المثال، النسب المئوية) - يتم حسابها الخطأ المعياري للكسر:

حيث P هو المؤشر بنسبة %، وn هو عدد الملاحظات.

يتم عرض النتيجة كما (ف ± م)٪. على سبيل المثال،وكانت نسبة الشفاء بين المرضى (95.2±2.5)%.

في حالة تعدد عناصر السكان، ثم عند حساب الأخطاء المعيارية للوسط والكسر في مقام الكسر، بدلا منيجب أن توضع.

بالنسبة للتوزيع الطبيعي (توزيع متوسطات العينة طبيعي)، فإننا نعرف أي جزء من السكان يقع ضمن أي فترة زمنية حول المتوسط. بخاصة:

ومن الناحية العملية، تكمن المشكلة في أن خصائص عامة السكان غير معروفة لنا، ويتم إجراء العينة بدقة بغرض تقديرها. هذا يعني أنه إذا صنعنا عينات من نفس الحجم نمن عامة السكان، ففي 68.3% من الحالات، سيحتوي الفاصل الزمني على القيمة م(في 95.5% من الحالات سيكون على الفاصل الزمني وفي 99.7% من الحالات – على الفاصل الزمني).

نظرًا لأنه تم أخذ عينة واحدة فقط بالفعل، فقد تمت صياغة هذا البيان من حيث الاحتمال: مع احتمال 68.3%، يقع متوسط ​​قيمة السمة في المجتمع في الفاصل الزمني، مع احتمال 95.5% - في الفاصل الزمني الخ

من الناحية العملية، يتم إنشاء فاصل زمني حول قيمة العينة بحيث، مع وجود احتمالية معينة (عالية بما فيه الكفاية)، احتمال الثقة –سوف "يغطي" القيمة الحقيقية لهذه المعلمة في عموم السكان. يسمى هذا الفاصل فاصل الثقة.

احتمال الثقةص هذه هي درجة الثقة بأن فاصل الثقة سيحتوي بالفعل على القيمة الحقيقية (غير المعروفة) للمعلمة في المجتمع.

على سبيل المثال، إذا كان احتمال الثقة رهي 90%، وهذا يعني أن 90 عينة من أصل 100 ستعطي التقدير الصحيح للمعلمة في المجتمع. وبناء على ذلك فإن احتمال الخطأ، أي. تقدير غير صحيح للمعدل العام للعينة يساوي بالنسبة المئوية: . في هذا المثال، هذا يعني أن 10 عينات من أصل 100 ستعطي تقديرًا غير صحيح.

من الواضح أن درجة الثقة (احتمالية الثقة) تعتمد على حجم الفاصل الزمني: كلما اتسع الفاصل الزمني، زادت الثقة في أن قيمة غير معروفة للسكان ستقع فيه. ومن الناحية العملية، يتم استخدام ضعف خطأ أخذ العينات على الأقل لإنشاء فاصل ثقة لتوفير ثقة بنسبة 95.5% على الأقل.

يتيح لنا تحديد حدود الثقة للمتوسطات والقيم النسبية العثور على القيمتين المتطرفتين - الحد الأدنى الممكن والحد الأقصى الممكن، والذي يمكن أن يحدث من خلاله المؤشر المدروس في جميع السكان. بناء على هذا، حدود الثقة (أو فاصل الثقة)- هذه هي حدود القيم المتوسطة أو النسبية، والتي بعدها بسبب التقلبات العشوائية هناك احتمال ضئيل.

يمكن إعادة كتابة فترة الثقة على النحو التالي: ، أين ر- معيار الثقة.

يتم تحديد حدود الثقة للوسط الحسابي في المجتمع بالصيغة:

م الجين = م يختار + ر م م

للقيمة النسبية:

ر الجين = ص يختار + ر م ر

أين م الجينو ر الجين- القيم المتوسطة والنسبية لعموم السكان؛ م يختارو ر يختار- قيم المتوسط ​​والقيم النسبية التي تم الحصول عليها من مجتمع العينة؛ م مو م ص- أخطاء القيم المتوسطة والنسبية؛ ر- معيار الثقة (معيار الدقة الذي يتم تحديده عند التخطيط للدراسة ويمكن أن يساوي 2 أو 3)؛ ر م- هذا هو فاصل الثقة أو Δ - الحد الأقصى لخطأ المؤشر الذي تم الحصول عليه في دراسة العينة.

وتجدر الإشارة إلى أن قيمة المعيار ريرتبط إلى حد ما باحتمالية التنبؤ الخالي من الأخطاء (p)، معبرًا عنه بنسبة٪. ويتم اختياره من قبل الباحث نفسه، مسترشداً بضرورة الحصول على النتيجة بدرجة الدقة المطلوبة. وبالتالي فإن احتمالية التنبؤ الخالي من الأخطاء تبلغ 95.5%، وتكون قيمة المعيار رهو 2، بنسبة 99.7% - 3.

تعتبر تقديرات فترة الثقة المحددة مقبولة فقط للمجموعات الإحصائية التي لديها أكثر من 30 ملاحظة، ومع حجم سكاني أصغر (عينات صغيرة)، يتم استخدام جداول خاصة لتحديد معيار t. في هذه الجداول، تقع القيمة المطلوبة عند تقاطع الخط المقابل لحجم السكان (ن-1)، وعمود يتوافق مع مستوى احتمالية التنبؤ الخالي من الأخطاء (95.5%، 99.7%) الذي اختاره الباحث. في الأبحاث الطبية، عند وضع حدود الثقة لأي مؤشر، فإن احتمالية التنبؤ الخالي من الأخطاء تبلغ 95.5% أو أكثر. وهذا يعني أن قيمة المؤشر الذي تم الحصول عليه من مجتمع العينة يجب أن تكون موجودة في عموم السكان في 95.5% على الأقل من الحالات.

    أسئلة حول موضوع الدرس:

    أهمية مؤشرات تنوع السمات في مجتمع إحصائي.

    الخصائص العامة المؤشرات المطلقةالاختلافات.

    الانحراف المعياري، الحساب، التطبيق.

    التدابير النسبية للاختلاف.

    الوسيط، النتيجة الربعية.

    تقييم الأهمية الإحصائية لنتائج الدراسة.

    الخطأ المعياري للوسط الحسابي، صيغة الحساب، مثال للاستخدام.

    حساب النسبة وخطأها المعياري.

    مفهوم احتمالية الثقة، مثال للاستخدام.

10. مفهوم فترة الثقة وتطبيقه.

    اختبار المهام حول الموضوع مع الإجابات القياسية:

1. المؤشرات المطلقة للاختلاف تشير إلى

1) معامل الاختلاف

2) معامل التذبذب

4) متوسط

2. المؤشرات النسبية للتغير تتعلق

1) التباين

4) معامل الاختلاف

3. المعيار الذي يتم تحديده من خلال القيم القصوى لخيار في سلسلة متغيرة

2) السعة

3) التشتت

4) معامل الاختلاف

4. الفرق بين الخيارات المتطرفة هو

2) السعة

3) الانحراف المعياري

4) معامل الاختلاف

5. متوسط ​​مربع انحرافات القيم الفردية لخاصية ما عن قيمها المتوسطة هو

1) معامل التذبذب

2) متوسط

3) التشتت

6. نسبة مقياس التباين إلى متوسط ​​قيمة الشخصية هي

1) معامل الاختلاف

2) الانحراف المعياري

4) معامل التذبذب

7. نسبة متوسط ​​الانحراف المربع إلى متوسط ​​قيمة إحدى الخصائص هي

1) التباين

2) معامل الاختلاف

3) معامل التذبذب

4) السعة

8. الخيار الذي يقع في منتصف سلسلة التنويع ويقسمها إلى جزأين متساويين هو

1) متوسط

3) السعة

9. في الأبحاث الطبية، عند وضع حدود الثقة لأي مؤشر، يتم قبول احتمالية التنبؤ الخالي من الأخطاء

10. إذا كانت 90 عينة من أصل 100 تعطي التقدير الصحيح لمعلمة ما في المجتمع، فهذا يعني أن احتمال الثقة صمتساوي

11. إذا أعطت 10 عينات من 100 تقديرًا غير صحيح، فإن احتمال الخطأ يكون متساويًا

12. حدود القيم المتوسطة أو النسبية، التي يكون تجاوزها بسبب التذبذبات العشوائية احتمالًا ضئيلًا - هذا هو

1) فاصل الثقة

2) السعة

4) معامل الاختلاف

13. تعتبر عينة صغيرة من السكان

1) ن أقل من أو يساوي 100

2) ن أقل من أو يساوي 30

3) ن أقل من أو يساوي 40

4) ن قريب من 0

14. لاحتمالية التنبؤ الخالي من الأخطاء، قيمة المعيار 95% ريكون

15. لاحتمالية التنبؤ الخالي من الأخطاء 99% قيمة المعيار ريكون

16. بالنسبة للتوزيعات القريبة من التوزيع الطبيعي، يعتبر السكان متجانسين إذا لم يتجاوز معامل التباين

17. الخيار، الخيارات المنفصلة، ​​التي لا تتجاوز قيمها العددية 25% من الحد الأقصى الممكن في سلسلة معينة - هذا هو

2) الربع الأدنى

3) الربع الأعلى

4) الربع

18. البيانات التي لا تشوه وتعكس الواقع الموضوعي بشكل صحيح تسمى

1) مستحيل

2) ممكن على قدم المساواة

3) موثوقة

4) عشوائية

19. وفقا لقاعدة "ثلاثة سيجما"، مع التوزيع الطبيعي للخاصية داخل
سوف يتم تحديد موقعه

1) خيار 68.3%

تجدر الإشارة إلى أن حساب التباين هذا له عيب - فقد تبين أنه متحيز، أي. توقعها الرياضي لا يساوي القيمة الحقيقية للتباين. اقرأ المزيد عن هذا. وفي الوقت نفسه، ليس كل شيء سيئا للغاية. ومع زيادة حجم العينة، فإنها لا تزال تقترب من نظيرتها النظرية، أي. غير متحيز بشكل مقارب. لذلك، عند العمل مع أحجام كبيرةالعينات، يمكنك استخدام الصيغة أعلاه.

ومن المفيد ترجمة لغة الإشارات إلى لغة الكلمات. وتبين أن التباين هو متوسط ​​مربع الانحرافات. أي أنه يتم حساب متوسط ​​القيمة أولاً، ثم يتم أخذ الفرق بين كل قيمة أصلية ومتوسطة، وتربيعه، وإضافته، ثم قسمته على عدد القيم في المجتمع. يعكس الفرق بين القيمة الفردية والمتوسط ​​مقياس الانحراف. يتم تربيعها بحيث تصبح جميع الانحرافات أرقامًا موجبة حصريًا ولتجنب التدمير المتبادل للانحرافات الإيجابية والسلبية عند تلخيصها. وبعد ذلك، وبالنظر إلى الانحرافات التربيعية، فإننا ببساطة نحسب الوسط الحسابي. المتوسط ​​- المربع - الانحرافات. يتم تربيع الانحرافات ويتم حساب المتوسط. الحل يكمن في ثلاث كلمات فقط.

ومع ذلك، في شكل نقي، مثل الوسط الحسابي، أو الفهرس، ولا يتم استخدام التباين. إنه بالأحرى مؤشر مساعد ومتوسط ​​ضروري لأنواع أخرى من التحليل الإحصائي. ولا تحتوي حتى على وحدة قياس عادية. إذا حكمنا من خلال الصيغة، فهذا هو مربع وحدة قياس البيانات الأصلية. بدون زجاجة، كما يقولون، لا يمكنك معرفة ذلك.

(الوحدة 111)

ومن أجل إعادة التباين إلى الواقع، أي استخدامه لأغراض أكثر دنيوية، يتم استخراج الجذر التربيعي منه. اتضح ما يسمى الانحراف المعياري (RMS). هناك أسماء “الانحراف المعياري” أو “سيجما” (من اسم الحرف اليوناني). صيغة الانحراف المعياري هي:

للحصول على هذا المؤشر للعينة، استخدم الصيغة:

كما هو الحال مع التباين، هناك خيار حسابي مختلف قليلاً. ولكن مع نمو العينة، يختفي الفرق.

من الواضح أن الانحراف المعياري يميز أيضًا مقياس تشتت البيانات، ولكن الآن (على عكس التشتت) يمكن مقارنته بالبيانات الأصلية، حيث أن لديهم نفس وحدات القياس (وهذا واضح من صيغة الحساب). لكن هذا المؤشر في شكله النقي ليس مفيدًا جدًا، لأنه يحتوي على عدد كبير جدًا من الحسابات الوسيطة المربكة (الانحراف، التربيع، المجموع، المتوسط، الجذر). ومع ذلك، فمن الممكن بالفعل العمل مباشرة مع الانحراف المعياري، لأن خصائص هذا المؤشر مدروسة ومعروفة جيدًا. على سبيل المثال، هناك هذا قاعدة ثلاثة سيجماوالتي تنص على أن 997 من 1000 قيمة بيانات تقع ضمن ±3 سيجما من الوسط الحسابي. الانحراف المعياري، كمقياس لعدم اليقين، يشارك أيضًا في العديد من الحسابات الإحصائية. وبمساعدتها، يتم تحديد درجة دقة التقديرات والتنبؤات المختلفة. إذا كان التباين كبيرًا جدًا، فسيكون الانحراف المعياري كبيرًا أيضًا، وبالتالي ستكون التوقعات غير دقيقة، وسيتم التعبير عنها، على سبيل المثال، في فترات ثقة واسعة جدًا.

معامل الاختلاف

يعطي الانحراف المعياري تقديرًا مطلقًا لقياس التشتت. ولذلك، لفهم مدى حجم التشتت بالنسبة للقيم نفسها (أي بغض النظر عن حجمها)، فمن الضروري المؤشر النسبي. ويسمى هذا المؤشر معامل الاختلافويتم حسابها باستخدام الصيغة التالية:

يتم قياس معامل الاختلاف كنسبة مئوية (إذا ضرب بنسبة 100%). باستخدام هذا المؤشر، يمكنك مقارنة مجموعة متنوعة من الظواهر، بغض النظر عن حجمها ووحدات القياس. هذه الحقيقة تجعل معامل الاختلاف شائعًا جدًا.

ومن المقبول في الإحصاء أنه إذا كانت قيمة معامل التباين أقل من 33%، يعتبر السكان متجانسين؛ وإذا كانت أكثر من 33%، فهو غير متجانس. من الصعب بالنسبة لي التعليق على أي شيء هنا. لا أعرف من حدد ذلك ولماذا، لكنها تعتبر بديهية.

أشعر أنني مفتون بالنظرية الجافة وأحتاج إلى إحضار شيء مرئي ومجازي. من ناحية أخرى، تصف جميع مؤشرات التباين نفس الشيء تقريبًا، ولكن يتم حسابها بشكل مختلف. لذلك، من الصعب عرض مجموعة متنوعة من الأمثلة التي يمكن أن تختلف فقط في قيم المؤشرات، ولكن ليس جوهرها. لذلك دعونا نقارن كيف تختلف قيم مؤشرات التباين المختلفة لنفس مجموعة البيانات. لنأخذ مثال حساب متوسط ​​الانحراف الخطي (من). فيما يلي البيانات المصدر:

وجدول لتذكيرك.

وباستخدام هذه البيانات، نقوم بحساب مؤشرات التباين المختلفة.

القيمة المتوسطة هي الوسط الحسابي المعتاد.

نطاق الاختلاف هو الفرق بين الحد الأقصى والحد الأدنى:

يتم حساب متوسط ​​الانحراف الخطي باستخدام الصيغة:

الانحراف المعياري:

دعونا نلخص الحساب في الجدول.

وكما يتبين، فإن المتوسط ​​الخطي والانحراف المعياري يعطيان قيمًا متشابهة لدرجة تباين البيانات. التباين هو مربع سيجما، لذلك سيكون دائمًا نسبيًا عدد كبير، وهو في الواقع لا يعني شيئًا. نطاق الاختلاف هو الفرق بين القيم المتطرفة ويمكن أن يتحدث كثيرًا.

دعونا تلخيص بعض النتائج.

يعكس تباين المؤشر تباين العملية أو الظاهرة. يمكن قياس درجتها باستخدام عدة مؤشرات.

1. نطاق الاختلاف - الفرق بين الحد الأقصى والحد الأدنى. يعكس نطاق القيم الممكنة.
2. متوسط ​​الانحراف الخطي – يعكس متوسط ​​الانحرافات المطلقة (المعيارية) لجميع قيم السكان الذين تم تحليلهم عن متوسط ​​قيمتها.
3. التشتت - متوسط ​​مربع الانحرافات.
4. الانحراف المعياري هو جذر التشتت (متوسط ​​مربع الانحرافات).
5. يعتبر معامل التباين المؤشر الأكثر شمولية، حيث يعكس درجة تشتت القيم، بغض النظر عن حجمها ووحدات قياسها. يتم قياس معامل التباين كنسبة مئوية ويمكن استخدامه لمقارنة التباين في العمليات والظواهر المختلفة.

وهكذا يوجد في التحليل الإحصائي نظام من المؤشرات التي تعكس تجانس الظواهر واستقرار العمليات. في كثير من الأحيان لا يكون لمؤشرات التباين معنى مستقل وتستخدم لمزيد من تحليل البيانات (حساب فترات الثقة

في هذا المقال سأتحدث عنه كيفية العثور على الانحراف المعياري. هذه المادة مهمة للغاية لفهم الرياضيات بشكل كامل، لذلك يجب على مدرس الرياضيات تخصيص درس منفصل أو حتى عدة دروس لدراستها. ستجد في هذه المقالة رابطًا لفيديو تعليمي مفصل ومفهوم يشرح ما هو الانحراف المعياري وكيفية العثور عليه.

الانحراف المعيارييجعل من الممكن تقييم انتشار القيم التي تم الحصول عليها نتيجة لقياس معلمة معينة. يشار إليه بالرمز (الحرف اليوناني "سيجما").

صيغة الحساب بسيطة للغاية. للعثور على الانحراف المعياري، عليك أن تأخذ الجذر التربيعي للتباين. والآن عليك أن تسأل: "ما هو التباين؟"

ما هو التباين

تعريف التباين يذهب مثل هذا. التشتت هو الوسط الحسابي لمربعات انحرافات القيم عن المتوسط.

للعثور على التباين، قم بإجراء العمليات الحسابية التالية بالتسلسل:

  • تحديد المتوسط ​​(المتوسط ​​الحسابي البسيط لسلسلة من القيم).
  • ثم اطرح المتوسط ​​من كل قيمة وقم بتربيع الفرق الناتج (تحصل على الفرق التربيعي).
  • الخطوة التالية هي حساب الوسط الحسابي لفروق المربعات الناتجة (يمكنك معرفة السبب وراء المربعات أدناه).

لنلقي نظرة على مثال. لنفترض أنك وأصدقاؤك قررتم قياس ارتفاع كلابك (بالملليمترات). نتيجة للقياسات، حصلت على قياسات الارتفاع التالية (عند الذراعين): 600 مم، 470 مم، 170 مم، 430 مم، 300 مم.

دعونا نحسب المتوسط ​​والتباين والانحراف المعياري.

دعونا أولا العثور على القيمة المتوسطة. كما تعلم بالفعل، للقيام بذلك تحتاج إلى جمع كل القيم المقاسة وتقسيمها على عدد القياسات. تقدم الحساب:

متوسط ​​ملم.

وبذلك يكون المتوسط ​​(الوسط الحسابي) 394 ملم.

الآن نحن بحاجة إلى تحديد انحراف ارتفاع كل كلب عن المتوسط:

أخيراً، لحساب التباين، نقوم بتربيع كل من الفروق الناتجة، ثم نوجد الوسط الحسابي للنتائج التي تم الحصول عليها:

التشتت مم 2 .

وبذلك يكون التشتت 21704 مم2.

كيفية العثور على الانحراف المعياري

فكيف يمكننا الآن حساب الانحراف المعياري مع معرفة التباين؟ وكما نتذكر، خذ الجذر التربيعي له. أي أن الانحراف المعياري يساوي:

مم (مقرب إلى أقرب عدد صحيح بالملليمتر).

باستخدام هذه الطريقة، وجدنا أن بعض الكلاب (على سبيل المثال، فصيلة روتويللر) شديدة للغاية الكلاب الكبيرة. ولكن هناك أيضًا كلابًا صغيرة جدًا (على سبيل المثال، الكلاب الألمانية، لكن لا يجب أن تخبرهم بذلك).

والشيء الأكثر إثارة للاهتمام هو أن الانحراف المعياري يحمل معه معلومات مفيدة. يمكننا الآن إظهار أي من نتائج قياس الارتفاع التي تم الحصول عليها تقع ضمن الفاصل الزمني الذي نحصل عليه إذا رسمنا الانحراف المعياري عن المتوسط ​​(على كلا الجانبين).

أي أنه باستخدام الانحراف المعياري نحصل على طريقة "قياسية" تسمح لنا بمعرفة أي من القيم طبيعية (متوسطة إحصائية) وأيها كبيرة بشكل غير عادي أو صغيرة على العكس.

ما هو الانحراف المعياري

لكن... كل شيء سيكون مختلفاً قليلاً إذا قمنا بالتحليل عينةبيانات. في مثالنا نظرنا عامه السكان.أي أن كلابنا الخمسة كانت الكلاب الوحيدة في العالم التي أثارت اهتمامنا.

ولكن إذا كانت البيانات عبارة عن عينة (قيم مختارة من عدد كبير من السكان)، فيجب إجراء الحسابات بشكل مختلف.

إذا كانت هناك قيم، إذن:

ويتم تنفيذ جميع الحسابات الأخرى بالمثل، بما في ذلك تحديد المتوسط.

على سبيل المثال، إذا كانت كلابنا الخمسة مجرد عينة من عدد الكلاب (جميع الكلاب على هذا الكوكب)، فيجب علينا القسمة على 4 وليس 5يسمى:

تباين العينة = مم 2.

وفي هذه الحالة يكون الانحراف المعياري للعينة يساوي مم (مقربًا إلى أقرب عدد صحيح).

يمكننا القول أننا قمنا ببعض "التصحيح" في الحالة التي تكون فيها قيمنا مجرد عينة صغيرة.

ملحوظة. لماذا بالضبط الاختلافات التربيعية؟

لكن لماذا نأخذ الفروق المربعة بالضبط عند حساب التباين؟ لنفترض أنه عند قياس بعض المعلمات، تلقيت مجموعة القيم التالية: 4؛ 4؛ -4؛ -4. إذا قمنا ببساطة بجمع الانحرافات المطلقة عن الوسط (الفروق) معًا... فسيتم حذف القيم السالبة مع القيم الموجبة:

.

وتبين أن هذا الخيار لا طائل منه. إذن ربما يكون من المفيد تجربة القيم المطلقة للانحرافات (أي وحدات هذه القيم)؟

للوهلة الأولى، اتضح جيدا (القيمة الناتجة، بالمناسبة، تسمى متوسط ​​الانحراف المطلق)، ولكن ليس في جميع الحالات. دعونا نجرب مثالا آخر. دع القياس يؤدي إلى مجموعة القيم التالية: 7؛ 1؛ -6؛ -2. ثم متوسط ​​الانحراف المطلق هو:

رائع! مرة أخرى حصلنا على نتيجة 4، على الرغم من أن الاختلافات لها انتشار أكبر بكثير.

الآن دعونا نرى ما سيحدث إذا قمنا بتربيع الاختلافات (ثم أخذنا الجذر التربيعي لمجموعها).

بالنسبة للمثال الأول سيكون:

.

أما المثال الثاني فيكون:

الآن أصبح الأمر مختلفًا تمامًا! وكلما زادت الفروقات زاد الانحراف المعياري.. وهو ما كنا نهدف إليه.

في الواقع، في هذه الطريقةيتم استخدام نفس الفكرة عند حساب المسافة بين النقاط، ويتم تطبيقها بطريقة مختلفة فقط.

ومن وجهة نظر رياضية، فإن استخدام المربعات و الجذور التربيعيةيعطي فائدة أكثر مما يمكن أن نعتمد عليه القيم المطلقةالانحرافات، مما يجعل الانحراف المعياري قابلاً للتطبيق على المشكلات الرياضية الأخرى.

أخبرك سيرجي فاليريفيتش بكيفية العثور على الانحراف المعياري

الانحراف المعياري(مرادفات: الانحراف المعياري, الانحراف المعياري, انحراف مربع; المصطلحات ذات الصلة: الانحراف المعياري, انتشار قياسي) - في نظرية الاحتمالات والإحصاء، المؤشر الأكثر شيوعا لتشتت قيم المتغير العشوائي نسبة إلى توقعه الرياضي. مع صفائف محدودة من عينات القيم، بدلا من التوقع الرياضي، يتم استخدام الوسط الحسابي لمجموعة العينات.

يوتيوب الموسوعي

  • 1 / 5

    يتم قياس الانحراف المعياري بوحدات قياس المتغير العشوائي نفسه ويستخدم عند حساب الخطأ المعياري للوسط الحسابي، عند بناء فترات الثقة، عند اختبار الفرضيات إحصائيا، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.

    الانحراف المعياري:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • ملاحظة: في كثير من الأحيان توجد اختلافات في أسماء MSD (الانحراف الجذري لمتوسط ​​المربع) وSTD (الانحراف المعياري) مع صيغهما. على سبيل المثال، في وحدة numPy في لغة البرمجة Python، توصف الدالة std() بأنها "الانحراف المعياري"، بينما تعكس الصيغة الانحراف المعياري (القسمة على جذر العينة). في Excel، تختلف الدالة STANDARDEVAL() (القسمة على جذر n-1).

    الانحراف المعياري(تقدير الانحراف المعياري للمتغير العشوائي سمقارنة بتوقعها الرياضي المبني على تقدير غير متحيز لتباينها) س (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    أين σ 2 (\displaystyle \sigma ^(2))- تشتت؛ س ط (\displaystyle x_(i)) - أناالعنصر الرابع من الاختيار؛ ن (\displaystyle n)- حجم العينة؛

    - الوسط الحسابي للعينة:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة، من المستحيل بناء تقدير غير متحيز. ومع ذلك، فإن التقدير المبني على تقدير التباين غير المتحيز ثابت.

    وفقًا لـ GOST R 8.736-2011، يتم حساب الانحراف المعياري باستخدام الصيغة الثانية من هذا القسم. يرجى التحقق من النتائج.

    وفقًا لـ GOST R 8.736-2011، يتم حساب الانحراف المعياري باستخدام الصيغة الثانية من هذا القسم. يرجى التحقق من النتائج. (قاعدة ثلاثة سيجما 3 σ (\displaystyle 3\سيجما ) ) - تقع جميع قيم المتغير العشوائي الموزع بشكل طبيعي تقريبًا في الفاصل الزمني(x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)) . بشكل أكثر دقة - مع احتمال تقريبي 0.9973، تقع قيمة المتغير العشوائي الموزع بشكل طبيعي في الفاصل الزمني المحدد (شريطة أن تكون القيمةس ¯ (\displaystyle (\bar (x)))

    صحيح، ولم يتم الحصول عليه نتيجة لمعالجة العينات). . بشكل أكثر دقة - مع احتمال تقريبي 0.9973، تقع قيمة المتغير العشوائي الموزع بشكل طبيعي في الفاصل الزمني المحدد (شريطة أن تكون القيمةإذا كانت القيمة الحقيقية غير معروف، فلا يجب عليك استخدامهσ (\displaystyle \sigma ) ، أس ، أ .

    . وهكذا تتحول قاعدة الثلاثة سيجما إلى قاعدة الثلاثة

    تفسير قيمة الانحراف المعياري تُظهر القيمة الأكبر للانحراف المعياري انتشارًا أكبر للقيم في المجموعة المقدمةحجم متوسط

    الجموع. وبالتالي، فإن القيمة الأصغر توضح أن القيم الموجودة في المجموعة مجمعة حول القيمة المتوسطة. على سبيل المثال، لدينا ثلاث مجموعات أرقام: (0، 0، 14، 14)، (0، 6، 8، 14) و (6، 6، 8، 8). جميع المجموعات الثلاث لها قيم متوسطة تساوي 7، والانحرافات المعيارية، على التوالي، تساوي 7 و 5 و 1. المجموعة الأخيرة لها انحراف معياري صغير، حيث يتم تجميع القيم في المجموعة حول القيمة المتوسطة؛ المجموعة الأولى لديها أكثر من غيرهاأهمية عظيمة

    وبمعنى عام، يمكن اعتبار الانحراف المعياري مقياسا لعدم اليقين. على سبيل المثال، في الفيزياء، يتم استخدام الانحراف المعياري لتحديد خطأ سلسلة من القياسات المتعاقبة لبعض الكمية. هذه القيمة مهمة جداً لتحديد مدى معقولية الظاهرة قيد الدراسة بالمقارنة مع القيمة التي تنبأت بها النظرية: إذا كان متوسط ​​قيمة القياسات يختلف كثيراً عن القيم التي تنبأت بها النظرية (انحراف معياري كبير)، ثم يجب إعادة فحص القيم التي تم الحصول عليها أو طريقة الحصول عليها. المحددة بمخاطر المحفظة.

    مناخ

    لنفترض أن هناك مدينتين لهما نفس متوسط ​​درجة الحرارة اليومية القصوى، لكن إحداهما تقع على الساحل والأخرى على السهل. من المعروف أن المدن الواقعة على الساحل لديها العديد من درجات الحرارة القصوى المختلفة أثناء النهار والتي تكون أقل من المدن الواقعة في الداخل. ولذلك فإن الانحراف المعياري لدرجات الحرارة القصوى اليومية لمدينة ساحلية سيكون أقل منه لمدينة ثانية، على الرغم من أن متوسط ​​قيمتها هو نفسه، وهو ما يعني عمليا أن احتمال ذلك درجة الحرارة القصوىسيختلف الهواء في كل يوم محدد من السنة بقوة أكبر عن متوسط ​​القيمة، وهو أعلى بالنسبة لمدينة تقع داخل القارة.

    رياضة

    لنفترض أن هناك العديد من فرق كرة القدم التي يتم تقييمها وفقًا لمجموعة معينة من المعايير، على سبيل المثال، عدد الأهداف المسجلة والمستقبلة، وفرص التسجيل، وما إلى ذلك. من المرجح أن أفضل فريق في هذه المجموعة سيحصل على أفضل القيموفقا لمزيد من المعلمات. كلما كان الانحراف المعياري للفريق أصغر لكل من المعلمات المقدمة، كلما كانت نتيجة الفريق متوازنة بشكل أكبر؛ ومن ناحية أخرى، شارك الفريق مع قيمة عظيمةالانحراف المعياري يصعب التنبؤ بالنتيجة، وهو ما يفسر بدوره عدم التوازن، على سبيل المثال، دفاع قويلكن هجوم ضعيف.

    إن استخدام الانحراف المعياري لمعلمات الفريق يجعل من الممكن، بدرجة أو بأخرى، التنبؤ بنتيجة المباراة بين فريقين، وتقييم نقاط القوة ونقاط القوة. الجوانب الضعيفةالأوامر، وبالتالي الأساليب المختارة للنضال.

    الانحراف المعياري هو أحد تلك المصطلحات الإحصائية في عالم الشركات التي تضفي مصداقية على الأشخاص الذين ينجحون في تحقيقها بشكل جيد في محادثة أو عرض تقديمي، بينما يترك ارتباكًا غامضًا لأولئك الذين لا يعرفون ما هو ولكنهم يشعرون بالحرج الشديد من القيام بذلك بسأل. في الواقع، معظم المديرين لا يفهمون مفهوم الانحراف المعياري، وإذا كنت واحدًا منهم، فقد حان الوقت لكي تتوقف عن عيش الكذبة. في مقالة اليوم، سأخبرك كيف يمكن لهذا المقياس الإحصائي الذي لا يحظى بالتقدير الكافي أن يساعدك على فهم البيانات التي تتعامل معها بشكل أفضل.

    ماذا يقيس الانحراف المعياري؟

    تخيل أنك صاحب متجرين. ولتجنب الخسائر، من المهم أن يكون لديك سيطرة واضحة على أرصدة المخزون. في محاولة لمعرفة المدير الذي يدير المخزون بشكل أفضل، عليك أن تقرر تحليل المخزون في الأسابيع الستة الأخيرة. متوسط ​​التكلفة الأسبوعية للمخزون لكلا المتجرين هو نفسه تقريبًا ويبلغ حوالي 32 وحدة تقليدية. للوهلة الأولى، يظهر متوسط ​​جولة الإعادة أن كلا المديرين يؤديان أداءً مماثلاً.

    ولكن إذا ألقيت نظرة فاحصة على أنشطة المتجر الثاني، فسوف تقتنع أنه على الرغم من صحة متوسط ​​القيمة، إلا أن تقلب السهم مرتفع جدًا (من 10 إلى 58 دولارًا أمريكيًا). ومن ثم، يمكننا أن نستنتج أن المتوسط ​​لا يقيم البيانات بشكل صحيح دائمًا. هذا هو المكان الذي يأتي فيه الانحراف المعياري.

    يوضح الانحراف المعياري كيفية توزيع القيم بالنسبة للمتوسط ​​في منطقتنا. وبعبارة أخرى، يمكنك أن تفهم مدى انتشار الجريان السطحي من أسبوع لآخر.

    في مثالنا، استخدمنا دالة STDEV الخاصة ببرنامج Excel لحساب الانحراف المعياري مع المتوسط.

    في حالة المدير الأول، كان الانحراف المعياري 2. وهذا يخبرنا أن كل قيمة في العينة، في المتوسط، تنحرف 2 عن المتوسط. هل هذا جيد؟ دعونا ننظر إلى السؤال من زاوية مختلفة - الانحراف المعياري 0 يخبرنا أن كل قيمة في العينة تساوي متوسطها (في حالتنا، 32.2). وبالتالي فإن الانحراف المعياري 2 لا يختلف كثيرًا عن 0، مما يشير إلى أن معظم القيم قريبة من المتوسط. كلما اقترب الانحراف المعياري من 0، كلما كان المتوسط ​​أكثر موثوقية. علاوة على ذلك، يشير الانحراف المعياري القريب من 0 إلى تباين بسيط في البيانات. أي أن قيمة الجريان السطحي مع الانحراف المعياري 2 تشير إلى اتساق لا يصدق للمدير الأول.

    وفي حالة المتجر الثاني كان الانحراف المعياري 18.9. أي أن تكلفة الجريان السطحي في المتوسط ​​تنحرف بمقدار 18.9 عن متوسط ​​القيمة من أسبوع لآخر. انتشار مجنون! كلما زاد الانحراف المعياري عن 0، كلما كان المتوسط ​​أقل دقة. في حالتنا، يشير الرقم 18.9 إلى أن متوسط ​​القيمة (32.8 دولارًا أمريكيًا في الأسبوع) لا يمكن الوثوق به ببساطة. ويخبرنا أيضًا أن الجريان السطحي الأسبوعي متغير للغاية.

    هذا هو مفهوم الانحراف المعياري باختصار. على الرغم من أنه لا يوفر نظرة ثاقبة للقياسات الإحصائية الهامة الأخرى (الوضع، الوسيط...)، إلا أن الانحراف المعياري يلعب في الواقع دورًا حاسمًا في معظم الحسابات الإحصائية. إن فهم مبادئ الانحراف المعياري سوف يسلط الضوء على العديد من العمليات التجارية الخاصة بك.

    كيفية حساب الانحراف المعياري؟

    والآن نعرف ما يقوله رقم الانحراف المعياري. دعونا معرفة كيف يتم حسابه.

    دعونا نلقي نظرة على مجموعة البيانات من 10 إلى 70 بزيادات قدرها 10. وكما ترون، لقد قمت بالفعل بحساب قيمة الانحراف المعياري لهم باستخدام الدالة STANDARDEV في الخلية H2 (باللون البرتقالي).

    فيما يلي الخطوات التي يتخذها Excel للوصول إلى 21.6.

    يرجى ملاحظة أن جميع الحسابات مصورة لفهم أفضل. في الواقع، في Excel، تتم العملية الحسابية على الفور، مع ترك جميع الخطوات وراء الكواليس.

    أولاً، يقوم Excel بالبحث عن متوسط ​​العينة. في حالتنا، تبين أن المتوسط ​​هو 40، والذي يتم طرحه في الخطوة التالية من قيمة كل عينة. يتم تربيع كل فرق تم الحصول عليه وتلخيصه. لقد حصلنا على مجموع يساوي 2800، والذي يجب قسمته على عدد عناصر العينة ناقص 1. وبما أن لدينا 7 عناصر، اتضح أننا بحاجة إلى قسمة 2800 على 6. ومن النتيجة التي حصلنا عليها نجد الجذر التربيعي، وهذا الرقم سيكون الانحراف المعياري.

    بالنسبة لأولئك الذين ليسوا واضحين تمامًا بشأن مبدأ حساب الانحراف المعياري باستخدام التصور، أقدم تفسيرًا رياضيًا للعثور على هذه القيمة.

    وظائف لحساب الانحراف المعياري في إكسيل

    لدى Excel عدة أنواع من صيغ الانحراف المعياري. كل ما عليك فعله هو كتابة =STDEV وسترى بنفسك.

    تجدر الإشارة إلى أن الدالتين STDEV.V وSTDEV.G (الدالتان الأولى والثانية في القائمة) تكرران الدالتين STDEV وSTDEV (الدالتين الخامسة والسادسة في القائمة)، على التوالي، اللتين تم الاحتفاظ بهما للتوافق مع الإصدارات السابقة إصدارات إكسل.

    بشكل عام، يشير الاختلاف في نهايات الدالتين .B و.G إلى مبدأ حساب الانحراف المعياري للعينة أو المجتمع. لقد شرحت بالفعل الفرق بين هاتين المصفوفتين في المصفوفة السابقة.

    إحدى ميزات الدالتين STANDARDEVAL وSTANDARDEVAL (الدالتان الثالثة والرابعة في القائمة) هي أنه عند حساب الانحراف المعياري لمصفوفة، يكون الأمر منطقيًا و قيم النص. النص والقيم المنطقية الحقيقية هي 1، والقيم المنطقية الخاطئة هي 0. لا أستطيع أن أتخيل موقفًا سأحتاج فيه إلى هاتين الوظيفتين، لذلك أعتقد أنه يمكن تجاهلهما.