05.03.2024

כיצד לחשב את מקדם המתאם. מקדמי מתאם. שימוש באקסל לחישוב מקדמי מתאם


הודעה!הפתרון לבעיה הספציפית שלך ייראה דומה לדוגמה זו, כולל כל הטבלאות וטקסטים ההסברתיים להלן, אך תוך התחשבות בנתונים הראשוניים שלך...

מְשִׁימָה:
יש מדגם קשור של 26 זוגות ערכים (x k, y k):

ק 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

ק 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

ק 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

נדרש לחישוב/עלילה:
- מקדם התאמה;
- בדוק את השערת התלות של משתנים אקראיים X ו-Y, ברמת מובהקות של α = 0.05;
- מקדמי משוואת רגרסיה לינארית;
- דיאגרמת פיזור (שדה מתאם) וגרף קו רגרסיה;

פִּתָרוֹן:

1. חשב את מקדם המתאם.

מקדם המתאם הוא אינדיקטור להשפעה ההסתברותית ההדדית של שני משתנים אקראיים. מקדם התאמה ריכול לקחת ערכים מ -1 לפני +1 . אם הערך המוחלט קרוב יותר ל 1 , אז זו עדות לקשר חזק בין כמויות, ואם קרוב יותר ל 0 - אז זה מצביע על קשר חלש או היעדרו. אם ערך מוחלט רשווה לאחד, אז אפשר לדבר על קשר פונקציונלי בין כמויות, כלומר, כמות אחת יכולה להתבטא דרך אחרת באמצעות פונקציה מתמטית.


ניתן לחשב את מקדם המתאם באמצעות הנוסחאות הבאות:
נ
Σ
k = 1
(x k -M x) 2 , σ y 2 =
Mx =
1
נ
נ
Σ
k = 1
xk, M y =

או לפי נוסחה

Rx,y =
M xy - M x M y
S x S y
(1.4), שבו:
Mx =
1
נ
נ
Σ
k = 1
xk, M y =
1
נ
נ
Σ
k = 1
y k, Mxy =
1
נ
נ
Σ
k = 1
x k y k (1.5)
S x 2 =
1
נ
נ
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
נ
נ
Σ
k = 1
y k 2 - M y 2 (1.6)

בפועל, לרוב משתמשים בנוסחה (1.4) לחישוב מקדם המתאם מכיוון זה דורש פחות חישוב. עם זאת, אם השונות חושבה בעבר cov(X,Y), אז זה משתלם יותר להשתמש בנוסחה (1.1), כי בנוסף לערך השונות עצמו, ניתן להשתמש גם בתוצאות של חישובי ביניים.

1.1 בואו נחשב את מקדם המתאם באמצעות נוסחה (1.4), לשם כך, אנו מחשבים את הערכים של x k 2, y k 2 ו- x k y k ומכניסים אותם לטבלה 1.

שולחן 1


ק
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. בוא נחשב את M x באמצעות נוסחה (1.5).

1.2.1. x k

x 1 + x 2 + … + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

M x = 25.750000

1.3. הבה נחשב את M y בצורה דומה.

1.3.1. בואו נוסיף את כל האלמנטים ברצף y k

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. חלקו את הסכום המתקבל במספר הרכיבים לדוגמה

793.00000 / 26 = 30.50000

M y = 30.500000

1.4. באופן דומה אנו מחשבים את M xy.

1.4.1. בואו נוסיף ברצף את כל הרכיבים של העמודה השישית של טבלה 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. חלקו את הסכום המתקבל במספר האלמנטים

20412.83000 / 26 = 785.10885

M xy = 785.108846

1.5. בואו נחשב את הערך של S x 2 באמצעות נוסחה (1.6.).

1.5.1. בואו נוסיף ברצף את כל הרכיבים של העמודה הרביעית של טבלה 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. חלקו את הסכום המתקבל במספר האלמנטים

17256.91000 / 26 = 663.72731

1.5.3. החסר את הריבוע של M x מהמספר האחרון כדי לקבל את הערך של S x 2

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. הבה נחשב את הערך של S y 2 באמצעות נוסחה (1.6.).

1.6.1. בואו נוסיף ברצף את כל הרכיבים של העמודה החמישית של טבלה 1

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. חלקו את הסכום המתקבל במספר האלמנטים

24191.84000 / 26 = 930.45538

1.6.3. החסר את הריבוע של M y מהמספר האחרון כדי לקבל את הערך של S y 2

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. בוא נחשב את המכפלה של הכמויות S x 2 ו- S y 2.

S x 2 S y 2 = 0.66481 0.20538 = 0.136541

1.8. ניקח את השורש הריבועי של המספר האחרון ונקבל את הערך S x ​​S y.

S x S y = 0.36951

1.9. הבה נחשב את הערך של מקדם המתאם באמצעות נוסחה (1.4.).

R = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028

תשובה: R x,y = -0.720279

2. בודקים את המשמעות של מקדם המתאם (בודקים את השערת התלות).

מכיוון שאומדן מקדם המתאם מחושב על מדגם סופי ולכן עשוי לסטות מערך האוכלוסייה שלו, יש צורך לבדוק את מובהקות מקדם המתאם. הבדיקה מתבצעת באמצעות מבחן t:

t =
Rx,y
n - 2
1 - R 2 x,y
(2.1)

ערך אקראי טעוקב אחר התפלגות t של הסטודנט ובאמצעות טבלת התפלגות t יש צורך למצוא את הערך הקריטי של הקריטריון (t cr.α) ברמת מובהקות נתונה α. אם t מחושב לפי נוסחה (2.1) בערך מוחלט מתברר כקטנה מ-t cr.α , אזי אין תלות בין המשתנים האקראיים X ו-Y. אחרת, הנתונים הניסויים אינם סותרים את ההשערה לגבי התלות של משתנים אקראיים.


2.1. הבה נחשב את הערך של קריטריון t באמצעות נוסחה (2.1) ונקבל:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. באמצעות טבלת התפלגות t, אנו קובעים את הערך הקריטי של הפרמטר t cr.α

הערך הרצוי של tcr.α ממוקם בצומת השורה התואמת למספר דרגות החופש והעמודה המתאימה לרמת המובהקות הנתונה α.
במקרה שלנו, מספר דרגות החופש הוא n - 2 = 26 - 2 = 24 ו-α = 0.05 , המתאים לערך הקריטי של הקריטריון t cr.α = 2.064 (ראה טבלה 2)

שולחן 2 התפלגות t

מספר דרגות החופש
(n - 2)
α = 0.1 α = 0.05 α = 0.02 α = 0.01 α = 0.002 α = 0.001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. הבה נשווה את הערך המוחלט של קריטריון t ו-t cr.α

הערך המוחלט של קריטריון t אינו קטן מהערך הקריטי t = 5.08680, t cr.α = 2.064, לכן נתונים ניסויים, עם הסתברות 0.95(1 - α), לא סותרים את ההשערהעל התלות של משתנים אקראיים X ו-Y.

3. חשב את המקדמים של משוואת הרגרסיה הליניארית.

משוואת רגרסיה ליניארית היא משוואה של ישר המקורבת (מתארת ​​בקירוב) את הקשר בין משתנים אקראיים X ו-Y. אם נניח שהערך X חופשי ו-Y תלוי ב-X, אזי משוואת הרגרסיה תיכתב כ- עוקב


Y = a + b X (3.1), כאשר:

ב =Rx,y
σy
σ x
= Rx,y
ס י
S x
(3.2),
a = M y - b M x (3.3)

המקדם שחושב באמצעות נוסחה (3.2) בנקרא מקדם הרגרסיה הליניארי. בחלק מהמקורות אנקרא מקדם רגרסיה קבוע ו בלפי המשתנים.

שגיאות בחיזוי Y עבור ערך X נתון מחושבות באמצעות הנוסחאות:

הכמות σ y/x (נוסחה 3.4) נקראת גם סטיית תקן שיורית, הוא מאפיין את היציאה של הערך Y מקו הרגרסיה המתואר במשוואה (3.1) עבור ערך קבוע (נתון) של X.

.
S y 2 / S x 2 = 0.20538 / 0.66481 = 0.30894. ניקח את השורש הריבועי של המספר האחרון ונקבל:
S y / S x = 0.55582

3.3 בוא נחשב את מקדם בלפי נוסחה (3.2)

ב = -0.72028 0.55582 = -0.40035

3.4 בוא נחשב את מקדם אלפי נוסחה (3.3)

א = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 בואו נאמוד את השגיאות של משוואת הרגרסיה.

3.5.1 אם לוקחים את השורש הריבועי של S y 2 נקבל:

= 0.31437
3.5.4 בוא נחשב את השגיאה היחסית באמצעות נוסחה (3.5)

δ y/x = (0.31437 / 30.50000)100% = 1.03073%

4. אנו בונים דיאגרמת פיזור (שדה מתאם) וגרף קווי רגרסיה.

תרשים פיזור הוא ייצוג גרפי של זוגות מקבילים (x k, y k) כנקודות במישור, בקואורדינטות מלבניות עם צירי X ו-Y שדה המתאם הוא אחד מהייצוגים הגרפיים של מדגם קשור. גם גרף קווי הרגרסיה משורטט באותה מערכת קואורדינטות. יש לבחור סולמות ונקודות התחלה על הצירים בקפידה כדי להבטיח שהתרשים יהיה ברור ככל האפשר.

4.1. מצא את האלמנט המינימלי והמקסימלי של המדגם X הוא האלמנט ה-18 וה-15, בהתאמה, x min = 22.10000 ו-x max = 26.60000.

4.2. אנו מוצאים שהרכיב המינימלי והמקסימלי של המדגם Y הם האלמנטים השני וה-18, בהתאמה, y min = 29.40000 ו-y max = 31.60000.

4.3. על ציר ה-x, בחרו נקודת התחלה מעט משמאל לנקודה x 18 = 22.10000, ובקנה מידה כזה שנקודת x 15 = 26.60000 מתאימה לציר ושאר הנקודות נראות בבירור.

4.4. על ציר הסמין, בחר נקודת התחלה מעט משמאל לנקודת y 2 = 29.40000, וסולם כזה שנקודת y 18 = 31.60000 מתאימה על הציר וניתן להבחין בבירור בנקודות הנותרות.

4.5. אנו מציבים ערכי x k על ציר האבשיסה, וערכי y k על ציר הסמיכה.

4.6. אנו משרטטים את הנקודות (x 1, y 1), (x 2, y 2),..., (x 26, y 26) במישור הקואורדינטות. אנו מקבלים את דיאגרמת הפיזור (שדה המתאם) המוצג באיור למטה.

4.7. בואו נצייר קו רגרסיה.

לשם כך, נמצא שתי נקודות שונות עם קואורדינטות (x r1, y r1) ו- (x r2, y r2) המשוואה (3.6), נשרטט אותן במישור הקואורדינטות ונשריר דרכן קו ישר. בתור האבססיס של הנקודה הראשונה, ניקח את הערך x min = 22.10000. החלפת הערך x min במשוואה (3.6), נקבל את האורדינאטה של ​​הנקודה הראשונה. לפיכך, יש לנו נקודה עם קואורדינטות (22.10000, 31.96127). באופן דומה, אנו מקבלים את הקואורדינטות של הנקודה השנייה, שמים את הערך x max = 26.60000 בתור האבססיס. הנקודה השנייה תהיה: (26.60000, 30.15970).

קו הרגרסיה מוצג באיור למטה באדום

שימו לב שקו הרגרסיה עובר תמיד דרך נקודת הערכים הממוצעים של X ו-Y, כלומר. עם קואורדינטות (M x , M y).

מטרת ניתוח המתאםהוא לזהות אומדן של עוצמת הקשר בין משתנים אקראיים (תכונות) המאפיינים תהליך אמיתי כלשהו.
בעיות של ניתוח מתאם:
א) מדידת מידת הקוהרנטיות (קרבה, חוזק, חומרה, עוצמה) של שתי תופעות או יותר.
ב) בחירת גורמים בעלי ההשפעה המשמעותית ביותר על התכונה המתקבלת, בהתבסס על מדידת מידת הקישוריות בין תופעות. גורמים משמעותיים בהיבט זה משמשים עוד בניתוח רגרסיה.
ג) איתור קשרים סיבתיים לא ידועים.

צורות הביטוי של מערכות יחסים מגוונות מאוד. הסוגים הנפוצים ביותר הם פונקציונליים (שלם) ו חיבור מתאם (לא שלם)..
מתאםמתבטא בממוצע עבור תצפיות המוניות, כאשר הערכים הנתונים של המשתנה התלוי תואמים לסדרה מסוימת של ערכים הסתברותיים של המשתנה הבלתי תלוי. הקשר נקרא קורלציה, אם כל ערך של מאפיין הגורם מתאים לערך לא אקראי מוגדר היטב של המאפיין המתקבל.
ייצוג חזותי של טבלת מתאם הוא שדה המתאם. זהו גרף שבו ערכי X משורטטים על ציר האבססיס, ערכי Y משורטטים על ציר הסמיטה, ושילובים של X ו-Y מוצגים על ידי נקודות לפי מיקום הנקודות, ניתן לשפוט את הנוכחות של חיבור.
אינדיקטורים של קרבת חיבורמאפשרים לאפיין את התלות של הווריאציה של התכונה המתקבלת בשונות של תכונת הגורם.
אינדיקטור מתקדם יותר למידת הצפיפות קשר מתאםהוא מקדם מתאם ליניארי. בעת חישוב אינדיקטור זה, נלקחות בחשבון לא רק סטיות של ערכים בודדים של מאפיין מהממוצע, אלא גם גודל הסטיות הללו.

שאלות המפתח בנושא זה הן משוואות קשר הרגרסיה בין המאפיין האפקטיבי למשתנה ההסברתי, שיטת הריבועים הקטנים להערכת הפרמטרים של מודל הרגרסיה, ניתוח איכות משוואת הרגרסיה המתקבלת, בניית רווחי סמך לניבוי ערכים של המאפיין האפקטיבי באמצעות משוואת הרגרסיה.

דוגמה 2


מערכת משוואות נורמליות.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
עבור הנתונים שלנו, למערכת המשוואות יש את הצורה
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
מהמשוואה הראשונה אנו מבטאים אוהחליפו לתוך המשוואה השנייה:
נקבל b = -3.46, a = 1379.33
משוואת הרגרסיה:
y = -3.46 x + 1379.33

2. חישוב פרמטרים של משוואת רגרסיה.
אמצעי מדגם.



שונות לדוגמא:


סטיית תקן


1.1. מקדם התאמה
שיתוף פעולה.

אנו מחשבים את האינדיקטור של קרבת החיבור. אינדיקטור זה הוא מקדם המתאם הליניארי המדגם, אשר מחושב על ידי הנוסחה:

מקדם המתאם הליניארי לוקח ערכים מ-1 עד +1.
קשרים בין מאפיינים יכולים להיות חלשים וחזקים (קרובים). הקריטריונים שלהם מוערכים על סולם צ'דוק:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
בדוגמה שלנו, הקשר בין תכונה Y לגורם X הוא גבוה והפוך.
בנוסף, ניתן לקבוע את מקדם המתאם של הזוג הליניארי באמצעות מקדם הרגרסיה b:

1.2. משוואת הרגרסיה(הערכה של משוואת רגרסיה).

משוואת הרגרסיה הליניארית היא y = -3.46 x + 1379.33

מקדם b = -3.46 מציג את השינוי הממוצע במדד האפקטיבי (ביחידות מדידה y) עם עלייה או ירידה בערך של גורם x ליחידת מדידה שלו. בדוגמה זו, עם עלייה של יחידה אחת, y יורד ב-3.46 בממוצע.
מקדם a = 1379.33 מראה רשמית את הרמה החזויה של y, אך רק אם x = 0 קרוב לערכי המדגם.
אבל אם x=0 רחוק מערכי המדגם של x, אז פרשנות מילולית עלולה להוביל לתוצאות שגויות, וגם אם קו הרגרסיה מתאר את ערכי המדגם שנצפו בצורה מדויקת למדי, אין ערובה שזה גם להיות המקרה בעת אקסטרפולציה שמאלה או ימינה.
על ידי החלפת ערכי ה-x המתאימים למשוואת הרגרסיה, נוכל לקבוע את הערכים המיושרים (החזויים) של מחוון הביצועים y(x) עבור כל תצפית.
הקשר בין y ל-x קובע את הסימן של מקדם הרגרסיה b (אם > 0 - קשר ישיר, אחרת - הפוך). בדוגמה שלנו, הקשר הפוך.
1.3. מקדם גמישות.
לא כדאי להשתמש במקדמי רגרסיה (בדוגמה ב) כדי להעריך ישירות את השפעת הגורמים על מאפיין תוצאתי אם יש הבדל ביחידות המדידה של המדד המתקבל y ומאפיין הגורם x.
למטרות אלו מחושבים מקדמי גמישות ומקדמי בטא.
מקדם האלסטיות הממוצע E מראה באיזה אחוז בממוצע תשתנה התוצאה במצטבר בְּ-מהערך הממוצע שלו כאשר הגורם משתנה איקסב-1% מערכו הממוצע.
מקדם האלסטיות נמצא בנוסחה:


מקדם האלסטיות קטן מ-1. לכן, אם X ישתנה ב-1%, Y ישתנה בפחות מ-1%. במילים אחרות, ההשפעה של X על Y אינה משמעותית.
מקדם בטאמראה באיזה חלק מערך סטיית התקן שלו ישתנה הערך הממוצע של המאפיין המתקבל כאשר מאפיין הגורם משתנה לפי ערך סטיית התקן שלו עם ערך המשתנים הבלתי תלויים הנותרים קבועים ברמה קבועה:

הָהֵן. עלייה ב-x בסטיית התקן S x תוביל לירידה בערך הממוצע של Y ב-0.74 סטיית תקן S y.
1.4. טעות בקירוב.
הבה נעריך את איכות משוואת הרגרסיה באמצעות השגיאה של קירוב מוחלט. טעות ממוצעת בקירוב - סטייה ממוצעת של ערכים מחושבים מהערכים בפועל:


מכיוון שהשגיאה היא פחות מ-15%, ניתן להשתמש במשוואה זו כרגרסיה.
ניתוח שונות.
מטרת ניתוח השונות היא לנתח את השונות של המשתנה התלוי:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
איפה
∑(y i - y cp) 2 - סכום כולל של סטיות בריבוע;
∑(y(x) - y cp) 2 - סכום הסטיות בריבוע עקב רגרסיה ("מוסברת" או "פקטוריאלית");
∑(y - y(x)) 2 - סכום שיורי של סטיות בריבוע.
קשר מתאם תיאורטישכן חיבור ליניארי שווה למקדם המתאם r xy .
עבור כל צורה של תלות, אטימות החיבור נקבעת באמצעות מקדם מתאם מרובה:

מקדם זה הוא אוניברסלי, שכן הוא משקף את סמיכות הקשר ואת דיוק המודל, וניתן להשתמש בו גם לכל צורה של חיבור בין משתנים. בעת בניית מודל מתאם של גורם אחד, מקדם המתאם המרובה שווה למקדם המתאם הזוגי r xy.
1.6. מקדם קביעה.
הריבוע של מקדם המתאם (המרוב) נקרא מקדם הקביעה, המראה את שיעור השונות בתכונה המתקבלת המוסברת על ידי השונות בתכונת הגורם.
לרוב, כאשר מפרשים את מקדם הקביעה, הוא מבוטא באחוזים.
R2 = -0.742 = 0.5413
הָהֵן. ב-54.13% מהמקרים, שינויים ב-x מובילים לשינויים ב-y. במילים אחרות, הדיוק של בחירת משוואת הרגרסיה הוא ממוצע. שאר 45.87% מהשינוי ב-Y מוסברים על ידי גורמים שלא נלקחו בחשבון במודל.

בִּיבּלִיוֹגְרָפִיָה

  1. אקונומטריקה: ספר לימוד / עורך. I.I. אליזיבה. – מ': פיננסים וסטטיסטיקה, 2001, עמ'. 34..89.
  2. מגנוס י.ר., קטישב פ.ק., פרסצקי א.א. אקונומטריה. קורס מתחילים. הדרכה. – מהדורה שנייה, ריב. – M.: Delo, 1998, p. 17..42.
  3. סדנה בנושא אקונומטריה: פרוק. קצבה / I.I. Eliseeva, S.V. קורישבע, נ.מ. גורדינקו ואחרים; אד. I.I. אליזיבה. – מ': פיננסים וסטטיסטיקה, 2001, עמ'. 5..48.

06.06.2018 16 235 0 איגור

פסיכולוגיה וחברה

כל דבר בעולם קשור זה בזה. כל אדם, ברמת האינטואיציה, מנסה למצוא קשרים בין תופעות על מנת שיוכל להשפיע עליהן ולשלוט בהן. המושג המשקף את הקשר הזה נקרא קורלציה. מה זה אומר במילים פשוטות?

תוֹכֶן:

מושג המתאם

מתאם (מהלטינית "correlatio" - יחס, קשר)– מונח מתמטי שמשמעותו מדד לתלות הסתברותית סטטיסטית בין כמויות אקראיות (משתנים).



דוגמא:ניקח שני סוגים של מערכות יחסים:

  1. ראשון- עט בידו של אדם. לאיזה כיוון היד נעה, בכיוון הזה העט הולך. אם היד במנוחה, אז העט לא יכתוב. אם אדם לוחץ עליו קצת יותר, הסימן על הנייר יהיה עשיר יותר. סוג זה של קשר משקף תלות קפדנית ואינו מתאם. הקשר הזה הוא פונקציונלי.
  2. סוג שני- הקשר בין רמת ההשכלה של האדם לקריאת ספרות. לא ידוע מראש מי קוראים יותר: בעלי או בלי השכלה גבוהה. הקשר הזה הוא אקראי או סטוכסטי הוא נחקר על ידי המדע הסטטיסטי, העוסק אך ורק בתופעות המוניות. אם חישוב סטטיסטי יאפשר להוכיח את המתאם בין רמת ההשכלה לקריאת ספרות, אז זה יאפשר לבצע תחזיות כלשהן ולחזות את התרחשותם ההסתברותית של אירועים. בדוגמה זו, בדרגה גבוהה של הסתברות, ניתן לטעון שאנשים בעלי השכלה גבוהה, אלה המשכילים יותר, קוראים יותר ספרים. אך מכיוון שהקשר בין הפרמטרים הללו אינו פונקציונלי, אנו עלולים לטעות. אתה תמיד יכול לחשב את ההסתברות לטעות כזו, שתהיה קטנה בבירור ונקראת רמת המובהקות הסטטיסטית (p).

דוגמאות ליחסים בין תופעות טבע הן:שרשרת המזון בטבע, גוף האדם, המורכב ממערכות איברים המחוברות זו לזו ומתפקדות כמכלול אחד.

מדי יום אנו נתקלים בקורלציות בחיי היומיום: בין מזג האוויר למצב רוח טוב, ניסוח נכון של יעדים והשגתן, גישה חיובית ומזל, תחושת אושר ורווחה כלכלית. אבל אנחנו מחפשים קשרים, לא מסתמכים על חישובים מתמטיים, אלא על מיתוסים, אינטואיציה, אמונות טפלות והשערות סרק. קשה מאוד לתרגם את התופעות הללו לשפה מתמטית, לבטא במספרים ולמדוד. זה עניין אחר כאשר אנו מנתחים תופעות שניתן לחשב ולהציג בצורה של מספרים. במקרה זה, נוכל להגדיר קורלציה באמצעות מקדם המתאם (r), המשקף את החוזק, המידה, הקרבה והכיוון של המתאם בין משתנים אקראיים.

מתאם חזק בין משתנים אקראיים- עדות לקיומו של קשר סטטיסטי כלשהו ספציפית בין תופעות אלו, אך לא ניתן להעביר קשר זה לאותן תופעות, אלא למצב שונה. לעתים קרובות, חוקרים, לאחר שהשיגו מתאם משמעותי בין שני משתנים בחישוביהם, בהתבסס על הפשטות של ניתוח מתאם, מניחים הנחות אינטואיטיביות שגויות לגבי קיומם של קשרי סיבה ותוצאה בין מאפיינים, ושוכחים שמקדם המתאם הוא הסתברותי באופיו. .

דוגמא:מספר הנפגעים בתנאי קרח ומספר תאונות הדרכים בקרב כלי רכב. כמויות אלו יתכתבו ביניהן, למרות שהן לחלוטין אינן קשורות זו לזו, אלא יש להן רק קשר עם הגורם השכיח לאירועים אקראיים אלה - קרח שחור. אם הניתוח אינו מגלה מתאם בין תופעות, אין זו עדיין עדות להיעדר תלות ביניהן, אשר עשויה להיות מורכבת לא ליניארית ולא מתגלה על ידי חישובי מתאם.




הראשונים שהכניסו את מושג המתאם לשימוש מדעי היו הצרפתים הפלאונטולוג ז'ורז' קוויאר. במאה ה-18 הוא הסיק את חוק המתאם של חלקים ואיברים של יצורים חיים, שבזכותו ניתן היה לשחזר את מראהו של יצור מאובן שלם, בעל חיים, מחלקי הגוף שנמצאו (שרידי). בסטטיסטיקה, המונח קורלציה שימש לראשונה בשנת 1886 על ידי מדען אנגלי פרנסיס גלטון. אבל הוא לא הצליח להסיק את הנוסחה המדויקת לחישוב מקדם המתאם, אבל תלמידו עשה זאת - המתמטיקאי והביולוג המפורסם קרל פירסון.

סוגי מתאם

לפי חשיבות– משמעותי ביותר, משמעותי ולא משמעותי.

סוגים

למה שווה r

משמעותי ביותר

r מתאים לרמת המובהקות הסטטיסטית p<=0,01

משמעותי

r מתאים לעמ'<=0,05

לֹא מַשְׁמָעוּתִי

r לא מגיע ל-p>0.1

שלילי(ירידה בערך של משתנה אחד מובילה לעלייה ברמתו של אחר: ככל שיש לאדם יותר פוביות, כך יקטן הסיכוי שהוא יתפוס עמדת מנהיגות) וחיובי (אם עלייה במשתנה אחד מביאה לעלייה ברמה של אחר: ככל שאתה עצבני יותר, כך גדל הסיכוי שתחלי). אם אין קשר בין המשתנים, אז מתאם כזה נקרא אפס.

ליניארי(כאשר ערך אחד עולה או יורד, השני גם עולה או יורד) ולא ליניארי (כאשר כאשר ערך אחד משתנה, לא ניתן לתאר את אופי השינוי בשני באמצעות קשר ליניארי, אז מיושמים חוקים מתמטיים אחרים - פולינום, היפרבולי יחסים).

בכוח.

קְטָטָה




בהתאם לאיזה סולם שייכים המשתנים הנבדקים, מחושבים סוגים שונים של מקדמי מתאם:

  1. מקדם המתאם של פירסון, מקדם המתאם ליניארי זוג או מתאם מומנט המוצר מחושבים עבור משתנים עם סולמות מדידת מרווחים וסולם.
  2. מקדם מתאם דירוג ספירמן או קנדל - כאשר לפחות לאחת מהכמויות יש סולם אורדינל או לא מתפלגת בצורה נורמלית.
  3. מקדם מתאם ביסריאלי נקודתי (מקדם מתאם סימן פכנר) - אם אחת משתי הכמויות היא דיכוטומית.
  4. מקדם מתאם של ארבעה שדות (מקדם מתאם בדרגות מרובות (קונקורדנציה) - אם שני משתנים הם דיכוטומיים.

מקדם פירסון מתייחס למדדי מתאם פרמטריים, כל השאר אינם פרמטריים.

ערך מקדם המתאם נע בין -1 ל-+1. עם מתאם חיובי מלא, r = +1, עם מתאם שלילי מלא, r = -1.

נוסחה וחישוב





דוגמאות

יש לקבוע את הקשר בין שני משתנים: רמת ההתפתחות האינטלקטואלית (לפי הבדיקה) ומספר העיכובים בחודש (לפי רישומים ביומן החינוכי) בקרב תלמידי בית הספר.

הנתונים הראשוניים מוצגים בטבלה:

נתוני IQ (x)

נתונים על מספר העיכובים (y)

סְכוּם

1122

מְמוּצָע

112,2


כדי לתת פרשנות נכונה של המחוון המתקבל, יש צורך לנתח את הסימן של מקדם המתאם (+ או -) ואת הערך המוחלט שלו (מודולו).

בהתאם לטבלת הסיווג של מקדם המתאם לפי חוזק, אנו מסיקים כי rxy = -0.827 הוא מתאם שלילי חזק. לפיכך, למספר תלמידי בית הספר המאחרים יש תלות חזקה מאוד ברמת ההתפתחות האינטלקטואלית שלהם. ניתן לומר שתלמידים עם רמת מנת משכל גבוהה מאחרים לשיעורים בתדירות נמוכה יותר מאשר תלמידים עם רמת מנת משכל נמוכה.



מקדם המתאם יכול לשמש הן על ידי מדענים כדי לאשר או להפריך את הנחת התלות של שני כמויות או תופעות ולמדוד את עוצמתה ומובהקות שלה, והן על ידי סטודנטים כדי לבצע מחקר אמפירי וסטטיסטי בנושאים שונים. יש לזכור כי מחוון זה אינו כלי אידיאלי הוא מחושב רק כדי למדוד את חוזק הקשר ליניארי ותמיד יהיה ערך הסתברותי שיש בו שגיאה מסוימת.

ניתוח מתאם משמש בתחומים הבאים:

  • מדע כלכלי;
  • אסטרופיזיקה;
  • מדעי החברה (סוציולוגיה, פסיכולוגיה, פדגוגיה);
  • אגרוכימיה;
  • מֵטַלוּרגִיָה;
  • תעשייה (לבקרת איכות);
  • הידרוביולוגיה;
  • ביומטריה וכו'.

הסיבות לפופולריות של שיטת ניתוח המתאם:

  1. הפשטות היחסית של חישוב מקדמי מתאם אינה מצריכה השכלה מתמטית מיוחדת.
  2. מאפשר לך לחשב את הקשרים בין משתנים אקראיים מסה, שהם נושא לניתוח במדע הסטטיסטי. בהקשר זה, שיטה זו הפכה לנפוצה בתחום המחקר הסטטיסטי.

אני מקווה שכעת תוכל להבחין בין קשר פונקציונלי לקשר מתאם ותדע שכאשר אתה שומע בטלוויזיה או קורא בעיתונות על מתאם, המשמעות היא תלות הדדית חיובית ודי משמעותית בין שתי תופעות.

סימנים שונים עשויים להיות קשורים זה לזה.

ישנם 2 סוגי קשרים ביניהם:

  • פוּנקצִיוֹנָלִי;
  • מתאם.

מתאםתרגום לרוסית אינו אלא חיבור.
במקרה של קשר מתאם, ניתן לאתר את ההתאמה של מספר ערכים של מאפיין אחד למספר ערכים של מאפיין אחר. כדוגמאות, אנו יכולים לשקול את המתאמים שנקבעו בין:

  • אורך הכפות, הצוואר והמקור של ציפורים כגון אנפות, עגורים וחסידות;
  • אינדיקטורים של טמפרטורת הגוף וקצב הלב.

עבור רוב התהליכים הביו-רפואיים, נוכחות סוג זה של קשר הוכחה סטטיסטית.

שיטות סטטיסטיות מאפשרות לבסס את עובדת קיומה של תלות הדדית של מאפיינים. השימוש בחישובים מיוחדים לשם כך מוביל להקמת מקדמי מתאם (מדדי קישוריות).

חישובים כאלה נקראים ניתוח מתאם.זה מתבצע כדי לאשר את התלות של 2 משתנים (משתנים אקראיים) זה בזה, המתבטאת במקדם המתאם.

שימוש בשיטת המתאם מאפשר לך לפתור מספר בעיות:

  • לזהות את נוכחות הקשר בין הפרמטרים המנותחים;
  • ידע על נוכחות מתאם מאפשר לנו לפתור בעיות חיזוי. לפיכך, ישנה הזדמנות אמיתית לחזות את התנהגותו של פרמטר על סמך ניתוח התנהגותו של פרמטר מתאם אחר;
  • ביצוע סיווג המבוסס על בחירת תכונות בלתי תלויות זו בזו.

עבור משתנים:

  • בהתייחס לסולם הסידורי, מחושב מקדם ספירמן;
  • קשור לסולם המרווחים - מקדם פירסון.

אלו הם הפרמטרים הנפוצים ביותר, יש אחרים מלבדם.

ערך המקדם יכול לבוא לידי ביטוי חיובי או שלילי.

במקרה הראשון, ככל שהערך של משתנה אחד עולה, נצפית עלייה במשתנה השני. אם המקדם שלילי, התבנית מתהפכת.

לשם מה מקדם המתאם?

משתנים אקראיים הקשורים זה לזה עשויים להיות בעלי אופי שונה לחלוטין של קשר זה. זה לא בהכרח יהיה פונקציונלי, במקרה שבו ניתן לאתר קשר ישיר בין כמויות. לרוב, שתי הכמויות מושפעות ממכלול שלם של גורמים שונים במקרים בהם הן משותפות לשתי הכמויות, נצפית היווצרות של דפוסים קשורים.

המשמעות היא שהעובדה המוכחת סטטיסטית של קיומו של קשר בין כמויות אינה מאשרת כי הוכחה הסיבה לשינויים שנצפו. ככלל, החוקר מסיק שיש שתי השלכות הקשורות זו בזו.

תכונות של מקדם המתאם

למאפיין סטטיסטי זה יש את המאפיינים הבאים:

  • ערך המקדם נע בין -1 ל-+1. ככל שמתקרבים יותר לערכים הקיצוניים, כך הקשר החיובי או השלילי בין הפרמטרים הליניאריים חזק יותר. במקרה של ערך אפס, אנחנו מדברים על היעדר מתאם בין המאפיינים;
  • ערך חיובי של המקדם מציין שאם הערך של מאפיין אחד גדל, נצפית עלייה בשני (מתאם חיובי);
  • ערך שלילי - במקרה של עלייה בערך של מאפיין אחד, נצפית ירידה בשני (מתאם שלילי);
  • הגישה של ערך האינדיקטור לנקודות הקיצון (או -1 או +1) מצביעה על נוכחות של קשר ליניארי חזק מאוד;
  • אינדיקטורים של מאפיין יכולים להשתנות בעוד ערך המקדם נשאר ללא שינוי;
  • מקדם המתאם הוא כמות חסרת מימד;
  • נוכחות של מתאם לא בהכרח מאשרת קשר של סיבה ותוצאה.

ערכי מקדם מתאם

ניתן לאפיין את עוצמת המתאם על ידי פנייה לסולם צ'לדוק, שבו ערך מספרי מסוים מתאים למאפיין איכותי.

במקרה של מתאם חיובי עם הערך:

  • 0-0.3 - המתאם חלש מאוד;
  • 0.3-0.5 - חלש;
  • 0.5-0.7 - חוזק בינוני;
  • 0.7-0.9 - גבוה;
  • 0.9-1 - חוזק מתאם גבוה מאוד.

הסולם יכול לשמש גם עבור מתאם שלילי. במקרה זה, המאפיינים האיכותיים מוחלפים באלה ההפוכים.

אתה יכול להשתמש בסולם Cheldock הפשוט, המבדיל רק 3 הדרגות של חוזק מתאם:

  • חזק מאוד - אינדיקטורים ±0.7 - ±1;
  • ממוצע - אינדיקטורים ±0.3 - ±0.699;
  • חלש מאוד - אינדיקטורים 0 - ±0.299.

אינדיקטור סטטיסטי זה מאפשר לא רק לבדוק את ההנחה של קיומו של קשר ליניארי בין מאפיינים, אלא גם לבסס את עוצמתו.

סוגי מקדם מתאם

ניתן לסווג מקדמי מתאם לפי סימן וערך:

  • חִיוּבִי;
  • ריק;
  • שלילי.

בהתאם לערכים המנותחים, המקדם מחושב:

  • פירסון;
  • ספירמן;
  • קנדל;
  • שלטי פכנר;
  • קונקורדנציה או מתאם בדרגות מרובות.

מקדם המתאם של פירסון משמש ליצירת קשרים ישירים בין הערכים האבסולוטיים של משתנים. במקרה זה, ההתפלגויות של שתי סדרות המשתנים צריכות להתקרב לנורמליות. המשתנים בהשוואה חייבים להיות שונים באותו מספר של מאפיינים משתנים. הסולם המייצג את המשתנים חייב להיות סולם מרווחים או יחס.

  • ביסוס מדויק של חוזק המתאם;
  • השוואה בין מאפיינים כמותיים.

יש מעט חסרונות לשימוש במקדם המתאם הליניארי של פירסון:

  • השיטה אינה יציבה במקרה של חריגים של ערכים מספריים;
  • באמצעות שיטה זו, ניתן לקבוע את חוזק המתאם רק עבור קשר ליניארי עבור סוגים אחרים של קשרים הדדיים של משתנים, יש להשתמש בשיטות ניתוח רגרסיה.

מתאם דירוג נקבע בשיטת ספירמן, המאפשרת לחקור סטטיסטית את הקשר בין תופעות. הודות למקדם זה, מחושבת מידת ההקבלה בפועל של שתי סדרות מאפיינים המבוטאות כמותית, וכן מוערכת אטימות הקשר המזוהה.

  • לא דורש קביעה מדויקת של ערך כוח המתאם;
  • לאינדיקטורים המושוואים יש משמעויות כמותיות וייחוסות כאחד;
  • השוואה של סדרות מאפיינים עם גרסאות פתוחות של ערכים.

שיטת ספירמן היא שיטת ניתוח לא פרמטרית, ולכן אין צורך לבדוק את תקינות ההתפלגות של מאפיין. בנוסף, זה מאפשר לך להשוות אינדיקטורים המתבטאים בסולמות שונים. לדוגמה, השוואה של מספר תאי הדם האדומים בנפח מסוים של דם (סולם רציף) והערכת מומחים המתבטאת בנקודות (סולם סדום).

יעילות השיטה מושפעת לרעה מהבדל גדול בין ערכי הכמויות המושוואות. השיטה גם אינה יעילה במקרים בהם הערך הנמדד מאופיין בחלוקה לא אחידה של ערכים.

חישוב שלב אחר שלב של מקדם המתאם באקסל

חישוב מקדם המתאם כולל ביצוע ברצף של מספר פעולות מתמטיות.

הנוסחה לעיל לחישוב מקדם פירסון מראה עד כמה תהליך זה עתיר עבודה אם נעשה באופן ידני.
שימוש ביכולות של אקסל מזרז את תהליך מציאת המקדם בצורה משמעותית.

זה מספיק כדי לעקוב אחר אלגוריתם פשוט של פעולות:

  • הזנת מידע בסיסי - עמודה של ערכי x ועמודה של ערכי y;
  • בכלים, בחר ופתח את הכרטיסייה "נוסחאות";
  • בכרטיסייה שנפתחת, בחר "הכנס פונקציית FX";
  • בתיבת הדו-שיח שנפתחת, בחר את הפונקציה הסטטיסטית "Corel", המאפשרת לך לחשב את מקדם המתאם בין 2 ערכות נתונים;
  • החלון שנפתח, הזן את הנתונים: מערך 1 - טווח ערכים של עמודה x (יש לבחור נתונים), מערך 2 - טווח ערכים של עמודה y;
  • מקש "אישור" נלחץ, התוצאה של חישוב המקדם מופיעה בשורה "ערך";
  • מסקנה לגבי נוכחות מתאם בין 2 מערכי נתונים וחוזקה.

מקדם המתאם משקף את מידת הקשר בין שני אינדיקטורים. זה תמיד לוקח ערך מ-1 עד 1. אם המקדם ממוקם סביב 0, אז אין קשר בין המשתנים.

אם הערך קרוב לאחד (מ-0.9, למשל), אז יש קשר ישיר חזק בין העצמים הנצפים. אם המקדם קרוב לנקודת הקיצון השנייה של הטווח (-1), אז יש קשר הפוך חזק בין המשתנים. כאשר הערך הוא איפשהו בין 0 ל-1 או 0 ל-1, אז אנחנו מדברים על קשר חלש (ישיר או הפוך). מערכת יחסים זו בדרך כלל אינה נלקחת בחשבון: מאמינים שהיא אינה קיימת.

חישוב מקדם מתאם באקסל

הבה נסתכל על דוגמה לשיטות לחישוב מקדם המתאם, תכונות של קשרים ישירים והפוכים בין משתנים.

ערכי האינדיקטורים x ו-y:

Y הוא משתנה בלתי תלוי, x הוא משתנה תלוי. יש צורך למצוא את החוזק (חזק / חלש) והכיוון (ישיר / הפוך) של הקשר ביניהם. נוסחת מקדם המתאם נראית כך:


כדי להקל על ההבנה, הבה נחלק אותו למספר אלמנטים פשוטים.

קשר ישיר חזק נקבע בין המשתנים.

פונקציית CORREL המובנית מונעת חישובים מורכבים. בואו לחשב את מקדם המתאם הזוגי באקסל באמצעותו. קרא לאשף הפונקציות. אנחנו מוצאים את האחד שאנחנו צריכים. הארגומנטים של הפונקציה הם מערך של ערכי y ומערך של ערכי x:

בואו נראה את ערכי המשתנים בגרף:


נראה קשר חזק בין y ל-x, כי הקווים עוברים כמעט במקביל זה לזה. הקשר ישיר: y גדל - x גדל, y יורד - x יורד.



מטריצת מקדם מתאם זוג באקסל

מטריצת המתאם היא טבלה בצומת שורות ועמודות שבה ממוקמים מקדמי המתאם בין הערכים המתאימים. הגיוני לבנות אותו עבור מספר משתנים.

מטריצת מקדמי המתאם באקסל נבנית באמצעות כלי "Correlation" מחבילת "Data Analysis".


נמצא קשר ישיר חזק בין הערכים של y ו-x1. יש משוב חזק בין x1 ל-x2. אין כמעט קשר לערכים בעמודה x3.