05.03.2024

Si të llogaritet koeficienti i korrelacionit. Koeficientët e korrelacionit. Përdorimi i Excel për të llogaritur koeficientët e korrelacionit


Njoftim! Zgjidhja për problemin tuaj specifik do të duket e ngjashme me këtë shembull, duke përfshirë të gjitha tabelat dhe tekstet shpjeguese më poshtë, por duke marrë parasysh të dhënat tuaja fillestare...

Detyra:
Ekziston një mostër e lidhur me 26 çifte vlerash (x k,y k):

k 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

Kërkohet për të llogaritur/hartuar:
- koeficienti i korrelacionit;
- të testojë hipotezën e varësisë së variablave të rastësishëm X dhe Y, në një nivel sinjifikance α = 0,05;
- koeficientët e ekuacionit të regresionit linear;
- diagrami i shpërndarjes (fusha korrelative) dhe grafiku i vijës së regresionit;

ZGJIDHJA:

1. Llogaritni koeficientin e korrelacionit.

Koeficienti i korrelacionit është një tregues i ndikimit të ndërsjellë probabilistik të dy ndryshoreve të rastit. Koeficienti i korrelacionit R mund të marrë vlera nga -1 para +1 . Nëse vlera absolute është më afër 1 , atëherë kjo është dëshmi e një lidhjeje të fortë midis sasive, dhe nëse më afër 0 - atëherë kjo tregon një lidhje të dobët ose mungesë të saj. Nëse vlera absolute Rështë e barabartë me një, atëherë mund të flasim për një lidhje funksionale midis sasive, domethënë, një sasi mund të shprehet përmes një tjetre duke përdorur një funksion matematikor.


Koeficienti i korrelacionit mund të llogaritet duke përdorur formulat e mëposhtme:
n
Σ
k = 1
(x k -M x) 2, σ y 2 =
Mx =
1
n
n
Σ
k = 1
xk, M y =

ose me formulë

Rx, y =
M xy - M x M y
S x S y
(1.4), ku:
Mx =
1
n
n
Σ
k = 1
xk, M y =
1
n
n
Σ
k = 1
y k , Mxy =
1
n
n
Σ
k = 1
x k y k (1.5)
S x 2 =
1
n
n
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
n
n
Σ
k = 1
y k 2 - M y 2 (1.6)

Në praktikë, formula (1.4) përdoret më shpesh për llogaritjen e koeficientit të korrelacionit sepse kërkon më pak llogaritje. Megjithatë, nëse kovarianca është llogaritur më parë cov(X,Y), atëherë është më fitimprurëse të përdoret formula (1.1), sepse Përveç vetë vlerës së kovariancës, mund të përdorni edhe rezultatet e llogaritjeve të ndërmjetme.

1.1 Le të llogarisim koeficientin e korrelacionit duke përdorur formulën (1.4), për ta bërë këtë, ne llogarisim vlerat e x k 2, y k 2 dhe x k y k dhe i futim ato në tabelën 1.

Tabela 1


k
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. Le të llogarisim M x duke përdorur formulën (1.5).

1.2.1. x k

x 1 + x 2 + … + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

M x = 25.750000

1.3. Le të llogarisim M y në mënyrë të ngjashme.

1.3.1. Le të shtojmë të gjithë elementët me radhë y k

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. Ndani shumën që rezulton me numrin e elementeve të mostrës

793.00000 / 26 = 30.50000

M y = 30.500000

1.4. Në mënyrë të ngjashme ne llogarisim M xy.

1.4.1. Le të shtojmë në mënyrë sekuenciale të gjithë elementët e kolonës së 6-të të tabelës 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. Ndani shumën që rezulton me numrin e elementeve

20412.83000 / 26 = 785.10885

M xy = 785,108846

1.5. Le të llogarisim vlerën e S x 2 duke përdorur formulën (1.6.).

1.5.1. Le të shtojmë në mënyrë sekuenciale të gjithë elementët e kolonës së 4-të të tabelës 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. Ndani shumën që rezulton me numrin e elementeve

17256.91000 / 26 = 663.72731

1.5.3. Zbrisni katrorin e M x nga numri i fundit për të marrë vlerën për S x 2

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. Le të llogarisim vlerën e S y 2 duke përdorur formulën (1.6.).

1.6.1. Le të shtojmë në mënyrë sekuenciale të gjithë elementët e kolonës së 5-të të tabelës 1

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. Ndani shumën që rezulton me numrin e elementeve

24191.84000 / 26 = 930.45538

1.6.3. Zbrisni katrorin e M y nga numri i fundit për të marrë vlerën për S y 2

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. Le të llogarisim prodhimin e sasive S x 2 dhe S y 2.

S x 2 S y 2 = 0,66481 0,20538 = 0,136541

1.8. Le të marrim rrënjën katrore të numrit të fundit dhe të marrim vlerën S x S y.

S x S y = 0,36951

1.9. Le të llogarisim vlerën e koeficientit të korrelacionit duke përdorur formulën (1.4.).

R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028

PËRGJIGJE: R x,y = -0.720279

2. Kontrollojmë rëndësinë e koeficientit të korrelacionit (kontrollojmë hipotezën e varësisë).

Për shkak se vlerësimi i koeficientit të korrelacionit llogaritet në një kampion të fundëm, dhe për këtë arsye mund të devijojë nga vlera e tij e popullsisë, është e nevojshme të testohet rëndësia e koeficientit të korrelacionit. Kontrollimi bëhet duke përdorur T-testin:

t =
Rx, y
n - 2
1 - R 2 x, y
(2.1)

Vlera e rastësishme t ndjek shpërndarjen t të Studentit dhe duke përdorur tabelën e shpërndarjes t është e nevojshme të gjendet vlera kritike e kriterit (t cr.α) në një nivel të caktuar rëndësie α. Nëse t e llogaritur me formulën (2.1) në vlerë absolute rezulton të jetë më e vogël se t cr.α, atëherë nuk ka asnjë varësi midis variablave të rastësishëm X dhe Y. Përndryshe, të dhënat eksperimentale nuk bien ndesh me hipotezën për varësinë e variablave të rastësishëm.


2.1. Le të llogarisim vlerën e kriterit t duke përdorur formulën (2.1) dhe të marrim:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. Duke përdorur tabelën e shpërndarjes t, përcaktojmë vlerën kritike të parametrit t cr.α

Vlera e dëshiruar e tcr.α ndodhet në kryqëzimin e rreshtit që korrespondon me numrin e shkallëve të lirisë dhe kolonës që korrespondon me nivelin e dhënë të rëndësisë α.
Në rastin tonë, numri i shkallëve të lirisë është n - 2 = 26 - 2 = 24 dhe α = 0.05 , që i përgjigjet vlerës kritike të kriterit t cr.α = 2.064 (shih tabelën 2)

tabela 2 t-shpërndarja

Numri i shkallëve të lirisë
(n - 2)
α = 0,1 α = 0,05 α = 0,02 α = 0,01 α = 0,002 α = 0,001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. Le të krahasojmë vlerën absolute të kriterit t dhe t cr.α

Vlera absolute e kriterit t nuk është më e vogël se vlera kritike t = 5,08680, t cr.α = 2,064, pra të dhëna eksperimentale, me probabilitet 0.95(1 - α), nuk kundërshtojnë hipotezën nga varësia e variablave të rastësishëm X dhe Y.

3. Njehsoni koeficientët e ekuacionit të regresionit linear.

Një ekuacion i regresionit linear është një ekuacion i një vije të drejtë që përafron (përafërsisht përshkruan) marrëdhënien midis ndryshoreve të rastësishme X dhe Y. Nëse supozojmë se vlera X është e lirë dhe Y është e varur nga X, atëherë ekuacioni i regresionit do të shkruhet si vijon


Y = a + b X (3.1), ku:

b =Rx, y
σy
σ x
= Rx, y
S y
S x
(3.2),
a = M y - b M x (3.3)

Koeficienti i llogaritur duke përdorur formulën (3.2) b quhet koeficienti i regresionit linear. Në disa burime a quhet koeficient i regresionit konstant dhe b sipas variablave.

Gabimet në parashikimin e Y për një vlerë të dhënë X llogariten duke përdorur formulat:

Quhet edhe sasia σ y/x (formula 3.4). devijimi standard i mbetur, karakterizon largimin e vlerës Y nga vija e regresionit të përshkruar nga ekuacioni (3.1) për një vlerë fikse (të dhënë) të X.

.
S y 2 / S x 2 = 0,20538 / 0,66481 = 0,30894. Le të marrim rrënjën katrore të numrit të fundit dhe të marrim:
S y / S x = 0,55582

3.3 Le të llogarisim koeficientin b sipas formulës (3.2)

b = -0.72028 0.55582 = -0.40035

3.4 Të llogarisim koeficientin a sipas formulës (3.3)

a = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 Le të vlerësojmë gabimet e ekuacionit të regresionit.

3.5.1 Duke marrë rrënjën katrore të S y 2 marrim:

= 0.31437
3.5.4 Le të llogarisim gabimin relativ duke përdorur formulën (3.5)

δ y/x = (0,31437 / 30,50000)100% = 1,03073%

4. Ndërtojmë një diagramë shpërndarjeje (fushë korrelacioni) dhe një grafik vijash regresioni.

Shpërndarja është një paraqitje grafike e çifteve përkatëse (x k, y k) si pika në një rrafsh, në koordinata drejtkëndëshe me boshtet X dhe Y. Fusha e korrelacionit është një nga paraqitjet grafike të një kampioni të lidhur. Grafiku i vijës së regresionit është paraqitur gjithashtu në të njëjtin sistem koordinativ. Shkallët dhe pikat e fillimit në akset duhet të zgjidhen me kujdes për të siguruar që diagrami të jetë sa më i qartë.

4.1. Gjeni elementin minimal dhe maksimal të mostrës X është elementi i 18-të dhe i 15-të, përkatësisht, x min = 22.10000 dhe x max = 26.60000.

4.2. Ne gjejmë se elementi minimal dhe maksimal i mostrës Y janë elementet e 2-të dhe të 18-të, përkatësisht, y min = 29.40000 dhe y max = 31.60000.

4.3. Në boshtin x, zgjidhni një pikë fillestare pak në të majtë të pikës x 18 = 22.10000 dhe një shkallë të tillë që pika x 15 = 26.60000 të përshtatet në bosht dhe pikat e mbetura të jenë qartë të dukshme.

4.4. Në boshtin e ordinatave, zgjidhni një pikë fillimi pak në të majtë të pikës y 2 = 29,40000 dhe një shkallë të tillë që pika y 18 = 31,60000 të përshtatet në bosht dhe pikat e mbetura të dallohen qartë.

4.5. Ne vendosim vlerat x k në boshtin e abshisës dhe vlerat y k në boshtin e ordinatave.

4.6. I vizatojmë pikat (x 1, y 1), (x 2, y 2),…, (x 26, y 26) në planin koordinativ. Marrim diagramin e shpërndarjes (fushën e korrelacionit) të paraqitur në figurën më poshtë.

4.7. Le të vizatojmë një vijë regresioni.

Për ta bërë këtë, do të gjejmë dy pika të ndryshme me koordinata (x r1, y r1) dhe (x r2, y r2) të kënaqshme me ekuacionin (3.6), do t'i vizatojmë në planin koordinativ dhe do të vizatojmë një vijë të drejtë përmes tyre. Si abshisa e pikës së parë marrim vlerën x min = 22.10000. Duke zëvendësuar vlerën x min në ekuacionin (3.6), marrim ordinatën e pikës së parë. Kështu, kemi një pikë me koordinata (22.10000, 31.96127). Në mënyrë të ngjashme, marrim koordinatat e pikës së dytë, duke vendosur vlerën x max = 26.60000 si abshisë. Pika e dytë do të jetë: (26.60000, 30.15970).

Vija e regresionit është paraqitur në figurën më poshtë me të kuqe

Ju lutemi vini re se linja e regresionit kalon gjithmonë përmes pikës së vlerave mesatare të X dhe Y, d.m.th. me koordinata (M x, M y).

Qëllimi i analizës së korrelacionitështë të identifikojë një vlerësim të fuqisë së lidhjes ndërmjet variablave (veçorive) të rastësishme që karakterizojnë një proces real.
Problemet e analizës së korrelacionit:
a) Matja e shkallës së koherencës (afërsisë, forcës, ashpërsisë, intensitetit) të dy ose më shumë dukurive.
b) Përzgjedhja e faktorëve që kanë ndikimin më të rëndësishëm në atributin që rezulton, bazuar në matjen e shkallës së lidhjes ndërmjet dukurive. Faktorët që janë domethënës në këtë aspekt përdoren më tej në analizën e regresionit.
c) Zbulimi i marrëdhënieve shkakësore të panjohura.

Format e manifestimit të marrëdhënieve janë shumë të ndryshme. Llojet më të zakonshme janë funksionale (të plota) dhe lidhje korrelacioni (e paplotë)..
Korrelacioni manifestohet mesatarisht për vëzhgimet masive, kur vlerat e dhëna të ndryshores së varur korrespondojnë me një seri të caktuar vlerash probabilistike të ndryshores së pavarur. Marrëdhënia quhet korrelacion, nëse secila vlerë e karakteristikës së faktorit korrespondon me një vlerë jo të rastësishme të përcaktuar mirë të karakteristikës rezultante.
Një paraqitje vizuale e një tabele korrelacioni është fusha e korrelacionit. Është një grafik ku vlerat X janë paraqitur në boshtin e abshisës, vlerat Y janë paraqitur në boshtin e ordinatave dhe kombinimet e X dhe Y tregohen me pika, mund të gjykohet prania të një lidhjeje.
Treguesit e afërsisë së lidhjes bëjnë të mundur karakterizimin e varësisë së variacionit të tiparit që rezulton nga variacioni i tiparit të faktorit.
Një tregues më i avancuar i shkallës së grumbullimit lidhje korrelacioniështë koeficienti linear i korrelacionit. Gjatë llogaritjes së këtij treguesi, merren parasysh jo vetëm devijimet e vlerave individuale të një karakteristike nga mesatarja, por edhe vetë madhësia e këtyre devijimeve.

Pyetjet kryesore të kësaj teme janë ekuacionet e marrëdhënies së regresionit midis karakteristikës efektive dhe variablit shpjegues, metoda e katrorëve më të vegjël për vlerësimin e parametrave të modelit të regresionit, analiza e cilësisë së ekuacionit të regresionit që rezulton, ndërtimi i intervaleve të besimit për parashikimin e vlerat e karakteristikës efektive duke përdorur ekuacionin e regresionit.

Shembulli 2


Sistemi i ekuacioneve normale.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Për të dhënat tona, sistemi i ekuacioneve ka formën
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
Nga ekuacioni i parë shprehim A dhe zëvendësojeni në ekuacionin e dytë:
Marrim b = -3.46, a = 1379.33
Ekuacioni i regresionit:
y = -3,46 x + 1379,33

2. Llogaritja e parametrave të ekuacionit të regresionit.
Mjetet e mostrës.



Ndryshimet e mostrës:


Devijimi standard


1.1. Koeficienti i korrelacionit
Kovarianca.

Ne llogarisim treguesin e afërsisë së lidhjes. Ky tregues është koeficienti i korrelacionit linear të mostrës, i cili llogaritet me formulën:

Koeficienti linear i korrelacionit merr vlera nga -1 në +1.
Lidhjet ndërmjet karakteristikave mund të jenë të dobëta dhe të forta (të afërta). Kriteret e tyre vlerësohen në shkallën Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Në shembullin tonë, marrëdhënia midis tiparit Y dhe faktorit X është e lartë dhe e anasjelltë.
Përveç kësaj, koeficienti i korrelacionit të çiftit linear mund të përcaktohet përmes koeficientit të regresionit b:

1.2. Ekuacioni i regresionit(vlerësimi i ekuacionit të regresionit).

Ekuacioni i regresionit linear është y = -3,46 x + 1379,33

Koeficienti b = -3.46 tregon ndryshimin mesatar të treguesit efektiv (në njësi matëse y) me një rritje ose ulje të vlerës së faktorit x për njësi të matjes së tij. Në këtë shembull, me një rritje prej 1 njësi, y zvogëlohet mesatarisht me -3.46.
Koeficienti a = 1379.33 tregon zyrtarisht nivelin e parashikuar të y, por vetëm nëse x = 0 është afër vlerave të mostrës.
Por nëse x=0 është larg nga vlerat e mostrës së x, atëherë një interpretim i fjalëpërfjalshëm mund të çojë në rezultate të pasakta, dhe edhe nëse linja e regresionit përshkruan vlerat e vëzhguara të mostrës me mjaft saktësi, nuk ka asnjë garanci që kjo gjithashtu do të të jetë rasti kur ekstrapolohet majtas ose djathtas.
Duke zëvendësuar vlerat e duhura x në ekuacionin e regresionit, ne mund të përcaktojmë vlerat e rreshtuara (të parashikuara) të treguesit të performancës y(x) për çdo vëzhgim.
Marrëdhënia midis y dhe x përcakton shenjën e koeficientit të regresionit b (nëse > 0 - marrëdhënie direkte, përndryshe - inverse). Në shembullin tonë, lidhja është e kundërt.
1.3. Koeficienti i elasticitetit.
Nuk këshillohet përdorimi i koeficientëve të regresionit (në shembullin b) për të vlerësuar drejtpërdrejt ndikimin e faktorëve në një karakteristikë rezultante nëse ka një ndryshim në njësitë e matjes së treguesit rezultant y dhe karakteristikës së faktorit x.
Për këto qëllime, llogariten koeficientët e elasticitetit dhe koeficientët beta.
Koeficienti mesatar i elasticitetit E tregon se me çfarë përqindje mesatarisht do të ndryshojë rezultati në agregat nga vlera mesatare e tij kur faktori ndryshon x me 1% të vlerës mesatare të saj.
Koeficienti i elasticitetit gjendet me formulën:


Koeficienti i elasticitetit është më i vogël se 1. Prandaj, nëse X ndryshon me 1%, Y do të ndryshojë me më pak se 1%. Me fjalë të tjera, ndikimi i X në Y nuk është i rëndësishëm.
Koeficienti beta tregon se me cilën pjesë të vlerës së devijimit të tij standard do të ndryshojë vlera mesatare e karakteristikës që rezulton kur karakteristika e faktorit ndryshon me vlerën e devijimit standard të saj me vlerën e variablave të pavarur të mbetur të fiksuar në një nivel konstant:

Ato. një rritje në x nga devijimi standard S x do të çojë në një ulje të vlerës mesatare të Y me 0.74 devijimi standard S y.
1.4. Gabim përafrimi.
Le të vlerësojmë cilësinë e ekuacionit të regresionit duke përdorur gabimin e përafrimit absolut. Gabim mesatar i përafrimit - devijimi mesatar i vlerave të llogaritura nga ato aktuale:


Meqenëse gabimi është më pak se 15%, ky ekuacion mund të përdoret si regresion.
Analiza e variancës.
Qëllimi i analizës së variancës është të analizojë variancën e ndryshores së varur:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
Ku
∑(y i - y cp) 2 - shuma totale e devijimeve në katror;
∑(y(x) - y cp) 2 - shuma e devijimeve në katror për shkak të regresionit ("shpjeguar" ose "faktorial");
∑(y - y(x)) 2 - shuma e mbetur e devijimeve në katror.
Marrëdhënia teorike e korrelacionit për një lidhje lineare është e barabartë me koeficientin e korrelacionit r xy.
Për çdo formë varësie, ngushtësia e lidhjes përcaktohet duke përdorur koeficienti i korrelacionit të shumëfishtë:

Ky koeficient është universal, pasi pasqyron afërsinë e marrëdhënies dhe saktësinë e modelit, si dhe mund të përdoret për çdo formë lidhjeje midis variablave. Kur ndërtohet një model korrelacioni me një faktor, koeficienti i korrelacionit të shumëfishtë është i barabartë me koeficientin e korrelacionit të çiftit r xy.
1.6. Koeficienti i përcaktimit.
Katrori i koeficientit të korrelacionit (i shumëfishtë) quhet koeficienti i përcaktimit, i cili tregon proporcionin e variacionit në atributin rezultante të shpjeguar nga ndryshimi në atributin faktor.
Më shpesh, kur interpretohet koeficienti i përcaktimit, ai shprehet në përqindje.
R2 = -0,742 = 0,5413
ato. në 54.13% të rasteve, ndryshimet në x çojnë në ndryshime në y. Me fjalë të tjera, saktësia e zgjedhjes së ekuacionit të regresionit është mesatare. Pjesa e mbetur prej 45.87% e ndryshimit në Y shpjegohet me faktorë që nuk janë marrë parasysh në model.

Bibliografi

  1. Ekonometria: Teksti mësimor / Ed. I.I. Eliseeva. – M.: Financa dhe Statistikat, 2001, f. 34..89.
  2. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Kursi fillestar. Tutorial. – Botimi i 2-të, rev. – M.: Delo, 1998, f. 17..42.
  3. Workshop mbi ekonometrinë: Proc. shtesa / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko dhe të tjerët; Ed. I.I. Eliseeva. – M.: Financa dhe Statistikat, 2001, f. 5..48.

06.06.2018 16 235 0 Igor

Psikologjia dhe Shoqëria

Gjithçka në botë është e ndërlidhur. Çdo person, në nivelin e intuitës, përpiqet të gjejë marrëdhënie midis dukurive në mënyrë që të jetë në gjendje t'i ndikojë dhe kontrollojë ato. Koncepti që pasqyron këtë marrëdhënie quhet korrelacion. Çfarë do të thotë me fjalë të thjeshta?

Përmbajtja:

Koncepti i korrelacionit

Korrelacioni (nga latinishtja "correlation" - raport, marrëdhënie)– një term matematik që nënkupton një masë të varësisë probabilistike statistikore ndërmjet sasive (ndryshoreve) të rastësishme.



Shembull: Le të marrim dy lloje marrëdhëniesh:

  1. Së pari- një stilolaps në dorën e një personi. Në cilin drejtim lëviz dora, në atë drejtim shkon stilolapsi. Nëse dora është në qetësi, atëherë stilolapsi nuk do të shkruajë. Nëse një person e shtyp atë pak më fort, shenja në letër do të jetë më e pasur. Kjo lloj marrëdhënieje pasqyron një varësi të rreptë dhe nuk është korrelative. Kjo marrëdhënie është funksionale.
  2. Lloji i dytë– marrëdhënia midis nivelit të arsimimit të një personi dhe leximit të literaturës. Nuk dihet paraprakisht se cilët njerëz lexojnë më shumë: ata me ose pa arsim të lartë. Kjo lidhje është e rastësishme ose stokastike, ajo studiohet nga shkenca statistikore, e cila merret ekskluzivisht me dukuritë masive. Nëse një përllogaritje statistikore bën të mundur vërtetimin e korrelacionit midis nivelit të arsimimit dhe leximit të literaturës, atëherë kjo do të bëjë të mundur që të bëhen çdo parashikim dhe të parashikohet ndodhja probabiliste e ngjarjeve. Në këtë shembull, me një shkallë të lartë probabiliteti, mund të argumentohet se njerëzit me arsim të lartë, ata që janë më të arsimuar, lexojnë më shumë libra. Por meqenëse lidhja midis këtyre parametrave nuk është funksionale, mund të gabojmë. Ju gjithmonë mund të llogarisni probabilitetin e një gabimi të tillë, i cili do të jetë qartësisht i vogël dhe quhet niveli i rëndësisë statistikore (p).

Shembuj të marrëdhënieve ndërmjet dukurive natyrore janë: zinxhiri ushqimor në natyrë, trupi i njeriut, i cili përbëhet nga sisteme organesh që janë të ndërlidhura dhe funksionojnë si një tërësi e vetme.

Çdo ditë hasim korrelacione në jetën e përditshme: midis motit dhe humorit të mirë, formulimit të saktë të qëllimeve dhe arritjes së tyre, qëndrimit pozitiv dhe fatit, ndjenjës së lumturisë dhe mirëqenies financiare. Por ne po kërkojmë lidhje, duke u mbështetur jo në llogaritjet matematikore, por në mite, intuitë, bestytni dhe spekulime boshe. Këto dukuri janë shumë të vështira për t'u përkthyer në gjuhën matematikore, për t'u shprehur në numra dhe për t'u matur. Është një çështje tjetër kur analizojmë fenomene që mund të llogariten dhe të paraqiten në formën e numrave. Në këtë rast, ne mund të përcaktojmë korrelacionin duke përdorur koeficientin e korrelacionit (r), i cili pasqyron forcën, shkallën, afërsinë dhe drejtimin e korrelacionit midis ndryshoreve të rastit.

Korrelacion i fortë ndërmjet variablave të rastësishëm- dëshmi e pranisë së ndonjë lidhjeje statistikore konkretisht midis këtyre dukurive, por kjo lidhje nuk mund të transferohet në të njëjtat dukuri, por për një situatë të ndryshme. Shpesh, studiuesit, pasi kanë marrë një korrelacion të rëndësishëm midis dy variablave në llogaritjet e tyre, bazuar në thjeshtësinë e analizës së korrelacionit, bëjnë supozime intuitive të rreme për ekzistencën e marrëdhënieve shkak-pasojë midis karakteristikave, duke harruar se koeficienti i korrelacionit është probabilist në natyrë. .

Shembull: numri i personave të lënduar gjatë kushteve të akullit dhe numri i aksidenteve rrugore ndërmjet mjeteve motorike. Këto sasi do të lidhen me njëra-tjetrën, megjithëse ato nuk janë absolutisht të ndërlidhura, por kanë vetëm një lidhje me shkakun e përbashkët të këtyre ngjarjeve të rastësishme - akullin e zi. Nëse analiza nuk zbulon një korrelacion midis fenomeneve, kjo nuk është ende dëshmi e mungesës së varësisë midis tyre, e cila mund të jetë komplekse jolineare dhe të mos zbulohet nga llogaritjet e korrelacionit.




Të parët që futën konceptin e korrelacionit në përdorim shkencor ishin francezët paleontologu Georges Cuvier. Në shek. Në statistika, termi korrelacion u përdor për herë të parë në 1886 nga një shkencëtar anglez Francis Galton. Por ai nuk mundi të nxirrte formulën e saktë për llogaritjen e koeficientit të korrelacionit, por studenti i tij e bëri atë - matematikani dhe biologu i famshëm Karl Pearson.

Llojet e korrelacionit

Për nga rëndësia- shumë domethënëse, domethënëse dhe e parëndësishme.

Llojet

me çfarë është r i barabartë

Shumë domethënëse

r korrespondon me nivelin e rëndësisë statistikore p<=0,01

Të rëndësishme

r korrespondon me p<=0,05

I parëndësishëm

r nuk arrin p>0.1

Negativ(ulja e vlerës së një ndryshore çon në një rritje të nivelit të një tjetri: sa më shumë fobi të ketë një person, aq më pak ka gjasa që ai të zërë një pozicion drejtues) dhe pozitiv (nëse një rritje në një variabël çon në rritje në nivelin e tjetrit: sa më nervoz të jeni, aq më shumë ka gjasa të sëmureni). Nëse nuk ka lidhje midis variablave, atëherë një korrelacion i tillë quhet zero.

Linear(kur një vlerë rritet ose zvogëlohet, e dyta gjithashtu rritet ose zvogëlohet) dhe jolineare (kur kur një vlerë ndryshon, natyra e ndryshimit në të dytën nuk mund të përshkruhet duke përdorur një marrëdhënie lineare, atëherë zbatohen ligje të tjera matematikore - polinomiale, hiperbolike marrëdhëniet).

Nga forca.

Shanset




Varësisht se cilës shkallë i përkasin variablat në studim, llogariten lloje të ndryshme të koeficientëve të korrelacionit:

  1. Koeficienti i korrelacionit Pearson, koeficienti i korrelacionit linear në çift, ose korrelacioni i momentit të produktit llogaritet për variablat me shkallë të matjes së intervalit dhe shkallës.
  2. Koeficienti i korrelacionit të gradës Spearman ose Kendall - kur të paktën një nga sasitë ka një shkallë rendore ose nuk shpërndahet normalisht.
  3. Koeficienti i korrelacionit biserial i pikës (koeficienti i korrelacionit të shenjës Fechner) - nëse njëra nga dy madhësitë është dikotomike.
  4. Koeficienti i korrelacionit me katër fusha (koeficienti i korrelacionit të renditjes së shumëfishtë (përputhshmërisë) - nëse dy variabla janë dikotomikë.

Koeficienti Pearson i referohet treguesve të korrelacionit parametrik, të gjithë të tjerët janë joparametrik.

Vlera e koeficientit të korrelacionit varion nga -1 në +1. Me një korrelacion të plotë pozitiv, r = +1, me një korrelacion të plotë negativ, r = -1.

Formula dhe llogaritja





Shembuj

Është e nevojshme të përcaktohet marrëdhënia midis dy variablave: niveli i zhvillimit intelektual (sipas të dhënave të testimit) dhe numri i vonesave në muaj (sipas shënimeve në ditarin arsimor) midis nxënësve të shkollës.

Të dhënat fillestare janë paraqitur në tabelë:

Të dhënat e IQ (x)

Të dhëna për numrin e vonesave (y)

Shuma

1122

Mesatare

112,2


Për të dhënë një interpretim të saktë të treguesit të marrë, është e nevojshme të analizohet shenja e koeficientit të korrelacionit (+ ose -) dhe vlera e tij absolute (modulo).

Në përputhje me tabelën e klasifikimit të koeficientit të korrelacionit sipas forcës, konkludojmë se rxy = -0.827 është një korrelacion i fortë negativ. Kështu, numri i nxënësve që vonohen ka një varësi shumë të fortë nga niveli i tyre i zhvillimit intelektual. Mund të thuhet se nxënësit me nivel të lartë të inteligjencës vonohen në mësime më rrallë se studentët me nivel të ulët të inteligjencës.



Koeficienti i korrelacionit mund të përdoret si nga shkencëtarët për të konfirmuar ose hedhur poshtë supozimin e varësisë së dy sasive ose fenomeneve dhe për të matur forcën dhe rëndësinë e tij, ashtu edhe nga studentët për të kryer kërkime empirike dhe statistikore në lëndë të ndryshme. Duhet mbajtur mend se ky tregues nuk është një mjet ideal, ai llogaritet vetëm për të matur forcën e një marrëdhënieje lineare dhe do të jetë gjithmonë një vlerë probabiliste që ka një gabim të caktuar.

Analiza e korrelacionit përdoret në fushat e mëposhtme:

  • shkenca ekonomike;
  • astrofizikë;
  • shkencat sociale (sociologji, psikologji, pedagogji);
  • agrokimi;
  • metalurgji;
  • industria (për kontrollin e cilësisë);
  • hidrobiologji;
  • biometrike etj.

Arsyet për popullaritetin e metodës së analizës së korrelacionit:

  1. Thjeshtësia relative e llogaritjes së koeficientëve të korrelacionit nuk kërkon edukim të veçantë matematikor.
  2. Ju lejon të llogaritni marrëdhëniet midis variablave të rastësishëm të masës, të cilat janë objekt i analizës në shkencën statistikore. Në këtë drejtim, kjo metodë është bërë e përhapur në fushën e kërkimit statistikor.

Shpresoj që tani do të jeni në gjendje të dalloni një marrëdhënie funksionale nga një marrëdhënie korrelacioni dhe do të dini se kur dëgjoni në televizion ose lexoni në shtyp për korrelacionin, kjo do të thotë një ndërvarësi pozitive dhe mjaft domethënëse midis dy fenomeneve.

Shenja të ndryshme mund të lidhen me njëra-tjetrën.

Ekzistojnë 2 lloje lidhjesh midis tyre:

  • funksionale;
  • korrelacioni.

Korrelacioni e përkthyer në Rusisht nuk është gjë tjetër veçse një lidhje.
Në rastin e një lidhjeje korrelacioni, mund të gjurmohet korrespondenca e disa vlerave të një karakteristike me disa vlera të një karakteristike tjetër. Si shembuj, ne mund të konsiderojmë korrelacionet e vendosura midis:

  • gjatësia e putrave, qafës dhe sqepave të shpendëve si çafkat, vinçat dhe lejlekët;
  • treguesit e temperaturës së trupit dhe ritmit të zemrës.

Për shumicën e proceseve biomjekësore, prania e këtij lloji të lidhjes është vërtetuar statistikisht.

Metodat statistikore bëjnë të mundur vërtetimin e faktit të ekzistencës së ndërvarësisë së karakteristikave. Përdorimi i llogaritjeve speciale për këtë çon në vendosjen e koeficientëve të korrelacionit (masat e lidhjes).

Llogaritjet e tilla quhen analiza e korrelacionit. Ajo kryhet për të konfirmuar varësinë e 2 variablave (ndryshore të rastësishme) nga njëra-tjetra, e cila shprehet me koeficientin e korrelacionit.

Përdorimi i metodës së korrelacionit ju lejon të zgjidhni disa probleme:

  • të identifikojë ekzistencën e një marrëdhënieje ndërmjet parametrave të analizuar;
  • njohja e pranisë së një korrelacioni na lejon të zgjidhim problemet e parashikimit. Kështu, ekziston një mundësi reale për të parashikuar sjelljen e një parametri bazuar në një analizë të sjelljes së një parametri tjetër korrelues;
  • kryerja e klasifikimit bazuar në përzgjedhjen e veçorive të pavarura nga njëra-tjetra.

Për variablat:

  • lidhur me shkallën rendore, llogaritet koeficienti Spearman;
  • lidhur me shkallën e intervalit – Koeficienti Pearson.

Këta janë parametrat më të përdorur, përveç tyre ka edhe të tjerë.

Vlera e koeficientit mund të shprehet ose pozitive ose negative.

Në rastin e parë, me rritjen e vlerës së njërës ndryshore, vërehet një rritje në të dytën. Nëse koeficienti është negativ, modeli është i kundërt.

Për çfarë është koeficienti i korrelacionit?

Variablat e rastësishëm të lidhura me njëri-tjetrin mund të kenë natyra krejtësisht të ndryshme të kësaj lidhjeje. Nuk do të jetë domosdoshmërisht funksional, rasti kur mund të gjurmohet një marrëdhënie e drejtpërdrejtë midis sasive. Më shpesh, të dyja sasitë ndikohen nga një grup i tërë faktorësh të ndryshëm në rastet kur ato janë të përbashkëta për të dy sasitë, vërehet formimi i modeleve të lidhura;

Kjo do të thotë se fakti i vërtetuar statistikisht i ekzistencës së një marrëdhënieje midis sasive nuk konfirmon se shkaku i ndryshimeve të vëzhguara është vërtetuar. Si rregull, studiuesi arrin në përfundimin se ekzistojnë dy pasoja të ndërlidhura.

Vetitë e koeficientit të korrelacionit

Kjo karakteristikë statistikore ka këto karakteristika:

  • vlera e koeficientit varion nga -1 në +1. Sa më afër vlerave ekstreme, aq më e fortë është marrëdhënia pozitive ose negative midis parametrave linearë. Në rastin e një vlere zero, flasim për mungesën e korrelacionit midis karakteristikave;
  • një vlerë pozitive e koeficientit tregon se nëse vlera e një karakteristike rritet, vërehet një rritje në të dytën (korrelacion pozitiv);
  • vlera negative - në rastin e rritjes së vlerës së një karakteristike, vërehet një rënie në të dytën (korrelacion negativ);
  • afrimi i vlerës së treguesit në pikat ekstreme (ose -1 ose +1) tregon praninë e një marrëdhënieje shumë të fortë lineare;
  • treguesit e një karakteristike mund të ndryshojnë ndërsa vlera e koeficientit mbetet e pandryshuar;
  • koeficienti i korrelacionit është një sasi pa dimension;
  • prania e një korrelacioni nuk konfirmon domosdoshmërisht një marrëdhënie shkak-pasojë.

Vlerat e koeficientit të korrelacionit

Forca e korrelacionit mund të karakterizohet duke përdorur shkallën Cheldock, në të cilën një vlerë e caktuar numerike korrespondon me një karakteristikë cilësore.

Në rastin e një korrelacioni pozitiv me vlerën:

  • 0-0,3 – korrelacioni është shumë i dobët;
  • 0,3-0,5 – i dobët;
  • 0,5-0,7 - forca mesatare;
  • 0,7-0,9 - e lartë;
  • 0.9-1 - forca shumë e lartë korrelacioni.

Shkalla mund të përdoret gjithashtu për korrelacion negativ. Në këtë rast, karakteristikat cilësore zëvendësohen nga ato të kundërta.

Ju mund të përdorni shkallën e thjeshtuar të Cheldock, e cila dallon vetëm 3 shkallëzime të forcës së korrelacionit:

  • shumë të fortë - tregues ±0.7 - ±1;
  • mesatare - tregues ±0,3 - ±0,699;
  • shumë i dobët - tregues 0 - ±0.299.

Ky tregues statistikor lejon jo vetëm të testojë supozimin e ekzistencës së një marrëdhënie lineare midis karakteristikave, por edhe të vendosë forcën e tij.

Llojet e koeficientit të korrelacionit

Koeficientët e korrelacionit mund të klasifikohen sipas shenjës dhe vlerës:

  • pozitive;
  • i pavlefshëm;
  • negativ.

Në varësi të vlerave të analizuara, koeficienti llogaritet:

  • Pearson;
  • Shtizëtar;
  • Kendal;
  • Shenjat Fechner;
  • përputhshmëria ose korrelacioni i shumëfishtë i rangut.

Koeficienti i korrelacionit Pearson përdoret për të vendosur marrëdhënie të drejtpërdrejta midis vlerave absolute të variablave. Në këtë rast, shpërndarjet e të dy serive të variablave duhet t'i afrohen normales. Variablat e krahasuar duhet të ndryshojnë në të njëjtin numër karakteristikash të ndryshme. Shkalla që përfaqëson variablat duhet të jetë një shkallë intervali ose raporti.

  • vendosja e saktë e forcës së korrelacionit;
  • krahasimi i karakteristikave sasiore.

Ka pak disavantazhe në përdorimin e koeficientit linear të korrelacionit Pearson:

  • metoda është e paqëndrueshme në rastin e vlerave numerike të jashtme;
  • Duke përdorur këtë metodë, është e mundur të përcaktohet forca e korrelacionit vetëm për një marrëdhënie lineare, për llojet e tjera të marrëdhënieve të ndërsjella të variablave, duhet të përdoren metoda të analizës së regresionit.

Korrelacioni i renditjes përcaktohet nga metoda Spearman, e cila lejon që dikush të studiojë statistikisht marrëdhëniet midis fenomeneve. Falë këtij koeficienti, llogaritet shkalla aktuale e paralelizmit të dy serive të karakteristikave të shprehura në mënyrë sasiore, si dhe vlerësohet ngushtësia e lidhjes së identifikuar.

  • që nuk kërkon përcaktim të saktë të vlerës së forcës së korrelacionit;
  • treguesit e krahasuar kanë kuptim sasior dhe atributiv;
  • krahasimi i serive të karakteristikave me variantet e hapura të vlerave.

Metoda e Spearman është një metodë analize joparametrike, kështu që nuk ka nevojë të kontrollohet normaliteti i shpërndarjes së një karakteristike. Përveç kësaj, ju lejon të krahasoni treguesit e shprehur në shkallë të ndryshme. Për shembull, krahasimi i numrit të qelizave të kuqe të gjakut në një vëllim të caktuar gjaku (shkallë e vazhdueshme) dhe vlerësimi i ekspertëve i shprehur në pikë (shkalla rendore).

Efektiviteti i metodës ndikohet negativisht nga një ndryshim i madh midis vlerave të sasive të krahasuara. Metoda nuk është gjithashtu efektive në rastet kur vlera e matur karakterizohet nga një shpërndarje e pabarabartë e vlerave.

Llogaritja hap pas hapi e koeficientit të korrelacionit në Excel

Llogaritja e koeficientit të korrelacionit përfshin kryerjen vijuese të një numri operacionesh matematikore.

Formula e mësipërme për llogaritjen e koeficientit Pearson tregon se sa punë intensive është ky proces nëse kryhet me dorë.
Përdorimi i aftësive të Excel përshpejton ndjeshëm procesin e gjetjes së koeficientit.

Mjafton të ndiqni një algoritëm të thjeshtë veprimesh:

  • futja e informacionit bazë - një kolonë me vlera x dhe një kolonë me vlera y;
  • në mjetet, zgjidhni dhe hapni skedën "Formulat";
  • në skedën që hapet, zgjidhni "Fut funksionin fx";
  • në kutinë e dialogut që hapet, zgjidhni funksionin statistikor "Corel", i cili ju lejon të llogaritni koeficientin e korrelacionit midis 2 grupeve të të dhënave;
  • në dritaren që hapet, futni të dhënat: grupi 1 - vargu i vlerave të kolonës x (duhet të zgjidhen të dhënat), grupi 2 - vargu i vlerave të kolonës y;
  • shtypet tasti "ok", rezultati i llogaritjes së koeficientit shfaqet në rreshtin "vlera";
  • përfundim në lidhje me praninë e një korrelacioni midis 2 grupeve të të dhënave dhe fuqisë së tij.

Koeficienti i korrelacionit pasqyron shkallën e marrëdhënies midis dy treguesve. Gjithmonë merr një vlerë nga -1 në 1. Nëse koeficienti ndodhet rreth 0, atëherë nuk ka lidhje midis variablave.

Nëse vlera është afër një (nga 0.9, për shembull), atëherë ekziston një lidhje e fortë e drejtpërdrejtë midis objekteve të vëzhguara. Nëse koeficienti është afër pikës tjetër ekstreme të diapazonit (-1), atëherë ekziston një marrëdhënie e fortë e kundërt midis variablave. Kur vlera është diku midis 0 dhe 1 ose 0 deri -1, atëherë flasim për një lidhje të dobët (të drejtpërdrejtë ose të kundërt). Kjo marrëdhënie zakonisht nuk merret parasysh: besohet se nuk ekziston.

Llogaritja e koeficientit të korrelacionit në Excel

Le të shohim një shembull të metodave për llogaritjen e koeficientit të korrelacionit, veçorive të marrëdhënieve të drejtpërdrejta dhe të anasjellta midis variablave.

Vlerat e treguesve x dhe y:

Y është një ndryshore e pavarur, x është një ndryshore e varur. Është e nevojshme të gjendet forca (e fortë / e dobët) dhe drejtimi (i drejtpërdrejtë / i kundërt) i lidhjes midis tyre. Formula e koeficientit të korrelacionit duket si kjo:


Për ta bërë më të lehtë për t'u kuptuar, le ta ndajmë atë në disa elementë të thjeshtë.

Një lidhje e fortë e drejtpërdrejtë përcaktohet midis variablave.

Funksioni i integruar CORREL shmang llogaritjet komplekse. Le të llogarisim koeficientin e korrelacionit të çiftit në Excel duke e përdorur atë. Thirrni magjistarin e funksionit. Ne gjejmë atë që na nevojitet. Argumentet e funksionit janë një grup me vlera y dhe një grup vlerash x:

Le të tregojmë vlerat e variablave në grafik:


Një lidhje e fortë midis y dhe x është e dukshme, sepse vijat shkojnë pothuajse paralel me njëra-tjetrën. Marrëdhënia është e drejtpërdrejtë: y rritet - x rritet, y zvogëlohet - x zvogëlohet.



Matrica e koeficientit të korrelacionit të çiftit në Excel

Matrica e korrelacionit është një tabelë në kryqëzimin e rreshtave dhe kolonave të së cilës ndodhen koeficientët e korrelacionit midis vlerave përkatëse. Ka kuptim ta ndërtosh atë për disa variabla.

Matrica e koeficientëve të korrelacionit në Excel është ndërtuar duke përdorur mjetin “Correlation” nga paketa “Analiza e të dhënave”.


U gjet një lidhje e fortë e drejtpërdrejtë midis vlerave të y dhe x1. Ekziston një reagim i fortë midis x1 dhe x2. Praktikisht nuk ka asnjë lidhje me vlerat në kolonën x3.