Bariantza

testwikitik
Nabigaziora joan Bilaketara joan

Estatistikan, bariantza datu-multzo batek nahiz probabilitate-banaketa batek duen sakabanatzearen neurri absolutu bat da. Hain zuzen, bariantzaren erro karratu positiboa desbideratze estandarra da, eta azken honek datu bakoitza batezbesteko aritmetiko sinpletik zenbat desbideratzen den adierazten du. Kalkuluaren aldetik, bariantza batezbestekoari buruzko bigarren mailako momentua ere bada. Aldakortasun edo sakabanatze neurri izateaz gainera, bere propietate matematikoak direla eta, maiz agertzen da azterketa estatistikoetan. Esate baterako, aldagai batek duen aldakortasun-maila bariantzaren bitartez neurtzen da eta bariantza oso hau beste aldagai edo faktore zenbaitek eragindako aldakortasun-mailetan zatitu daiteke, aldagai horren kausak hauteman eta kausa horien eragina zehazteko, bariantza-analisian eta karratu txikienen erregresioan egiten den bezala.

Kalkulua datuetarako

Honela adierazi eta kalkulatzen da, datuak x1,x2,,xn izanik:

sX2=1Ni=1N(xix)2

Aurreko formulari jarraiki, pauso hauek jarraitu behar dira kalkulurako:

  1. batezbesteko aritmetiko sinplea (x) kalkulatu;
  2. xix, datu bakoitzak batezbestekora duen distantzia alegia, kalkulatu;
  3. batuketa egitean konpentsa ez daitezen, distantzia karratuak kalkulatu;
  4. distantzia karratu horien batezbestekoa kalkulatzen da, zati n datu kopurua eginez.

Laburrago kalkulatzeko formula bat ere badago, aurreko formulatik erator daitekeena:

sX2=i=1nxi2nx2

Desbideratze estandarra bariantzaren erro karratu positiboa da:

sX=1Ni=1N(xix)2=i=1nxi2nx2

Adibidea datu bakanduetarako

Kalkulurako adibide gisa, azterketa batean ikasle zenbaitek jasotako kalifikazio hauek hartuz (puntutan): 6-7-9-5-3.

Jatorrizko formula Formula laburtua
xi (xix)2
6 (6-6)2=0
7 (7-6)2=1
9 (9-6)2=9
5 (5-6)2=1
3 (3-6)2=9
30 20
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x=ixin=305=6
Jarraian,
sx2=i(xix)2n=205=4sX=4=2
Bariantza 4 puntu2 izango da, beraz. Desbidazio estandarra emaitza horren erro karratua da: 2 puntu.
xi xi2
6 62=36
7 72=49
9 92=81
5 52=25
3 32=9
30 200
Lehendabizi, batezbesteko aritmetiko sinplea kalkulatzen da:
x=ixin=305=6
Jarraian,
sx2=ixi2nx2=200562=4sX=4=2
Arestiko emaitza berdinak eskuratzen dira, baina kalkuluak erosoago eginez.

Adibidea maiztasun-tauletatarako

Datuak maiztasun-taula batean bildu direnean, maiztasun-taulatik bertatik egin daiteke kalkulua. Aiseago egiten da formula laburtuarekin, hurrengo adibidean egiten den bezala.

xi(balioak) ni(maiztasunak) nixi nixi2
5 2 10 50
6 3 18 108
8 1 64 64
baturak 6 36 670
sx2=ini(xix)2ini=inixi2inix2=2226(366)2=1

Adibidea tartetan bildutako datuetarako

Datuak tartetan bildu direnean, tarte horietako erdipuntuak hartzen dira kalkuluetarako balio adierazgarri moduan.

Tarteak ni(maiztasunak) xi(balioak) nixi nixi2
0-40 5 20 100 2000
40-80 30 60 1800 108000
80-120 10 100 1000 100000
baturak 45 2900 210000
sx2=ini(xix)2ini=inixi2inix2=21000045(290045)2=513.63

Tarte bakoitzean hartutako erdipuntuaren hurbilketak dakarren errorea zuzentzeko Shepparden zuzenketa delakoa erabiltzen da, datuak banaketa normalari jarraiki banatzen direnean eta tarte-zabalera konstantea denean soilik aplika daitekeena (b, tarte-zabalera):

s~X2=sX2b212=513.6340212=380.3

Kalkulua probabilitate banakuntzetarako

Honela definitzen da, μ=E[X] izanik itxaropen matematikoa:

var[X]=σX2=E[(Xμ)2]

Banakuntza jarraitua bada, honela kalkulatzen da, integralak X aldagaiaren balioen Ω(X) eremuan ebaluatu behar direlarik:

var[X]=σX2=Ω(X)(xμ)2p(x)dx, non μ=Ω(X)xp(x)dx

Banakuntza diskretua bada, xi,p(xi) aldagaiaren balio eta beren probabilitateak izanik:

var(X)=σX2=ipi(xiμ)2, non μ=ixip(xi)

Definizioaren formula garatuz, jatorriari buruzko momentuetan oinarritutako adierazpen batera heltzen da, kalkulurako erosoagoa dena:

var[X]=σX2=E[(Xμ)2]=E[X2]μ2=E[X2]E[X]2


Banakuntza diskretu baterako adibidea

0 eta 1 balioak 0.4 eta 0.6 probabilitateaz hartzen dituen probabilitate-banaketaren bariantza kalkulatu behar da.

Jatorrizko formula Formula laburtua
xi p(xi) xip(xi) (xiμ)2p(xi)
0 0.4 0 0.144
1 0.6 0.6 0.096
baturak 1 μ=0.6 σ2=0.24
Lehendabizi, itxaropen matematikoa kalkulatzen da, hirugarren zutabean egiten den bezala.
Jarraian, bariantza kalkulatzeko, bere formula aplikatzen da zuzenean laugarren zutabean.
xi p(xi) xip(xi) xi2p(xi)
0 0.4 0 0
1 0.6 0.6 0.6
baturak 1 μ=0.6 E[X2]=0.6
Itxaropen matematikoa hirugarren zutabean kalkulatzen da.
Jarraian, laugarren zutabean, E[X2] kalkulatzen da.
σ2=E[X2]E[X]2=0.60.62=0.24

Banakuntza jarraitu baterako adibidea

fX(x)=2x; 0<x<1 banaketaren bariantza kalkulatu behar da,

Jatorrizko formula Formula laburtua
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ=E[X]=Ωxf(x)dx=01x2xdx=0.66
Jarraian, bariantza kalkulatzeko:
σ2=Ω(xμ)2f(x)dx=01(x0.66)22xdx=0.055
Lehendabizi, itxaropen matematikoa kalkulatzen da:
μ=E[X]=Ωxf(x)dx=01x2xdx=0.666
Jarraian, E[X2] kalkulatzen da:
E[X2]=Ω(x)2f(x)dx=01x22xdx=0.5
Azkenik, bariantza honela kalkulatzen da
σ2=E[X2]E[X]2=0.50.6662=0.055

Bariantzaren propietateak

Bariantza beti da ez-negatiboa

Bariantza ez da inongo kasutan negatiboa. 0 balioa ere har dezake, datu guztiak berdinak direnean nahiz 1 probabilitatea duen konstante baten kasuan.

Bigarren mailako momentu txikiena

Bariantza bigarren mailako momentu txikiena da:

  • datuetarako, i(xik)2n adierazpena minimotzen duen k balioa x da;
  • probabilitate banakuntzetarako, E[(Xk)2] minimiotzen duen k balioa μ da.

Aldagai-aldaketa lineala

  • Y=a+bX aldagai-aldaketa lineala egiten bada, a, b konstanteak izanik,
    • datuen bariantzari buruz, sY2=b2sX2,
    • probabilitate-banakuntzen bariantzari buruz, var[Y]=b2var[X]

Hau da, datu guztiei (edo zorizko aldagaiari) konstante bat gehitu edo kentzeagatik, bariantzaren emaitza ez da aldatzen, baina konstante batez bidertzean, bariantza bider konstante hori karratura bidertzen da.

Aldagaien baturaren bariantza

X1,X2,,Xn aldagaiak elkarrekiko independenteak badira:

var[X1+X2++Xn]=var[X1]+var[X2]++var[Xn]

Aurreko berdintza aldagaiak elkarrekiko korrelazio linealik gabeak direnean ere betetzen da.

Oro har, independenteak ez badira, bariantzak eta aldagai-bikote guztien kobariantzak gehitu behar dira[1]:

var[X1+X2++Xn]=ivar[Xi]+ijicov[Xi,Xj]=ivar[Xi]+2ij>icov[Xi,Xj]

Bi aldagaien kasurako, esate baterako:

var[X1+X2]=var[X1]+var[X2]+2cov[X1,X2]

Bariantza bi aldagai berdinen arteko kobariantza da

Bariantza kobariantza berezi bat besterik ez da, non kobariantzan parte hartzen duten bi aldagaiak berdinak diren:

var[X]=cov[X,X]

Erreferentziak

Txantiloi:Erreferentzia zerrenda

Kanpo lotutak

Txantiloi:Wikiztegia

Kanpo estekak

Txantiloi:Autoritate kontrola