Txebixeven desberdintza

testwikitik
Nabigaziora joan Bilaketara joan

Probabilitate teorian eta estatistikan, Txebixeven desberdintzak edo Bienaymé-Txebixeven desberdintzak edozein probabilitate banaketatan, itxaropen matematiko edo batezbestekoa eta σ bariantza finituaren balioa soilik ezagutzen direlarik, suertatzen den balioa batezbestekotik gehienezko eta gutxienezko distantzia batera izateko probabilitatea hurbiltzen du, probabilitateari buruzko tarte bat ezarriz, probabilitate-banaketa ezaguna ez denez probabilitate zehatza ezin baita finkatu. Zehatzago, suertatzen den balioa batezbestekotik gutxienezko ε distantzia batera izateko probabilitatea σ22 baino txikiagoa dela ezartzen du (eta beraz, gehienezko ε distantzia batera izateko probabilitatea 1-(σ22) baino handiagoa dela ere bai), non σ2 banaketaren bariantza den. Probabilitate-banaketa zehatz bat ezarri ezin eta batezbestekoa eta bariantza soilik finkatu diren egoeretan probabilitateak hurbiltzeko baliatu ahal izateaz gainera, Txebixeven desberdintza teorema estatistiko garrantzitsuak frogatzeko erabiltzen da, hala nola zenbaki handien lege ahula. Konfidantza-tarteak eta horiek behar diren lagin-tamainaak finkatzeko ere erabiltzen da. Irenée-Jules Bienaymé estatistikaria izan zen desberdintza eta dagokion froga lehen aldiz plazaratu zuena 1853 urtean, bereziki beste gai zenbait garatzen zituen artikulu batean egin bazuen ere. Desberdintzaren berezko balioaz jabetu eta zabaldu zuena, ordea, Pafnuti Txebixev matematikaria izan zen 1867 urtean, desberdintzari buruzko berariazko artikulu batean. Hori dela eta, historialari gehienen irizpideari jarraiki, desberdintzaren meritua Txebixevi ematen zaio gehienetan.

Txebixeven desberdintzaren formula

Txebixeven ezberdintzak itxaropena eta bariantza soilik ezagutzen direnean, tarte zentral bati eta muturrei buruzko probabilitateak mugatzen ditu.

Batezbestekotik zehazten den distantzia desbideratze estandarraren terminoetan jartzen den formulak bi aldaera desberdin ditu. Bietan ez dago inongo lehentasun ordenarik eta bata zein bestea erabil daiteke kasu guztietan, batzuetan erosotasunez formularen aldaera bat bestea baino egokiagoa izan badaiteke ere.

Lehen aldaera

μ itxaropena eta σ2 bariantza finitua dituen probabilitate banaketa batean,

  • muturretako probabilitaterako,
ϵ>0,  P(|Xμ|ϵ)σ2ϵ2.
  • batezbestekoaren inguruko tarte simetriko bati dagokion probabilitaterako, muturretako balioek (aurreko adierazpenean) aurkako gertakizuna osatzen dutela kontuan hartuz,
ϵ>0,  P(|Xμ|<ϵ)1σ2ϵ2.

Bigarren aldaera

Itxaropenerako distantzia desbideratze estandarraren unitatetan neurtzen bada, hau da, ε=kσ bihurtuz soilik, Txebixeven desberdintza honela geratzen da:

  • muturretako probabilitaterako,
k>0,  P(|Xμ|kσ)1k2.
  • batezbestekoaren inguruko tarte simetriko bati dagokion probabilitaterako,
k>0,  P(|Xμ|<kσ)11k2.

ADIBIDEA

Zorizko aldagai baten itxaropena 2000 eta bariantza 100 izanik, zenbatekoa da itxaropenetik 200 baino gutxiago desbideratzeko, hau da, X 1800-2200 bitartean suertatzeko probabilitatea?

P(|X2000|<200)110022002=0.75

Beraz, eskatutako probabilitatea 0.75 baino handiagoa da.

Desberdintzaren bigarren aldaera erabiliz, berriz:

kσ=ϵ100k=200k=2
P(|X2000|<2×100)1122=0.75

Tarte nabarmenak, banaketa normalarekin alderatuz

Honako taula honetan, Txebixeven desberdintzak k balio zenbaitetarako P[|Xμ|>kσ] probabilitateak zehazten dira, N(μ,σ) zorizko aldagai normal estandar batean (non itxaropena eta bariantza 0 eta 1 diren, hurrenik hurren) eta U(0,1) banaketa uniforme jarraitu batean (non itxaropena eta bariantza 0.5 eta 0.2886 diren, hurrenik hurren) suertatuko liratekeen probabilitate zehatzekin batera.

k balioa Txebixeven desberdintza (1/k2) Banakuntza normala U(0,1) banaketa uniformea
1 ≥0 0.6827 0.5772
1.25 ≥0.36 0.7887 0.7215
1.5 ≥0.55 0.8664 0.8658
2 ≥0.75 0.9545 1
2.5 ≥0.84 0.9876 1
3 ≥0.889 0.9973 1
4 ≥0.9375 0.99994 1

Aurreko emaitzetan ohartzekoa da Txebixeven desberdintzaren zehaztasuna handiagoa dela k balio handietarako, betiere bi probabilitate-banaketa zehatz horiekin alderaturik.

Desberdintzaren frogapenak

Lehen frogapena

Txebixeven lehen aldaerako formula frogatuko da. Horretarako bariantzaren definiziotik abiatu behar da. ϵ>0 balio baterako eta X zorizko aldagai jarraitu baterako:

σ2=(xμ)2f(x)dx|xμ|ϵ(xμ)2f(x)dx     (1)

Azken integralean,

|xμ|ϵ(xμ)2ϵ2

Beraz, (1) adierazpenera itzuliz,

|xμ|ϵ(xμ)2f(x)dx|xμ|ϵϵ2f(x)dx=ϵ2|xμ|ϵf(x)dx=ϵ2P[|xμ|ϵ]      (2)

Eta, azkenik, (1) garapenaren abiapuntua eta (2) garapenaren bukaerako adierazpena lotuz:

σ2ϵ2P[|xμ|ϵ]P[|xμ|ϵ]σ2ϵ2

Zorizko aldagai diskretu baterako modu berean frogatzen da, integralaren ordez batukaria eta f(x) dentsitate-funtzioaren ordez p(x) probabilitate-funtzioa ezarriz.

Markoven desberdintzan oinarritutako frogapena

Y=(XE[X])2 aldagaia sortuz, Y aldagairako Markoven desberdintza balia daiteke, balio ez negatiboak hartu eta bere itxaropen matematikoa, definizioz X aldagaiaren bariantza alegia, existitzen baita. Beraz,

P(Yk2E[Y])1k2

Beste alde batetik, E[Y]=E[(XE[X])2]=σX2 betetzen denez:

P(Yk2E[Y])=P( (XE[X])2k2σX2 )=P(|XE[X]|kσX)

Beraz,

P(|XE[X]|kσX)1k2[1]

Hirugarren frogapen sinple bat

Ondorengo frogapenak ez du kontuan hartzen banaketa jarraitua edo diskretua den eta ez du baliatzen Markoven desberdintza.[2]

x aldagaian oinarrituta, zorizko aldagai berri hau sortzen da:

f(n)={k2σX2,baldin |xμx|kσX0,baldin |xμx|<kσX

Orduan,

y(xμX)2E[Y]=yp(y)=k2σX2P[|xμx|kσX]+0×P[|xμx|<kσX]=k2σX2P[|xμx|kσX]E[(XμX)2]=σX2

Hasierako eta bukaerako adierazpenak k2σX2 adierazpenekin zatituz, Txebixeven desberdintza eskuratzen da:

P[|xμx|kσX]1k2

Txebixeven desberdintzaren aldaerak

Banakuntza simetrikoak

Itxaropenaz eta bariantzaz gainera, banaketa simetrikoa dela ezartzen bada, mutur bakar baterako probabilitatea ezar daiteke, hurbildutako probabilitatea zati bi eginez:

x0<μ ;P[X<x0]σ22(μx0)2
x0>μ ;P[X>x0]σ22(x0μ)2

Aplikazioak

Probabilitate banaketa batetik itxaropena eta bariantza ezagutzen direnerako probabilitate-tarteak eratzeaz gainera, Txebixeven desberdintzak beste zenbait aplikazio ditu.

Konfiantza-tarteak

Parametro bati buruzko konfiantza-tarteak erabiltzen da, zenbateslearen lagin banaketari buruz itxaropena, konfidantza-tartea eratzeko parametroaren balioarekin bat etorri behar duena (hau da, zenbateslea alboragabea izan behar da) eta bariantza soilik ezagunak direnean. Konfidantza tarte jakin bat eratzeko jaso beharreko lagin-tamaina kalkulatzeko ere erabil daiteke.

Populazio baten batezbestekoari buruzko konfiantza-tartea

Populazio guztietarako lagin-batezbestekoaren itxaropena eta desbideratze estandarra hauek dira, non μ populazio-batezbestekoa den eta n lagin-tamainaa:

μx=E[x]=μ
σx=var[x]=σn

Populazioa normala denean, gainera, lagin-batezbestekoa banaketa normalari jarraiki banatzen da eta beraz, konfiantza-tartea eratzeko banaketa normalean oinarritu behar da. Lagin-tamainaa handia denean (oro har, n>30) ere erabiliko da banaketa normala tartea eratzeko, limitearen teorema zentrala erabiliz, lagin-batezbestekoa normal banatzen baita kasu horretan. Beste kasu guztietan beraz, populazioa normaltzat jo ezin denean eta lagin-tamainaa txikia denean alegia, populazio-batezbestekoari buruzko konfiantza-tartea eratzeko Txebixeven desberdintza erabili behar da, arestian zehaztutako itxaropena eta bariantza baliatuz:

P[|xμ|<kσ]11k2

Hortik konfiantza-tarte hau eratzen da, 11k2 konfiantza-mailakoa:

x±kσn

Adibidez, konfiantza-maila arruntetarako honela eratuko lirateke tarteak:

Konfiantza maila (1α) k=11(1α) Konfiantza-tartea
0.8 2.23 x±2.23σn
0.9 3.16 x±3.16σn
0.95 4.47 x±4.47σn
0.99 10 x±10σn

Populazio-proportzio bati buruzko konfiantza-tarteak

Txantiloi:Sakontzeko

Egoera guztietan p^ lagin proportzioaren itxaropena eta desbideratzen estandarra hauek dira, non p populazio-proportzioa den eta n lagin-tamainaa:

μp^=E[p^]=p
σp^=var[p^]=p(1p)n

Gainera, lagin-tamainaa handia denean (oro har, n>30) lagin-proportzioa banaketa normalaren bitartez hurbil daiteke eta orduan konfiantza-tartea gutxi gorabehera zehatza era daiteke. Lagin-tamainaa txikia denean, konfiantza-tartea eratzeko lagin-proportzioaren jatorriko banaketa den banaketa binomiala har daiteke oinarritzat, Clopper-Pearson tartea eratzeko ondoren. Beste soluzio bat, tarte zabalagoak (baina bide batez, zuhurragoak ere bai) ematen dituen arren, Txebixeven desberdintza erabiltzea da, arestiko itxaropena eta desbideratzeak erabiliz:

P[|p^p|<ϵ]1σ2ϵ2=1p(1p)nϵ2

Konfiantza maila modu zuhur batez finkatzearren, p proportzio ezjakintasunean, 1p(1p)nk2 adierazpenak balio minimoa hartzen duela pentsatu behar da: hori p(1p)=1/4 adierazpenaren gehienezko balioa betetzen denean gertatzen da, kontuan hartuz p probabilitatea 0 eta 1 balioen artean egon behar dela. Beraz,

P[|p^p|<ϵ]114nϵ2

Hortik, konfiantza-tarte hau eratzen da:

p^±ϵ, non konfiantza 114nϵ2 den.

Ondorengo taulan, lagin-tamaina zenbaitetarako (lagin-tamainaa 30 edo handiagoa denean, hurbilketa normala erabil daiteke) eta gutxieneko ohiko konfiantza-mailetarako sortuko liratekeen tarteak azaltzen dira, aurreko formulatik abiatuta:

Lagin-tamainaa / Konfiantza-maila %80 %90 %95 %99
n=3 p^±0.645 p^±0.913 - -
n=5 p^±0.559 p^±0.790 - -
n=10 p^±0.354 p^±0.500 p^±0.707 -
n=15 p^±0.289 p^±0.408 p^±0.577 -
n=20 p^±0.250 p^±0.354 p^±0.500 -
n=25 p^±0.224 p^±0.316 p^±0.447 -

Ikusten denez, Txebixeven desberdintzak oso konfiantza-tarte zabalak ematen ditu populazio-proportziorako, proportzioa [0,1] bitarteko balioak hartzen dituela kontuan hartuz. %99ko konfiantza-mailarako ezin da inongo tarterik zehaztu, kasu guztietan [0,1] mugetatik kanpo geratzen baita.

Zenbaki handien legea

Txebixeven desberdintza zenbaki handien lege ahula frogatzeko erabiltzen da, zeinak batezbesteko aritmetiko sinpleak populazioko batezbesteko edo itxaropen matematikotik distantzia batetik harago urruntzeko probabilitatea, laginaren tamainaa handitu ahala, zerorantz doala baieztatzen duen:

limnPr(|Xnμ|>ε)=0.

Txebixeven desberdintzaren doitasuna

k-mugako banaketak

Txebixeven desberdintzak ezartzen duen probabilitate-muga hobezina dela esan daiteke, probabilitate-mugaren balioarekin bat datorren probabilitate-banaketa bati buruzko probabilitate zehatza existitzen delako. Txebixeven probabilitate-muga zehazki betetzen duten banaketak k-mugako banaketak direla esaten da. Hain zuzen, oinarrian honelakoak dira Txebixeven desberdintzaren k-mugako banaketak:

x p(x)
-1 12k2
0 11k2
1 12k2

Arestiko probabilitate-banaketan itxaropena eta desbideratze estandarra μ=0  eta σ=1/k hurrenik hurren direla jakinik eta Txebixeven desberdintza aplikatuz:

P[|Xμ|<kσ]=P[|X|<1]11k2

Probabilitate zehatza Txebixeven desberdintzaren mugaraino doi-doi heltzen da:

P[|X|<1]=P[X=0]=11k2

Froga daiteke aurreko probabilitate-banakuntzetarako burutzen den edozein y=mx+b motako aldagai aldaketen ondorioz sortutako probabilitate-banaketa berriak ere k balio bererako k-mugako banaketak direla. Hortik, x k-mugako banaketa orori, estandartuz, hau da, z=(x-μ)/σ aldaketa eginez, k-mugako banaketa estandar (batezbestekoa 0 eta desbideratzea 1 dituena, alegia) bakarra dagokiola froga daiteke.

Froga daiteke, beste alde batetik ez dagoela k-mugako probabilitate-banaketa jarraiturik.[3]

k-bildutako banaketak

k-bildutako banakuntzetan probabilitateak, k balio jakin baterako, Txebixeven desberdintzak ezarritako probabilitate-mugatik urrutien dauden banaketak dira. Adibidez, Txebixeven desberdintzak P[80<X<120]≥0.60 betetzen dela ezartzen duen kasuetarako, k-bildutako banaketan P[80<X<120]=1 betetzen da. Arestiko atal batean, U(0,1) banaketa uniforme jarraitua k=2 baliotik gorako tarteetarako k-bildutako banaketa da. Zehatzago, probabilitate-banaketa bat k-bildutakoa dela esaten da P[|Xμ|<kσ]=1, hots, P[|Xμ|kσ]=0 betetzen denean.

Itxaropenetik batez besteko desbideratzea dela ezartzen duen desbideratze estandarraren definizioan oinarrituz, argi dago ez dagoela k<1 balio baterako k-bildutako banaketarik: probabilitate-masa guztia ezin da bildu μ±σ baino estuagoa den tarte batean, σ parametroak itxaropenetik batez besteko desbideratzea adierazten duelako. Hala ere, badira ia k-bildutako-banaketak direnak.[3] Probabilitate-banaketa hau definitzen bada, non μ=0 eta σ=1n betetzen diren:

x p(x)
-1 12n
0 11n
1 12n
0<k1 ; P[|Xμ|<kσ]=11n, zeinen limitea 1 den, n infiniturantz joan ahala.

Beste alde batetik, k-bildutako banaketa izatetik neurri jakin batean hurbil dauden banaketak ere gara daitezke, baina oro har funtzio konplexuak dira, batere balio praktikorik ez dutenak.[3]

Erreferentziak

Txantiloi:Erreferentzia zerrenda

Kanpo estekak

Txantiloi:Autoritate kontrola