probabilidad

1. Estat./Mat.

Estatistikan, gertaera jakin bat gauzatu dadin dagoen aukeraren neurria. Fenomeno edo saiakuntza batean gertaera jakin bat gauzatzen den kasuen (aldeko kasuen) eta beha daitezkeen gertaera edo kasu guztien arteko zatidura da. 1 baliotik (gertaera beti gauzatzen bada) 0 baliora (inoiz ere gauzatzen ez bada) bitartean alda daiteke.

Zenbaki handien legea. Txanpon orekatu baten jaurtiketaren emaitzen proportzioak, jaurtialdi-kopururaren arabera
Zenbaki handien legea. Txanpon orekatu baten jaurtiketaren emaitzen proportzioak, jaurtialdi-kopururaren arabera

1. Estat./Mat.
Estatistikan, gertaera jakin bat gauzatu dadin dagoen aukeraren neurria. Fenomeno edo saiakuntza batean gertaera jakin bat gauzatzen den kasuen (aldeko kasuen) eta beha daitezkeen gertaera edo kasu guztien arteko zatidura da. 1 baliotik (gertaera beti gauzatzen bada) 0 baliora (inoiz ere gauzatzen ez bada) bitartean alda daiteke.

Probabilitatea Edit

Egilea: Yosu Yurramendi

PROBABILITATEA

Probabilitateak, labur esanda, zer edo zer gertatzeko zoriaren ezaugarri bat adierazten du. Ezjakintasunari, ziurtasun-gabeziari, ezegonkortasunari (aldagarritasunari) eta zehaztasunik ezari lotuta agertzen da.

Probabilitate hitzak oinarrizkoa dela ematen du, eta geroarekin edo gertatuko ote denarekin lotzen den nozio bat da. Kontzeptua ez da oso zehatza, edo ulerkera bat baino gehiago du, baina zenbakiz adierazten da.

Nozioa aspaldikoa da, hala dirudi behintzat aurkitu diren kurkulux edo dadoei erreparatuz gero, eta makina bat teoria egin da nozio horren inguruan. Ikuspegi filosofikotik, zenbait teoria osatu da bere muina zein den azaltzearren. Ikuspegi matematikoa estuagoa da gaur egun, probabilitate-teoria izenaz da ezaguna, eta arrakastaz erabiltzen da edozein jakintza-arlotan estatistika ren lagungarri gisa, aurreikuspen edo aurresan eta diagnostikoak egin nahi izaten direnean, azken finean, erabakiak hartzen direnean.

Ulerkerak

Probabilitate hitza latinezko probabilis hitzetik dator. XVII. mendera arte, latinezko probabilis hitzak esan nahi zuen zerbaiti buruzko iritzia edo ekintza "onargarria" zela zentzuren batean. Probabilitate hitzaren esanahia lotuta dago latinezko alea eta grekoko estocas hitzekin, baita arabierako azahar hitzarekin ere (dadoetan azaltzen zen lorea izaki, nonbait). Euskaraz ere badaude hainbat hitz horrekin lotuta: zori, ausa, adur, zorte, suerte.

Probabilitatea zenbakiz adierazten denean, muturreko bi balioak aski ongi ulertzen dira. Izan ere, gertaera baten probabilitatea 1 dela esaten bada (% 100, hizkera arruntaz), esan nahi da gertaera ziurtasun osoz gertatuko dela, ezbairik gabe; probabilitatea 0 bada, berriz, ez dela gertatuko, zalantzarik gabe. Bien bitarteko balioen ulerkera zailagoa da zehaztea.

Bi dira ulerkera nagusiak: subjektiboa eta objektiboa.

Ulerkera subjektiboaren arabera, gertaera bati eransten zaion probabilitatea sinesmen edo uste-maila baten antzekoa da. Sinesgarritasuna eta konfiantza, edo fidagarritasunari lotuta doakiona da.

Ulerkera horrek tradizioan badu zerikusirik apustuekin. Gertaera baten probabilitatea 0,50 dela esaten denean, apustuen hizkeran esan daiteke ez dela errazago gertatuko gertaera bat aurkakoa baino, ezta alderantziz ere, gertagarritasunaren aurrean bi aldeak parekoak direla, alegia. Probabilitatea 0,80 dela esaten denean, aldiz, ez da ziurra gertaera hori gertatuko denik, baina bai aurkakoa baino errazago gertatuko dela. Apustuetara eramanda, esan daiteke bi aukeren gertagarritasunak 4:1 proportzioan daudela (100:25); hau da, gertaeraren aldekoak apustuaren 4 unitate jarriko duela mahai gainean, eta aurkakoak (uste berdintsuko inor balego), 1. apustua edo trabesa egin eta gero argituko da zein den apustuaren irabazlea. Bien artean asmatzen duenak guztia (4 + 1 = 5) jasoko du.

Biek, aldekoek eta aurkakoek, ikusten dute errazagoa dela gertaera hori gertatzea ez gertatzea baino, eta modu berdintsuan, gainera. Bi subjektibotasunak antzekoak direlako lot daiteke trabesa. Aurkakoaren alde egiten duenak are errazago gertatuko delako ustea izango balu (jo 0,90), ez luke trabesa onartuko; zailagoa delako ustea izango balu (jo 0,60), aldiz, aise onartuko luke trabesa, aukera paregabea delakoan. Jakina, trabesa mahaigaineratzen duenak badaki horixe gerta daitekeela ere, eta, maiz, egiten duen apustua ez da izaten zehatz-mehatz bere uste hutsaren neurrikoa, abantaila txiki bat duena baizik. Esate baterako, gertaeraren probabilitatea 100:25 proportzioan dagoela uste badu, saiatuko da 100:30 lotzen. Apustuzaleen munduak badu zerikusirik probabilitatearekin, baina ez da zehatz-mehatz horixe bera.

Subjektibotasuna tarteko, probabilitateari zailtasunak ikusten dizkiote zenbaitek erabiltzeko garaian. Ulerkera subjektibo horren harira, badira beste zenbait kontzeptu: sinesgarritasuna, onargarritasuna, posibilitatea eta abar.

Ulerkera objektibo deritzonak, ordea, zerikusi handia du estatistikako maiztasun erlatiboarekin. Gertaera baten probabilitatea zorizko saioetan —saiotik saiora baldintzak aldatu gabe— gertaera horrek duen maiztasun erlatiboaren parekoa da. Zenbat eta saio gehiago egin, orduan eta konfiantza handiagoa dago gertaeraren maiztasun erlatiboa bere probabilitatetik nahi bezain gertu egoteko. Horrekin, zera esan nahi da: zorizko saioa zenbat eta gehiagotan egin baldintza berberetan, espero dela gertaeraren maiztasun erlatiboa gertaerari egokitu zaion probabilitatetik orduan eta hurbilago egotea. Pentsamolde horri forma bilatzen zaio probabilitate-teorian, eta zenbaki handien lege izenaz da ezaguna.

Esate baterako, lau bola gorri eta bola urdin bat duen kutxa batetik bola bat zoriz ateratzerakoan, esaten da bola gorri bat izateko probabilitatea 0,80 (% 80, 1/5 edo 4:1) dela; nonbait bola bat zoriz ateratzeko saioa behin eta berriz egiten bada —ateratako bola kutxara itzuliz—, bola gorri bat ateratzearen maiztasun erlatiboa 0,80ra hurbilduko delako ezinbestez.

grafikoak1

Zenbaki handien legea. Txanpon orekatu baten jaurtiketaren emaitzen proportzioak, jaurtialdi-kopururaren arabera

Probabilitatearen ulerkera horrek, beraz, zorizko saiakuntzaren nozioa argitzea eskatzen du, baita zorizko maiztasun erlatiboen segida baten limite edo jomuga kalkulatzea ere. Esaterako, gertaera jakin baten probabilitatea zein den jakin gabe, baldintza berberetan zorizko saioak eginez, maiztasun erlatiboak ematen duen emaitzak (iragana) agian ez du zehatz-mehatz argitzen probabilitatearen balioa zein den (geroa). Adibidez, nahiz eta alde gorriak eta urdinak dituen txanpon bat 100 aldiz bota eta gero 60tan alde gorria erakutsi eta 40 alditan alde urdina (estatistika hutsean, maiztasun erlatiboak: % 60tan gorri, % 40tan urdin), ez da jakingo saio batean gorri izateko probabilitatea 0,50 den ala ez. Lepoa joka daiteke, ziur aski, gorri izateko probabilitatea ez dela 0,10ekoa, baina zaila da erabakitzea, besteak beste, 0,50, 0,60 ala 0,70ekoa izango den. 100 alditan bota ordez, 100.000 alditan botaz gero, lor daitezkeen balioen esparrua estutu egingo da, baina zaila izango da orduan ere probabilitatea zein den jakitea. Praktikan, ordea, esparrua nahiko estua izatearekin nahikoa izan daiteke aurresan edo aurreikuspen nahiko onak egiteko.

Ikuspegi horrek sekulako garrantzia du inferentzia estatistikoko zenbatespen edo kalkuluen gaiarekin.

Bi ulerkerek dituzte beren oztopo eta zailtasunak. Zorionez, ikuspegi matematiko batetik, probabilitate-kalkulu berberetara eramaten dute biek.

Probabilitatearen lege nagusiak

Ikuspegi matematikoak eskatzen du kontzeptuari erantzuten dion objektu matematiko bat definitzea, hau da, zenbait gertaeren probabilitateak nola konbinatzen diren zehaztea, zoriaren gainean kalkuluak egin eta eraginak neurtzea.

Halako kalkulu bat lortzeko bidea luzea izan da. Antzinatik dator zoriaren inguruko hausnarketa eta kuantifikatu nahia, eta horixe izan da gaur egun dagoen probabilitate-kalkuluaren jatorria, baina kalkuluaren lehendabiziko oinarri matematikoak XVII. mendean ezarri ziren. Aurretik, XV. eta XVI. mendeetan, egia da garrantzi handiko urratsak eman zirela, baina erabateko kalkulua XVII. mendean lortu zen. Jokoak eta konbinatoria izan ziren kalkuluaren iturburu (konbinatoria).

Aipatzekoa da kalkulu diferentziala ere orduan lortu zela, nahiz bere aurrekariak aspaldikoak izan. Kalkulu diferentzialean azaltzen da kantitate txiki asko nola konbinatzen diren; probabilitate-kalkuluan, berriz, gertaera baten zergati txiki asko nola konbinatzen diren.

Probabilitatearen oinarrizko legeak bi dira. Izan bitez A eta B bi gertaera:

  • Batuketaren legea: bi gertaeretako bat gertatzeko probabilitatea bi gertaeren probabilitateen batura da (P (A edo B) P (A B) = P (A) + P (B)), baldin eta bi gertaerak ezin badira batera gertatu. Adibidez, dado bat jaurtitzean emaitza bost (A) edo sei (B) izateko probabilitatea —bakoitzarena 1/6 izanda—, 1/6 + 1/6 = 1/3 da.

  • Biderketaren legea: bi gertaera batera gertatzeko probabilitatea bi gertaeren probabilitateen biderkadura da (P (A eta B) P (A B)= P (A)· P (B)), baldin eta bi gertaerak elkarrekiko independenteak badira, hau da, bat gertatzeak ez badu ondorio gisa ekartzen bestea gertatzea edo ez gertatzea. Adibidez, bi dado jaurtitzean (bi emaitzak elkarrekiko independenteak dira) bi bost —bost, dado batean (A) eta bost, bestean (B)— lortzeko probabilitatea 1/6·1/6 = 1/36 da.

XVIII. mendean argitaratu ziren probabilitate-kalkuluaren beste lege garrantzitsu batzuk, besteak beste, zenbaki handien legearen froga matematikoa, gaur egun limitearen teorema nagusi gisa ezaguna den froga (kurba normala ren izatea justifikatzen duen legea), bai eta zergatien probabilitateak kalkulatzeko formula ere.

Zenbaki handien legeak dio, lehen esan bezala eta teknizismo gehiegirik gabe, probabilitate jakin bat duen gertaera bat gertatzeko maiztasun erlatiboa probabilitate horretarantz doala edo horretara hurbiltzen dela, saio-kopurua handitzen den heinean. Edo, beste modu batera esanda, maiztasun erlatiboaren eta jomuga den probabilitatearen arteko aldea nahi bezain txikia izan daitekeela saio-kopuru aski handia eginez gero. Teknizismoaren beharra dago: joera horren adierazpena ez da kalkulu diferentzialean ezaguna den limitearena bezalakoa. Zehazkiago esanda, beraz, aurrekoari hau gehitu behar zaio: maiztasuna erlatiboaren eta jomuga den probabilitatearen arteko aldea edozein kantitate baino txikiagoa izateko probabilitatea ziurtasunerantz (1 probabilitaterantz) doa, saio-kopurua handitzen den neurrian.

Limitearen teorema nagusia areago doa oraindik: osotasunez, modu sintetiko batez ematen ditu probabilitate horiek. Teoremak dio hurbiltze horren probabilitateen banaketa normala dela; hau da, teoremak adierazten du maiztasun erlatiboaren eta jomuga den probabilitate horren arteko aldearen probabilitateen banaketak kanpaiaren itxura hartzen duela. Gaur egun, teorema hori XVIII. mendean eman zen bertsioa baino askoz ere zabalagoa da. Orduan, oraingo hizkeran esanda, teoremak zioen banaketa binomiala (gertaera jakin bat izan ala ez izatearen maiztasunaren probabilitate-banaketa, zorizko saioak behin eta berriz egiten direnean) banaketa normalaren bitartez adieraz daitekeela; gaur egun, banaketa normalaren nagusitasuna baldintza jakin batzuk betetzen dituen edozein probabilitate-banaketaren baturetan jartzen da agerian.

grafikoak2

Limitearen teorema nagusia

Horrekin lotuta, aipatu behar da banaketa normalaren nagusitasuna ere XVIII. mendeko akatsen teoriari zor zaiola. Behaketen zehaztasunik eza zergati txiki askoren batura gisa uler daiteke, akats positibo eta negatiboak probabilitate berdinekoak izanda eta aipatutako banaketa binomialaren ikuspuntutik abiatuta.

Mende horretan, estatistikak probabilitatearen laguntza jaso zuen bere indarra eta erabilgarritasuna areagotzeko, batez ere inferentzia estatistikoa egiteko eta unibertsoaren zati edo lagin batean behatutakoa —lagina zoriz aukeratu denean— unibertso osora zabaltzeko.

Zergatien probabilitateen formula zenbaki handien legea atzekoz aurrera jartzeko asmoz burutu zen, hau da, saio-segida baten ondorioz gertatutako maiztasun erlatiboaren bitartez gertaeraren probabilitatea kalkulatzeko. Esate baterako, gertaera baten probabilitatea 0,80 bada eta zorizko 10 saio egiten badira, probabilitatearen oinarrizko legeak erabiliz (batuketa eta biderketarena) kalkula daiteke 7 alditan gertatzeko probabilitatea 0,2013 dela. Baina gertaera horren probabilitatea 0,75 edo 0,50 edo 0,90 edo beste edozein izango balitz ere, 7 alditan gertatzeko probabilitatea kalkulatzerik ere badago. Arazoa kasu honetan dago: zorizko saioak eginez gero 7 alditan gertatzen denean eta gertaeraren probabilitatea zein den ezaguna ez denean (lehen aipatutako txanponaren adibidearen parekoa da). Formula horrek zergati bakoitzari, gertaeraren balizko probabilitate bakoitzari, probabilitate bat egokitzen dio. Badu, ordea, eztabaidarako puntu bat ere: probabilitate horiek kalkulatzeko aldez aurretik (a priori) ezagutu behar da zein den gertaeraren balizko probabilitate bakoitzaren probabilitatea. Horiek ezagunak izanda, zorizko saioen ondoren, formularen bitartez kalkula daiteke zein den balizko probabilitate bakoitzaren probabilitate berria (a posteriori). Garai haietan, a priori probabilitateari zuzena esaten zioten, eta a posteriori probabilitateari, alderantzizkoa.

grafikoak3

Zergatien probabilitate-legea

Halako a priori probabilitateak erabiltzearen aldekoei bayestarrak esaten zaie, nonbait XVIII. mendeko Bayes izeneko matematikaria izan zelako formula hori idatzi zuen lehenengoa (horregatik esaten zaio Bayesen formula). A priori probabilitate horiek, noski, subjektiboak behar dute izan. Beste matematikari asko, probabilitate objektiboen aldekoek (maiztasunzaleek) ez dute bidezkoa ikusten halako probabilitate subjektiboak ezartzea problema batean. Beraz, geroztik, probabilitate-teoria hausnartu edo probabilitate-kalkulua erabiltzen dutenen artean badaude bi talde, bayestarrak direnak eta ez direnak, eta haien arteko eztabaida amaigabeak bi mailetan egiten dira, teorian eta praktikan.

Probabilitate matematikoa

XIX. mendean, aurreko legeak garatu eta hedatu egin ziren, eta zenbait paradoxa sortu zen probabilitateak espazio infinitu eta jarraituetan (geometrikoetan) kalkulatu behar zirenean. Teoria matematiko biribil baten beharra ikusi zen hori guztia lotzeko, hau da, probabilitatearen kontzeptuak formalki adierazteko beharra, esanahirik gabekoak, garai hartako matematika eta logikako eragiketa hutsetan oinarrituta eta horien orduko eskakizunetara moldatuta.

XX. mendearen lehen herenean heldu zen probabilitate-teoria matematiketan txertatzeko garaia. Gertaerak multzotzat hartu ziren, eta multzo-teoriaren arabera konbinatu. Horien gaineko probabilitate-eragiketak axioma gutxi batzuen bitartez adierazi ziren, eta, ondorioz, deduzitu egin ziren gainontzeko (eta ordurako ezagunak ziren) teorema edo probabilitatearen legeak. Probabilitate-teoriaren garapena axioma edo oinarri horietan datza.

Probabilitate-teoriaren axiomatizazio ezagunena multzo-teorian eta neurri-teorian datza. Zorizko saio batean gerta daitezkeen gertakizun bakunenak biltzen dituen unibertso edo multzo nagusi bat definituz gero (Ω)—laginen espazio deritzo—, gertaerak horren azpimultzo dira, eta haien artean egitura aljebraiko finko bat osatzen dute, σ-aljebra deritzona (horixe izan zen paradoxak ekiditeko bidea). Probabilitate bat hiru axioma finko betetzen duen aplikazio bat da, azpimultzoen multzoa eta [0,1] balio-tartearen artekoa. Aplikazio hori azpimultzoen neurri bat da.

Aipatu behar da, bide batez, neurriaren teoria estuki lotuta dagoela integrazioaren teoriarekin. Zentzu horretan, probabilitatea neurri berezi bat da, luzera, azalera eta bolumena diren bezalaxe.

Probabilitate-teoria hirukote batean oinarritzen da (Ω, G, P), probabilitate-espazioa deritzon hirukotean, hain zuzen ere: Ω lagin-espazioa; G, gertaeren espazioa —σ-aljebra baten egitura du eta, Ω finitua izatekotan, Ω-ren parteen multzoa da, hau da, Boolen aljebraren egitura du—; eta P, probabilitatea. Aipatutako hiru axioma horiek betetzen dituen aplikazio bat da hau:

  • F-ko edozein A gertaerarentzat, P (A) 0, hau da, A probabilitatea 0 edo 0 baino handiagoa da (ez-negatibotasunaren adierazpena).

  • P (Ω) = 1 (ziurtasunaren adierazpena; goi-muga, alegia).

  • Binaka bateraezin diren edozein A1 , A2 ... gertaeren segida zenbakarri batek betetzen du berdintza hau: P(ai) = Σi P(Ai).

Hiru axioma horien ondorioz, probabilitatearen propietateak deduzitzen dira teorema gisa; besteak beste, oinarrizkoak diren hauek: a) A gertaera bat ez gertatzeko probabilitatea 1-P (A) da, eta b) batuketaren legea.

Biderketaren legea ezartzeko, baldintzapeko probabilitatearen definizioa behar da: A-ren probabilitatea, B-k baldintzatua edo B gertatu dela emanda P(A/B) = P(AB)/P(B). Honen bitartez, independentzia zer den adierazten da: P(A/B) = P(A) edo P(AB) = P(A) · P(B).

Independentziaren definizioaren laguntzaz zenbaki handien legea frogatzerik badago, baita limitearen teorema nagusia ere. Bayesen formularen bertsiorik bakunena baldintzapeko probabilitatearen definizioaren ondorio zuzena besterik ez da, eta aipatutako zergatien probabilitatearen formula orokorra Bayesen formula bakun horretan independentziaren definizioa txertatuz deduzitzen da.