|
|
|||||||||||
|
|
Glossari d'estadística
|
||||||||||
Autoria : Toni González Hidalgo. Estudiant de 2on Batxillerat IES Icària
|
|||||||||||
|
|
|||||||||||
|
Població: conjunt d'elements dels quals volem estudiar alguna característica determinada. Mostra: subconjunt de la població del qual extraurem les dades per a la realització de l'estudi estadístic. Caràcter estadístic: propietat que volem estudiar dels elements de la població i que permet classificar-los en diferents modalitats. S'anomena freqüència absoluta d'un valor Xi el nombre de vegades que es repeteix aquest. S'anomena freqüència relativa d'un valor Xi el quocient entre la freqüència absoluta fi i el nombre total de dades N. S'anomena freqüència absoluta acumulada (Fi) d'un valor Xi el nombre de repeticions de valors que són més petits o iguals que ell. S'anomena freqüència relativa acumulada (Hi) d'un valor xi el quocient entre la freqüència absoluta acumulada i el nombre total de dades. S'anomena mitjana aritmètica d'una distribució estadística el quocient entre la suma de tots els valors de Xi observats i el nombre total d'observacions, N. Es representa per x. S'anomena mediana d'un distribució estadística el valor de la variable tal que la freqüència absoluta dels valors més petits que ell és igual a la freqüència absoluta dels valors més grans que ell. Es representa per M. La moda (Mo) d'una distribució estadística és el valor (o valors) de freqüència més alta. S'anomena rang d'una distribució estadística la diferència entre el valor màxim i el valor mínim d'aquesta.
La desviació mitjana d'una distribució és la mitjana
aritmètica de les desviacions preses en valor absolut. La representem per Dx.
La variància d'una distribució és la mitjana
aritmètica dels quadrats de les desviacions de cada valor. La representem
per S2x.
La desviació tipus, també dita desviació estàndard,
és l'arrel quadrada positiva de la variància. Es representa per Sx.
El coeficient de variació és el quocient entre la desviació tipus i
la mitjana aritmètica.
DISTRIBUCIONS BIDIMENSIONALS
S'anomena covariància d'una variable bidimensional
(X, Y) la mitjana aritmètica dels productes de les desviacions de cada una
de les variables respecte de les seves mitjanes respectives. Es representa
per Sxy.
El coeficient de correlació lineal de Pearson es defineix per mitjà
de l'expressió següent:
Les
variacions ordinàries o les variacions sense repetició de m elements
agafats n a n (n
La quantitat de variacions ordinàries de m elements agafats n a n es representa per Vm,n o Vnm. Les variacions amb repetició de m elements agafats n a n són diferents grups que es poden formar amb els m elements, de manera que:
El nombre de variacions amb repetició de m elements agafats n a n es representa per VRm, n o VRnm. Les permutacions ordinàries de n elements són els diferents grups que es poden formar, de manera que:
El nombre de permutacions ordinàries de n elements es representa per Pn. Tenim que n és un nombre natural més gran que 1. Anomenem factorial de n el producte dels n primers nombres naturals. Les permutacions amb repetició de n elements, on el primer element es repeteix a vegades, el segon b vegades, ..., el darrer K vegades (a + b + ... + k = n), són els diferents grups que es poden formar, de manera que:
El nombre de permutacions amb repetició de n elements, on el primer element es repeteix a vegades; el segon, b vegades, ..., el darrer k vegades, es representa per Pna,b, ...,k. Les combinacions ordinàries o sense
repetició de m elements agafats n a n (n
El nombre de combinacions de m elements agafats n a n es representa per Cm, n O Cnm. El conjunt format per tots els resultats possibles d'un experiment aleatori s'anomena espai mostral. Cada un dels subconjunts de l'espai mostral E s'anomena esdeveniment d'un experiment aleatori. Donat un esdeveniment qualsevol A de l'espai d'esdeveniment S, s'anomena esdeveniment contrari de A un esdeveniment que només es produeix quan no es produeix A, i viceversa. Donat dos esdeveniments A i B d'un mateix experiment aleatori, anomenem esdeveniment unió de A i B l'esdeveniment que es produeix quan es compleix A o B. Donats dos esdeveniments A i B d'un mateix experiment aleatori, anomenem esdeveniment intersecció de A i B l'esdeveniment que es produeix quan es produeixen simultàniament els esdeveniments A i B. Generalitzant, es diu que els esdeveniments A1, A2..., An constitueixen un sistema complet d'esdeveniments per a un determinat experiment aleatori si es verifiquen aquestes dues condicions:
La probabilitat d'un esdeveniment A és el quocient entre el nombre de casos favorables i el nombre de casos possibles. La probabilitat és una llei que associa a cada esdeveniment A, de l'espai d'esdeveniments, un nombre real que anomenem probabilitat de A i representem per p(A), que compleix els axiomes següents:
Si A i B són dos esdeveniments compatibles d'un mateix experiment aleatori, es verifica que la probabilitat de la unió de A i B és igual a la suma de les probabilitats de cada esdeveniment menys la probabilitat de l'esdeveniment intersecció de A i B. P(A U B) = p(A) + p(B) - p(A Ç B) La probabilitat condicionada de l'esdeveniment B respecte de l'esdeveniment A, que designem per p(B/A), és quocient:
p(B/A) =
Dos esdeveniments A i B són independents si p(B) = p(B/A). Dos esdeveniments A i B són
dependents si p(B)
Així, tres esdeveniments A, B i C són independents si es verifiquen simultàniament les condicions següents:
Si A i B són dos esdeveniments independents, es verifica que la probabilitat de la intersecció de A i B és igual al producte de les probabilitats de cada un dels esdeveniments: p(A Ç B) = p(A) · p(B) Si A i B són dos esdeveniments dependents d'un mateix experiment aleatori, es verifica que la probabilitat de la intersecció de A i B és igual al producte de la probabilitat d'un dels esdeveniments, que es suposa no nul·la, per la probabilitat de l'altre, condicionada al compliment de l'anterior: p(A Ç B) = p(A) · p(B/A) S'anomena variable aleatòria tota llei (o funció) que associa a cada element de l'espai mostral E un nombre real. S'anomena funció de probabilitat d'una variable aleatòria discreta X l'aplicació que associa a cada valor Xi de la variable la seva probabilitat pi. S'anomena mitjana d'una variable aleatòria X, que pren els valors x1, x2, ..., Xn, amb probabilitats p1, p2, ..., pn, respectivament, el valor de l'expressió següent: m = x1 · p1 + x2 · p2 + ... + xn · pn = S xi · pi S'anomena variància d'una variable aleatòria X, que pren els valors x1, x2, ..., Xn, amb probabilitats p1, p2, ..., pn, respectivament, el valor de l'expressió següent: s2 = Sxi2 · pi - m2 = x21 · p1 + x22 · p2 + ... + x2n · pn - m2 Les funcions f(x) associades a una variable aleatòria X que compleixen les condicions:
S'anomena funcions de densitat de la variable aleatòria continua X (x representa valors particulars de la variable aleatòria X). La mitjana i la variància de la variable contínua X vénen donades, respectivament, pel valor de les integrals següents:
Població: és el conjunt de tots els elements que tenen una característica determinada. En general, suposem que la població és molt gran. Mostra: és el subconjunt de la població. Mostreig: és el procés mitjançant el qual es tria una mostra de la població. En el mostreig aleatori simple tots els elements de la població tenen la mateixa probabilitat de ser triats per formar part de la mostra. En el mostreig aleatori estratificat la població es divideix en grups homogenis que anomenem estrats, i posteriorment s'extreu una mostra aleatòria simple de cada estrat. En el mostreig aleatori sistemàtic se selecciona a l'atzar un element de la població i a partir d'aquest element se seleccionen els elements següents de k en k. En el mostreig per conglomerats i àrees es divideix la població en diferents seccions o conglomerats. Es trien a l'atzar unes quantes d'aquestes seccions i es prenen tots els elements de les seccions triades per formar la mostra. La distribució dels valors P s'anomena distribució mostral. Es demostra que:
La distribució dels valors de X s'anomena distribució de les mitjanes mostrals. Es demostra que:
La distribució de valors de T s'anomena distribució de les sumes mostrals o distribució de les sumes en el mostreig. Es demostra que:
La distribució de X1 - X2 s'anomena distribució de la diferència de mitjanes en el mostreig. Es demostra que:
Si X és una variable aleatòria d'una població de mitjana m i desviació típica s, es verifica que:
Paràmetre: és un valor numèric que descriu una característica de la població. Estadístic: és un valor numèric que descriu una característica de la mostra. Estimador puntual: és l'estadístic que s'utilitza per estimar un paràmetre poblacional. Per tant, és una variable aleatòria en el mostreig, que té la seva distribució mostral corresponent. Estimació puntual: és el valor numèric que agafa l'estimador puntual per a una mostra determinada. Estimador no esbiaixat: quan la seva mitjana coincideix amb el valor del paràmetre que es vol estimar. Estimador eficient: quan la seva variància és mínima. Estimador per interval: és un parell d'estadístics que s'utilitzen per estimar un paràmetre poblacional. Per tant, són un parell de variables aleatòries en el mostreig que tenen la distribució mostral corresponent. Estimació per interval: són els valors numèrics que pren l'estimador per interval per a una mostra determinada; és a dir, són els extrems de l'interval de confiança. Coeficient de confiança: és la probabilitat que un estimador per interval cobreixi el veritable valor del paràmetre que es pretén estimar. S'acostuma a representar per 1 - a. Nivell de significació o de risc: És la diferència entre la certesa i el nivell de confiança desitjat; és a dir, 1 - (1 - a) = a. Valor crític: és el valor de l'abscissa que deixa a la seva dreta una àrea igual a a / 2; el coeficient de confiança és 1 - a. Es representa per Za/2 Marge d'error: és la diferència entre l'extrem superior i l'extrem inferior de l'interval de confiança. Contrast d'hipòtesis: Procediment estadístic mitjançant el qual s'investiga la veritat o la falsedat d'una hipòtesi sobre una població o unes poblacions. Hipòtesis nul·la H0: És una hipòtesis que es formula i que es vol comprovar; és, per tant, la hipòtesis que s'accepta o es rebutja com a conseqüència del contrast. Hipòtesis alternativa Ha: Qualsevol altra hipòtesis que sigui diferent de la formulada i que ens situï enfront de H0, de manera que si es rebutja H0 s'accepta Ha i si s'accepta H0 es rebutja Ha. Estadístic del contrast: És una funció dels valors mostrals. És una variable aleatòria que segueix una distribució en el mostreig. Agafa un valor per a cada mostra. Regió d'acceptació: És la regió formada per un conjunt de punts determinat de manera que els valors de l'estadístic del contrast ens porten a acceptar la hipòtesis nul·la. Regió crítica o de rebuig: És la regió formada per un conjunt de punts determinat de manera que els valors de l'estadístic del contrast ens porten a rebutjar la hipòtesis nul·la. Contrast bilateral: Quan la regió crítica està formada per dos conjunts de punts disjunts. Contrast unilateral: Quan la regió crítica està formada per un sol conjunt de punts. Error de tipus I: És el que cometem quan rebutgem la hipòtesis nul·la quan és vertadera. Error de tipus II: És el que cometem quan acceptem la hipòtesis nul·la quan es falsa. Nivell de significació: És la probabilitat de cometre l'error de tipus I. Es representa per a. Nivell d'un contrast: És la probabilitat de rebutjar la hipòtesi nul·la quan és falsa. Basat en
el llibre Estadística Ed. Cruïlla |
|||||||||||