Glossari d'estadística

 

 

Autoria : Toni González Hidalgo. Estudiant de 2on Batxillerat IES Icària

 


DISTRIBUCIONS UNIDIMENSIONAL

Població: conjunt d'elements dels quals volem estudiar alguna característica determinada.

Mostra: subconjunt de la població del qual extraurem les dades per a la realització de l'estudi estadístic.

Caràcter estadístic: propietat que volem estudiar dels elements de la població i que permet classificar-los en diferents modalitats.

S'anomena freqüència absoluta d'un valor Xi el nombre de vegades que es repeteix aquest.

S'anomena freqüència relativa d'un valor Xi el quocient entre la freqüència absoluta fi i el nombre total de dades N.

S'anomena freqüència absoluta acumulada (Fi) d'un valor Xi el nombre de repeticions de valors que són més petits o iguals que ell.

S'anomena freqüència relativa acumulada (Hi) d'un valor xi el quocient entre la freqüència absoluta acumulada i el nombre total de dades.

S'anomena mitjana aritmètica d'una distribució estadística el quocient entre la suma de tots els valors de Xi observats i el nombre total d'observacions, N. Es representa per x.

S'anomena mediana d'un distribució estadística el valor de la variable tal que la freqüència absoluta dels valors més petits que ell és igual a la freqüència absoluta dels valors més grans que ell. Es representa per M.

La moda (Mo) d'una distribució estadística és el valor (o valors) de freqüència més alta.

S'anomena rang d'una distribució estadística la diferència entre el valor màxim i el valor mínim d'aquesta.

La desviació mitjana d'una distribució és la mitjana aritmètica de les desviacions preses en valor absolut. La representem per Dx.

La variància d'una distribució és la mitjana aritmètica dels quadrats de les desviacions de cada valor. La representem per S2x.

La desviació tipus, també dita desviació estàndard, és l'arrel quadrada positiva de la variància. Es representa per Sx.

El coeficient de variació és el quocient entre la desviació tipus i la mitjana aritmètica.

DISTRIBUCIONS BIDIMENSIONALS

S'anomena covariància d'una variable bidimensional (X, Y) la mitjana aritmètica dels productes de les desviacions de cada una de les variables respecte de les seves mitjanes respectives. Es representa per Sxy.

El coeficient de correlació lineal de Pearson es defineix per mitjà de l'expressió següent:

COMBINATÒRIA

Les variacions ordinàries o les variacions sense repetició de m elements agafats n a n (n m) són els diferents grups que es poden formar amb els m elements, de manera que:>

  • A cada grup entrin n elements diferents.
  • Dos grups són diferents si es diferencies en algun element o en l'ordre de col·locació dels elements.

La quantitat de variacions ordinàries de m elements agafats n a n es representa per Vm,n o Vnm.

Les variacions amb repetició de m elements agafats n a n són diferents grups que es poden formar amb els m elements, de manera que:

  • A cada grup entrin n elements, repetits o no.
  • Dos grups són diferents si es diferencien en algun element o en l'ordre de col·locació dels elements.

El nombre de variacions amb repetició de m elements agafats n a n es representa per VRm, n o VRnm.

Les permutacions ordinàries de n elements són els diferents grups que es poden formar, de manera que:

  • A cada grup hi ha els n elements.
  • Un grup es diferencia d'un altre únicament en l'ordre de col·locació dels elements.

El nombre de permutacions ordinàries de n elements es representa per Pn.

Tenim que n és un nombre natural més gran que 1. Anomenem factorial de n el producte dels n primers nombres naturals.

Les permutacions amb repetició de n elements, on el primer element es repeteix a vegades, el segon b vegades, ..., el darrer K vegades (a + b + ... + k = n), són els diferents grups que es poden formar, de manera que:

  • A cada grup de n elements, el primer element hi és a vegades; el segon element, b vegades; ...

  • Un grup es diferencia d'un altre únicament per l'ordre de col·locació dels seus elements.

El nombre de permutacions amb repetició de n elements, on el primer element es repeteix a vegades; el segon, b vegades, ..., el darrer k vegades, es representa per Pna,b, ...,k.

Les combinacions ordinàries o sense repetició de m elements agafats n a n (n m) són els diferents grups que es poden formar amb els m elements, de manera que:

  • A cada grup entrin n elements diferents.

  • Dos grups són diferents si tenen algun element diferent, però no per l'ordre de col·locació dels elements.

El nombre de combinacions de m elements agafats n a n es representa per Cm, n O Cnm.

CÀLCUL DE PROBABILITATS

El conjunt format per tots els resultats possibles d'un experiment aleatori s'anomena espai mostral.

Cada un dels subconjunts de l'espai mostral E s'anomena esdeveniment d'un experiment aleatori.

Donat un esdeveniment qualsevol A de l'espai d'esdeveniment S, s'anomena esdeveniment contrari de A un esdeveniment que només es produeix quan no es produeix A, i viceversa.

Donat dos esdeveniments A i B d'un mateix experiment aleatori, anomenem esdeveniment unió de A i B l'esdeveniment que es produeix quan es compleix A o B.

Donats dos esdeveniments A i B d'un mateix experiment aleatori, anomenem esdeveniment intersecció de A i B l'esdeveniment que es produeix quan es produeixen simultàniament els esdeveniments A i B.

Generalitzant, es diu que els esdeveniments A1, A2..., An constitueixen un sistema complet d'esdeveniments per a un determinat experiment aleatori si es verifiquen aquestes dues condicions:

  • 1ª A1 U A2 U A3 U ... U An = E.

  • 2ª A1, A2, A3, ..., An són incompatibles dos a dos.

La probabilitat d'un esdeveniment A és el quocient entre el nombre de casos favorables i el nombre de casos possibles.

La probabilitat és una llei que associa a cada esdeveniment A, de l'espai d'esdeveniments, un nombre real que anomenem probabilitat de A i representem per p(A), que compleix els axiomes següents:

  • La probabilitat d'un esdeveniment qualsevol és positiva o nul·la:
     0 p(A)

  • La probabilitat de l'esdeveniment cert és igual a la unitat: p(E) = 1

  • La probabilitat de la unió de dos esdeveniments incompatibles és igual a la suma de les probabilitats de cada un dels esdeveniments:
    Si A i B són incompatibles, llavors p(A U B) = p(A) + p(B)

Si A i B són dos esdeveniments compatibles d'un mateix experiment aleatori, es verifica que la probabilitat de la unió de A i B és igual a la suma de les probabilitats de cada esdeveniment menys la probabilitat de l'esdeveniment intersecció de A i B.

P(A U B) = p(A) + p(B) - p(A Ç B)

PROBABILITAT CONDICIONADA

La probabilitat condicionada de l'esdeveniment B respecte de l'esdeveniment A, que designem per p(B/A), és quocient:

p(B/A) = si p(A) 0

Dos esdeveniments A i B són independents si p(B) = p(B/A).

Dos esdeveniments A i B són dependents si p(B) p(B/A).

Així, tres esdeveniments A, B i C són independents si es verifiquen simultàniament les condicions següents:

  1. p(A Ç B) = p(A) · p(B)

  2. p(A Ç C) = p(A) · p(C)

  3. p(B Ç C) = p(B) · p(C)

  4. p(A Ç B Ç C) = p(A) · p(B) · p(C)

Si A i B són dos esdeveniments independents, es verifica que la probabilitat de la intersecció de A i B és igual al producte de les probabilitats de cada un dels esdeveniments:

p(A Ç B) = p(A) · p(B)

Si A i B són dos esdeveniments dependents d'un mateix experiment aleatori, es verifica que la probabilitat de la intersecció de A i B és igual al producte de la probabilitat d'un dels esdeveniments, que es  suposa no nul·la, per la probabilitat de l'altre, condicionada al compliment de l'anterior:

p(A Ç B) = p(A) · p(B/A)

DISTRIBUCIÓ BINOMINAL

S'anomena variable aleatòria tota llei (o funció) que associa a cada element de l'espai mostral E un nombre real.

S'anomena funció de probabilitat d'una variable aleatòria discreta X l'aplicació que associa a cada valor Xi de la variable la seva probabilitat pi.

S'anomena mitjana d'una variable aleatòria X, que pren els valors x1, x2, ..., Xn, amb probabilitats p1, p2, ..., pn, respectivament, el valor de l'expressió següent:

m = x1 · p1 + x2 · p2 + ... + xn · pn = S  xi · pi

S'anomena variància d'una variable aleatòria X, que pren els valors x1, x2, ..., Xn, amb probabilitats p1, p2, ..., pn, respectivament, el valor de l'expressió següent:

s2 = Sxi2 · pi - m2 = x21 · p1 + x22 · p2 + ... + x2n · pn - m2

DISTRIBUCIÓ NORMAL

Les funcions f(x) associades a una variable aleatòria X que compleixen les condicions:

  • 0 F(x) a tot el domini de la funció

  • L'àrea tancada sota la corba de f(x) és la unitat.

S'anomena funcions de densitat de la variable aleatòria continua X (x representa valors particulars de la variable aleatòria X).

La mitjana i la variància de la variable contínua X vénen donades, respectivament, pel valor de les integrals següents:

TEORIA DE MOSTRES

Població: és el conjunt de tots els elements que tenen una característica determinada. En general, suposem que la població és molt gran.

Mostra: és el subconjunt de la població.

Mostreig: és el procés mitjançant el qual es tria una mostra de la població.

En el mostreig aleatori simple tots els elements de la població tenen la mateixa probabilitat de ser triats per formar part de la mostra.

En el mostreig aleatori estratificat la població es divideix en grups homogenis que anomenem estrats, i posteriorment s'extreu una mostra aleatòria simple de cada estrat.

En el mostreig aleatori sistemàtic se selecciona a l'atzar un element de la població i a partir d'aquest element se seleccionen els elements següents de k en k.

En el mostreig per conglomerats i àrees es divideix la població en diferents seccions o conglomerats. Es trien a l'atzar unes quantes d'aquestes seccions i es prenen tots els elements de les seccions triades per formar la mostra.

La distribució dels valors P s'anomena distribució mostral. Es demostra que:

La variable aleatòria P té les característiques següents:

  • Mitjana m = p

  • Desviació típica: s =

     

  • A mesura que n creix, la distribució de P s'aproxima a la normal, sempre que p no s'acosti ni a 0 ni a 1.

La distribució dels valors de X s'anomena distribució de les mitjanes mostrals. Es demostra que:

La variable aleatòria X té les característiques següents:

  • Mitjana m
     

  • Desviació típica:

     

  • A mesura que n creix, la distribució de X s'aproxima a una normal.

La distribució de valors de T s'anomena distribució de les sumes mostrals o distribució de les sumes en el mostreig. Es demostra que:

La variable aleatòria T té les característiques següents:

  • Mitjana: nm

  • Desviació típica:

  • A mesura que n creix, la distribució de T s'aproxima a la normal.

La distribució de X1 - X2 s'anomena distribució de la diferència de mitjanes en el mostreig. Es demostra que:

La variable X1 - X2 té les característiques següents:

  • Mitjana m1 - m2

  • Desviació típica:

     

  • A Mesura que n1 i n2 creixen, la distribució de X1 - X2 s'aproxima a la normal.

Si X és una variable aleatòria d'una població de mitjana m i desviació típica s, es verifica que:

  • La distribució de les mitjanes mostrals de volum n té com a mitjana m i com a desviació típica
     

  • La distribució de les mitjanes mostrals s'aproxima a una normal a mesura que el volum de la mostra n creix.

INTERVALS DE CONFIANÇA

Paràmetre: és un valor numèric que descriu una característica de la població.

Estadístic: és un valor numèric que descriu una característica de la mostra.

Estimador puntual: és l'estadístic que s'utilitza per estimar un paràmetre poblacional. Per tant, és una variable aleatòria en el mostreig, que té la seva distribució mostral corresponent.

Estimació puntual: és el valor numèric que agafa l'estimador puntual per a una mostra determinada.

Estimador no esbiaixat: quan la seva mitjana coincideix amb el valor del paràmetre que es vol estimar.

Estimador eficient: quan la seva variància és mínima.

Estimador per interval: és un parell d'estadístics que s'utilitzen per estimar un paràmetre poblacional. Per tant, són un parell de variables aleatòries en el mostreig que tenen la distribució mostral corresponent.

Estimació per interval: són els valors numèrics que pren l'estimador per interval per a una mostra determinada; és a dir, són els extrems de l'interval de confiança.

Coeficient de confiança: és la probabilitat que un estimador per interval cobreixi el veritable valor del paràmetre que es pretén estimar. S'acostuma a representar per 1 - a.

Nivell de significació o de risc: És la diferència entre la certesa i el nivell de confiança desitjat; és a dir, 1 - (1 - a) = a.

Valor crític: és el valor de l'abscissa que deixa a la seva dreta una àrea igual a a / 2; el coeficient de confiança és 1 - a. Es representa per Za/2

Marge d'error: és la diferència entre l'extrem superior i l'extrem inferior de l'interval de confiança.

CONTRAST D'HIPÒTESIS

Contrast d'hipòtesis: Procediment estadístic mitjançant el qual s'investiga la veritat o la falsedat d'una hipòtesi sobre una població o unes poblacions.

Hipòtesis nul·la H0: És una hipòtesis que es formula i que es vol comprovar; és, per tant, la hipòtesis que s'accepta o es rebutja com a conseqüència del contrast.

Hipòtesis alternativa Ha: Qualsevol altra hipòtesis que sigui diferent de la formulada i que ens situï enfront de H0, de manera que si es rebutja H0 s'accepta Ha i si s'accepta H0 es rebutja Ha.

Estadístic del contrast: És una funció dels valors mostrals. És una variable aleatòria que segueix una distribució en el mostreig. Agafa un valor per a cada mostra.

Regió d'acceptació: És la regió formada per un conjunt de punts determinat de manera que els valors de l'estadístic del contrast ens porten a acceptar la hipòtesis nul·la.

Regió crítica o de rebuig: És la regió formada per un conjunt de punts determinat de manera que els valors de l'estadístic del contrast ens porten a rebutjar la hipòtesis nul·la.

Contrast bilateral: Quan la regió crítica està formada per dos conjunts de punts disjunts.

Contrast unilateral: Quan la regió crítica està formada per un sol conjunt de punts.

Error de tipus I: És el que cometem quan rebutgem la hipòtesis nul·la quan és vertadera.

Error de tipus II: És el que cometem quan acceptem la hipòtesis nul·la quan es falsa.

Nivell de significació: És la probabilitat de cometre l'error de tipus I. Es representa per a.

Nivell d'un contrast: És la probabilitat de rebutjar la hipòtesi nul·la quan és falsa.

Basat en el llibre Estadística Ed. Cruïlla