Què oferim?
Tutories virtuals
Publicació dels treballs
Tutories
Suggeriments dels
tutors virtuals
Recursos útils...
Propostes de treballs interessants de recerca
Treballs d'exemple
Plantilles per presentacions
Criteris per citar fonts bibliogràfiques
Qué fer amb les dades?
Com és fa una enquesta?
Com és fa una entrevista?
Com es dissenya un experiment?
Com es tracten les
variables estadístiques?
Com fer gràfics i taules en Excel?
Com publicar
els treballs en web?
Conceptes bàsics de HTML
Enllaços d'interés
Què és i cóm es fa un treball de recerca?
Els millors treballs de recerca fets a Catalunya (CIRIT)
Premis
 
  Treballs de recerc@
 

Cóm es dissenya un experiment?

(Pàgina en desenvolupament)

 
 
 
 

Introducció

La investigació científica és un procés d'aprenentatge dirigit. Aquest es basa en la iteració: una hipòtesi condueix, mitjançant un procés de deducció, a unes conseqüències que es poden valorar amb dades, p.e combinar dos productes en un laboratori a una certa temperatura donaran més d'un tercer producte que si es fa a una altra temperatura. Si les dades resultants de l'experiment no coincideixen amb el que s'ha deduït caldrà fer un procés d'inducció que portarà a modificar la hipòtesis i iniciar una nova iteració

Dificultats amb les que es troba un investigador

  • Error experimental: el produeixen factors coneguts, com per exemple la manca de precisió de les eines de mesura, i altres factors desconeguts
  • confusió entre correlació i causalitat: Es considera que dues variables estan molt lligades (correlacionades) i en veritat el que passa es que les dues depenen d'una tercera
  • Complexitat dels efectes: Si en un experiment es modifiquen més de dues variables els resultats poden ser imprevisibles ja que els efectes poden no ser additius linealment.

Notes prèvies

Els mètodes que es presenten requereixen d'uns coneixements estadístics previs que aquí no és possible desenvoluparem. Tan sols introduirem les mesures descriptives de la població i les mostres, la distribució Normal, la t student i el Teorema Central del Límit.

Mesures descriptives de la població i les mostres

Per descriure una població o una mostra utilitzem la mitjana, la variança i la desviació estàndard

Mesura de la centralitat

η = Σy/N mitjana poblacional també anomenada Esperança matemàtica = E(y) . y = valor variable observada de la població (per exemple pes o alçada) i N = nombre individus de la població.

Ў = Σy/n mitjana mostral. y = valor variable observada de la mostra (per exemple pes o alçada) i n = nombre individus de la mostra.

Mesura de la dispersió

V(y) = б2 = Σ ( y - η )2 / n variança poblacional = E(y - η )2

s2 = Σ ( y - Ў )2 / (n-1) variança mostral

Explicació de perquè dividim per n-1 i els graus de llibertat.

Per a n observacions Σ ( y - Ў ) = 0 per tant coneguts n-1 ( y - Ў ) l'n serà el que ens faci que la suma dels anteriors sigui 0 i ja ve determinat. Es diu que tenim n-1 graus de llibertat.

La Normal N i la t d'student t

Les observacions repetides que es diferencien per error d'experimentació varien al voltant d'un valor central seguint una distribució simètrica en les que les petites desviacions son molt més freqüents que les grans. La distribució Normal serveix per representar situacions d'aquest tipus i es representa com N(η,б)

z = ( y - η ) / б la distribució de z és N(0,1) mitjana 0 i variança 1 i ho podem representar de la següent manera Pr(y > η + б) = Pr ( (y - η) > б ) = Pr ( (y - η) / б> 1 )

Quan es desconeix б i s'utilitza la variança mostral s, les desviacions respecte al valor central segueixen una t-student

Utilització de les taules

Per saber quina probabilitat tenim de que y sigui superior a un determina y0 es calcula la desviació normal z0 = (y0 - η) / б i obtindrem Pr(z > z0) de la taula de la N (nosaltres utilitzarem una funció d'excel). En el cas de la t-student el procés és similar però les taules donen diferents valors segons els graus de llibertat (n -1) , quan n>30 podem considerar que la forma de la distribució t és igual a la N.

Exemple d'utilització de la normal

Funció EXCEL     =1-DISTR.NORM.ESTAND(z0)

η = 4,0     y0 = 4,4    б = 0,3 aleshores z0 = (y0 - η) / б = (4,4 - 4,0 ) / 0,3 = 1,33

Pr( z > 1,33) = 0,0918 -> que hi ha un 9% de probabilitat de que trobem casos amb valors superiors a 4,4

Exemple d'utilització de la t

Funció EXCEL     =DISTR.T(t0;n-1;1)

η = 4,0     y0 = 4,4    б = 0,3 aleshores t0 = (y0 - η) / s = (4,4 - 4,0 ) / 0,3 = 1,33

Pr( t> 1,33) = 0,12 -> que hi ha un 9% de probabilitat de que trobem casos amb valors superiors a 4,4

El Teorema Central del Límit

Aquest teorema diu que sota certes circumstàncies, que es donen normalment en el món de l'experimentació, la distribució d'aquesta funció lineal dels errors tendirà a una distribució normal sempre que hi hagi un nombre prou gran d'observacions.

 
   
 
 
 

Comparació de dos tractaments.

Disseny no aparellat

Suposem que no tenim cap tipus de dades poblacionals. Tan sols tenim els resultats basats en un model de mostreig aleatori simple, disposem de nA mostres obtingudes amb el mètode A i nB mostres obtingudes amb el mètode B. Les mostres A i B son independents entre si.

Aquestes mostres suposem que son representatives d'una població NA i NB. La pregunta que ens fem és si la població A és significativament diferent de la població B, que podem escriure com:

H0: ηA - ηB = 0    H0 hipòtesis nul·la i ηA és la mitjana poblacional
H1: ηA - ηB <> 0  H1 hipòtesis alternativa i ηB és la mitjana poblacional

Els passos que anem a descriure serviran per demostrar si es pot considerar que les mostres provenen de poblacions diferents o no.

Les variances mostrals son:

         

Ambdues es poden combinar en

que donen una estimació de la desviació de la població amb nA + nB - 2 graus de llibertat

Sota la hipòtesis de mostreig aleatori obtenim

sota la hipòtesis nul·la    ηA - ηB = 0

Sota la hipòtesis de mostreig aleatori de poblacions normals de variances iguals un cop calculat el valor aquest segueix una t amb nA + nB - 2 graus de llibertat.

Exemple

Suposem que criem conills aplicant dos mètodes diferents A i B. Obtenim aleatoriament 10 mostres del pes dels conills al nàixer. Ens agradaria saber si els resultats son significativament diferents o no

Metode A
Metode B
110
75
80
85
85
75
110
60
95
75
70
90
90
70
90
75
100
70
70
70

 
 
Mètode A
Mètode B
Mitjana mostral   Ў
90
74,5
Variança s2
137,36
desviació standard
11,72
t0
((90-74,5)-0)/(11,72*ARREL(1/nA + 1/nB)) = 2,96
Pr(t > 2,96)
0,0043 que representa un 0,43%

Amb menys d'un 0,5% de probabilitat les dues mostres provenen de la mateixa població (es a dir, que la diferència de mitjanes poblacionals sigui nul·la és extremadament estrany). Per tant és significatiu el mètode que utilitzem per criar els conills. Tenint en compte que el mètode A ens dona un pes promig més alt considerarem que és millor.