Contrastes sobre Independencia para dos criterios de clasificación. TABLAS DE CONTINGENCIA. Formulación.
Volver a página previa Ir a página siguiente Volver al índice de contenidos

 

Contrastes sobre independencia de dos variables  categóricas. Para introducir este tipo de contraste, supongamos que en una población Ω se consideran dos criterios de clasificación A y B,  integrados por los niveles o clases A1, A2, ..., Ar ; y B1, B2, ..., Bs , respectivamente.  Una  muestra aleatoria de n individuos define la variable multinomial

donde Xij= nº de individuos de la muestra clasificados en  la clase Ai de A  y en la Bj de B; y  configura la siguiente tabla de contingencia con r filas y s columnas 

 

B1

B2

......

Bs

Totales

A1

x11

x12

......

x1s

n1+

A2

x21

x22

......

x2s

n2+

.....

...

...

......

...

 

Ar

xr1

xr2

......

xrs

nr+

Totales

n+1

n+2

 

n+s

n

ni+= total de la i-ésima fila = nº individuos en la muestra de la clase Ai de  A 

n+j= total de la j-ésima columna = nº individuos en la muestra de la clase Bj de B

Afirmar que los dos criterios de clasificación son independientes significaría que cualquier  nivel (suceso) Ai del criterio A es independiente de cualquier nivel (suceso) Bj del criterio B, es decir, 

Una manera más intuitiva e equivalente de interpretar la independencia entre los criterios A y B sería la siguiente:

es, decir, la proporción de individuos de la clase Bj es la misma en cualquiera de la r subpoblaciones que se obtendrían al separar los individuos de las clases  A1, A2, .., y Ar ;respectivamente, cualquiera que sea j. Obviamente, esta proporción coincide con la de Bj en la totalidad de la población. 

La formulación del contraste de independencia o test de asociación entre dos variables categóricas sería:

Bajo la veracidad de H0 , el estadístico

sigue de manera aproximada, si los tamaños muestrales son grandes, la ley de probabilidad de una variable χ2 con (r-1)(s-1) grados de libertad, donde

 

son estimaciones de las probabilidades pi+ y p+j.

La aproximación considerada es aceptable siempre que las estimaciones de todos valores esperados (Eij=npi+p+j) sean como mínimo 5; aunque una regla menos conservadora permite que la aproximación pueda emplearse si como máximo el 20% de estos valores esperados son menores que 5 y ninguno es cero.


 
Volver a página previa Ir a página siguiente Volver al índice de contenidos
    
Dpto. de Matemática Aplicada (Biomatemática). Facultad de Biología. UCM.