INTRODUCCION AL SPSS
Volver a página previa Ir a página siguiente Volver al índice de contenidos del SPSS

 

Reemplazamiento de valores perdidos

Aunque está en el deseo de todos tener matrices de datos impecables, en las que no existan valores perdidos, de todos es sabida la dificultad que conlleva la realización de un estudio y la facilidad con la que se pierden datos: muestras que desaparecen, pacientes que abandonan, etc. Sabidos también los problemas que generan este tipo de ausencias en el análisis de los datos (Anovas desbalanceados, medidas repetidas sin todos los datos, etc), a un paso está la tentación de reemplazar los valores perdidos por algún dato obtenido bajo criterios más o menos objetivos.

Es obligado reflexionar acerca del riesgo que conlleva la sustitución de estos datos perdidos. Primero, no es seguro que los datos faltantes sean por puro azar. Por ejemplo, puede ser que los pacientes que abandonen un estudio sean aquellos que han evolucionado mejor (o peor). Por otro lado, la sustitución de datos perdidos, por ejemplo, por la media del grupo afecta a la aleatoriedad de la muestra, condición ésta indispensable para la realización de pruebas estadísticas, afectando además a la dispersión (varianza) que tendrá ese grupo. Este último hecho puede provocar la aparición de una diferencia estadísticamente significativa que es fruto exclusivo de esta homogeneización de la muestra. 

El SPSS propone varios métodos de sustitución en el cuadro de diálogo correspondiente.

 

 

Volver a página previa Ir a página siguiente Volver al índice de contenidos del SPSS
    
Dpto. de Matemática Aplicada (Biomatemática). Facultad de Biología. UCM.