You are on page 1of 8

Qué son los residuos?

El residuo de una observación dada es igual al valor de la observación, menos


el valor ajustado gráficas de residuos

eij = yij − yˆij


= yij − yi.
Minitab provee tres tipos de residuos:

 Residuo regular: valor observado - valor pronosticado.

 Residuo estandarizado: residuo regular / desv. est. del residuo regular.

La estandarización elimina el efecto del punto de ubicación de los datos con


respecto a los predictores o factores.

 Residuo eliminado studentizado: para el punto de datos iésimo, la


fórmula sigue la misma expresión que el residuo estandarizado. Sin embargo,
el iésimo valor ajustado y la desviación estándar se calculan para el residuo
eliminado studentizado eliminando el caso iésimo en el análisis. En
comparación con el residuo estandarizado, el residuo eliminado studentizado
es más grande en presencia de un punto de datos poco común.

Supuestos del modelo

Los procedimientos de regresión y ANOVA aplican los siguientes supuestos en


relación con los errores:

 Los errores están distribuidos normalmente con una media de cero.

 La varianza de error no cambia para diferentes niveles de un factor o de


acuerdo con los valores de la respuesta pronosticada.

 Cada error es independiente de todos los demás errores. En un


experimento diseñado, la mejor manera de obtener errores independientes es
aleatorizando el orden de la corrida de los ensayos experimentales.

Verifique la validez de estos supuestos en su análisis. Los residuos son los


mejores estimados de error. Por lo tanto, puede verificar cada uno de estos
supuestos de forma gráfica utilizando las gráficas de residuos.

Si su modelo no cumple con estos supuestos, los resultados del análisis


pueden ser engañosos. Por ejemplo, si los errores están correlacionados, los
errores estándares de los coeficientes se pueden estimar incorrectamente, lo
cual produciría valores t y p incorrectos.
Gráficas de residuos

Minitab ofrece las siguientes gráficas de residuos: histograma de residuos,


gráfica de probabilidad normal de los residuos, residuos versus valores
ajustados, residuos versus orden de los datos y residuos versus variables.

Utilice las gráficas de residuos para evaluar sus datos en relación con los
siguientes problemas: no normalidad, variación no aleatoria, varianza no
constante, relaciones de orden más alto y valores atípicos.

Histograma de residuos

Un histograma de residuos muestra la distribución de los residuos para todas


las observaciones. Utilice el histograma como una herramienta de exploración
para obtener información sobre las siguientes características de los datos:

 Valores típicos, dispersión o variación y forma

 Valores poco comunes en los datos

El histograma de residuos debería tener forma de campana. Utilice esta gráfica


para buscar lo siguiente:

Este patrón... Indica...


Colas largas Sesgo
Una barra muy alejada Un valor atípico
de las otras barras

Debido a que el aspecto del histograma puede cambiar según el número de


intervalos utilizados para agrupar los datos, utilice la gráfica de probabilidad
normal y las pruebas de bondad de ajuste para evaluar si los residuos son
normales.
En lo que respecta a los datos sobre los equipos, no existe evidencia de sesgo
o valores atípicos.

Gráfica normal de los residuos

Esta gráfica representa los residuos versus sus valores esperados cuando la
distribución es normal. Los residuos del análisis deben estar distribuidos
normalmente. En la práctica, para diseños con un número grande de
observaciones, las desviaciones moderadas con respecto a la normalidad no
afectan seriamente los resultados.

La gráfica de probabilidad normal de residuos debe seguir aproximadamente


una línea recta. Utilice esta gráfica para buscar lo siguiente:

Este patrón... Indica...


No una línea recta No normalidad
Curva en las colas Sesgo
Un punto alejado de la Un valor atípico
línea
Cambio de pendiente Una variable no
identificada

Si sus datos tienen menos de 50 observaciones, la gráfica podría mostrar una


curvatura en las colas, aun si los residuos están normalmente distribuidos. A
medida que disminuye el número de observaciones, la gráfica de probabilidad
pudiera mostrar una variación y no linealidad aun mayores. Utilice la gráfica de
probabilidad normal y las pruebas de bondad de ajuste para evaluar la
normalidad de los residuos en conjuntos de datos pequeños.

En lo que respecta a los datos sobre los equipos, los residuos no parecen
seguir una línea recta. Una evidencia de no normalidad existe en las colas,
aunque no es extrema. Usted pudiera desear realizar una prueba de
normalidad para determinar si los residuos son normales
Sesgo

El sesgo se refiere a una falta de simetría. Una distribución es sesgada si una


cola se extiende más que la otra.

Valor atípico

Un valor atípico es una observación inusualmente grande o pequeña. Los


valores atípicos pueden ser resultado de errores en la recolección de los datos
o en el ingreso de los datos, y se deben verificar.

Los valores atípicos pueden tener una marcada influencia en los resultados de
los procedimientos, como por ejemplo el ANOVA de un factor. Muchos
investigadores consideran que una observación es un valor atípico si es
diferente de la media de la muestra en más del doble de la desviación estándar
agrupada

Residuos versus ajustes

Esta gráfica representa los residuos versus los valores ajustados. Los residuos
deberían estar dispersos aleatoriamente alrededor de cero. Utilice esta gráfica
para buscar lo siguiente:

Este patrón... Indica...


Dispersión en abanico o Varianza no constante
irregular de los residuos
en los valores ajustados
Curvilíneo Un término de orden
más alto faltante
Un punto alejado de cero Un valor atípico

De acuerdo con esta gráfica, los residuos parecen estar dispersos


aleatoriamente alrededor de cero. No existe evidencia de varianza no
constante, términos faltantes o valores atípicos
Residuos versus Orden

Esta gráfica representa los residuos en el orden de las observaciones


correspondientes. La gráfica es útil cuando el orden de las observaciones
puede influir en los resultados, lo cual puede ocurrir cuando los datos se
recolectan en una secuencia de tiempo o en alguna otra secuencia, como por
ejemplo área geográfica. Esta gráfica puede ser particularmente útil en un
experimento diseñado en el cual las corridas no estén aleatorizadas.

Los residuos de la gráfica deben fluctuar en un patrón aleatorio alrededor de la


línea central. Examine la gráfica para determinar si existe alguna correlación
entre los términos de error cercanos entre sí. La correlación entre los residuos
puede ser representada por:

 Una tendencia ascendente o descendente en los residuos

 Cambios rápidos en los signos de residuos adyacentes

En lo que respecta a los datos sobre los equipos, los residuos parecen estar
dispersos aleatoriamente alrededor de cero. No existe evidencia de que los
términos de error estén correlacionados entre sí.

Residuos versus las Variables

Esta gráfica representa los residuos versus otra variable. Los residuos deben
fluctuar en un patrón aleatorio alrededor de la línea central. Si la variable ya
está incluida en el modelo, utilice la gráfica para determinar si debe agregar un
término de orden más alto de la variable. Si la variable aún no está incluida en
el modelo, utilice la gráfica para determinar si la variable está influyendo en la
respuesta de forma sistemática.

Utilice esta gráfica para buscar lo siguiente:

Este patrón... Indica...


Patrón en los La variable está
residuos influyendo en la respuesta
de forma sistemática
Curvatura en los Un término de orden más
puntos alto de la variable se
debería incluir en el
modelo

En lo que respecta a los datos sobre los equipos, los residuos parecen estar
dispersos aleatoriamente alrededor de cero. No existe evidencia de un patrón
en los residuos o curvatura en los datos. La gráfica indica que las variables no
parecen tener un efecto sistemático en la respuesta.

Gráfica de residuos cuatro en uno

La gráfica de residuos cuatro en uno muestra cuatro gráficas de residuos


diferentes en una ventana de gráfica. Este diseño puede ser útil para comparar
las gráficas a fin de determinar si su modelo cumple con los supuestos del
análisis. Las gráficas de residuos incluidas en el diseño cuatro en uno son:

 Histograma  indica si los datos están sesgados o si existen valores


atípicos en los datos

 Gráfica de probabilidad normal  indica si los datos están distribuidos


normalmente, si otras variables están influyendo en la respuesta o si existen
valores atípicos en los datos

 Residuos versus valores ajustados  indica si la varianza es constante, si


existe una relación no lineal o si existen valores atípicos en los datos

 Residuos versus orden de los datos  indica si hay efectos sistemáticos en


los datos debido al tiempo o al orden de recolección de los datos
Transformación de una variable de respuesta

Una transformación puede ser necesaria cuando los residuos exhiban varianza
no constante o no normalidad.

Las transformaciones también pueden ser útiles cuando el modelo exhiba una
falta de ajuste significativa, lo cual es particularmente importante en los
experimentos de análisis de superficie de respuesta. Supongamos que usted
incluye todas las interacciones significativas y los términos cuadráticos en el
modelo, pero la prueba de falta de ajuste sugiere la necesidad de términos de
orden más alto. Una transformación puede eliminar la falta de ajuste.

Si la transformación corrige el problema, usted puede utilizar el análisis de


regresión en lugar de otros métodos de análisis, posiblemente más
complicados. Un texto apropiado sobre regresión o análisis de experimentos
diseñados puede ofrecer una orientación adecuada con respecto a cuáles
transformaciones resuelven diferentes problemas.

La transformación de Box-Cox es la transformación de estabilización de la


varianza utilizada con más frecuencia.

Varianza no constante

Uno de los supuestos de regresión y del análisis ANOVA es que la varianza del
término de error es constante. En la gráfica de residuos versus valores
ajustados, los errores tienen varianza constante cuando los residuos están
dispersos de forma aleatoria alrededor de cero. Si los residuos aumentan o
disminuyen con los valores ajustados en un patrón que parece un embudo, los
errores pudieran no tener varianza constante.
Término de orden más alto

El orden de un término en un modelo de regresión corresponde al grado


exponencial de ese término: un término lineal (x) es un término de primer
orden; un término cuadrático (x2) es un término de segundo orden; y una
interacción de dos factores (x1x2) también es un término de segundo orden.

Los términos de orden más alto se pueden utilizar para modelar curvatura en
los datos. Un patrón curvilíneo en la gráfica de residuos versus valores
ajustados puede indicar que usted necesita agregar un término de orden más
alto a su modelo. Graficar variables individuales en su modelo versus los
residuos puede ayudarle a determinar cuáles variables tienen una relación
curvilínea con la respuesta.

You might also like