Recordemos que: SCT = SCE + SCR, la cual fragmenta la suma de cuadrados total (SCT) en dos componentes:
La suma de cuadrados explicada (SCE) y
La suma de cuadrados de residuos (SCR). El estudio de estos componentes de SCT se conoce como anlisis de varianza (ANOVA) desde el punto de vista de la regresin. Asociados con toda suma de cuadrados estn sus gl, es decir, el nmero de observaciones independientes en las que se basa. La SCT tiene n 1 gl porque se pierde 1 gl en el clculo de la media muestral . La SCR tiene n 2 gl. (Nota: Esto slo es vlido para el modelo de regresin con dos variables con presencia del intercepto 1 .). SCE tiene 1 gl (de nuevo, esto slo vale para el caso de dos variables), lo cual se deduce de que SCE= 22 2 sea una funcin slo de 2 , pues se conoce 2 . i.
Reorganicemos las sumas de cuadrados y sus gl asociados
en la siguiente tabla:
que es la forma estndar de la tabla AOV, denominada algunas
veces tabla ANOVA. Con la informacin de la tabla, consideremos ahora la siguiente variable: Si suponemos que las perturbaciones estn normalmente distribuidas, lo cual se cumple para el MCRLN, y si la hiptesis nula (H0) es que 2 = 0, puede demostrarse que la variable F de la ecuacin anterior, satisface la distribucin F con 1 gl en el numerador y (n 2) gl en el denominador.
Qu uso puede hacerse de la razn F anterior? Puede
demostrarse que
(Observe que 2 y 2 al lado derecho de estas ecuaciones son los
verdaderos parmetros.) Por tanto, si 2 es en realidad cero, ambas ecuaciones proporcionan estimaciones idnticas del verdadero 2. En esta situacin, la variable explicativa X no tiene influencia lineal alguna sobre Y, y toda la variacin en Y se explica con las perturbaciones aleatorias ui. Por otra parte, si 2 es diferente de cero, las ecuaciones sern diferentes y parte de la variacin en Y se atribuir a X. Por consiguiente, la razn F (lamina anterior) constituye una prueba de la hiptesis nula H0:2 =0. Como todas las cantidades que forman parte de esta ecuacin se obtienen de la muestra disponible, esta razn F constituye un estadstico de prueba para verificar la hiptesis nula de que el verdadero 2 es igual a cero. Slo debe calcularse la razn F y compararla con el valor crtico F obtenido de las tablas F en el nivel de significancia seleccionado, u obtener el valor p del estadstico F calculado.
Para esclarecer esto, continuamos con el ejemplo ilustrativo
(ingreso dada la escolaridad). La tabla ANOVA para este ejemplo se presenta a continuacin:
El valor F calculado es 108,3026. El valor p de este estadstico F
correspondiente a 1 y 8 gl no puede obtenerse de la tabla F, pero con tablas estadsticas electrnicas se demuestra que el valor p es 0,0000001, una probabilidad en efecto muy pequea. Si escoge el mtodo del nivel de significancia para la prueba de hiptesis y fija en 0,01, o en un nivel de 1%, se ver que la F calculada de 108,3026 es obviamente significativa en este nivel. Por tanto, si rechazamos la hiptesis nula de que 2 =0, la probabilidad de cometer un error tipo I es muy pequea. Para todo fin prctico, la muestra no pudo provenir de una poblacin con un valor 2 igual a cero, y se puede concluir con gran confianza que X, la educacin, s afecta Y, el salario promedio.