Análisis de variancia

Características de la distribución F
Véalo aquí
 
Existe una “familia” de distribuciones F.
Cada miembro de la familia está determinado por dos parámeteros: los grados de libertad (gl) en el numerador y los grados de libertad en el denominador.
El valor de F no puede ser negativo y es una distrubución continua.
La distribución F tiene sesgo postivo.
Sus valores varían de 0 a ¥ . Con forme F ® ¥  la curva se aproxima al eje X.

Prueba para variancias iguales
Véalo aquí

Para prueba de dos colas, el estadístico de prueba está dado por:



son las variancias muestrales para las dos muestras. La hipótesis nula se rechaza si el cálculo del estadístico de prueba es más grande que el valor crítico (de tablas) con nivel de confianza y grados de libertad para el numerador y el denominador.

Ejemplo:
Colin, agente de bolsa del Critical Securities, reportó que la tasa media de retorno en una muestra de 10 acciones de software fue 12.6% con una desviación estándar de 3.9%. La tasa media de retorno en una muestra de 8 acciones de compañías de servicios fue 10.9% con desviación estándar de 3.5%. Para .05 de nivel de significancia, ¿puede Colin concluir que hay mayor variación en las acciones de software?
Paso 1:

Paso 2: H0 se rechaza si F > 3.68,
gl = (9, 7), a= .05
Paso 3:

Paso 4: H0 no se rechaza. No hay evidencia suficiente para asegurar que hay mayor variación en las acciones de software.
 

Suposiciones de ANOVA
Véalo aquí

La distribución F también se usa para probar la igualdad de más de dos medias con una técnica llamada análisis de variancia (ANOVA). ANOVA requiere las siguientes condiciones:
la población que se muestrea tiene una distribución normal
las poblaciones tienen desviaciones estándar iguales
las muestras se seleccionan al azar y son independientes

Estadísticas Inferencial
Véalo aquí

Estadística inferencial: una decisión, estimación, predicción o generalización sobre una población, en base a una muestra.
Una población es un conjunto de todos los posibles individuos, objetos o medidas de interés.
Una muestra es una porción, o parte, de la población de interés.

Procedimiento de análisis de variancia
Véalo aquí

Hipótesis nula: las medias de las poblaciones son iguales.
Hipótesis alterna: al menos una de las medias es diferente.
Estadístico de prueba: F = (variancia entre muestras)/(variacia dentro de muestras).
Regla de decisión: para un nivel de significancia , la hipótesis nula se rechaza si F (calculada) es mayor que F (en tablas) con grados de libertad en el numerador y en el denominator.

NOTA
Véalo aquí

Si se muestrean k poblaciones, entonces los gl (numerador) = k - 1
Si hay un total de N puntos en la muestra, entonces los gl (denominador) = N - k
El estadístico de prueba se calcula con: F = [(SST) /(k - 1)] /[(SSE) /(N - k)].
SST es la suma de cuadrados de los tratamientos.
SSE es la suma de cuadrados del error.
Sea TC el total de la columna, nc el número de observaciones en cada columna, y SX la suma de todas las observaciones.

Fórmulas
Véalo aquí


Inferencias acerca de las medias de tratamiento
Véalo aquí

Cuando se rechaza la hipótesis nula de que las medias son iguales, quizá sea bueno saber qué medias de tratamiento difieren.
Uno de los procedimientos más sencillo es el uso de los intervalos de confianza.

Intervalos de confianza para la diferencia entre dos medias
Véalo aquí

 
donde t se obtiene de la tabla con (N - k) grados de libertad.
MSE = [SSE /(N - k)]
 

Dos factores ANOVA
Véalo aquí

 
Para ANOVA de dos factores se prueba si existe una diferencia signifcativa entre el efecto de tratamiento y si existe una diference en la variable de bloqueo.
Sea Br el total de bloque (r según las filas)
SSB representa la suma de los cuadrados de los bloques, donde:
<< atras

Tabla de contenidos

adelante >>