Se han medido las
alturas de 19 alumnos de 1º ESO y se consiguieron los
resultados siguientes:
150, 151, 147, 155, 145, 151, 152, 150, 149, 160, 142, 158, 153, 144,
190, 145, 147, 150, 156
a) Comprobar si existen outlier
mediante el método basado en la desviación
típica.
b) Comprobar si existen outlier
mediante el método basado en el rango intercuartílico.
Con la hoja de cálculos Excel, podemos
calcular muchos de los datos estadísticos estudiados en clase; pero hay otros de
los que Excel no dispone funciones ni formas de calcularlos. Este es el caso de
los outlier y otros, pero haciendo dato de nuestro conocimientos podemos
facilitar nuestros cálculos usando Excel como herramienta de trabajo.
Una vez abierta la hoja de cálculo EXCEL, introducimos los datos en la columna A desde la fila 1 hasta la 19.Recordando el método basado en la desviación típica, consideraremos outliers a todo los datos fuera del intervalo (media - 3·Desviacion típica,(media + 3·Desviacion típica ), si consideramos k=3, (media - 4·Desviacion típica, media - 4·Desviacion típica ) considerando k=4. Nosotros tendremos en cuanta la primera forma.
Debemos calcular la desviacion típica y la media, para ello podemos introducir en la barra de fórmulas: =PROMEDIO(A1:A19), obtenemos la media y DESVESTP(A1:A19), obtenemos la desviación típica. También podemos seleccionar de la opción "Insertar" de la barra de tareas la opción "fx función", y después de las funciones estadísticas la función PROMEDIO y DESVESTP.
Ahora sólo tenemos que restarle a la media 3
veces la desviación típica, para ello
la barra de fórmulas introducimos:
=PROMEDIO(A1:A19) - 3*(DESVESTP(A1:A19)); con esto tenemos el primer término del
intervalo. Para hayar el segundo hay que escribir: =PROMEDIO(A1:A19) +
3*(DESVESTP(A1:A19)).
El intervalo obtenido es el (122,34; 182,38). Serán ourlier todos los valores fuera de este intervalo; en este caso 190 es considerado outlier.
Existe otro método para la detección de ourlier, que es el basado en el rango intercuartílico. Recordando el método, consideraremos outliers a todo los datos fuera del intervalo (f1, f2), siendo estos las vallas interior de la variable; para calcularlas hay que calcular el primer cuartil y el rango intercuartílico (es decir el cuertil tercero menos el primero). Para ello introducimos la fórmula =CUARTIL (matriz, numero) o hacemos uso de las funiones estadísticas. Finalmente para hallar el intervalo introducimos: =CUARTIL(A1:A19;1)-1,5*((CUARTIL(A1:A19;3)-(CUARTIL(A1:A19;1)))), y =CUARTIL(A1:A19;1)+1,5*((CUARTIL(A1:A19;3)-(CUARTIL(A1:A19;1)))).
Con esto el intervalo es (136,5; 157,5). Ahora, como antes, también se considera 190 un outlier.