Errores tipicos

Errores tipicos gy isakIS I Aeza6pR 02, 2010 25 pagos Estadística aplicada a las Ciencias Sociales Estadística inferencial: el error típico de la media OPedro Morales Vallejo, Universidad Pontificia Comillas, Madrid Facultad de Ciencias Humanas y Sociales (última revisión 21 de Septiembre de 2007) indice 1. Introducción: estadística descriptiva y estadística inferencial: estadísticos y parámetros, poblaciones Y muestras. ….. — 2. Las distribuciones muestrales y el error 3. El error típico de la meda…. 4.

Utilidad del error tí media.. 4. 1. Establecer entre se encuentra la medi PACE 1 or2s Sv. ipe to View nut*ge e confianza) blecer parámetros 4. 2. Establecer los intervalos de confianza de una proporcion — 335668 4. 3. Comparar la media de una muestra con la media de una población…. 10 4. 4. Calcular el tamaño N de la muestra para extrapolar los resultados a la población . . 12 5. Referencias bibliográficas intervalos 13 Anexo: Los Swlpe to vlew nexr page de confianza de la media y de las proporciones en Internet 14 2 3 1.

Introducción: estadística descriptiva y estadística inferencial: estadísticos y parámetros, poblaciones y muestras Recordamos lgunos conceptos básicos: Una población es un conjunto de elementos (sujetos, objetos) cuyos límites los define el

Lo sentimos, pero las muestras de ensayos completos están disponibles solo para usuarios registrados

Elija un plan de membresía
investigador; por ejemplo los alumnos de una universidad, o los de una sola facultad o los de todo el país… Una muestra es un número concreto de elementos extraídos de una población.

Una muestra aleatoria es aquella en la que todos los sujetos (u objetos) han tenido la misma probabilidad de ser escogidos; las muestras aleatorias son las que mejor representan las características de la poblaciónl. La estad[stica descriptiva tiene por objeto describir las muestras: por ejemplo, la media ritmética (una medida de tendencia central) y la desviación típica (una medida de dispersión) son estadísticos o medidas propias de la estadística descrptiva: nos describen cómo es una muestra.

La estadística inferencial nos permite hacer inferencias, sacar conclusiones con respecto a una población: a partir de los datos descriptivos de una muestra, deducimos los datos o medidas de la población, que en este caso se denominan parámetros. Normalmente el investigador trabaja con muestras, grupos concretos a los cuales tiene acceso o que ha buscado y que puede medir en alguna característica. Las poblaciones son en general inasequibles; se trabaja con pequeñas muestras y se general 2 OF as característica.

Las poblaciones son en general inasequibles; se trabaja con pequeñas muestras y se generalizan las conclusiones a las poblaciones a las que pertenecen las muestras. Lo que vamos a ver ahora tiene que ver sobre todo (no exclusivamente) con la generalización a la población de los datos que encontramos en muestras concretas. 2. Las distribuciones muestrales y el error típico Dos conceptos previos importantes son los de distribución muestral y error típico.

En definitiva nos vamos a encontrar con na aplicación de lo que ya sabemos de la distribución normal y de las puntuaciones típicas: en la distribución normal conocemos las probabilidades de obtener una puntuación superior o inferior a cualquier puntuación típica. Ahora se trata básicamente de una aplicaclón de esta relación. Qué es una distribución muestral lo podemos ver con facilidad con un caso concreto: 10 Imaginemos una población de sujetos; por ejemplo los alumnos de una universidad.

Los límites de la población (qué sujetos, u objetos, pertenecen a una población) lo determina el que investiga. De la isma manera que ponemos como ejemplo de población a los alumnos de una universidad, podríamos decidir que la población que vamos a estudiar son los alumnos de una sola facultad, o los alumnos de todas las universidades del país. 20 De esta población podemos extraer una muestra aleatona de, por ejemplo, 30 sujetos. Muestra aleatoria quiere decir que todos los sujetos de la población han tenido en principio la misma oportunidad de ser elegidos.

Las muestras aleatoria as han tenido en principio la misma oportunidad de ser elegidos. Las muestras aleatorias son en principio las que mejor representan Los diversos tipos de muestreo, aleatorio otros, y cómo llevarlos a cabo, pueden verse en muchos textos (como Hernández Sampieri, Fernández Collado y Baptista Lucio, 2000; Salkind, 1 998) y en monografías específicas (como Rodríguez Osuna, 1993). Una breve exposición de los tipos de muestras puede verse en Internet, en STATPAC INC (2003) 4 las caracteristicas de la población.

Hay varios métodos para elegir muestras aleatorias pero no los tratamos aquí. 30 De esta muestra podemos calcular la media. Seguimos extrayendo muestras aleatorias y calculando sus medias. 40 Al disponer de un úmero grande de medias tendríamos una distribución de estas medias; esa distribución es una distribución muestral: no se trata de una distribución de puntuaciones individuales sino de medias de muestras. Un punto importante es que aunque las muestras no tengan una distribución normal, las medias de estas muestras si tienden a seguir la distribución normal. 0 La desviación típica de estas distribuciones muestrales se denomina error típico y se puede estimar a partir de los datos de una muestra. por lo tanto un error típico es la desviación típica de una distribución uestral, y se interpreta como cualquier desviación típica. Dos distribuciones muestrales, con sus errores típicos, nos van a interesar de manera especial: 1) la distribución muestral de las medias; 2) la dist típicos, nos van a interesar de manera especial: 1) la distribución muestral de las medias; 2) la distribución muestral de las diferencias entre medias de la misma población.

Estas distribuciones muestrales son modelos teóncos que a partir de los datos de una muestra nos van a permitir inferir conclusiones acerca de la población a la que pertenece la muestra. Conociendo l error típico de estas distribuciones podemos estimar entre qué limites se encuentra la media de la población o si dos muestras proceden de poblaciones distintas con media distinta. Ahora nos centramos en el error típico de la media. Conviene caer en la cuenta desde el principio de la utilidad del error típico de la media.

Es fácil obtener la media de una muestra en cualquier vanable de interés, pero con frecuencia lo que nos interesa no es la media como dato descriptivo de una muestra, sino conocer o tener una idea de por dónde anda la media en la población representada por esta muestra. La media de la población no la vamos a conocer, pero si podremos estimar entre qué valores se encuentra. La media de una muestra podemos interpretarla como una estimación (solamente una estimación sujeta a error) de la media de la población.

Esta estimación será más precisa: ID Si la muestra es aleatoria porque en ese caso representa mejor las características de la población 20 Si la muestra es grande (si la muestra comprendiera a toda la población tendríamos el dato exacto, no una estimación). El error típico, como es la desviación típica de todas las posibles muestras de esa po s OF as rror típico, como es la desviación típica de todas las posibles muestras de esa población, nos va a permitir localizar entre qué límites se encuentra la media de la población.

Este planteamiento es semejante al que nos encontramos en los sondeos de opinión, como son las encuestas pre-electorales. Si el 48% de los sujetos entrevistados dice que va a votar a un determinado candidato, esto no quiere decir que el 48% exacto de la población le vaya a votar. Sin embargo los datos obtenidos de una muestra nos van a permitir estimar un tanto por ciento mínimo probable y un tanto por ciento máximo probable de votantes a ese andidato: entre esos dos tantos por ciento se va a encontrar el tanto por ciento definitivo cuando todos hayan votado.

De los datos de una muestra extrapolamos a la población, por eso se trata de estadística inferencial. De manera análoga podemos pensar en distribuciones muestrales de otros estadísticos como proporciones, medianas, coeficientes de correlación, etc. , y también en distribuciones muestrales de las diferencias entre proporciones, medianas, coeficientes de correlación, etc. , con aplicaciones semejantes a las que vamos a ver con respecto a la media que son las de utilidad más inmediata y frecuente. 3.

El error típico de la media Según el teorema del límite central, si de cualquier población se extraen muestras aleatorias del mismo tamaño N, al aumentar el número de muestras sus medias se distribuyen normalmente, con media p y una desviación típica, o error t 6 OF as de muestras sus medias se distribuyen normalmente, con media p y una desviación típica, o error típico o/ N Esta distribución muestral de las medias es independiente de la distribución de la población: aunque la distribución en la población no sea normal, las medias de las muestras aleatorias extraídas de esa población ienden a tener una distribución normal.

El error típico de la media (desviación típica de la distribución muestral de las medias) podemos expresarlo de dos maneras: ON-1 En la fórmula [1] la desviación típica del numerador se supone calculada dividiendo por N-l la suma de cuadrados (o la suma de las puntuaciones diferenciales, X- X, elevadas previamente al cuadrado). En la fórmula [2] la desviación t[pica se ha calculado dividiendo por N, como es normal hacerlo cuando se calcula la desviación típica como dato descriptivo de la muestra.

Ambas fórmulas son equivalentes y dan el mismo resultado; la única diferencia está en uándo se ha restado 1 a N. En principio suponemos que la desviación típica de la muestra la hemos calculado dividiendo por N, como dato descriptivo de la dispersión en la muestr alcular el error típico de la media utilizaremos la La desviación típica del desviación típica de la población, utilizamos la de la muestra como una estimación de la desviación típica de la población.

Observando la fórmula del error típico de la media podemos ver que: la Es claro que el error típico de la media será menor que la desviación típica de cualquier muestra: el cociente siempre será menor que el numerador. Esto quiere decir que las medias de las muestras son más estables y tienden a oscilar menos que las puntuaciones individuales; dicho de otra manera, las medias de muestras de la misma población se parecen entre sí más que los sujetos (u objetos) de una muestra entre sí. 0 Observando las fórmulas vemos también que el error típico de la media será más pequeño en la medida en que N sea grande: si aumentamos el denominador, disminuirá el cociente. Es natural que al aumentar el número de sujetos (N) el error sea menor: la media de la muestra se aproximará más a la media de la población. Si N es uy grande, el error tiende a cero; y si N no comprende a una muestra sino a toda la población, el error sería cero: en este caso la media de la población coincide con la media de la muestra y no hay error muestral (o variacion esperable de muestra a muestra). 0 Por otra parte si la desviación típica de la muestra es grande, el error típico estimado de la media será también mayor: si aumentamos el numerador, el cociente será mayor. 6 También esto es lógico: una desviación típica grande en una muestra quiere decir que las diferencias entre los sujetos desviación típica grande en una muestra quiere decir que las iferencias entre los sujetos son mayores, y consecuentemente las medias de las diferentes muestras también diferirán más entre sí. 4. Utilidad del error típico de la media Vamos a exponer dos usos del error típico de la media.

Aquí el más importante es el primero, establecer los limites probables (intervalos de confianza) entre los que se encuentra la media de la población, un planteamiento típico y frecuente en estadística inferencial. Veremos también lo mismo aplicado a una proporción, que es la media cuando se trata de datos dicotómicos (1 ó 0). En segundo lugar el error tipico de la media nos permite comprobar i una muestra con una determinada media puede considerarse como perteneciente a una poblaclón cuya media conocemos, es también de interés y es simplemente una aplicación del anterior.

Igualmente podemos aplicarlo si la media es una proporción (una proporción es la media cuando los datos son unos y ceros). Es conveniente exponerlo aqui brevemente, pero lo volveremos a encontrar al tratar del contraste de medias, pues allí veremos un procedimiento más sencillo. Son procedimientos equivalentes. Podemos añadir un tercer uso del error típico de la media, que es determinar el número de sujetos que necesitamos en la muestra ara extrapolar los resultados a la población.

Cuando a partir de los datos de una muestra nos interesa extrapolar los resultados a la población (por ejemplo cuántos van a votar a un partido político en unas elecciones), lo hacemos con un margen d van a votar a un partido político en unas elecciones), lo hacemos con un margen de error (en cuyo cálculo tenemos en cuenta el error típico y nuestro nivel de confianza): si queremos un margen de error pequeño, necesltaremos más sujetos… por eso en las fórmulas para determinar el número de sujetos de la muestra entrará el error típico.

Este punto lo veremos de manera más sucinta, porque suele verse con más detalle en otro contexto más práctico, al tratar de las muestras, tipos de muestras, número de sujetos necesario según distintas finalidades, etc. No sobra por último repetir una observación ya hecha: estamos tratando del error tipico de la media (o desviación típica de una hipotética distribución de medias), pero de manera análoga podríamos tratar de otros errores típicos y con las mismas apllcaciones: de los coeficientes de correlación, de las proporciones, y de cualquier otro estadístico. . 1. Establecer entre qué limites (intervalos de onfianza) se encuentra la media (V) de la población V (establecer parámetros poblacionales) La media de una muestra (X) es una estimación de la media de la población (p); pero decir que es una estimación quiere decir que está sujeta a error.

La media exacta de la población no la conocemos; pero sí podemos estimar entre qué límites extremos se encuentra, y esto a partir de la media de una muestra y del error típico de la media. El error típico de la media no es otra cosa que una estimación de la desviación típica de las medias (de muestras de la misma población), y se interpreta de la misma manera;