Saltar al contenido

Curso de muestreo

Primeras definiciones.

  • Población y muestra
  • Probabilidad
  • Encuestas por Muestreo
  • Diseño Muestral
  • Muestreo Probabilístico
  • Marcos Muestrales
  • Propiedades deseables de los marcos
  • Definición de Unidades

¿Qué es una Población?

  • Es un conjunto bien definido de todos los elementos que interesa investigar.
  • Ejemplos: personas, personas mayores de cierta edad, hogares particulares, instituciones, empresas, alumnos de cierta edad, alumnos de un grado.
  • Expresiones equivalentes: “Población Objetivo” o “Universo”.

Investigación sobre calidad educativa.  ¿Cuál es la Población?

  • Alumnos de cierta edad especificad, no importa el grado que cursan.
  • Alumnos matriculados en un grado escolar.
  • Alumnos del grado que concurren habitualmente a clases en el momento que se realizan las pruebas.
  • Alumnos del grado que rinden las pruebas.

¿Qué es una muestra?

  • Es una parte de la población que se espera pueda brindar información sobre toda la población.
  • Trabajar con datos de una muestra, en lugar de la población, origina cierto grado de incertidumbre o riesgo.
  • Obliga a vivir con el “Error Muestral”.
  • Se espera que la muestra sea una buena imagen de la población.

¿Qué es la probabilidad?

  • Es una función que a cada suceso (resultado posible) de un experimento aleatorio, le asigna un número.
  • Un número comprendido entre 0 y 1, que está relacionado con la chance de ocurrencia de un suceso. A mayor chance, mayor la probabilidad.
  • Si el suceso tiene mucha chance de ocurrir, entonces la probabilidad es un número cercano a 1. Si tiene escasas posibilidades de ocurrir, entonces la probabilidad del suceso es un número cercano a 0.

Muestreo Probabilístico

  • El procedimiento de selección de la muestra se basa en un mecanismo de azar.
  • Es posible definir el conjunto de muestras posibles.
  • Cada muestra posible tiene asociada una probabilidad conocida de ser seleccionada.
  • Todo elemento de la población tiene probabilidad no nula de ser seleccionado (toda unidad de la población pertenece al menos a una muestra posible).

¿Porqué una muestra y no un censo?

  • Menor costo
  • Menos recursos humanos calificados
  • Información más oportuna
  • Mayor calidad ¿por qué?

¿Qué es una Encuesta por Muestreo?

Es una estrategia que implica:

  • La selección de una muestra de unidades de la población.
  • La definición de un procedimiento y de un instrumento para la captura de datos.
  • La recolección de datos sobre las unidades de la muestra.
  • El procesamiento de los datos hasta obtener una base de datos depurada.
  • El resumen de la información.

Motivos del Muestreo Probabilístico

  • El muestreo probabilístico es el fundamento de la teoría estadística.
  • Permite expandir los resultados de la muestra a la población.
  • La teoría le dice al muestrista cuántas unidades son necesarias para representar a la población.
  • También, cuánta confianza se puede poner en la representatividad de la muestra.

Métodos de Muestreo Probabilístico

  • Muestreo aleatorio simple
  • Muestreo con probabilidades desiguales
  • Muestreo sistemático
  • Muestreo estratificado
  • Muestreo por conglomerados
  • Muestreo en varias etapas
  • Muestreo en dos fases

Muestreo No Probabilístico

  • El método de selección no emplea la teoría de probabilidades.
  • No se conoce la chance que tiene cada unidad de la población de ser seleccionada
  • No hay posibilidades de evaluar precisión en los resultados
  • Es fácil de implementar con pocos recursos
  • No garantiza representatividad.

Métodos de Muestreo No Probabilístico

  • Muestreo de voluntarios (donantes)
  • Selección de juicio o intencional (de unidades “típicas”)
  • Muestreo de unidades accesibles (clientes que vienen a presentar quejas)
  • Muestreo por bola de nieve
  • Muestreo por cuotas
  • Muestreo de personas que pasan por un lugar en un momento dado (sondeo)
  • Muestreo originalmente probabilístico con serios problemas de cobertura o de no respuesta ¿se soluciona con los reemplazos?

¿Qué es un Marco Muestral?

  • Un marco muestral es una lista.
  • Una lista de las unidades de muestreo, con información asociada, el cual se utiliza para seleccionar una muestra de la población.
  • ¿Las unidades de muestreo coinciden con los elementos de la población?

¿Qué es un Marco Muestral?

Cuando las unidades de muestreo no coinciden con los elementos de la población, entonces el marco muestral contiene unidades de distinta jerarquía – unidades compuestas y unidades elementales – y la información necesaria para relacionarlas.

¿Qué es un Marco Muestral?

  • La identificación precisa de las unidades permite su cuantificación, y con ello, la asignación de probabilidades de selección para el sorteo de la muestra.
  • La ubicación de las unidades consiste en la dirección o la referenciación en un mapa, y conjuntamente con la identificación, constituyen requisitos imprescindibles para direccionar al personal de campo y realizar el control administrativo de la encuesta.

¿Qué es un Marco Muestral?. Ejemplos de marcos muestrales:

  • Guía telefónica
  • Listado de hospitales
  • Lista de empresas o locales
  • Listado de viviendas
  • Listado de escuelas
  • Listado de grupos o secciones
  • Listado de alumnos

Relevancia de un Marco Muestral. De él depende:

  • Que todas las unidades de la población tengan chance de ser incluidas en la muestra.
  • Las alternativas para la selección de la muestra (el diseño muestral a emplear).
  • El tipo de unidad que se va a muestrear.
  • Cómo se llega a contactar a las unidades de la muestra.
  • El método de estimación para aproximar los parámetros de la población.

Posibles problemas de los Marcos

  • Cobertura deficiente
  • Sobre cobertura (unidades extrañas)
  • Duplicación de unidades
  • Desactualización
  • Información auxiliar incorrecta
  • Información de acceso incorrecta

Propiedades deseables de un Marco Relacionadas con la calidad:

  • unidades bien definidas
  • completo
  • estable
  • fácil de actualizar

Propiedades deseables de un Marco Relacionadas con la eficiencia:

  • la información auxiliar está actualizada o es fácil de actualizar
  • facilita la selección de las unidades muestrales es fácil de procesar y manipular

Propiedades deseables de un Marco Relacionadas con los costos:

  • bajo costo de preparación
  • bajo costo para el uso
  • bajo costo de actualización

Tipo de unidades en las Encuestas

  • Unidad de Muestreo: cada una de las partes en que se divide el marco.
  • Unidad de Análisis: unidades que interesa investigar en la Encuesta; pueden o no coincidir con las unidades de muestreo.
  • Unidad de Información: unidad que provee la información sobre las unidades de análisis.

Ejemplos de unidades en las Encuestas

  • Unidad de Muestreo: escuela
  • Unidad de Análisis: grupo escolar, alumno
  • Unidad de Información: maestro, alumno

Más definiciones

  • Variable
  • Parámetro
  • Estimador
  • Estimación
  • Error muestral
  • Errores ajenos al muestreo
  • Teoría de probabilidades
  • Probabilidades de inclusión
  • Mecanismos aleatorios

¿Qué es una variable?

  • Una variable estadística es una característica numérica que poseen todas las unidades de la población.
  • En teoría, es posible medir el valor de la variable en cada unidad de la población.

¿Qué es un parámetro?

  • Es una medida resumen de la variable.
  • Es una magnitud fija y desconocida.
  • Es un dato numérico que caracteriza a la población.
  • No depende de la muestra elegida. Pero la muestra puede ayudar a conocerla (aproximarla).

Parámetros más usuales

  • Total: suma de los valores de una variable medidos sobre toda la población.
  • Promedio: cociente entre el total de la variable y el tamaño de la población.
  • Proporción de un atributo: porcentaje de elementos de la población que cumplen una condición.
  • Razón: cociente de los Totales (o de los Promedios) de dos variables.
  • Cuantil: Valor de una variable que, previamente ordenada, acumula cierto porcentaje de la población.

¿Qué es un estadístico o estimador?

  • Es una función matemática de las observaciones de la muestra, que no depende de elementos desconocidos, y que puede utilizarse como aproximación del parámetro.

¿Qué es el error muestral?

  • Diferencia entre el valor del parámetro y la estimación que provee la muestra.
  • Es el error que resulta de utilizar sólo una parte de la población para aproximar el parámetro.
  • Su magnitud es desconocida (porque el parámetro es desconocido) y por lo tanto imposible de calcular.

¿Qué es el error muestral?

  • No está generalmente relacionado con el tamaño de la población, pero sí con el tamaño de la muestra (disminuye cuando el tamaño de la muestra aumenta).
  • Si el muestreo es probabilístico, el error muestral se puede acotar (controlar) con una probabilidad alta.

¿Qué son los errores no muestrales?

  • Son errores ajenos al muestreo, que no provienen del hecho de observar una parte de la población, sino que son consecuencia de otros factores relacionados con las encuestas.
  • No disminuyen cuando el tamaño de la muestra aumenta, sino que incluso pueden aumentar.
  • Su característica principal: no son medibles.
  • Se pueden clasificar con arreglo a diversos criterios.

¿Qué son los errores no muestrales?

Clasificación de los errores por el agente causante:

  • muestrista
  • método de recolección
  • entrevistador
  • entrevistado
  • cuestionario
  • programador
  • digitador
  • analista

¿Qué son los errores no muestrales?

Clasificación de los errores por tipo:

  • de cobertura
  • de respuesta
  • de no respuesta

¿Qué son los errores no muestrales?

Clasificación de los errores según la etapa de la investigación en que se producen:

  • en la elaboración de los instrumentos
  • en la selección de la muestra
  • en la recolección de datos
  • en el procesamiento
  • en la estimación y expansión  en el análisis de los resultados

¿Cómo se utiliza la Teoría de las Probabilidades con fines de Muestreo?

  • En la etapa de selección de la muestra.
  • En la etapa de proyección de los resultados a toda la población (inferencia estadística).
  • En la etapa de evaluación de la precisión y confianza en las estimaciones.

¿Qué son las probabilidades de inclusión?

  • Son las probabilidades que tienen las unidades de la población de pertenecer a la muestra.
  • En el muestreo probabilístico, toda unidad del marco tiene una probabilidad de inclusión fijada por el muestrista de antemano.

¿Qué es un Mecanismo Aleatorio?

  • Es un procedimiento que permite seleccionar unidades de una población con probabilidades conocidas de antemano.
  • El procedimiento suele generar números al azar, números que pueden asociarse unívocamente a las unidades de la población.
  • Ejemplos: Bolillero, tecla RAN de las calculadoras científicas, función ALEATORIO en paquetes de software estadístico.

¿Qué es un Mecanismo Aleatorio?

  • Procedimiento que impide cualquier forma de “manipulación” del investigador, por cuanto las unidades de la muestra se eligen en forma objetiva, con independencia de las motivaciones de quien las selecciona.
  • Es un mecanismo que debe encontrar el muestrista para asegurar la asignación de probabilidades planeada (equiprobabilidad o probabilidades desiguales).

Muestreo Aleatorio Simple

  • Definición
  • Probabilidades de inclusión
  • Ventajas y desventajas
  • Tasa de muestreo
  • Selección de una muestra aleatoria simple
  • Estimadores
  • Error de muestreo
  • Precisión
  • Intervalo de confianza

¿Qué es una muestra aleatoria simple sin reposición (MAS S/R)?

  • Se eligen n elementos de los N de la población, de a uno y sin reponer.
  • En cada extracción todos los elementos (que no fueron elegidos antes) tienen la misma probabilidad de ser elegidos.
  • Todas las muestras con los mismos elementos, aunque en distinto orden, se consideran la misma muestra.

Propiedades de una MAS

  • Todas las combinaciones de n elementos tomados de los N de la población son muestras posibles.
  • Todas las muestras posibles tienen igual probabilidad de ser seleccionadas.
  • Cada elemento de la población tiene igual probabilidad de ser incluido en una muestra. Dicha probabilidad es igual a n/N, también conocida como fracción de muestreo.
  • Las probabilidades de inclusión son iguales para todos los elementos de la población.

Ventajas de una MAS

  • Es fácil de seleccionar.
  • Es adecuada cuando la población es bien homogénea.
  • A más grande su tamaño, la muestra proporciona una imagen más parecida a la población.

Desventajas de una MAS

  • Estimaciones muy pobres cuando la población es muy asimétrica respecto del valor de la variable principal.
  • El MAS S/R no puede garantizar que en la muestra todas las subpoblaciones estarán bien representadas, sobre todo, si alguna de ellas tienen escasa incidencia en la población.
  • La estimación de parámetros tiene más error muestral que otros métodos de muestreo.
  • Tiene mayores costos que otros métodos de muestreo en los cuales las unidades de la muestra están próximas (agrupadas).

¿Qué son la tasa y la fracción de muestreo?

  • Los dos términos refieren a la proporción de población incluida en la muestra, una en forma porcentual (tasa de muestreo) y la otra en términos absolutos (fracción de muestreo).
  • Tasa de muestreo = 100*n/N.
  • Fracción de muestreo = n/N.

Probabilidad de inclusión en MAS

  • La probabilidad de inclusión de una unidad en la muestra es la misma para todas las unidades, y es igual a la fracción de muestreo: f = n/N.
  • ¿Cuántas unidades de la población representa una unidad seleccionada? Representa N/n elementos de la población, o sea la inversa de la fracción de muestreo.
  • N/n se denomina factor de expansión para una muestra aleatoria simple.

¿Cómo se selecciona una MAS?

  • Con la ayuda de una tabla de números al azar.
  • Con una calculadora que genere números al azar (tecla RAN).
  • Con software estadístico (EXCEL, SAS, SPSS)

¿Cómo se selecciona una MAS C/R?

  • Con el mismo esquema del bolillero, pero cada vez que se elige una bolilla, se la repone en el bolillero para que tenga chance de ser elegida en la siguiente extracción.
  • Con el esquema C/R en cada extracción todos los elementos tienen la misma probabilidad de ser elegidos.
  • El sorteo puede realizarse también con un bolillero, con la tecla RAN de las calculadoras científicas o con software estadístico (EXCEL, SAS, SPSS)

Diferencias entre MAS S/R y MAS C/R

  • En el MAS S/R las fórmulas para el cálculo de varianzas son más complicadas.
  • El número de muestras posibles es mucho mayor en el esquema C/R:
  • Para estimar promedios o totales el muestreo sin reposición es más eficiente que el muestreo con reposición:

¿Cómo se evalúa la precisión en el MAS?

Existen distintos termómetros para evaluar precisión:

  • Desvío Estándar del estimador
  • Coeficiente de Variación del estimador
  • Margen de Error
  • Intervalo de Confianza

¿Qué es el Desvío Estándar del estimador?

  • El DE un número que mide la variabilidad del estimador y permite evaluar la bondad de la estimación obtenida con una muestra.
  • Si la muestra es probabilística, se lo puede estimar con la misma muestra.
  • Valores pequeños indican el estimador le ha de “pegar” cerca al valor del parámetro.
  • El Desvío Estándar del estimador se mide en la misma escala que la variable que se está investigando.
  • Es un insumo para otras medidas de precisión.

Cálculo del Desvío Estándar del estimador de la media poblacional

  • Se obtiene como raíz cuadrada de la varianza del estimador.
  • Como en general la cuasi-varianza poblacional se desconoce. Colaborado por Raul Ibarra Gonzalez.



Bibliografía


Referencias, créditos & citaciones APA:
Portal de arquitectura Arqhys.com. Equipo de redacción profesional. (2011, 06). Curso de muestreo. Escrito por: Arqhys Misceláneos. Obtenido en fecha , desde el sitio web: https://www.arqhys.com/general/curso-de-muestreo.html.

Privacidad | Referencias | Mapa | Contacto