Cuándo se plantea un estudio para observar un determinado fenómeno, el interés del investigador no es sólo en los sujetos de la muestra, sino la población en general, de donde salió la misma.
Hay herramientas que permiten generalizar los resultados encontrados en la muestra a la población.
Estos procesos estadísticos forman parte de lo que se denomina inferencia estadística.
Es primordial para ello elegir muestras de tal forma que éstas reflejen las características de la población. Son las técnicas de muestreo.
Tipos de muestreo.

1.
Aleatorio simple. P=1/n
2.
Aleatorio sistemático.
3.
Estratificado.
4.
Conglomerados.
- No probabilístico o de conveniencia
del investigador. Puede haber personas en la población
que no tengan probabilidad o que se desconozca,
de ser seleccionado en la muestra.
1.
Accidental.
2.
Por cuotas.
Muestreo probabilístico.
Todos y cada
uno de los elementos tienen la misma probabilidad de ser elegidos.
-
Aleatorio Simple.
1. Se caracteriza porque cada unidad
tiene la probabilidad equitativa de ser incluida en la muestra:
De sorteo o rifa:
desventaja de este método es que no puede usarse cuando el universo es grande.
Tabla de números
aleatorios: más económico y requiere menor tiempo.
-
Aleatorio Sistematico.
1. Similar al aleatorio simple, en donde
cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Ejemplo: si
N:500 (población) y n:100 (personas que queremos en la muestra N/n:5 5
será el intervalo para la selección de cada unidad muestral. Si tengo las personas por numero seria así:
elijo el 5, 10, 15, 20, .. así hasta llegar al 100. Si termino la lista y no he
llegado al 100, vuelvo a empezar de nuevo, pero siempre con el intervalo que me
ha salido.
-
Estratificado.
1. Se caracteriza por la subdivisión de
la población en subgrupos o estratos, debido a que las variables principales
que deben someterse a estudio presentan cierta variabilidad o distribución
conocida que puede afectar a los resultados.
-
Conglomerado.
1. Se usa cuando no se dispone de una
lista detallada y enumerada de cada una de las unidades que conforman el
universo y resulta muy complejo elaborarla. En la selección de la muestra en
lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados.
2. En este tipo de muestreo el
investigador no conoce la distribución de la variable.
3. Las inferencias que se hacen en una
muestra conglomerada no son tan confiables como las que se obtienen en un
estudio hecho por muestreo aleatorio.
Muestreo no probabilístico.
- No puede considerarse que la muestra sea representativa de una población.
- Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
- Por conveniencia o intencional: en el que el investigador decide, según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que desea conocer.
TIPOS:
1. Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc.
2. Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente.
Tamaño de la muestra.
El tamaño de la muestra a tomar va a depender de:
-
Error
estándar.
-
De
la mínima diferencia entre los grupos de comparación que se considera
importante en los valores de la variable a estudiar.
-
De
la variabilidad de la variable a estudiar (varianza en la población).
-
El
tamaño de la población de estudio.
Calculo del tamaño de una muestra para estimar la media de
una población:
n= Z2x S2/e2
Z es un valor que
depende del nivel de confianza 1 – α con que se quiera dar
a los intervalos calculados a partir de estimadores de esa muestra.
(Para nivel
de confianza 95%, z= 1.96; y para nivel de confianza 99% z= 2.58).
S2 es la
varianza poblacional.
e: es el error máximo
aceptado por los investigadores en las diferencias entre los grupos de comparación
de la variable a estudiar.
Si tras esta operación
se cumple el resultado: N > n(n-1),
el cálculo del tamaño muestral termina
aquí.
Si no se cumple,
obtendremos el tamaño de la muestra con esta formula :
n´=n/1+(n/N)
Error estándar.
Es la medida que trata de captar la variabilidad de los valores de la media en todas
las posibles muestras de un tamaño determinado, en general, el error estándar de cualquier estimador, una media, una proporción, etc., mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
Cuanto
más pequeño es el error estándar de un estimador, más nos podemos fiar
del
valor de una muestra concreta.
Cálculo del error estándar.
Depende de cada estimador:
- Error estándar para una media :
- Error estándar para una proporción (frecuencia relativa):
( s=desviación típica n=tamaño de la muestra p=proporción del estimador).
Teorema central del límite.
Para
estimadores que pueden ser expresados como suma de valores muestrales, la
distribución de sus valores sigue
una distribución normal con media de la población y desviación típica igual al error
estándar del estimador de que se trate.
estándar del estimador de que se trate.
Si sigue una distribución normal, sigue los principios
básicos de ésta:
- 1 S 68,26% de las observaciones
(muestras).
-
2 S 95,45% de las
observaciones.
-
1,95 S 95% de las observaciones
-
3 S 99,73%
de las observaciones.
-
2,58 S
99% de las observaciones.
Intervalos de confianza.
Son un medio de conocer el parámetro en una población
midiendo el error que tiene que ver con el azar (error aleatorio).
Se trata de un par de números tales que, con un nivel de
confianza determinados, podamos asegurar que el valor del parámetro es mayor o
menor que ambos números.
Se calcula considerando que el estimador muestral sigue una
distribución normal, como establece la teoría central del límite.
Cálculo:
-
-
Z
es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo
(α=error máximo
admisible: 5%).
-
Para
nivel de confianza 95% z=1,96.
-
Para
nivel de confianza 99% z=2,58.
-
El
signo
significa que cuando se
elija el signo negativo se conseguirá el extremo inferior del intervalo y
cuando se elija el positivo se tendrá el extremo superior.
Mientras mayor sea la confianza que queramos otorgar al
intervalo, éste será más amplio, es decir, el extremo inferior y el superior
del intervalo estarán más distanciados y, por tanto, el intervalo será menos
preciso.
Se puede calcular intervalos de confianza para cualquier
parámetro: medias aritméticas, proporciones, riesgos relativos, odds ratio, …

No hay comentarios:
Publicar un comentario