Investigo, luego existo: Inferencia estadística.

De lo particular a lo general.

http://pendientedemigracion.ucm.es/info/genetica/Estadistica/Poblacion%20y%20muestra.JPG

Cuándo se plantea un estudio para observar un determinado fenómeno, el interés del investigador no es sólo en los sujetos de la muestra, sino la población en general, de donde salió la misma.

Hay herramientas que permiten generalizar los resultados encontrados en la muestra a la población.

Estos procesos estadísticos forman parte de lo que se denomina inferencia estadística.

Es primordial para ello elegir muestras de tal forma que éstas reflejen las características de la población. Son las técnicas de muestreo.

Tipos de muestreo.

- Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra.

1. Aleatorio simple. P=1/n

2. Aleatorio sistemático.

3. Estratificado.

4. Conglomerados.

- No probabilístico o de conveniencia del investigador. Puede haber personas en la población que no tengan probabilidad o que se desconozca,

de ser seleccionado en la muestra.

1. Accidental.

2. Por cuotas.

Muestreo probabilístico.

Todos y cada uno de los elementos tienen la misma probabilidad de ser elegidos.

- Aleatorio Simple.

1. Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:

De sorteo o rifa: desventaja de este método es que no puede usarse cuando el universo es grande.

Tabla de números aleatorios: más económico y requiere menor tiempo.

- Aleatorio Sistematico.

1. Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.

Ejemplo: si N:500 (población) y n:100 (personas que queremos en la muestra N/n:5 5 será el intervalo para la selección de cada unidad muestral. Si tengo las personas por numero seria así: elijo el 5, 10, 15, 20, .. así hasta llegar al 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo, pero siempre con el intervalo que me ha salido.

- Estratificado.

1. Se caracteriza por la subdivisión de la población en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados.

- Conglomerado.

1. Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados.

2. En este tipo de muestreo el investigador no conoce la distribución de la variable.

3. Las inferencias que se hacen en una muestra conglomerada no son tan confiables como las que se obtienen en un estudio hecho por muestreo aleatorio.

Muestreo no probabilístico.

-          No se sigue el proceso aleatorio.

-          No puede considerarse que la muestra sea representativa de una población.

-          Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios      identificados para los fines del estudio que realiza.

-          Por conveniencia o intencional: en el que el investigador decide, según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que desea conocer.

TIPOS:

1. Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc.
2. Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente.

Tamaño de la muestra.

El tamaño de la muestra a tomar va a depender de:

- Error estándar.

- De la mínima diferencia entre los grupos de comparación que se considera

importante en los valores de la variable a estudiar.

- De la variabilidad de la variable a estudiar (varianza en la población).

- El tamaño de la población de estudio.

Calculo del tamaño de una muestra para estimar la media de una población:

n= Z²x S²/e²

Z es un valor que depende del nivel de confianza 1 – α con que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra.

(Para nivel de confianza 95%, z= 1.96; y para nivel de confianza 99% z= 2.58).

S² es la varianza poblacional.

e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.

Si tras esta operación se cumple el resultado: N > n(n-1),

el cálculo del tamaño muestral termina aquí.

Si no se cumple, obtendremos el tamaño de la muestra con esta formula :

n´=n/1+(n/N)

Error estándar.

Es la medida que trata de captar la variabilidad de los valores de la media en todas

las posibles muestras de un tamaño determinado, en general, el error estándar de cualquier estimador, una media, una proporción, etc., mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.

Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar

del valor de una muestra concreta.

Cálculo del error estándar.

Depende de cada estimador:

- Error estándar para una media :

- Error estándar para una proporción (frecuencia relativa):

( s=desviación típica n=tamaño de la muestra p=proporción del estimador).

Teorema central del límite.

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error
estándar del estimador de que se trate.

Si sigue una distribución normal, sigue los principios básicos de ésta:

- 1 S 68,26% de las observaciones (muestras).

- 2 S 95,45% de las observaciones.

- 1,95 S 95% de las observaciones

- 3 S 99,73% de las observaciones.

- 2,58 S 99% de las observaciones.

Intervalos de confianza.

Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).

Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.

Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.

Cálculo:

- Z es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo

(α=error máximo admisible: 5%).

- Para nivel de confianza 95% z=1,96.

- Para nivel de confianza 99% z=2,58.

- El signo

significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior.

Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo será menos preciso.

Se puede calcular intervalos de confianza para cualquier parámetro: medias aritméticas, proporciones, riesgos relativos, odds ratio, …

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgU0BbwJd1E1vhWYo4yrESPf2SOLHCV2bw9U0ZAafqiQO0j_cC_8RYkZPVWSkV-NVlzvYQZZ2zAbUxtzk7XPcg5ExaQM_z5J8lVQv4spVJMqUl-rQU09cBE32xjbRo6BmoXkrejwVaBXN8/s400/Hip%25C3%25B3tesisDios.Caric.jpg

Investigo, luego existo

miércoles, 12 de junio de 2013

Inferencia estadística.