miércoles, 12 de junio de 2013

Medidas de tendencia central o posición y medidas de dispersión o variabilidad.

Medidas de tendencia central.

Son estadísticos que nos dan ideas de la magnitud o tamaño de los datos.

MEDIA: Se calcula sumando todas las observaciones y dividiéndola por el número de ellas.

MEDIANA: Es el valor que, ordenadas las observaciones en forma creciente, ocupa la posición central. En el caso de que tengamos un número impar de observaciones la mediana ocuparía el lugar (n+1)/2 y en el caso de un número par, la mediana sería la media de las dos observaciones que ocupan las posiciones centrales.

MODA: Es el valor que más se repite. Si hay dos, se considera bimodal, si hay más de dos, multimodal.

CUANTILES. Se calculan para variables cuantitativas y, al igual que la mediana, solo tienen en cuenta la posición de los valores en la muestra.
Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente.


Medidas de dispersión. 

Indican la variabilidad de un conjunto de observaciones, por lo tanto, complementan y mejoran los datos aportados por las medidas de tendencia central.

RANGO O RECORRIDO: Diferencia entre el mayor y el menor valor de la muestra.  
                                                                  | XN- X1|
                                                                         
DESVIACIÓN MEDIA:  Media aritmética de las distancias de cada observación con respecto a la media de la muestra.

                                                             Dm= € |Xi-X|/n

DESVIACIÓN TÍPICA: Destaca el error que cometemos si sólo tenemos en cuenta la media.
 
                                                           S = √€ (Xi-X)2/n-1  

VARIANZA: Expresa el mismo valor, pero en valores cuadráticos.

                                                           S2 = (Xi-X)2/n-1
RECORRIDO INTERCUARTÍLICO: La diferencia entre el 3º y 1º cuartil.            
                                                                   
                                                                    |Q3-Q1|

COEFICIENTE DE VARIACIÓN: Nos sirve para comparar la heterogeneidad o variabilidad, independientemente de las unidades de medida.
 
                                                                C.V = S/X

Asimetrías y Curtosis.

Asimetria 

Es una medida de forma de una distribución que permite identificar y describir la manera en que los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.

              
 
Asimetría es al lado contrario al que vemos el pico, es decir, si vemos el pico 
hacia la derecha la asimetría es a la izquierda, justo en el lado que queda la 
media de la mediana.                


Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media. Es adimensional y se define:
  
                                                                          

Los resultados pueden ser los siguientes:

-          g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
-          g1>0 (distribución asimétrica positiva; existe mayor concentración de valores  a la derecha de la media que a su izquierda).
-          g1<0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).


                              
    

                                           (Es al contrario, la positiva es negativa)


Curtosis o apuntamiento:

Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentración de los valores que toma en torno a su media.
Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.

                                 
    

Los resultados pueden ser los siguientes:
-          g2=0 (distribución mesocúrtica). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
-          g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
-          g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
 
                                 
                                 


                                                     
                                                     
                   La curtosis se puede hallar para gráficas asimétricas, pero cambia la fórmula.





         










 




No hay comentarios:

Publicar un comentario