lunes, 8 de julio de 2013

MEDIDAS DE DISPERSIÓN

     El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada.


En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio.


A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva.

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

1. RANGO :
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el más bajo (X1 ó Xmin) en un conjunto de datos.
Rango para datos no agrupados;

R = Xmáx.-Xmín = Xn-X1
Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 años

Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango tomando el límite superior de la última clase menos el límite inferior de la primera clase.

Rango para datos agrupados;
R= (lim. Sup. De la clase n – lim. Int. De la clase 1)
Ejemplo:



Clases
P.M.
Xi
fi
fr
fa↓
fa↑
fra↓
fra↑
7.420 – 21.835
14.628
10
0.33
10
30
0.33
1.00
21.835 – 36.250
29.043
4
0.13
14
20
0.46
0.67
36.250 – 50.665
43.458
5
0.17
19
16
0.63
0.54
50.665 – 65.080
57.873
3
0.10
22
11
0.73
0.37
65.080 – 79.495
72.288
3
0.10
25
8
0.83
0.27
79.495 – 93.910
86.703
5
0.17
30
5
1.00
0.17
Total
XXX
30
1.00
XXX
XXX
XXX
XXX



El rango de la distribución de frecuencias se calcula así:

R= (lim. Sup. De la clase n – lim. Int. De la clase 1) = (93.910 – 7.420) = 86.49

·        Propiedades del Rango o Recorrido:

·         El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores extremos (máximo y mínimo) en una distribución.

·         Puesto que el recorrido se basa en los valores extremos éste tiende s ser errático. No es extraño que en una distribución de datos económicos o comerciales incluya a unos pocos valores en extremo pequeños o grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersión con respecto a esos valores anormales, ignorando a los demás valores de la variable.

·         La principal desventaja del recorrido es que sólo está influenciado por los valores extremos,, puesto que no cuenta con los demás valores de la variable. Por tal razón, siempre existe el peligro de que el recorrido ofrezca una descripción distorsionada de la dispersión.



·         En el control de la calidad se hace un uso extenso del recorrido cuando la distribución a utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los cálculos es un factor de importancia.



2. DESVIACIÓN MEDIA:
     Esta medida de dispersión considera todos los datos, está definida como el promedio aritmético de los valores absolutos de la desviación de cada valor de la variable con respecto a la media aritmética.
      La desviación media utiliza la siguiente fórmula:




Dicha fórmula de forma más específica se representa de la siguiente manera:

Donde:

X : valor de cada observación.

N : número de observaciones en la muestra.

| |: Valor absoluto.


3.VARIANZA :

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por σ 2.


varianza                              varianza


Varianza para datos agrupados:

varianza                   varianza

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
varianza       varianza

Varianza para datos agrupados:
varianza                                   varianza
4. DESVIACIÓN TÍPICA:

La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.



de relación típica              desviación
Desviación típica para datos agrupados:

desviación típica       desviación


Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

desviación típica                                           desviación típica
Desviación típica para datos agrupados:


desviación típica                             desviación típica