Distribución de frecuencias Unidad de Ciencias Básicas

Distribución de frecuencia

Es una ordenación tabulada de los datos recopilados en una investigación o estudio, de acuerdo a la clase o intervalo a que pertenece y con el número de veces o frecuencias que se repite. Una distribución de frecuencias se represente por medio de tablas de frecuencia y gráficas.

Clases de frecuencias

  • Frecuencia absoluta.
  • La frecuencia absoluta de una variable estadística, es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por fi

  • Frecuencia relativa.
  • Es una medida útil para poder comparar. La frecuencia relativa es el cociente entre la frecuencia absoluta y el tamaño de la muestra. Generalmente se expresa en porcentaje. Se denota por fr
    Donde n = Tamaño de la muestra fi = frecuencia absoluta

  • Frecuencia Absoluta Acumulada.
  • Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Fi.

  • Frecuencia Relativa Acumulada.
  • Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fr

    Ejemplo
    Tomamos para ello los datos relativos a las notas de una prueba de matemáticas.

    Rango de las notas( Intervalos) Número de notas (Frecuencia Absoluta) Frecuencia Absoluta Acumulada Frecuencia Relativa (%) Frecuencia Relativa Acumulada (%)
    fi Fi fr Fr
    1 - 2 16 16 16/50 = 32% 32%
    2 - 3 20 16 + 20 = 36 20/50 = 40% 32% + 40% = 72%
    3 - 4 9 36 + 9 = 45 9/50 = 18% 72% + 18% = 90%
    4 - 5 5 45 + 5 = 50 5/50 = 10% 90% + 10% = 100%
    Total 50 100%

Pasos para elaborar una distribución de frecuencias

  1. Ordenar los datos u observaciones, desde el menor hasta el mayor o viceversa

  2. Se determina el rango o amplitud de la serie de datos, que es la diferencia entre el valor mayor y el valor menor.

    Rango o Amplitud = C = Xmax. – Xmin.

  3. Se determina el número de intervalos o clases (K) que se utilizan para agrupar los datos.

  4. En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20 intervalos o clases. Sin embargo, si no se tiene seguridad del número de intervalos a utilizar, se puede aplicar la regla de Sturges, con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios para agruparlos.

    Número de Intervalos = K = 1 + 3.322 log. n

  5. Una vez escogido el número de intervalos se determina la amplitud de cada clase o intervalo (C). Esta amplitud es igual al rango de los datos dividida en el número de intervalos. El primer intervalo debe contener el menor valor de los datos y el último intervalo debe contener el mayor valor de los datos.


  6. Se calcula la marca de clase (Xi), que es el valor medio o promedio de cada intervalo. el cual sirve para facilitar el cálculo de algunas medidas de posición y de dispersión.


Ejemplo Se determinaron las ventas en millones de pesos durante el mes de junio, en 34 almacenes de la ciudad de Bogotá, obteniéndose los siguientes datos:

Almacén Ventas* Almacén Ventas* Almacén Ventas* Almacén Ventas* Almacén Ventas*
1 10.6 8 11.6 15 16.5 22 12.3 29 8.6
2 12.5 9 14.9 16 15.0 23 9.7 30 8.5
3 11.1 10 12.5 17 10.3 24 12.0 31 10.1
4 9.2 11 12.5 18 12.4 25 11.8 32 12.4
5 11.5 12 12.3 19 9.1 26 12.7 33 11.1
6 9.9 13 12.2 20 7.8 27 11.4 34 10.2
7 11.9 14 10.8 21 11.3 28 9.3

* Ventas en millones de pesos.


Aplicando la fórmula de Sturges para el cálculo del número de intervalos en que se dividen las observaciones obtenemos:
k = 1 + 3,322 log 34 = 1 + 3,322 • 1,53148 = 6,08757

Es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(max) = 16.5 y el menor
x(min) = 7.8, la amplitud sugerida es:

Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como intervalos en los que clasificar los datos

[7'5 - 9), [9 - 10'5), [10'5 - 12), [12 - 13'5), [13'5 - 15), [15 - 16'5]

Los datos agrupados en los intervalos obtenidos, proporcionan la siguiente tabla de distribución de frecuencia.

No de intervalos Intervalos fi Fi fr Fr Xi
1 7'5 - 9'0 3 3 8.8% 8.8% 8.25
2 9'0 - 10'5 8 11 23.6% 32.4% 9.75
3 10'5 – 12' 10 21 29.4% 61.8% 11.25
4 12' - 13'5 10 31 29.4% 91.2% 12.75
5 13'5 – 15' 1 32 2.9% 94.1% 14.25
6 15' - 16'5 2 34 5.9% 100% 15.75

Representación gráfica

Los gráficos que representan de manera adecuada una distribución de frecuencias son:

  • Histograma de frecuencia
  • Está formado por un conjunto de rectángulos, cada uno levantado para cada intervalo, de tal manera que la base será igual a la amplitud C y la altura está dado, ya sea por la frecuencia absoluta o por la relativa. En el ejemplo de las ventas, (tabla anterior) tenemos:

  • Polígono de frecuencia
  • Con la misma información que fue utilizada para elaborar el histograma de frecuencia se puede dibujar el polígono de frecuencia. Se establece los puntos medios del intervalo, denominados marca de clase, que se colocan en el eje horizontal o abscisa. Para cada valor de la variable corresponderá un valor de la frecuencia señalándose en el plano cartesiano por un punto; luego de establecidos todos los puntos, se unen mediante líneas rectas, las que en conjunto forman el polígono. El polígono de frecuencia para el ejemplo anterior es:

    • Ojiva
    • Es el gráfico de las frecuencias acumuladas. Para el trazado de esta grafica, en primer lugar, se ubican los puntos en el plano cartesiano. Dichos puntos se determinan teniendo en cuenta la marca de clase (eje x) y las frecuencias absolutas o relativas acumuladas (eje y) tal como se presenta a continuación:

Inicio