Distribución de Frecuencias


Distribución de Frecuencias


Agrupación de datos


Suponga que el director de una escuela, al inicio de las labores escolares, desea clasificar a los estudiantes del sexto grado, en tres secciones, y desea hacerlo de acuerdo a los resultados obtenidos en el examen de admisión. Los resultados se presentan en la siguiente tabla:

47  58  38  35  50  59  47  51  42  45
45  53  33  32  49  48  50  50  41  45
62  48  28  30  55  43  43  44  40  45
28  30  29  29  55  49  33  39  39  46
28  37  47  57  49  51  39  40  45  45
58  35  60  54  55  49  34  44  50  46
59  30  61  43  54  44  30  44  45  47
38  34  53  38  43  51  36  49  45  34
33  33  54  39  50  50  36  44  45  35
43  48  38  43 52   44  44  40  46  45
60  53  40  56  48  35  45  42  47  45
60  52  40  42  35  40  45  41  45  39   


El conjunto de datos de esta tabla constituye una serie estadística simple. La serie de datos no da mayor información; no se puede conocer como se distribuye la variable rendimiento de los estudiantes. Entonces si queremos comenzar a descubrir peculiaridades de nuestra variable, comenzaremos a ordenar los datos. Estos se pueden ordenar de forma creciente o decreciente, según su magnitud.
Los valores de la tabla ordenados en forma creciente se muestran a continuación.


28  33  37  40  43  45  46  49  51  55     
28  33  38  40  43  45  46  49  52  56         
28  33  38  40  43  45  47  49  52  57    
29  34  38  40  44  45  47  49  53  58     
29  34  38  41  44  45  47  49  53  58    
30  35  39  41  44  45  47  50  53  59    
30  35  39  42  44  45  47  50  54  59  
30  35  39  42  44  45  47  50  54  60
30  35  39  42  44  45  48  50  54  60    
32  35  39  43  44  45  48  50  55  60       
33  36  40  43  45  45  48  50  55  61       
33  36  40  43  45  46  48  51  55  61     


Los datos ordenados nos dan una pequeña información; por ejemplo conocemos el menor y el mayor de los datos, también podemos ver cuál es el valor más frecuente.

Si queremos seguir descubriendo mayor información de nuestra variable, pasaremos a formar una tabla de frecuencias.

Puntajes(x)
Frecuencias
Puntajes (x)
Frecuencias
28
3
46
3
29
2
47
6
30
4
48
4
31
0
49
5
32
1
50
6
33
4
51
2
34
3
52
2
35
5
53
3
36
2
54
3
37
1
55
4
38
4
56
1
39
5
57
1
40
6
58
2
41
2
59
2
42
3
60
3
43
6
61
1
44
7
62
1
45
13


                                                              TOTAL           120


Con esta tabla ya podemos ver el número de veces que se repite cada valor que toma nuestra variable, y así podemos ver que el valor más frecuente es 45. Entonces vamos entender por frecuencia, el número de veces que un valor o dato se repite en una serie estadística.


Podemos seguir descubriendo características de nuestra variable; para esto vamos a proceder a clasificar nuestros datos en grupos, llamados clases; por ejemplo cuántos alumnos han obtenido puntajes entre 28 y 32 inclusive; para cada una de estas clases caerá un determinado número de valores comprendidos entre estos dos limites de cada clase; a esos números les llamaremos frecuencias de clases. Al conjunto de clases y sus respectivas frecuencias, se le llama “Distribución de clases y frecuencias”. A continuación presentamos la distribución de los datos de nuestro problema.



Puntajes (x)           Frecuencia
28 – 32                        10
33 – 37                        15
38 – 42                        20
43 – 47                        35
48 – 52                        19
53 – 57                        12
58 – 62                          9
                  TOTAL      120


En la anterior distribución, los valores de la izquierda: 28, 33, 38, etc. Se llaman “limites inferiores aparentes de clase”, y a los de la derecha (32, 37, 42, etc) se llaman “limites superiores aparentes de clase”. A la diferencia de límite superior y el inferior más uno, se le llama “intervalo de clase”; en formula queda así:


ic =  ls – li + 1

Donde:

ic = intervalo de clase
ls = límite superior aparente
li = límite inferior aparente

Se  ha de estar preguntando si siempre hay que utilizar intervalos de cinco para agrupar los datos de una serie estadística, y si el número de clases tiene que ser siete, como en nuestro ejemplo. El intervalo de clase no es arbitrario, depende de la amplitud o rango de la serie estadística. La amplitud o rango no es más que la diferencia entre el mayor y el menor valor que toma la variable que se estudia; si escribimos esto en formula queda así:
AT= Xmayor -  Xmenor

En el ejemplo que venimos utilizando Xmayor es 62 y Xmenor es 28; entonces AT= 62 – 28 = 34.
Entonces, el intervalo que utilizaremos para transformar una serie simple en una distribución de clases y frecuencias, estará determinado por la siguiente relación: 



En donde K es el número de clases que deseamos obtener (k = 5, 6, 7,…,15).
Otra manera para determinar el intervalo de clase más adecuado es utilizando la fórmula empírica que  propone Sturges:


En la cual:

ic = intervalo de clase
N = nùmero de términos de la serie
Log10 = logaritmo ordinario de base 10.




No hay comentarios:

Publicar un comentario