Distribución
de Frecuencias
Agrupación
de datos
Suponga
que el director de una escuela, al inicio de las labores escolares, desea
clasificar a los estudiantes del sexto grado, en tres secciones, y desea
hacerlo de acuerdo a los resultados obtenidos en el examen de admisión. Los
resultados se presentan en la siguiente tabla:
47 58
38 35 50
59 47 51
42 45
45 53
33 32 49
48 50 50
41 45
62 48
28 30 55
43 43 44
40 45
28 30
29 29 55
49 33 39
39 46
28 37
47 57 49
51 39 40
45 45
58 35
60 54 55
49 34 44
50 46
59 30
61 43 54
44 30 44
45 47
38 34
53 38 43
51 36 49
45 34
33 33
54 39 50
50 36 44
45 35
43 48
38 43 52 44
44 40 46
45
60 53
40 56 48
35 45 42
47 45
60 52
40 42 35
40 45 41
45 39
|
El conjunto de datos de
esta tabla constituye una serie estadística simple. La serie de datos no da
mayor información; no se puede conocer como se distribuye la variable
rendimiento de los estudiantes. Entonces si queremos comenzar a descubrir
peculiaridades de nuestra variable, comenzaremos a ordenar los datos. Estos se
pueden ordenar de forma creciente o decreciente, según su magnitud.
28 33 37 40 43 45 46 49
51 55
28 33 38
40
43 45 46
49 52 56
28 33 38
40
43 45 47
49 52 57
29 34
38 40 44 45 47
49 53 58
29
34
38 41 44
45 47 49
53 58
30 35
39 41 44
45 47 50 53 59
30 35 39 42
44 45 47
50 54 59
30 35
39 42 44 45 47
50 54 60
30 35 39 42 44 45
48 50 54
60
32 35
39 43 44
45 48 50
55 60
33 36
40 43 45
45 48 50
55 61
33 36
40 43 45
46 48 51
55 61
|
Los datos ordenados nos
dan una pequeña información; por ejemplo conocemos el menor y el mayor de los
datos, también podemos ver cuál es el valor más frecuente.
Si queremos seguir
descubriendo mayor información de nuestra variable, pasaremos a formar una
tabla de frecuencias.
Puntajes(x)
|
Frecuencias
|
Puntajes (x)
|
Frecuencias
|
28
|
3
|
46
|
3
|
29
|
2
|
47
|
6
|
30
|
4
|
48
|
4
|
31
|
0
|
49
|
5
|
32
|
1
|
50
|
6
|
33
|
4
|
51
|
2
|
34
|
3
|
52
|
2
|
35
|
5
|
53
|
3
|
36
|
2
|
54
|
3
|
37
|
1
|
55
|
4
|
38
|
4
|
56
|
1
|
39
|
5
|
57
|
1
|
40
|
6
|
58
|
2
|
41
|
2
|
59
|
2
|
42
|
3
|
60
|
3
|
43
|
6
|
61
|
1
|
44
|
7
|
62
|
1
|
45
|
13
|
||
TOTAL 120
|
Con esta tabla ya
podemos ver el número de veces que se repite cada valor que toma nuestra
variable, y así podemos ver que el valor más frecuente es 45. Entonces vamos
entender por frecuencia, el número de veces que un valor o dato se repite en
una serie estadística.
Podemos seguir
descubriendo características de nuestra variable; para esto vamos a proceder a
clasificar nuestros datos en grupos, llamados clases; por ejemplo cuántos
alumnos han obtenido puntajes entre 28 y 32 inclusive; para cada una de estas
clases caerá un determinado número de valores comprendidos entre estos dos
limites de cada clase; a esos números les llamaremos frecuencias de clases. Al
conjunto de clases y sus respectivas frecuencias, se le llama “Distribución de
clases y frecuencias”. A continuación presentamos la distribución de los datos
de nuestro problema.
Puntajes
(x) Frecuencia
|
28
– 32 10
33
– 37 15
38
– 42 20
43
– 47 35
48
– 52 19
53
– 57 12
58
– 62 9
|
TOTAL 120
|
En la anterior distribución,
los valores de la izquierda: 28, 33, 38, etc. Se llaman “limites inferiores
aparentes de clase”, y a los de la derecha (32, 37, 42, etc) se llaman “limites
superiores aparentes de clase”. A la diferencia de límite superior y el
inferior más uno, se le llama “intervalo de clase”; en formula queda así:
ic = ls – li + 1
Donde:
ic =
intervalo de clase
ls = límite superior
aparente
li = límite inferior
aparente
Se ha de estar preguntando si siempre hay que
utilizar intervalos de cinco para agrupar los datos de una serie estadística, y
si el número de clases tiene que ser siete, como en nuestro ejemplo. El intervalo
de clase no es arbitrario, depende de la amplitud o rango de la serie estadística.
La amplitud o rango no es más que la diferencia entre el mayor y el menor valor
que toma la variable que se estudia; si escribimos esto en formula queda así:
AT=
Xmayor - Xmenor
En el ejemplo que
venimos utilizando Xmayor es 62 y Xmenor es 28; entonces AT= 62 – 28 = 34.
Entonces, el intervalo
que utilizaremos para transformar una serie simple en una distribución de
clases y frecuencias, estará determinado por la siguiente relación:
En donde K es el número
de clases que deseamos obtener (k = 5, 6, 7,…,15).
Otra manera para
determinar el intervalo de clase más adecuado es utilizando la fórmula empírica
que propone Sturges:
En la cual:
ic =
intervalo de clase
N = nùmero de términos de
la serie
Log10 =
logaritmo ordinario de base 10.
No hay comentarios:
Publicar un comentario