viernes, 26 de septiembre de 2014


Distribución de Frecuencias


Agrupación de datos


Suponga que el director de una escuela, al inicio de las labores escolares, desea clasificar a los estudiantes del sexto grado, en tres secciones, y desea hacerlo de acuerdo a los resultados obtenidos en el examen de admisión. Los resultados se presentan en la siguiente tabla:

47  58  38  35  50  59  47  51  42  45
45  53  33  32  49  48  50  50  41  45
62  48  28  30  55  43  43  44  40  45
28  30  29  29  55  49  33  39  39  46
28  37  47  57  49  51  39  40  45  45
58  35  60  54  55  49  34  44  50  46
59  30  61  43  54  44  30  44  45  47
38  34  53  38  43  51  36  49  45  34
33  33  54  39  50  50  36  44  45  35
43  48  38  43 52   44  44  40  46  45
60  53  40  56  48  35  45  42  47  45
60  52  40  42  35  40  45  41  45  39   


El conjunto de datos de esta tabla constituye una serie estadística simple. La serie de datos no da mayor información; no se puede conocer como se distribuye la variable rendimiento de los estudiantes. Entonces si queremos comenzar a descubrir peculiaridades de nuestra variable, comenzaremos a ordenar los datos. Estos se pueden ordenar de forma creciente o decreciente, según su magnitud.
Los valores de la tabla ordenados en forma creciente se muestran a continuación.


28  33  37  40  43  45  46  49  51  55     
28  33  38  40  43  45  46  49  52  56         
28  33  38  40  43  45  47  49  52  57    
29  34  38  40  44  45  47  49  53  58     
29  34  38  41  44  45  47  49  53  58    
30  35  39  41  44  45  47  50  53  59    
30  35  39  42  44  45  47  50  54  59  
30  35  39  42  44  45  47  50  54  60
30  35  39  42  44  45  48  50  54  60    
32  35  39  43  44  45  48  50  55  60       
33  36  40  43  45  45  48  50  55  61       
33  36  40  43  45  46  48  51  55  61     


Los datos ordenados nos dan una pequeña información; por ejemplo conocemos el menor y el mayor de los datos, también podemos ver cuál es el valor más frecuente.

Si queremos seguir descubriendo mayor información de nuestra variable, pasaremos a formar una tabla de frecuencias.

Puntajes(x)
Frecuencias
Puntajes (x)
Frecuencias
28
3
46
3
29
2
47
6
30
4
48
4
31
0
49
5
32
1
50
6
33
4
51
2
34
3
52
2
35
5
53
3
36
2
54
3
37
1
55
4
38
4
56
1
39
5
57
1
40
6
58
2
41
2
59
2
42
3
60
3
43
6
61
1
44
7
62
1
45
13


                                                              TOTAL           120


Con esta tabla ya podemos ver el número de veces que se repite cada valor que toma nuestra variable, y así podemos ver que el valor más frecuente es 45. Entonces vamos entender por frecuencia, el número de veces que un valor o dato se repite en una serie estadística.


Podemos seguir descubriendo características de nuestra variable; para esto vamos a proceder a clasificar nuestros datos en grupos, llamados clases; por ejemplo cuántos alumnos han obtenido puntajes entre 28 y 32 inclusive; para cada una de estas clases caerá un determinado número de valores comprendidos entre estos dos limites de cada clase; a esos números les llamaremos frecuencias de clases. Al conjunto de clases y sus respectivas frecuencias, se le llama “Distribución de clases y frecuencias”. A continuación presentamos la distribución de los datos de nuestro problema.



Puntajes (x)           Frecuencia
28 – 32                        10
33 – 37                        15
38 – 42                        20
43 – 47                        35
48 – 52                        19
53 – 57                        12
58 – 62                          9
                  TOTAL      120


En la anterior distribución, los valores de la izquierda: 28, 33, 38, etc. Se llaman “limites inferiores aparentes de clase”, y a los de la derecha (32, 37, 42, etc) se llaman “limites superiores aparentes de clase”. A la diferencia de límite superior y el inferior más uno, se le llama “intervalo de clase”; en formula queda así:


ic =  ls – li + 1

Donde:

ic = intervalo de clase
ls = límite superior aparente
li = límite inferior aparente

Se  ha de estar preguntando si siempre hay que utilizar intervalos de cinco para agrupar los datos de una serie estadística, y si el número de clases tiene que ser siete, como en nuestro ejemplo. El intervalo de clase no es arbitrario, depende de la amplitud o rango de la serie estadística. La amplitud o rango no es más que la diferencia entre el mayor y el menor valor que toma la variable que se estudia; si escribimos esto en formula queda así:
AT= Xmayor -  Xmenor

En el ejemplo que venimos utilizando Xmayor es 62 y Xmenor es 28; entonces AT= 62 – 28 = 34.
Entonces, el intervalo que utilizaremos para transformar una serie simple en una distribución de clases y frecuencias, estará determinado por la siguiente relación: 



En donde K es el número de clases que deseamos obtener (k = 5, 6, 7,…,15).
Otra manera para determinar el intervalo de clase más adecuado es utilizando la fórmula empírica que  propone Sturges:


En la cual:

ic = intervalo de clase
N = nùmero de términos de la serie
Log10 = logaritmo ordinario de base 10.




jueves, 25 de septiembre de 2014


Introducción a la Estadística
Guión histórico

La estadística se estructuro como disciplina científica en el siglo pasado; sin embargo, ya en las civilizaciones antiguas se realizaban censos rudimentarios.
En la época moderna, la técnica del censo adquirió importancia relevante, especialmente para planificar la acción del gobierno.
A mediados del siglo XVII, la estadística se constituye como un método de investigación de los fenómenos colectivos, gracias a los trabajos realizados por John Graunt (1620- 1674), quien haciendo uso de datos demográficos (nacimientos, muertes, casamientos, etc.) recolectados en las parroquias de Londres, logró efectuar estudios que le permitieron describir, por inferencias relaciones y leyes demográficas de validez permanente, llegando incluso a estimar con bastante aproximación, por un camino indirecto, la población de Londres y otras ciudades inglesas.

Generalidades sobre el método estadístico

Definición de estadística

La Estadística es un método científico que trata con variables aleatorias con el objeto de recolectar, organizar y analizar los valores que estos generan.
Deben diferenciarse dos funciones del método estadístico: funciones descriptivas y funciones inferenciales.
El objeto fundamental de la descriptiva es analizar poblaciones, para conocer convenientemente el comportamiento de ellas; es decir describe las características del fenómeno en estudio.
La estadística inferencial, saca conclusiones o generalizaciones acerca del parámetro o parámetros de poblaciones a partir de muestras extraídas aleatoriamente.  

Definición de algunos términos utilizados en estadística.

Variable. Característica que puede tomar diferentes valores. Generalmente se simbolizan con las últimas letras del alfabeto X, Y, Z, etc.
Una variable que teóricamente puede tomar cualquier valor entre dos valores dados, se llama variable continúa; si no es así se llama variable discreta.
Una regla práctica para distinguir una variable discreta de una continúa es: si son el resultado de medir, son variables continuas y si son el resultado de contar, son discretas.
Variables de acuerdo a la función que desempeñan en una hipótesis. Pueden ser: variables independientes, variables dependientes y variables intervinientes.

Variable Independiente: es la que explica, condicionada o determina cambios en otra llamada dependiente, es decir la variable independiente es la supuesta causa de los cambios que se operan en la variable dependiente.

Variable dependiente: es la que es explicada, condicionada o determinada por la variable independiente.

Población: conjunto completo de individuos, objetos, o medidas que poseen alguna característica común observable.

Muestra: es un subconjunto o parte de la población, que lleva implícita todas las características del universo.

Parámetro: cualquier característica de una población que sea medible por ejemplo, el salario promedio de todos los obreros de la industria manufacturera.

Estadístico: Medida resultante del análisis de una muestra.

Estadística descriptiva

La estadística descriptiva estudia el mundo real; narra una realidad; trata con datos numéricos concretos que sirven de base al `proceso estadístico de descripción; para esto se vale de la recolección presentación, tabulación y análisis de datos.    

Estadística inferencial

La estadística inferencial, toma como base la realidad existente, a través de una parte de la población (muestra), para poder predecir o estimar lo que está ocurriendo en toda la población. Esta es la parte de la estadística más interesante, ya que con el auxilio de la teoría de la probabilidad, se desarrollan una cantidad de modelos matemáticos, cuyo papel es fotografiar la realidad, y luego a través de ellos, poder hacer estimaciones y proyecciones, de gran utilidad para los investigadores; para la toma de decisiones en cualquier actividad del hombre, que sea susceptible de observarse y medirse.