domingo, 24 de mayo de 2015

TEMA 8: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN

El tema 8 comenzó realmente en el seminario numero 3, ya que el profesor Manuel Pabón nos explicó en este seminario unas pinceladas sobre lo que íbamos a dar en el tema. En este, hemos trabajado las diferentes formas de medidas estadística.
En primer lugar, empezamos a hablar sobre las medidas de tendencia central; estos nos dan idea de la magnitud o tamaño de los datos. Entre estas destacamos:
  • La media, esta es la suma de todos los valores de la variable (x) entre el total de observaciones (n), La formula seria para averiguarla seria:

X =∑x / n

Para que se comprenda mejor, voy a poner un ejemplo:
Tenemos 8 sujetos con edades comprendidas: 14-17-18-11-20-19-18-18
La media entre estos sujetos sería x= (14+17+18+11+20+19+18+18) = 16,875 años
También existe una media ponderada. Esto es la media pero de los datos agrupados en intervalos.

X =∑(mcfi)/ n

La mc es la marca de clase. Esta se obtiene mediante la suma de los extremos dividido entre dos si ese es el número de extremos, es decir, la media entre los extremos del intervalo.
La fi es la frecuencia absoluta.
  • Después esta la mediana que es el valor de la observación que deja el 50% de las observaciones menores y el otro 50% mayores. Se sitúa en medio del porcentaje. Dependiendo si el número de observaciones es par o impar se utiliza una formula para averiguarlo. Si es impar; utilizamos (n/2)+1 y en cambio, si es par; utilizamos (n/2) y (n/2)+1
Os muestro un ejemplo para que os resulte más fácil de entender: preguntamos la edad que tenían 7 niños de una escuela y obtenemos los siguientes datos: 5, 6, 9, 10, 12, 13, 15 años. En el ejemplo puesto, la media es 10 ya que dejamos 3 valores a la izquierda y otros 3 a la derecha.
  • El ultimo concepto de medidas centrales es la moda que es el valor que se expresa con mayor frecuencia; el que más se repite. Se puede calcular para cualquier tipo de variable.
Si los datos están agrupados, se habla de clase modal o de intervalo modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.

Esta parte del tema para mi no me resulto nada difícil ya que desde que somos chicos en matemáticas del instituto o colegio hemos hecho este tipo de medidas.

Después, el tema continua con las medidas de posición; estas son los cuantiles. Solo se pueden utilizar para variables cuantitativas. Puede ser de varios tipos según cuantas veces se divida la muestra y los más usados son:
  • Percentiles: Se divide en 100 partes
  • Deciles: Se divide en 10 partes.
  • Cuartiles: Se divide en 4 partes.
Una vez explicada las medidas de tendencia central y las de posición, pasamos a las que pienso yo que son más importantes ya que es la que nos proporciona mayor información que las otras dos. Esta nos da la información sobre la heterogenidad de las muestras. En estas destacamos:

    • Rango; nos muestra el tamaño de la muestra; es la diferencia entre el mayor y el menor valor.
          •    /xn-x1/

                 
                 
                 
    • Desviación media; es la media aritmética de las distancias de cada observador con respecto a la media de la muestra.
        •    dm=∑|xix¯| / n
       
       
    • Desviación típica (S); cuantifica el error que cometemos si representamos una muestra unicamente por su media. La desviación típica más utilizada es +2S y -2S.



    • Varianza; es el cuadrado de la desviación típica.


    • Recorrido intercuartílico, es la diferencia entre el tercer cuartil y el primero. 
                          /Q3- Q1/       
    • Coeficiente de variación: relaciona la variación tipica con la media. Tiene que adoptar valores de 0 a 1. Luego podemos pasarlo a porcentaje.  
              c.v= s/x
Esta parte ya se comenzó a complicar ya que fuimos metiendo conceptos que no habíamos dado anteriormente.

Posteriormente, pasamos al tema de las distribuciones normales. Estas son aquellas distribuciones que tienen forma acampanada y son simetricas respecto a los valores de posición central (media, la moda y la mediana coinciden) . A este tipo de curvas se les llama campana de Gauss.



Esta distribución sigue unos principios básicos; 68 % presenta una desviación de +/- 1, si es 95 % +/-2 y 99% +/-3.
 
Para finalizar este tema, hemos aprendido las asimetrias y curtosis.
Respecto a las asimetrías, pueden ser los siguientes resultados:
    • Si g1= 0, la distribución es simétrica, ya que existe la misma concentración de valores a la derecha que a la izquierda.
    • Si g1>0, distribución asimétrica positiva, existe mayor concentración de valores a la derecha que a la izquierda.
    • Si g1<0, distribución asimétrica negativa, existe mayor concentración de valores a la izquierda que a la derecha.

En cuanto a las curtosis, que sirve para medir el grado de concentración de los valores que toma en torno a su media.


Podemos encontrar tres tipos de distribuciones:
    • g2=0, distribución mesocúrtica.
    • g2>0, distribución leptocúrtica.
    • g2<0, distribución platicúrtica.
 
 
 
Para concluir, me parece que este tema está resultando más complicado ya que comprende lo que es realmente estadística. No obstante, me parece que el tema es muy importante para la realización de mi trabajo de investigación de la asignatura y todos los proyectos que quiera llevar a cabo en el futuro.   

No hay comentarios:

Publicar un comentario