320 likes | 1.14k Views
Medidas de Tendencia central. Se les llama medidas de tendencia central porque general mente la acumulación más alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comúnmente empleadas son : Media aritmética Mediana Moda Media geométrica
E N D
Medidas de Tendencia central Se les llama medidas de tendencia central porque general mente la acumulación más alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comúnmente empleadas son : Media aritmética Mediana Moda Media geométrica Media armónica Los cuantilos
Moda • La moda es el valor que aparece con mayor frecuencia en la serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21. • La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fácilmente : es la altura más corriente, es la velocidad más común, etc. Además tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos. • La principal limitación esta en el hecho de que requiere un número suficiente de observaciones para que se manifieste o se defina claramente. • Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga varias modas.
Mediana • La mediana toma en cuenta la posición de los datos y se define como el valor central de una serie de datos o, más específicamente, como un valor tal que no más de la mitad de las observaciones son menores que el y no más de la mitad mayores. • El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el número de datos es par, existirán dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos.
Los Cuantilos • En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. Así como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedaría dividido en cuatro partes y cada parte se llamara cuartilo. • Pero el conjunto puede dividirse también por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantilos. • Tanto la mediana, como los cuartilos y los deciles pueden expresarse como percentiles.
Así que conociendo los percentiles se puede averiguar cualquier cuantilo. • Para el calculo de los percentiles, el conjunto de datos debe estar ordenado, luego se aplica la siguiente formula : • Pm = m (n+1) termino 100 • Donde : Pm = Percentil m. Valor tal que un m/100 de las observaciones son menores que el y un 1 - m/100 son mayores. • m = Número que indica el percentil que se quiere. Por ejemplo, si m = 43, esto quiere decir que se quiere el percentil 43 (P43). • n = Número total de observaciones.
Media Aritmética • La media aritmética es el promedio más comúnmente usado, este puede ser simple o ponderado. • La media aritmética simple esta dada por la formula SX/n y que significa: la suma de todos los valores dividida por el número de datos. • Media Aritmética Ponderada • Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato. • En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos, se obtendrá la misma suma que si se hubieran sumado uno por uno.
Media Geométrica • La media geométrica es la raíz enésima del producto de todos los valores de la serie. • Media Armónica • La media armónica se define como el recíproco de la media aritmética de los recíprocos de los valores. • y reacomodando la fórmula se tiene:
Tablas estadísticas • Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas modalidades han sido agrupadas en un número k de clases, que denotamos mediante . • Para cada una de las clases ci, • , introducimos las siguientes magnitudes:
Frecuencia absoluta • de la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase. • Frecuencia relativa • de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir • Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por representa el porcentaje de la población que comprende esa clase. • Frecuencia absoluta acumulada • Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci:
Frecuencia relativa acumulada • , Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir, • Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que • o lo que es lo mismo, • Frecuencia absoluta (ni): Número de elementos que presentan la clase xi.
Frecuencia absoluta acumulada: . Frecuencia relativa acumulada:
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente:
Medidas de posición Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ". Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se describen las medidas de posición más comunes utilizadas en estadística, como lo son:deciles,percentiles,cuartiles.
MEDIDAS DE DISPERSIÓN: • Rango: • Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.
Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di . Desviaciòn media. Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
Varianza: • Es la media de los cuadrados de las desviaciones, y la denotaremos por o también por • Aunque también es posible calcularlo como: r
Desviación típica: • Es la raíz cuadrada de la varianza, se denota por Sx .
Cuasivarianza: • Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por
Cuasidesviación típica: • La raíz cuadrada de la cuasivarianza y la denotaremos por
Coeficiente de Variación: • Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.
Datos agrupados • Son datos que están organizados (formando grupos). Podemos formar más o menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le llamamos clase. Rara vez se emplean menos de seis clases o màs de quince.
Ventajas • Facilidad y rapidez al manejo de datos. • Se notan rápidamente el valor mayor y el valor menor de los datos • Se puede dividir fácilmente los datos en secciones. • Se puede observar si algún valor aparece mas de una vez en el ordenamiento. • Se observa la distancia entre los valores sucesivos de los datos.
Datos no agrupados • Son datos no agrupados cuando se consideran y analizan todos los valores observados tal como se obtuvieron. Es conveniente y mas sencillo trabajar a estos datos como no agrupados cuando la muestra no es muy grande. De preferencia que sea una cantidad menor de 30 datos. También resulta conveniente trabajarlos así cuando se quiere que el peso de cada observación se vea reflejado en el resumen de los datos.
ventajas • Resulta más fácil y rápido trabajar con los datos no agrupados. DESVENTAJAS • Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de equivocarse.