Comentarios
Contenido
A diferencia del rango y del rango intercuartil, la varianza es una medida de dispersión que tiene en cuenta la dispersión de todos los puntos de datos de un conjunto de datos. Es la medida de dispersión más utilizada, junto con la desviación estándar, que es simplemente la raíz cuadrada de la varianza. La varianza es la diferencia media al cuadrado entre cada punto de datos y el centro de la distribución medido por la media.
El primer paso es calcular la media. La suma es 33 y hay 5 puntos de datos. Por tanto, la media es 33 ÷ 5 = 6,6. A continuación, se toma cada valor del conjunto de datos, se resta la media y se eleva al cuadrado la diferencia. Por ejemplo, para el primer valor:
La desviación estándar es útil cuando se compara la dispersión de dos conjuntos de datos separados que tienen aproximadamente la misma media. El conjunto de datos con la desviación estándar más pequeña tiene una dispersión más estrecha de las medidas alrededor de la media y, por lo tanto, suele tener comparativamente menos valores altos o bajos. Un elemento seleccionado al azar de un conjunto de datos cuya desviación estándar es baja tiene más posibilidades de estar cerca de la media que un elemento de un conjunto de datos cuya desviación estándar es mayor. Sin embargo, la desviación típica se ve afectada por los valores extremos. Un solo valor extremo puede tener un gran impacto en la desviación típica.
Calcular la desviación estándar en r
Desviación Estándar s = Varianza s2 = Recuento n = Media \( \overline{x} \) = Suma de Cuadrados SS = Solución[ s = \sqrt{dfrac{{sum_{i=1}^{n}(x_i – \overline{x})^{2}{n – 1}}. \Para obtener estadísticas más detalladas, utilice la calculadora de estadísticas descriptivas
La desviación estándar es una medida estadística de la diversidad o variabilidad de un conjunto de datos. Una desviación estándar baja indica que los puntos de datos están generalmente cerca de la media o del valor medio. Una desviación estándar alta indica una mayor variabilidad en los puntos de datos, o una mayor dispersión respecto a la media.
La desviación estándar es una medida de la dispersión de los valores de los datos con respecto a la media. La fórmula de la desviación estándar es la raíz cuadrada de la suma de las diferencias al cuadrado con respecto a la media dividida por el tamaño del conjunto de datos.
Ejemplo de desviación estándar
La desviación típica de la población, la definición estándar de σ, se utiliza cuando se puede medir toda una población, y es la raíz cuadrada de la varianza de un conjunto de datos determinado. En los casos en los que se puede tomar una muestra de cada miembro de una población, se puede utilizar la siguiente ecuación para encontrar la desviación estándar de toda la población:
Para aquellos que no estén familiarizados con la notación de la suma, la ecuación anterior puede parecer desalentadora, pero cuando se aborda a través de sus componentes individuales, esta suma no es particularmente complicada. El i=1 en la suma indica el índice inicial, es decir, para el conjunto de datos 1, 3, 4, 7, 8, i=1 sería 1, i=2 sería 3, y así sucesivamente. Por lo tanto, la notación de suma significa simplemente realizar la operación de (xi – μ2) en cada valor a través de N, que en este caso es 5 ya que hay 5 valores en este conjunto de datos.
En muchos casos, no es posible realizar un muestreo de cada miembro dentro de una población, por lo que es necesario modificar la ecuación anterior para poder medir la desviación estándar a través de una muestra aleatoria de la población estudiada. Un estimador común para σ es la desviación estándar de la muestra, normalmente denotada por s. Vale la pena señalar que existen muchas ecuaciones diferentes para calcular la desviación estándar de la muestra ya que, a diferencia de la media de la muestra, la desviación estándar de la muestra no tiene ningún estimador único que sea insesgado, eficiente y tenga una probabilidad máxima. La ecuación que se ofrece a continuación es la «desviación estándar muestral corregida». Se trata de una versión corregida de la ecuación obtenida a partir de la modificación de la ecuación de la desviación típica de la población utilizando el tamaño de la muestra como el tamaño de la población, lo que elimina parte del sesgo de la ecuación. Sin embargo, la estimación insesgada de la desviación típica es muy complicada y varía en función de la distribución. Por ello, la «desviación típica de la muestra corregida» es el estimador más utilizado para la desviación típica de la población, y suele denominarse simplemente «desviación típica de la muestra». Es una estimación mucho mejor que su versión no corregida, pero sigue teniendo un sesgo significativo para tamaños de muestra pequeños (N<10).
Media y desviación estándar
Una forma común de cuantificar la dispersión de un conjunto de datos es utilizar la desviación estándar de la muestra. Su calculadora puede tener un botón de desviación estándar incorporado, que normalmente tiene una sx en él. A veces es bueno saber lo que su calculadora está haciendo detrás de las escenas.
Los pasos siguientes desglosan la fórmula de la desviación estándar en un proceso. Si alguna vez te piden que hagas un problema como éste en un examen, debes saber que a veces es más fácil recordar un proceso paso a paso que memorizar una fórmula.
A continuación, sumamos todas las entradas de la columna de la derecha. Esta es la suma de las desviaciones al cuadrado. A continuación, dividimos por uno menos que el número de valores de los datos. Por último, sacamos la raíz cuadrada de este cociente y ya hemos terminado.