Definición de cuartil
Contenido
¿Qué son los cuartiles y qué es el rango intercuartil (IQR)? ¿Cómo se calculan estos valores? ¿Dónde se utilizan y por qué es necesario conocerlos? En este artículo, entenderemos qué son y cómo podemos calcularlos y describiremos dónde se suelen utilizar.
Para entender el IQR, primero tenemos que entender los cuartiles (Q1, Q2 y Q3). Supongamos que has sacado un 89% de notas en un examen. Parece que no te has acercado al 100%, por lo que los demás pueden pensar que tu rendimiento no es tan bueno. Pero, de hecho, has sido el primero de la clase. La única razón por la que no obtuviste el 100% es porque el examen tenía preguntas difíciles que nadie de la clase fue capaz de responder. Por eso, si mencionas que fuiste el primero de la clase, la gente entiende que lo hiciste bastante bien en el examen. Por lo tanto, aunque no hayas obtenido el 100% (porcentaje), en realidad eres el 100º percentil. Es decir, el 100% de las personas de la clase (excluyéndote a ti mismo, por supuesto) están detrás de ti. Así, cuando decimos percentil 75, significa que el 25% de las personas de la clase lo hicieron mejor que tú y el 75% de las personas de la clase lo hicieron peor que tú. Del mismo modo, el percentil 50 significa que la mitad de la clase lo hizo mejor que tú y la otra mitad lo hizo peor que tú. En realidad, no importa la puntuación que obtengas, sino sólo la puntuación relativa que consigas en comparación con el resto de la clase.
Cuartil de datos continuos
En estadística, un cuartil es un tipo de cuantil que divide el número de puntos de datos en cuatro partes, o cuartos, de tamaño más o menos igual. Los datos deben ordenarse de menor a mayor para calcular los cuartiles; como tales, los cuartiles son una forma de estadística de orden. Los tres cuartiles principales son los siguientes:
Junto con el mínimo y el máximo de los datos (que también son cuartiles), los tres cuartiles descritos anteriormente proporcionan un resumen de cinco números de los datos. Este resumen es importante en estadística porque proporciona información sobre el centro y la dispersión de los datos. Conocer el cuartil inferior y superior proporciona información sobre la magnitud de la dispersión y si el conjunto de datos está sesgado hacia un lado. Dado que los cuartiles dividen el número de puntos de datos de manera uniforme, el rango no es el mismo entre los cuartiles (es decir, Q3-Q2 ≠ Q2-Q1) y en su lugar se conoce como rango intercuartil (IQR). Mientras que el máximo y el mínimo también muestran la dispersión de los datos, los cuartiles superior e inferior pueden proporcionar información más detallada sobre la ubicación de puntos de datos específicos, la presencia de valores atípicos en los datos y la diferencia de dispersión entre el 50% central de los datos y los puntos de datos exteriores[2].
Mediana y cuartiles
El primer cuartil, o percentil 25 xL (también escrito como Q1), es el número para el que el 25% de los valores del conjunto de datos son menores que xL.El segundo cuartil o percentil 50, xm (también escrito como Q2) también se conoce como la mediana. El tercer cuartil o percentil 75, xH (Q3), es el valor para el que el 75% de las observaciones son menores que xH.
n es el número de observaciones. x1, x2 … xn son los valores ordenados de menor a mayor.Por «entero» se entiende la parte entera y por decimal, la parte decimal (la parte del número que sigue al punto decimal) de un número.
Calculadora de cuartiles para datos agrupados
Para calcular el rango, hay que encontrar el mayor valor observado de una variable (el máximo) y restar el menor valor observado (el mínimo). El rango sólo tiene en cuenta estos dos valores e ignora los puntos de datos situados entre los dos extremos de la distribución. Se utiliza como complemento de otras medidas, pero rara vez se utiliza como única medida de dispersión porque es sensible a los valores extremos.
El rango intercuartil y el rango semi-intercuartil dan una mejor idea de la dispersión de los datos. Para calcular estas dos medidas, es necesario conocer los valores de los cuartiles inferior y superior. El cuartil inferior, o primer cuartil (Q1), es el valor por debajo del cual se encuentra el 25% de los puntos de datos cuando se ordenan de forma creciente. El cuartil superior, o tercer cuartil (Q3), es el valor por debajo del cual se encuentran el 75% de los puntos de datos cuando se disponen en orden creciente. La mediana se considera el segundo cuartil (Q2). El rango intercuartil es la diferencia entre los cuartiles superior e inferior. El rango semi-intercuartil es la mitad del rango intercuartil.