Em um artigo anterior, tínhamos discutido sobre as medidas resumo de tendência central. Neste, vamos tratar dos quantis. Um quantil é uma medida que marca a posição de separação em um conjunto ordenado de dados amostrais de uma variável ou da sua distribuição probabilística de acordo com um percentual dado. Por exemplo, o quantil 20% (ou 20%-quantil) é o valor que separa os 20% menores valores dos 80% maiores de uma amostra.
Os quantis são muito aplicados a distribuições probabilísticas de variáveis aleatórias (ver artigo). Podemos obter os quantis de uma variável tanto no campo probabilístico (teórico), quanto no campo amostral, a partir dos dados coletados da variável. No probabilístico, por exemplo, o quantil 20% é o valor para o qual temos probabilidade de 20% de obter valores menores que ele e 80% de obter valores maiores que ele.
Alguns quantis ganharam nomes particulares. Por exemplo, a mediana é o quantil 50% da distribuição de uma variável (veja o artigo Medidas resumo: média, mediana e moda). Também podemos dividir a distribuição de uma variável em quatro partes, gerando três quartis. O 1º quartil separa os 25% menores valores dos 75% maiores, o 2º quartil separa os 50% menores dos 50% maiores (também é a mediana) e o 3º quartil separa os 75% menores dos 25% maiores valores.
Seguindo a mesma lógica dos quartis, podemos dividir a distribuição em cinco partes, gerando os quintis (o quantil 20% é chamado de 1º quintil). Da mesma forma, podem ser calculados os decis (em intervalos de 10%) e percentis (em intervalos de 1%).
Os quantis podem fornecer informações importantes sobre vários aspectos de uma variável. Apenas com os três quartis, podemos obter uma noção de tendência central, a partir da mediana; de variabilidade, a partir da diferença entre o 1º e o 3º quartil (diferença interquartílica); de assimetria, comparando a mediana com a média e a moda, conforme mostra o gráfico abaixo.
Em distribuições simétricas, geralmente a média, a mediana e a moda são iguais (imagem A da figura acima). Numa distribuição assimétrica positiva (ou à direita), frequentemente a mediana é maior do que a moda e menor do que a média, que é muito influenciada pelos valores dos extremos que ocorrem na “cauda” superior da distribuição (imagem C). Numa distribuição assimétrica negativa (ou à esquerda), os valores extremos influenciam a média no sentido oposto (“cauda inferior”), fazendo a mediana ser maior do que a média e inferior à moda (imagem B).
Outra forma de visualizar assimetrias é verificar as diferenças entre os quartis. Consideremos que os três quartis sejam chamados de Q1, Q2 e Q3. Se Q3-Q2 é maior que Q2-Q1, geralmente a variável tem distribuição assimétrica positiva (ou à direita), caso contrário, a variável tem distribuição assimétrica negativa (ou à esquerda). Isso ocorre porque os valores extremos em uma das “caudas” tendem a aumentar a distância do quartil mais próximo para a mediana. Se obtivermos Q3-Q2 = Q2-Q1 (ou próximo disso), esperamos que a distribuição da variável seja simétrica.
Essa foi uma breve descrição dos quantis. Falaremos sobre mais medidas resumo em artigos posteriores.
Achou interessante para um amigo? Compartilhe!
Ficou com alguma dúvida? Deixe nos comentários!
Quer receber mais artigos como esse, deixe o seu e-mail na lateral ou no final da página.
Estatístico e cientista de dados. Apaixonado por aprender e compartilhar conhecimento nas áreas de estatística, economia, finanças e investimentos. Experiência com modelagem estatística e econométrica para a previsão de demanda no transporte rodoviário de passageiros e ferroviário de cargas; análise econômico-financeira de seguros ferroviários; planejamento amostral para pesquisas de campo e construção de modelos de Machine Learning para a análise de propensão de compra, risco de crédito e detecção de fraude.