Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva normal (o que é curva normal?). Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá) causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.
“Um outlier é uma observação que se diferencia tanto das demais observações que levanta suspeitas de que aquela observação foi gerada por um mecanismo distinto” (Hawkins, 1980).
Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:
A matriz ou intervalo de célula de valores numéricos cujo valor quartil você deseja obter. Quarto Necessário. Indica o valor a ser retornado....Sintaxe.
Calcular quartil no Excel é possível com uma fórmula simples....Para isso, basta digitar um dos valores abaixo;
Revisão sobre desvio-padrão amostral e populacional
O cálculo da variância populacional é obtido através da soma dos quadrados da diferença entre cada valor e a média aritmética, dividida pela quantidade de elementos observados.
Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada valor desse conjunto está do valor central (médio). ... Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais os valores estão distantes da média.
Podemos ver pelas fórmulas que a diferença entre a variância da população e a variância da amostra fica no denominador da fórmula. No caso da variância da população o único item no denominador é “n” já na variância da amostra a fórmula o denominador trata-se do “n-1”.
Mediana é uma medida de tendência central que indica exatamente o valor central de uma amostra de dados.
Variância e desvio padrão