Para tratamento dos outliers das variáveis dependentes e de controle (exceto Beta), utilizou-se a técnica de "Winsorização" das variáveis, que consiste em aparar os valores extremos (acima ou abaixo dos percentis mínimos e máximos definidos), substituindo-os pelos valores menores e maiores remanescentes na distribuição ...
Para encontrar os outliers em um conjunto de dados, usamos as seguintes etapas:
Uma ótima forma de identificar Outliers é plotando um gráfico de BoxPlot dos valores.
As medidas de dispersão são amplitude, desvio, variância e desvio padrão e são usadas para determinar o grau de variação dos números de uma lista com relação à média.
Para encontrar o coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado pela média. Essa medida é expressa em porcentagem. O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias diferentes.
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. As medidas de posições mais importantes são média aritmética, mediana e moda. Usaremos as seguintes notações: x: valor de cada indivíduo da amostra.
Existem várias formas de caracterizar um conjunto de dados. As formas mais simples estatisticamente falando, são as medidas de tendência central: moda, média e mediana.
As medidas de tendência central mais comuns são a média aritmética, a mediana e moda. Tendências centrais podem ser calculadas tanto para um número finito de valores quanto para uma distribuição teórica, a exemplo da distribuição normal.
Numa pesquisa estatística, as medidas de tendência central servem para determinar o número central. As medidas de tendência central são: média, moda e mediana.