A área da estatística denominada Estatística Descritiva visa aplicar técnicas estatísticas para descrever, organizar e resumir conjuntos de dados, para que assim, seja possível utilizá-los.
A estatística descritiva é um dos fundamentos mais básicos da análise de dados. Neste tutorial, vamos ver algumas das operações mais utilizadas para trabalhar com dados quantitativos. Aqui, vamos entender um pouco mais sobre o contexto básico de aplicação de cada uma de cada um dos seguintes tópicos:
Uma estratégia para analisar dados com valores muito discrepantes pode ser isolar os outliers e analisá-los à parte. No caso acima, poderíamos separar o presidente, que ganha muito acima dos demais funcionários, e fazer a média do restante.
Provavelmente, você irá usar um computador para calcular a variância e o desvio padrão para você, mas tenha em mente que, ao contrário da primeira, o desvio padrão é expresso na mesma unidade utilizada na média, por isso é mais fácil de ser utilizado para fins comparativos. Ainda que este conceito não seja claro para a maioria das pessoas e você não o utilize no seu conteúdo final, saber o básico sobre a interpretação dos valores de desvio padrão pode te ajudar a ter bons insights e analisar seus dados de forma mais eficiente.
Então, reflita: por que faz mais sentido informar a menor e a maior temperatura do dia – e não a média? Qual das duas informações seria mais útil na hora de decidir o que vestir, por exemplo?
Os cookies de desempenho são usados para compreender e analisar os principais índices de desempenho do site, o que ajuda a fornecer uma melhor experiência do usuário aos visitantes.
Bacharel em Ciências Exatas e Graduanda em Engenharia Elêtrica pela Universidade Federal de Juiz de Fora. Possui formação de Especialista em Power BI, White Belt em Lean Seis Sigma, Produção de Conteúdo Web e de Especialista em Marketing de Conteúdo. Foi bolsista no projeto de treinamento profissional de Desenvolvimento de têcnicas de modelagem para problemas reais de programação matemática. Participou como voluntária do PET Elêtrica da UFJF. Especialista na produção de conteúdo na área de Pesquisa e Desenvolvimento do Grupo Voitto.
Resumindo, a média consiste na soma dos valores dividido pelo número de observações. Já a moda representa o valor mais recorrente naquele conjunto de observações, e a mediana, o valor que está no meio deste conjunto de dados ordenados.
Logo o quartil se encontra na 11,25ª posição, mas como esse valor não é inteiro, para obtermos o valor do quartil iremos fazer uma média entre a 11ª posição e a 12ª posição:
Cookies analíticos são usados para entender como os visitantes interagem com o site. Esses cookies ajudam a fornecer informações sobre as métricas do número de visitantes, taxa de rejeição, origem do tráfego, etc.
Vamos imaginar uma outra empresa, mas esta se chama Ygual e tem 8 funcionários. Agora, não temos uma única linha/observação que separa nosso conjunto de dados ordenados na meta, com duas partes de igual tamanho de cada lado. Portanto, vamos somar os 2 valores intermediários (em cinza) e fazer a média deles.
Olá, o resultado do valor base para os outliers de baixo, conforme o exemplificado, não é negativo, é R$2.500,00. (3.000 x 1,5=4.500 – o valor do 1º quartil, que é 2.000).
Já para os outliers de cima, você deve somar o terceiro quartil (Q3) com o produto da mesma multiplicação anterior. Outliers de cima passam de Q3 + (1,5*IQR).
Por fim, a moda serve para revelar o valor que mais se repete em um conjunto de dados. Nos nossos exemplos acima, para as duas empresas, a resposta seria “5.000”, que o valor de salário mais recorrente, pois em ambas há mais de um gerente ganhando este mesmo valor, enquanto os demais valores não se repetem entre os outros cargos.
Se a amplitude for um valor elevado, significa que os seus dados estão distribuídos com um intervalo grande, e em caso contrário, isso nos mostra que os intervalos são pequenos.
Essa área da estatística é utilizada com frequência em situações em que nos deparamos com uma quantidade grande de dados e precisamos torná-los mais condensados para que assim seja possível trabalhar com eles.
Se a quantidade de valores ordenados for ímpar, a mediana é exatamente o número localizado no meio da lista. Se a quantidade de valores ordenados for par, a mediana é calculada como a média dos dois valores centrais.
Bom dia. Parabéns pelas explicações. Muito boas. Tenho uma dúvida: como faço para descrever um intervalo interquartil (1Q – 3Q) num texto? posso colocar IQR 37.0 – 54,7 , por exemplo?
A mediana trata-se do termo central que existe em um conjunto de dados que são colocados na ordem crescente ou na ordem decrescente. Ou seja, é uma medida do posicionamento central.
ESTATÍSTICA ANALÍTICA: Cálculo da Amostra. Na maioria das vezes, o pesquisador toma decisão para toda população, tendo examinado apenas parte desta população (amostra). Este processo chama-se de inferência. Na pesquisa científica, a inferência é feita com a ajuda de testes estatísticos.
Os fenômenos estudados pela Estatística são fenômenos cujo resultado, mesmo em condições normais de experimentação variam de uma observação para outra, dificultando dessa maneira a previsão de um resultado futuro. ...
A Estatística é de suma importância para empresários, administradores, gestores, para comparar grupos de variáveis relacionadas entre si e obter um quadro simples e resumido das mudanças significativas nas áreas relacionadas como preços de matérias primas,cadastros, preços de produtos acabados, preço final de produtos, .../span>