Desvio padrão. É um parâmetro muito usado em estatística que indica o grau de variação de um conjunto de elementos. Exemplificando. Se medirmos a temperatura máxima durante três dias em uma cidade e obtivermos os seguintes valores, 28º, 29º e 30º, podemos dizer que a média desses três dias foi 29º.
A volatilidade de um investimento é calculada a partir de seu comportamento em um determinado período. Para analisar esse comportamento, o ideal é observar pelo menos um ano (12 meses). Assim, você terá uma perspectiva mais ampla.
Quartis: Se organizarmos nossos dados em ordem crescente, podemos dividir o conjunto de dados em partes iguais, por exemplo, com quatro divisões, teremos o primeiro quartil (representando 25% dos dados – ou seja, sabemos que até o primeiro quartil, temos 1/4 dos dados), segundo quartil (50% dos dados), terceiro quartil ...
Para aplicar funções em linhas/colunas, você pode utilizar a função apply da base do R. Explicando o comando: O primeiro argumento do cbind: DADOS é o seu dataframe original que irá receber a nova coluna. O segundo argumento do cbind mediana=apply(DADOS[,-1], 1, median) é a nova coluna que recebe o nome de mediana.
A média e a mediana são facilmente calculadas no R através das funções mean() e median() .
A linguagem R é largamente usada entre estatísticos e analistas de dados para desenvolver software de estatística e análise de dados.
Podemos calcular os limites inferior e superior com a função range() . Essa função mostra os valores máximo e mínimo de um conjunto de dados. A medida da amplitude é simplemente a diferença entre os valores máximo e minimo. Nesse caso a amplitude dos dois conjunto é identica, ou seja, 7 em ambos.
Comandos Básicos no R
Esta medida da estatística descritiva é calculada através da diferença entre o terceiro quartil e o primeiro quartil. Exemplo: Suponha que desejemos encontrar o intervalo-interquartil da seguinte amostra: 9, 5, 10, 7, 4, 8, 5, 2, 5, 5, 4, 12, 3, 8. Dados ordenados: 2, 3, 4, 4, 5, 5, 5, 5, 7, 8, 8, 9, 10, 12.