Se trabalhar em análise estatística, poderá ter ouvido falar de medidas de dispersão. Este conceito, que pertence ao ramo da estatística descritiva, refere-se ao grau em que as observações são dispersas ou separadas da média .
Acreditem ou não, as estatísticas são muito úteis em vários campos, pois permitem-nos compreender melhor a informação a ser analisada e, com base nisto, levar a cabo estratégias de acordo com os objectivos desejados. Por esta razão, compreender para que medidas de dispersão são utilizadas é fundamental para a sua correcta utilização em diferentes situações.
Com isto em mente, preparámos esta nota que lhe permitirá aprender mais sobre um dos conceitos mais relevantes nas estatísticas: medidas de dispersão. Explicaremos em profundidade o que são medidas de dispersão e para que são utilizadas. Além disso, dir-lhe-emos quais são as principais medidas de dispersão e a utilização de cada uma delas.
Definição de medidas de dispersão
As medidas de dispersão são números que fornecem informações sobre a variabilidade dos dados. Por outras palavras, mostram quão próximos ou afastados estão os dados numa distribuição, e são geralmente utilizados em conjunto com medidas de tendência central, como a média ou a mediana, para fornecer uma descrição global de um conjunto de dados.
Como sublinhado por Matemovil, “os valores das medidas de dispersão permitem-nos saber se os dados estão fortemente agrupados, amplamente dispersos ou iguais“.
Quando a medida de dispersão tem um valor pequeno, significa que os dados estão localizados perto da posição central, enquanto que quando tem um valor grande, significa que estão mais afastados ou afastados do centro.
Portanto, considerando o acima exposto, podemos definir medidas de dispersão como medidas estatísticas orientadas para mostrar até que ponto ou fecho as pontuações de uma variável estão à média ou média aritmética.
Características das medidas de dispersão
Agora que está mais claro sobre o conceito de medidas de dispersão ou variabilidade, iremos fornecer-lhe algumas das suas características mais representativas, para que não perca nenhum detalhe:
As medidas de dispersão indicam a dispersão dos dados de uma distribuição.
Mostram quão perto ou longe da média os dados estão.
As medidas de variabilidade dão-lhe a possibilidade de conhecer a homogeneidade ou heterogeneidade das distribuições de dados.
São fáceis e rápidos de aplicar.
Os seus valores de dispersão são sempre positivos ou zero, no caso de serem iguais.
A utilização de medidas de dispersão pode ser aplicada em vários domínios, tais como a saúde, indústria, economia empresarial, etc.
para que servem as medidas de dispersão?
Sabemos que o objectivo de medir a dispersão é determinar o grau de desvio que existe nos dados e, portanto, os limites dentro dos quais os dados irão variar em alguma variável, atributo ou qualidade mensurável. Nesse sentido, as medidas de dispersão são de grande importância e ocupam uma posição única nos métodos estatísticos.
Para que possa compreender a utilidade das medidas de dispersão, vejamos as suas principais aplicações:
1. Ajudam a compreender o conjunto de dados
O uso mais importante das medidas de dispersão é que elas ajudam a compreender a distribuição dos dados. À medida que os dados se tornam mais diversos, o valor da medida de dispersão aumenta.
Por conseguinte, o conhecimento da dispersão é vital para a compreensão das estatísticas. Basicamente, ajuda-o a compreender conceitos como a diversificação dos dados, a forma como são distribuídos e a forma como se mantém sobre o valor central ou tendência central.
Além disso, as medidas de dispersão nas estatísticas dão-lhe uma forma de compreender melhor a distribuição dos dados. Por exemplo, 3 amostras diferentes podem ter a mesma média, mediana ou intervalo, mas níveis de variabilidade completamente diferentes.
2. Complementam a informação dada por medidas de tendência central
As medidas de dispersão são também chamadas médias de segunda ordem, ou seja, a média dos desvios de uma medida de tendência central uma segunda vez.
Fornece uma estimativa dos fenómenos a que se referem os dados (originais) fornecidos. Isto aumenta a precisão da análise e interpretação estatística, para que se possa estar em posição de extrair inferências mais fiáveis.
3. Tornam possível a comparação de diferentes grupos
Se os dados originais forem expressos em unidades diferentes, não será possível fazer comparações. Mas com a ajuda de medidas de dispersão relativa, todas estas comparações podem ser facilmente feitas. Uma comparação precisa entre a variabilidade de duas séries conduzirá a resultados fiáveis.
4. Serve como um controlo útil para evitar conclusões erradas na comparação de dados
A média aritmética pode ser a mesma para dois grupos diferentes, mas não revelará a prosperidade de um grupo e o atraso de outro. Este tipo de composição interna pode ser conhecido através da aplicação de medidas de dispersão.
Por conseguinte, com a ajuda de medidas de dispersão ou variabilidade, não se concluirá que ambos os grupos são semelhantes. Pode-se constatar que um grupo é próspero e o outro está atrasado por conhecer a quantidade de variabilidade em torno das medidas de tendência central.
As medidas de dispersão são de grande valor numa análise estatística, desde que os coeficientes de dispersão sejam postos em prática. Caso contrário, as conclusões tiradas serão, em grande parte, pouco fiáveis.
5. Variabilidade de controlo
As diferentes medidas de dispersão dão-lhe dados de variabilidade de diferentes ângulos, e este conhecimento pode ser útil no controlo da variação. Especialmente na análise financeira em negócios e medicina, estas medidas de dispersão podem ser muito úteis.
Fornecem também a base para análises estatísticas adicionais, tais como o cálculo de correlação, regressão, teste de hipóteses, etc.
Fonte: Unsplash
Tipos de medidas de dispersão
As medidas de dispersão podem ser classificadas em duas grandes categorias. Estas são medidas de dispersão absoluta e medidas de dispersão relativa. Dito isto, vamos analisar cada um deles em profundidade. toma nota!
Medidas de dispersão absoluta
As medidas de dispersão absoluta estão encarregadas de apresentar a distância entre os dados ou em conjunto, bem como mostrar a variabilidade em função da média dos desvios de observação. Tudo isto é apoiado pelas medidas mencionadas abaixo:
1. Gama
O intervalo é uma medida de dispersão que se refere à diferença entre os valores extremos de um conjunto. Ou seja, a subtracção entre os seus valores máximos e mínimos.
R: Xmax – Xmin
Onde:
Classificação: R
Valor máximo da amostra: Xmax
Valor mínimo da amostra: Xmin
Características
A distância entre o valor máximo e o valor mínimo é conhecida.
É a medida mais simples de dispersão.
É mais fácil de compreender e calcular.
A utilização da gama é limitada à concepção de ideias iniciais.
Considera apenas valores extremos, mas não os que se encontram entre eles.
Fonte: Unsplash
2. Desvio médio
Esta medida de dispersão é a diferença entre os valores da variável estatística e a média aritmética. Ou seja, a média dos desvios absolutos, que é expressa da seguinte forma:
Dm = 1/n [| x1 – A |+| x2- A |+| xn – A |]
Características
O desvio médio utiliza todas as observações para o cálculo.
É complexo e não é muito compreensível.
O cálculo é demorado.
Imagem: Unsplash
3. Desvio padrão
Outra medida de dispersão é o desvio padrão ou típico. É a raiz quadrada da média aritmética dos quadrados dos valores dos desvios. Em suma, é a raiz quadrada da variância e é representada da seguinte forma:
S= +√ [|x1 – A |2 n1] / N
S=+√S2
Características
O desvio padrão presta mais atenção aos desvios extremosdo que a outros desvios.
É difícil de compreender e de calcular.
É zero se todas as outras observações permanecerem as mesmas.
Imagem: Unsplash
4. Variância
A última das medidas de dispersão absoluta é a variância. Isto representa a variabilidade de um conjunto de dados no que diz respeito à sua média aritmética. é representado como o quadrado dos desvios da média de uma distribuição estatística e é expresso utilizando a seguinte sintaxe:
S2= Σ |x1 – A |2 n1 / N
Características
Um valor pode ser acrescentado a cada pontuação variável e a variância permanecerá constante.
A variância não tem valores negativos, apenas positivos ou zero.
Medidas de dispersão relativa
São utilizadas medidas de dispersão relativa para comparar a distribuição de várias amostras. Ou seja, informam o quão distantes ou dispersas estão as pontuações na distribuição estatística, independentemente de como são apresentadas. Para o fazer, contam com as seguintes medidas de dispersão relativa:
1. Coeficiente de variação
Esta medida de dispersão relativa fornece informação sobre a dispersão relativa de um conjunto de dados em relação à média ou média aritmética e, por sua vez, a dispersão dos dados entre si.
Basicamente, é utilizado para comparar o conjunto de dados no que diz respeito à homogeneidade ou consistência. Isto é expresso como uma percentagem como se segue:
CV = (σ / X) 100
X = desvio padrão
σ = média
Características
O coeficiente de variação é calculado como a razão entre o desvio padrão e a média aritmética.
Representa um número abstracto.
Indica o grau de variabilidade de um conjunto de dados.
Revela a representatividade do meio.
Fonte: Unsplash
2. Coeficiente de classificação
Uma medida de dispersão relativa que consiste na relação entre a diferença dos valores mais altos e mais baixos de um conjunto de dados e a soma dos valores mais altos e mais baixos.
Em termos simples, é calculado como o rácio da diferença entre os termos maior e menor da distribuição, para a soma dos termos maior e menor da distribuição. Esta é a fórmula:
L-S / L + S
onde L = maior valor
S = menor valor
Fonte: Pexels
3. Coeficiente de desvio médio
Pode ser definido como a razão entre o desvio médio e o valor do ponto central a partir do qual é calculado. Esta medida de dispersão relativa é representada da seguinte forma:
Desvio médio usando a média: ∑ | X-M | / norte
Desvio médio usando a média: ∑ | X-X1 | / Norte
Fonte: Pexels
4. Coeficiente de desvio de quartil
A razão da diferença entre o terceiro quartil e o primeiro quartil para a soma do terceiro quartil e do primeiro quartil. a fórmula para esta medida de dispersão relativa é definida da seguinte forma:
(T3 – T3) / (T3 + T1)
Q3 = Quartil superior
Q1 = Quartil inferior
Fonte: Unsplash
5. Coeficiente de desvio padrão
Outra medida de dispersão relativa é o coeficiente de desvio padrão. Esta é a razão entre o desvio padrão e a média da distribuição dos termos. aqui está a sua fórmula:
σ = ( √( X – X1)) / (N – 1)
Desvio = (X – X1)
σ = desvio padrão
N= número total
Em suma, medidas absolutas e relativas de dispersão são muito úteis para o cálculo de diferentes aspectos dos dados. De facto, quando os utiliza com a ciência dos dados, torna-se mais fácil consegui-lo, para que possa facilmente incorporar a automatização de processos no seu negócio.
Fonte: Unsplash
Exemplo de uma medida de dispersão
Temos a certeza de que já terá uma ideia de como estas medidas de dispersão se podem apresentar em situações ou negócios quotidianos. No entanto, para que não haja dúvidas sobre esta medida estatística, dar-lhe-emos um exemplo em que a sua importância se torna evidente .
Imagine que vai fazer uma viagem com os seus amigos e o hotel onde está hospedado tem uma piscina com uma altura média de 1,60 metros. Considerando que tem 1,70 metros de altura, poderia pensar em entrar na piscina sem qualquer inconveniente.
No entanto, como não sabe nadar, prefere ser cauteloso e descobrir se toda a piscina tem a mesma profundidade. Para o fazer, vai até ao nadador salvador e pergunta-lhe qual é a altura máxima e mínima, porque, com base nisso, pode decidir se pode utilizar toda a piscina ou apenas deslocar-se para um determinado ponto.
Acontece que a altura máxima da piscina é de 1,80 metros, enquanto que a mínima é de 1,40 metros. Isto significa que se se deslocar para o ponto mais profundo, poderá estar em perigo, porque de acordo com o exemplo da medida de dispersão, não sabe nadar, pelo que o mais aconselhável seria entrar com algum flutuador ou mover-se apenas para o meio da piscina.
Fonte: Pexels
está pronto para começar com a análise de dados? Agora que sabe mais sobre medidas de dispersão e a sua classificação, estamos certos de que será mais prático para si compreender e participar em cursos ou trabalhos que exijam a utilização desta medida estatística.
esperamos vê-lo no próximo artigo!