Estatística tem sido parte integrante da vida. As pessoas enfrentam isso em todos os lugares. Com base nas estatísticas, são tiradas conclusões sobre onde e quais doenças são comuns, o que é mais procurado em uma determinada região ou entre um determinado segmento da população. Até mesmo a construção de programas políticos de candidatos a órgãos governamentais é baseada em dados estatísticos. Eles também são utilizados por redes de varejo na compra de mercadorias, e os fabricantes se orientam por esses dados em suas propostas.
A estatística desempenha um papel importante na vida da sociedade e afeta cada um de seus membros individualmente, mesmo nas pequenas coisas. Por exemplo, se de acordo com as estatísticas, a maioria das pessoas prefere cores escuras em roupas em uma determinada cidade ou região, será extremamente difícil encontrar uma capa de chuva amarela brilhante com estampa floral em lojas locais. Mas que quantidadesesses dados se somam para ter tal impacto? Por exemplo, o que é “estatisticamente significativo”? O que exatamente se entende por esta definição?
O que é isso?
Estatística como ciência é composta de uma combinação de diferentes quantidades e conceitos. Um deles é o conceito de "significância estatística". Este é o nome do valor das variáveis, cuja probabilidade de aparecimento de outros indicadores é desprezível.
Por exemplo, 9 em cada 10 pessoas calçam sapatos de borracha nos pés durante uma caminhada matinal por cogumelos na floresta de outono após uma noite chuvosa. A probabilidade de que em algum momento 8 deles coloquem mocassins de lona é desprezível. Assim, neste exemplo em particular, o número 9 é o que é chamado de “significado estatístico”.
Assim, se desenvolvermos ainda mais o exemplo prático dado, as sapatarias compram botas de borracha no final da temporada de verão em maior quantidade do que em outras épocas do ano. Assim, a magnitude do valor estatístico tem impacto na vida comum.
Claro, em cálculos complexos, digamos, ao prever a propagação de vírus, um grande número de variáveis é levado em consideração. Mas a própria essência de determinar um indicador significativo de dados estatísticos é semelhante, independentemente da complexidade dos cálculos e do número de valores de variáveis.
Como é calculado?
Usado ao calcular o valor do indicador de "significância estatística" da equação. Ou seja, pode-se argumentar que neste caso tudo é decidido pela matemática. A opção de cálculo mais simples é uma cadeia de operações matemáticas, nas quais estão envolvidos os seguintes parâmetros:
- dois tipos de resultados obtidos de pesquisas ou do estudo de dados objetivos, como a quantidade de compras, denotados por a e b;
- indicador de tamanho da amostra para ambos os grupos – n;
- valor da parcela de amostra combinada - p;
- erro padrão - SE.
O próximo passo é determinar a pontuação geral do teste - t, seu valor é comparado com o número 1,96. 1,96 é o valor médio, transmitindo um intervalo de 95%, de acordo com a função de distribuição t de Student.
Muitas vezes surge a questão de qual é a diferença entre os valores de n e p. Essa nuance é fácil de esclarecer com um exemplo. Digamos que a significância estatística da lealdade a qualquer produto ou marca de homens e mulheres seja calculada.
Neste caso, as letras serão seguidas do seguinte:
- n - número de respondentes;
- p - número de satisfeitos com o produto.
O número de mulheres entrevistadas neste caso será designado como n1. Assim, os homens - n2. O mesmo valor terá os números "1" e "2" do símbolo p.
Comparar a pontuação do teste com a média das planilhas do aluno se torna o que é chamado de "significância estatística".
O que se entende por verificação?
Os resultados de qualquer cálculo matemático sempre podem ser verificados, isso é ensinado às crianças na escola primária. É lógico suporque, como as estatísticas são determinadas usando a cadeia de cálculos, elas são verificadas.
No entanto, testar a significância estatística não é apenas matemática. A estatística lida com um grande número de variáveis e várias probabilidades, que nem sempre são passíveis de cálculo. Ou seja, se voltarmos ao exemplo dos sapatos de borracha no início do artigo, a construção lógica de dados estatísticos nos quais os compradores de mercadorias para lojas confiarão pode ser interrompida pelo clima seco e quente, o que não é típico do outono. Como resultado desse fenômeno, o número de pessoas que compram botas de borracha diminuirá e os pontos de venda sofrerão perdas. É claro que uma fórmula matemática não é capaz de prever uma anomalia meteorológica. Este momento é chamado de “erro”.
Essa é apenas a probabilidade de tais erros e leva em consideração a verificação do nível de significância calculado. Leva em consideração tanto indicadores calculados quanto níveis de significância aceitos, bem como quantidades convencionalmente chamadas de hipóteses.
Qual é o nível de significância?
O conceito de "nível" está incluído nos principais critérios de significância estatística. É usado em estatística aplicada e prática. Este é um tipo de valor que leva em consideração a probabilidade de possíveis desvios ou erros.
O nível é baseado na identificação de diferenças em amostras prontas, permite estabelecer sua significância ou, inversamente, aleatoriedade. Esse conceito possui não apenas significados digitais, mas também suas interpretações peculiares. Eles explicamcomo você precisa entender o valor, e o nível em si é determinado comparando o resultado com o índice médio, isso revela o grau de confiabilidade das diferenças.
Assim, podemos imaginar o conceito de nível simplesmente - é um indicador de um erro ou erro aceitável e provável nas conclusões tiradas dos dados estatísticos obtidos.
Quais níveis de significância são usados?
A significância estatística dos coeficientes de probabilidade de erro na prática é baseada em três níveis básicos.
O primeiro nível é o limite no qual o valor é 5%. Ou seja, a probabilidade de erro não ultrapassa o nível de significância de 5%. Isso significa que a confiança na impecabilidade e infalibilidade das conclusões feitas com base nos dados da pesquisa estatística é de 95%.
O segundo nível é o limite de 1%. Assim, este valor significa que se pode guiar pelos dados obtidos durante os cálculos estatísticos com 99% de confiança.
Terceiro nível - 0,1%. Com este valor, a probabilidade de erro é igual a uma fração de um por cento, ou seja, os erros são praticamente eliminados.
O que é uma hipótese em estatística?
Os erros como conceito dividem-se em duas áreas, quanto à aceitação ou rejeição da hipótese nula. Uma hipótese é um conceito por trás do qual, de acordo com a definição, um conjunto de resultados de pesquisas, outros dados ou declarações estão ocultos. Ou seja, uma descrição da distribuição de probabilidade de algo relacionado ao assunto da contabilidade estatística.
Existem duas hipóteses em cálculos simples - zero e alternativa. A diferença entre elas é que a hipótese nula é baseada na ideia de que não há diferenças fundamentais entre as amostras envolvidas na determinação da significância estatística, e a alternativa é completamente oposta a ela. Ou seja, a hipótese alternativa é baseada na presença de uma diferença significativa nessas amostras.
Quais são os erros?
Os erros como conceito em estatística estão em proporção direta à aceitação desta ou daquela hipótese como verdadeira. Eles podem ser divididos em duas direções ou tipos:
- o primeiro tipo deve-se à aceitação da hipótese nula, que se revelou incorreta;
- second - causado por seguir a alternativa.
O primeiro tipo de erro é chamado de falso positivo e é bastante comum em todas as áreas onde as estatísticas são usadas. Assim, o erro do segundo tipo é chamado de falso negativo.
Por que precisamos de regressão nas estatísticas?
A significância estatística da regressão é que com sua ajuda é possível estabelecer o quanto o modelo de várias dependências calculado com base nos dados corresponde à realidade; permite identificar a suficiência ou f alta de fatores para contabilidade e conclusões.
O valor da regressão é determinado comparando os resultados com os dados listados nas tabelas de Fisher. Ou usando análise de variância. Os indicadores de regressão são importantes quandoestudos estatísticos complexos e cálculos envolvendo um grande número de variáveis, dados aleatórios e mudanças prováveis.