Como corrigir Normalidade em regressão múltipla com o tempo de Dados Série

Em muitas técnicas estatísticas , a suposição de normalidade dos erros é uma das bases da realização de testes de hipóteses estatísticas. Assim , é importante para um pesquisador para verificar seus dados de normalidade; se a suposição de normalidade não , isto implica que alguns métodos estatísticos será infundado se usado em conjunto de dados do pesquisador. Este fato é verdadeiro para regressão múltipla em dados de séries temporais . Dados de séries temporais – os dados de medição de um fenômeno particular e levado em momentos específicos – podem ser sensíveis à suposição de normalidade , como erros de medição podem mudar com o tempo. Correndo de regressão múltipla em tais dados complica ainda mais as coisas , devido ao alto nível de dimensionalidade ela envolve. No entanto, um bom estatístico ainda deve fazer uma tentativa de corrigir os desvios do pressuposto de normalidade nos dados. Instruções

1

Remover discrepantes . Muitas vezes, os dados em si não estão em conformidade com normalidade , mas parcelas e testes que verificam a normalidade falham simplesmente devido à existência de outliers nos dados. Trace seus dados de série de tempo , à procura de outliers ( quaisquer pontos que se afastam muito de os principais padrões presentes nos dados) . Tome esses valores discrepantes de dados e re-executar a regressão múltipla. Se a suposição de normalidade detém , então o problema está resolvido e você pode simplesmente afirmar em sua análise de dados que você tinha removido de outliers antes da análise de dados. Se a suposição de normalidade ainda não se sustenta após a remoção de outliers , passar para outras técnicas.

2

transformações de dados de teste . Em muitos casos , a transformação da variável dependente nos dados leva a uma distribuição com normalidade . Três funções comuns que podem transformar os seus dados de uma maneira que deixa os dados ainda são facilmente interpretável a função de log , a função raiz quadrada e da função inversa . Tente aplicar estas funções para a variável dependente, um de cada vez , e verificar a normalidade . É bem possível que essa transformação vai deixar você com um conjunto de dados normal, que você pode usar em sua análise de dados diretamente, apenas afirmando que você executou uma transformação antes da análise.

3

aumentar o tamanho da amostra. Sabe-se que o pressuposto de normalidade é especialmente importante e facilmente violado em conjuntos de dados que contêm poucos pontos de dados . Evite este problema por amostragem mais pontos. Para os dados de série de tempo , isso significa apertar os espaços entre as medições. Se os seus dados de chegar de um registro de um fenômeno , é fácil de voltar a provar os seus dados , gerando um novo conjunto de dados , que poderia ser normal. Mesmo que seus dados ainda quebra a suposição de normalidade , o fato de que você tem um grande conjunto de dados torna esta hipótese menos importante , devido às implicações do teorema do limite central.

Deixe um comentário