Como calcular um Erros Regressão incorporação de dados de ponto

A função de regressão na análise estatística é uma função ideal. Ao trabalhar com dados reais , estatísticos esperam usar a função de regressão para modelar os dados de interesse . No entanto , não há erro de ponto de dados envolvidos na recolha de dados de exemplo que vai ser objecto de regressão. Assim, muitas vezes é importante para os estatísticos para explicar esse erro no modelo de regressão em si . Enquanto é impossível calcular os verdadeiros valores do erro de ponto de dados, é possível estimar -los e incorporá-los no modelo de regressão. Instruções

1

Organize os dados em uma matriz de dados preparado para a regressão . A matriz de dados deve ser de tamanho n por p , em que n é o número de pontos de dados e p é o número de variáveis ​​independentes do modelo . Por exemplo , se seus dados incluídos 336 pacientes que foram medidos em 12 diferentes variáveis ​​(critérios) , você terá uma matriz de dados com 336 linhas e 12 colunas . Chame esse X. matriz

2

Executar um modelo de regressão , como de costume . Use um software de estatística. Por exemplo , no pacote de software estatístico R , o lm (Y ~ X ) regride a variável dependente Y sobre as variáveis ​​independentes X. O resultado será uma lista dos coeficientes . Colocá-los na forma vetorial e chamá-los B.

3

Transpor a matriz X. Na transposição da matriz, suas linhas se convertem as colunas e as colunas se tornam as linhas. Assim, você vai acabar com um p pela matriz n . Chame essa matriz X ‘. Para grandes matrizes , é aconselhável para encontrar X ‘ através de software estatístico. Por exemplo , no pacote de software de R , o comando t ( X ) produz a transposta de X.

4

Multiplicar a transposta de X por X em si . Neste cálculo , a ordem importa. Portanto , a computação X’X está correto enquanto XX ‘ não é. Para grandes matrizes que você deve realizar este cálculo em software estatístico. Se estiver usando o R , por exemplo, usar % *% para multiplicar duas matrizes. Assim, o comando é X ‘ % *% X.

5

Encontre o inverso do X’X . Este cálculo é inviável com a mão , então use software estatístico. Em R, o comando para isto é inv (). Portanto , este passo é realizado por inv ( X’X ) . Chame essa matriz ( X’X ) -1.

6

Compute a matriz chapéu. A matriz chapéu é dada pela fórmula X ( X’X ) – 1X ‘ . Ou seja, multiplicar por X ( X’X ) -1 e , em seguida, multiplicar o resultado por X ‘. Mais uma vez , as grandes matrizes impede cálculos manuais , então use software estatístico. Chame essa matriz H.

7

Subtrair a matriz chapéu a partir da matriz de identidade, I. A matriz identidade é uma matriz que tem o valor 1 para todas as entradas diagonais e 0 para todas as entradas fora da diagonal . Ligue para a matriz resultante ( IH ) .

8

Calcule os erros de ponto de dados estimados. Multiply ( IH ) pelo vetor de variáveis ​​dependentes do seu conjunto de dados. Chame esse vetor e. A solução será um vetor de estimativas de erro de ponto de dados.

9

Adicione as estimativas de erro de ponto de dados para o modelo de regressão. O modelo resultante é então Y = XB + e.

Deixe um comentário