O que é uma linha de regressão

? Regressão linear é conhecida como uma linha de melhor ajuste. Tentando encontrar uma linha reta que melhor representa os pontos traçados de dados observáveis ​​em um gráfico ajuda a compreender a correlação entre os dados, se houver alguma. Uma vez que uma equação de uma linha de regressão é derivado , ele pode ser utilizado para predizer os possíveis valores futuros, que ainda têm que ser observadas . Regressão Linear

Há vários aspectos a modelo de regressão linear , ou encontrar uma melhor linha de ajuste. O primeiro passo é coletar dados referentes a duas características presumivelmente relacionados, tais como altura e peso de várias pessoas aleatórias. Em problemas de regressão mais avançados, a correlação entre duas variáveis ​​não é tão óbvio, mas por uma questão de compreensão , vamos manter isso simples. Altura e peso são recolhidos e colocados em uma tabela – estes números são os seus dados , e eles são as variáveis ​​em sua equação de regressão , o que representará a linha de melhor ajuste. Você plotar os dados em um gráfico , com uma variável para cada eixo . Você nota que os pontos no gráfico parecem estar correlacionadas, como eles estão se movendo na mesma direção . O mais alto é uma pessoa, mais ele pesa . Você pode ver a correlação.

Mínimos Quadrados de Regressão

Enquanto um exemplo simples pode ser trabalhado manualmente , e deve ser para iniciantes, o processo de regressão linear é feito automaticamente pelo calculadoras gráficas . Regressão de mínimos quadrados é o processo pelo qual uma linha de melhor ajuste é derivado e sua equação , sob a forma de y = mx + b , é descoberto . Você usa um processo de cálculos a partir dos dados; estes cálculos são uma combinação de soma x observáveis ​​e valores de y , em quadratura com eles, subtraindo -los e dividi-los . Uma vez que você sabe o que cada valor na fórmula representa , é uma simples questão de ligar os números em uma calculadora e registrando o valor de suas operações. O resultado é uma equação para a sua linha de melhor ajuste ou regressão; é uma linha reta que pode ser tirada através de seus pontos de dados que melhor representa sua correlação matematicamente.

resíduos

Resíduos são a distância entre os pontos de dados ea linha de melhor ajuste. Tomando em consideração os resíduos permite que o observador saiba a validade do seu princípio de que há uma correlação entre esses dados . Na maioria dos problemas de regressão , parte da solução é descobrir se existe uma correlação de todo, ao contrário de altura e peso. Em uma calculadora gráfica , um novo gráfico pode ser feita exclusivamente dos resíduos , ea variável independente , o que pode dar de presente a presença de variáveis ​​à espreita .

Variáveis ​​Espreitando

A variável espreita podem existir quando os pontos de dados de produtividade de uma linha fraca de regressão , ou discrepantes . Uma variável à espreita é simplesmente um fator no problema que afeta os dados, mas pode não ter sido levado em consideração inicialmente. Altura e peso são correlacionados , mas para explicar um gráfico em que não há correlação entre eles , podemos imaginar que a ingestão de alimentos e /ou exercício é uma variável à espreita que faz uma pessoa curta pesado, ou uma pessoa alta e magra . Um ponto que representa um desses cenários estaria longe da linha de regressão e têm um alto residual.

Outliers

Os dados apontam que é o mais distante da linha de regressão em seu gráfico tem o maior valor residual. Um termo de pontos que estão muito longe da linha de regressão é de outliers . Outliers são importantes porque podem representar dados errados ou uma linha de ajuste pobre , e eles podem alterar a inclinação da sua linha de forma significativa.

Deixe um comentário