Técnicas estatísticas em Business &Economia, com conjuntos de dados global

Ter um conjunto de dados é apenas metade do caminho para escrever um grande papel ou a realização de uma análise interessante. Assim que tiver os dados, é preciso determinar uma maneira de analisar os dados que é útil e estatisticamente som. Com grandes conjuntos de dados globais , as técnicas mais comuns envolvem a análise de regressão . Regressão Linear Múltipla

A forma mais básica de análise de regressão é a regressão linear múltipla. Técnicas de regressão linear tentar ajustar uma função linear para os dados, a estimativa de uma intercepção e encostas parciais relativos às variáveis ​​independentes em seu modelo. Enquanto regressão linear múltipla é bastante comum , se a variável de interesse não se comporta de forma linear ao longo do intervalo relevante de sua regressão , você pode estar em apuros. Esta técnica é adaptável , mas quando você começa a violar os pressupostos do procedimento, os resultados podem se tornar tendenciosa ou você pode sofrer de uma falta de poder estatístico .

Binary Regressão Logística

Se a medida dependente que você está interessado em pode ser classificado como um 1 ou um 0 , como se ou não uma qualidade está presente na população , você pode estar interessado em regressão logística binária. Esta técnica de regressão relaciona a variável independente para a média móvel da variável dependente . A função que faz isso é chamado a função logit. Resultados de regressão logística binária podem ser difíceis de interpretar; no entanto, eles são mais estatisticamente sólida , em seguida, apenas por meio de regressão linear para fazer previsões binários.

Componentes Principais Regressão

Se o conjunto de dados tem muitas variáveis ​​independentes , você pode ser interessante no uso de análise de componentes principais para realizar uma redução de dados. Uma vez que a redução de dados está completa , os componentes principais podem ser utilizados em uma regressão de componentes principais . O procedimento PCA utiliza técnicas de álgebra e de otimização linear para encontrar componentes lineares ortogonais das variáveis ​​independentes . Os componentes potenciais são então classificam ordenada pela quantidade de variabilidade nos dados que eles explicam eo pesquisador é capaz de sacrificar uma pequena perda de variabilidade explicada por uma redução de dados e falta de multi- colinearidade . A desvantagem desta técnica é que as estimativas de inclinação dos componentes principais parciais podem ser difíceis de interpretar , sem tradução de volta para os valores originais.

Variáveis ​​Instrumentais Estimativa

variáveis ​​instrumentais estimativa pode ser utilizado com grandes conjuntos de dados quando as variáveis ​​independentes são correlacionados com as condições de erro do modelo . Isso ocorre quando o pesquisador não tem certeza do modelo estrutural da relação a ser investigada , o que é comum em grandes conjuntos de dados globais. Métodos de variáveis ​​instrumentais pode usar de dois estágios mínimos quadrados estimativa , que envolve uma análise de regressão de várias etapas que quebra a regressão em regressão de variáveis ​​endógenas sobre as variáveis ​​exógenas em primeiro lugar, e , em seguida, utiliza esses valores previstos para executar outra regressão. Embora essa técnica é poderosa , às vezes é difícil encontrar uma variável instrumental que só afeta a variável dependente através do efeito sobre a variável independente.

Deixe um comentário