Técnicas estatísticas em Business &Economia, com conjuntos de dados global
Ter um conjunto de dados é apenas metade do caminho para escrever um grande papel ou a realização de uma análise interessante. Assim que tiver os dados, é preciso determinar uma maneira de analisar os dados que é útil e estatisticamente som. Com grandes conjuntos de dados globais , as técnicas mais comuns envolvem a análise de regressão . Regressão Linear Múltipla
A forma mais básica de análise de regressão é a regressão linear múltipla. Técnicas de regressão linear tentar ajustar uma função linear para os dados, a estimativa de uma intercepção e encostas parciais relativos às variáveis independentes em seu modelo. Enquanto regressão linear múltipla é bastante comum , se a variável de interesse não se comporta de forma linear ao longo do intervalo relevante de sua regressão , você pode estar em apuros. Esta técnica é adaptável , mas quando você começa a violar os pressupostos do procedimento, os resultados podem se tornar tendenciosa ou você pode sofrer de uma falta de poder estatístico .
Binary Regressão Logística
Se a medida dependente que você está interessado em pode ser classificado como um 1 ou um 0 , como se ou não uma qualidade está presente na população , você pode estar interessado em regressão logística binária. Esta técnica de regressão relaciona a variável independente para a média móvel da variável dependente . A função que faz isso é chamado a função logit. Resultados de regressão logística binária podem ser difíceis de interpretar; no entanto, eles são mais estatisticamente sólida , em seguida, apenas por meio de regressão linear para fazer previsões binários.
Componentes Principais Regressão
Se o conjunto de dados tem muitas variáveis independentes , você pode ser interessante no uso de análise de componentes principais para realizar uma redução de dados. Uma vez que a redução de dados está completa , os componentes principais podem ser utilizados em uma regressão de componentes principais . O procedimento PCA utiliza técnicas de álgebra e de otimização linear para encontrar componentes lineares ortogonais das variáveis independentes . Os componentes potenciais são então classificam ordenada pela quantidade de variabilidade nos dados que eles explicam eo pesquisador é capaz de sacrificar uma pequena perda de variabilidade explicada por uma redução de dados e falta de multi- colinearidade . A desvantagem desta técnica é que as estimativas de inclinação dos componentes principais parciais podem ser difíceis de interpretar , sem tradução de volta para os valores originais.
Variáveis Instrumentais Estimativa
variáveis instrumentais estimativa pode ser utilizado com grandes conjuntos de dados quando as variáveis independentes são correlacionados com as condições de erro do modelo . Isso ocorre quando o pesquisador não tem certeza do modelo estrutural da relação a ser investigada , o que é comum em grandes conjuntos de dados globais. Métodos de variáveis instrumentais pode usar de dois estágios mínimos quadrados estimativa , que envolve uma análise de regressão de várias etapas que quebra a regressão em regressão de variáveis endógenas sobre as variáveis exógenas em primeiro lugar, e , em seguida, utiliza esses valores previstos para executar outra regressão. Embora essa técnica é poderosa , às vezes é difícil encontrar uma variável instrumental que só afeta a variável dependente através do efeito sobre a variável independente.