Como obter uma estimativa da densidade multivariada

Imagine a situação em que você tem um conjunto de dados que é multivariada ainda terrenos como , uma distribuição rígida robusto . Este resultado não é o ideal , uma vez que é difícil de descrever tal distribuição matematicamente. A solução para este problema é a estimativa da densidade multivariada . Este método permite que você use a sua distribuição multivariada blocos para estimar uma versão suave que provavelmente corresponde à verdadeira distribuição por trás dos dados amostrados. Neste método , você aplica um tipo específico de função, chamada de kernel, a seus dados originais , produzindo , assim, uma distribuição nova , mais suave que pode descrever as suas data.Things você precisa

software Statistical

mostrar Mais instruções

1

Coloque seus dados para o software estatístico de escolha. Quando você fizer isso , você deve identificar claramente cada variada em seus dados, como a estimativa de dados multivariada exige marginalizando os seus dados (ou seja , você terá que quebrar dados em vários conjuntos de dados univariados ) . Contanto que você inserir seus dados na forma de uma matriz, não haverá problemas. Por exemplo, no software estatístico R, você pode primeiro colocar os dados em um arquivo CSV do Excel e, em seguida, ler os dados com o comando ” dados

Página 2

Decida qual kernel você vai aplicar aos dados. O kernel Gaussian serve a maioria dos propósitos práticos. No entanto , a maioria dos pacotes de software estatísticos oferecem uma variedade de kernels para os usuários com fins particulares . Por exemplo, R oferece quase uma dúzia de grãos , incluindo triangular , retangular e co-seno . Também é possível programar o seu próprio kernel , desde que você esteja familiarizado com a forma de programar em seu pacote de escolha de software. Se estiver em dúvida sobre qual kernel para usar, escolha o kernel de Gauss.

3

Decidir sobre a largura de banda para a estimativa da densidade. A largura de banda , em suma, é o equivalente do desvio padrão para o processo de alisamento . Não existe um método padrão de escolha de uma largura de banda para a estimativa da densidade multivariada. Tenha em mente que larguras de banda menores são menos tendenciosa, mas levar a níveis mais elevados de variação , enquanto que larguras de banda maiores têm menor variação , mas são mais tendenciosa. Você pode querer voltar a este passo várias vezes , experimentando com diferentes larguras de banda para sua estimativa de densidade.

4

Realizar a estimativa da densidade multivariada. Use os dados , largura de banda e do kernel que você selecionou anteriormente . A maioria dos pacotes de software estatísticos usar uma chamada de uma linha para esta tarefa, pedindo apenas para os parâmetros necessários (dados, largura de banda e kernel). Em R, você chamar essa função com ” densidade ( dados , banda larga, kernel). ” O resultado (saída) será a estimativa da densidade multivariada.

Deixe um comentário