Como estimar Nonparametric Kernel Density

Análises estatísticas muitas vezes a esperança de generalizar pequenos conjuntos de dados individuais para grandes populações, em geral. Ao realizar a análise , os pesquisadores muitas vezes lidar com rígidas, pequenos conjuntos de dados. No entanto , é muitas vezes desejável a ” suavizar ” estes dados , a alteração de um histograma rígida numa curva . , Estimativa de densidade de kernel Nonparametric faz exatamente isso . Esta função é não-paramétrico em que não se assume que há uma estrutura fixa associada com os dados . Neste processo, você vai aplicar um kernel (uma função que muda o conjunto de dados original em um novo conjunto de dados ) para o conjunto de dados para estimar um dataset.Things mais suaves que você precisa

software Statistical

Show Mais instruções

1

Introduza os dados em seu software de estatística. , Estimativa de densidade de kernel não paramétrica só pode ser aplicada a dados unidimensionais , por isso, se os seus dados estão multidimensional , você vai precisar para realizar a estimativa da densidade variável de cada vez.

2

Escolha o kernel para ser usados ​​. A maioria dos programas estatísticos oferecem uma grande variedade de sementes . Por exemplo, o programa estatístico , R, oferece kernels Gaussian , triangular , rectangular, Epanechnikov , biweight , cosseno e optcosine . Em geral , os grãos rectangulares e triangulares tendem a ser menos liso , enquanto que os grãos de Gauss e Epanechnikov tendem a conduzir a distribuições mais suaves . A escolha mais comum do kernel é o kernel Gaussian , mas você pode experimentar com vários kernels .

3

Escolha a largura de banda para a dosagem. A largura de banda actua como o desvio padrão do núcleo de alisamento e afecta a forma da distribuição final estimado . Escolha de largura de banda é um tema complexo , fortemente debatida nas estatísticas e não há uma única maneira para a escolha de uma largura de banda adequada. O melhor é experimentar com muitas bandas , observando-se a distribuição resultante. Em geral , há um equilíbrio entre a variância e viés para diferentes larguras de banda de tamanho. Escolhendo uma largura de banda maior diminui a variância , enquanto aumenta o preconceito; escolher a largura de banda menor aumenta a variância ao diminuir o preconceito.

4

Execute o , a função de estimativa da densidade do kernel não paramétrico . Software estatístico irá pedir-lhe para introduzir os dados , kernel e largura de banda em cima de chamar essa função. Por exemplo, em R, o comando é ” densidade ( dados , banda larga, kernel). ”

5

graficamente os resultados. Traçando a saída da função de densidade irá permitir que você veja como a estimativa da densidade mudou a forma dos dados. Se realizada corretamente, ele deve aparecer como uma versão mais suave de seus dados originais.

Deixe um comentário