Como criar clusters com igual número de membros e Igual Média Atributos
análise de agrupamento é um método de análise de dados , atribuindo os dados para grupos previamente definidos. A associação em cada grupo baseia-se similaridade de características. Cada membro de um cluster deve ter mais em comum com os outros membros do mesmo grupo do que com membros de outros grupos. As variáveis pelo qual os dados são classificados podem ser numérico , binário , categórica , ou de qualquer outro tipo . Como os dados são classificados podem ser ligeiramente diferentes para diferentes tipos de variables.Things você precisa
Calculadora
Show Mais instruções
Dados Numéricos
1
Organizar a dados . Use um histograma se apenas uma variável está envolvido , ou um gráfico dos pontos em um plano de coordenadas , se duas variáveis estão envolvidas . Se os dados contêm mais de duas variáveis , organizá-lo em tabelas ou matrizes.
2
Divida o número de itens de dados por parte do número de clusters desejados para obter o número médio de membros por cluster.
3
Agrupe os dados em grupos contendo o número médio de membros. Se existe um resto , distribuir a cada ponto de dados restante para um cluster diferente , de modo a que não seja superior a qualquer outro conjunto de tamanho por mais do que um .
4
Encontrar o centróide de cada grupo através da adição dos valores de cada membro e dividindo pelo número de membros do cluster. Isto lhe dará o valor médio para o cluster.
5
Encontre a distância de cada membro de cada cluster de seu centróide . Se todos os pontos de dados estão mais próximos do centróide de um outro cluster, em seguida, movê-lo para outro cluster.
6
Contagem do número de pontos em cada cluster. Se algum aglomerados contêm mais do que o número médio , mover os membros excedentes mais afastadas do baricentro ao cluster vizinho mais próximo a eles.
7
Repita os passos quatro a seis até não é necessário continuar a redistribuição.
dados binários ou categórico
8
Encontre o número de membros desejados por cluster , dividindo o número total de itens de dados, o número desejado de grupos.
9
Coloque o número apropriado de itens de dados em clusters que tenham características semelhantes .
10
Encontre o valor mais comum ( modal ) para cada variável para os dados dentro de cada cluster. O centróide do cluster terá o valor mais comum para cada variável.
11
Divida o número de variáveis de cada item tem em comum com o baricentro , pelo número total de variáveis. Esta relação mostra o grau em que o ponto de dados se assemelha ao resto do conjunto
12
mover todos os pontos de dados, que tem proporções variáveis inferior a 0,5 para um outro conjunto com uma maior semelhança com o ponto . Redistribuir os pontos conforme necessário para manter o mesmo tamanho dos clusters . Repita os passos de três a cinco até não são necessárias novas medidas .