Como criar clusters com igual número de membros e Igual Média Atributos

análise de agrupamento é um método de análise de dados , atribuindo os dados para grupos previamente definidos. A associação em cada grupo baseia-se similaridade de características. Cada membro de um cluster deve ter mais em comum com os outros membros do mesmo grupo do que com membros de outros grupos. As variáveis ​​pelo qual os dados são classificados podem ser numérico , binário , categórica , ou de qualquer outro tipo . Como os dados são classificados podem ser ligeiramente diferentes para diferentes tipos de variables.Things você precisa

Calculadora

Show Mais instruções

Dados Numéricos

1

Organizar a dados . Use um histograma se apenas uma variável está envolvido , ou um gráfico dos pontos em um plano de coordenadas , se duas variáveis ​​estão envolvidas . Se os dados contêm mais de duas variáveis ​​, organizá-lo em tabelas ou matrizes.

2

Divida o número de itens de dados por parte do número de clusters desejados para obter o número médio de membros por cluster.

3

Agrupe os dados em grupos contendo o número médio de membros. Se existe um resto , distribuir a cada ponto de dados restante para um cluster diferente , de modo a que não seja superior a qualquer outro conjunto de tamanho por mais do que um .

4

Encontrar o centróide de cada grupo através da adição dos valores de cada membro e dividindo pelo número de membros do cluster. Isto lhe dará o valor médio para o cluster.

5

Encontre a distância de cada membro de cada cluster de seu centróide . Se todos os pontos de dados estão mais próximos do centróide de um outro cluster, em seguida, movê-lo para outro cluster.

6

Contagem do número de pontos em cada cluster. Se algum aglomerados contêm mais do que o número médio , mover os membros excedentes mais afastadas do baricentro ao cluster vizinho mais próximo a eles.

7

Repita os passos quatro a seis até não é necessário continuar a redistribuição.

dados binários ou categórico

8

Encontre o número de membros desejados por cluster , dividindo o número total de itens de dados, o número desejado de grupos.

9

Coloque o número apropriado de itens de dados em clusters que tenham características semelhantes .

10

Encontre o valor mais comum ( modal ) para cada variável para os dados dentro de cada cluster. O centróide do cluster terá o valor mais comum para cada variável.

11

Divida o número de variáveis ​​de cada item tem em comum com o baricentro , pelo número total de variáveis. Esta relação mostra o grau em que o ponto de dados se assemelha ao resto do conjunto

12

mover todos os pontos de dados, que tem proporções variáveis ​​inferior a 0,5 para um outro conjunto com uma maior semelhança com o ponto . Redistribuir os pontos conforme necessário para manter o mesmo tamanho dos clusters . Repita os passos de três a cinco até não são necessárias novas medidas .

Deixe um comentário