Como encontrar o Centroid em uma Análise de Agrupamento

A análise de agrupamento é um método de organização de dados em grupos representativos com base em características semelhantes. Cada membro do grupo tem mais em comum com os outros membros do mesmo grupo do que com os membros de outros grupos. O ponto mais representativo dentro do grupo é chamado de baricentro . Normalmente, esta é a média dos valores dos pontos de dados nos cluster.Things você precisa

Calculator

Graph papel

Show Mais instruções

1

Organizar os dados. Se os dados consistem de uma única variável , um histograma pode ser apropriada. Se duas variáveis ​​estão envolvidas, o gráfico dos dados em um plano de coordenadas . Por exemplo, se você estivesse olhando para a altura eo peso de crianças em idade escolar na sala de aula , plotar os pontos de dados de cada criança em um gráfico , sendo que o peso do eixo horizontal ea altura de ser o eixo vertical. Se houver mais de duas variáveis ​​são envolvidas , pode ser necessário matrizes para apresentar os dados .

2

Grupo os dados em conjuntos . Cada cluster deve ser composto de os pontos de dados mais próximos a ele. Na altura e peso exemplo , o grupo de todos os pontos de dados que parecem estar próximas umas das outras . O número de clusters , e se todos os pontos de dados tem que estar em um cluster, pode depender dos objetivos do estudo .

3

Para cada cluster, adicionar os valores de todos os membros . Por exemplo , se um conjunto de dados consistiu dos pontos (80, 56) , ( 75 , 53 ) , ( 60 , 50 ) e ( 68,54 ) , a soma dos valores seria ( 283 , 213 ) .

4

Divida o total pelo número de membros do cluster. No exemplo acima , 283 dividido por quatro é de 70,75 , e 213 dividido por quatro é 53,25 , então o centróide do cluster é ( 70.75 , 53.25 ) .

5

graficamente os centróides de clusters e determinar se todos os pontos estão mais próximos de um baricentro de um outro conjunto do que são para o baricentro do seu próprio cluster. Se todos os pontos estão mais próximos de um baricentro diferente, redistribuí-los para o cluster que contém o centróide mais próximo .

6

Repita os passos 3 , 4 e 5 até que todos os pontos de dados estão no cluster que contém o centróide para que estão mais próximos .

Deixe um comentário