Como usar análise discriminante

análise discriminante é um método de classificação que usa medidas estatísticas como covariância e medições geométricas como distância euclidiana para determinar qual grupo um ponto de dados desconhecido pertence. Usando a análise discriminante requer duas etapas principais : encontrar os coeficientes discriminantes de um conjunto bem compreendido de dados e aplicação dos coeficientes de dados desconhecidos para produzir classifications.Things grupo que você precisa

Statistical Software (R, SPSS, SAS ou S + )

Show Mais instruções

1

decidir sobre as variáveis ​​que você deseja incluir no estudo. Estas variáveis ​​devem ser características que você acha que vai ajudar a classificar os pontos de dados em grupos específicos, que se excluem mutuamente . Por exemplo, se os grupos estão a ser “homens e mulheres”, possíveis variáveis ​​incluem o número de filhos , anos de escolaridade e renda anual.

2

Coletar um conjunto de dados que podem ser classificados em mutuamente grupos exclusivos (por exemplo , homens e mulheres , compradores e vendedores , ou chineses e taiwaneses ). Coletar dados sobre as variáveis ​​que você já decididas para cada ponto de dados.

3

Calcular os centróides para cada grupo. O cálculo dos centróides depende do número de variáveis ​​que você escolheu para incluir na análise. Por exemplo, se você decidiu investigar apenas duas variáveis ​​, então seus centróides existirá em euclidiana 2- espaço.

4

Calcule a distância entre os dois centróides , e denotam a distância como um vetor , “D “. O vetor será tantas dimensões quanto o número de variáveis ​​de interesse. No caso que você está investigando duas variáveis, o seu vetor, “d “, será bidimensional.

5

Calcula a soma dentro do grupo de praças matrizes para cada grupo. Chamar essas matrizes ” W1 ” e ” W2 “.

6

Piscina a soma dentro do grupo de matrizes quadradas para produzir uma matriz de covariância dentro do grupo . Chame essa matriz ” Cw “.

7

Calcule o inverso da ” Cw “. Chame essa matriz inversa ” Cw- 1. ”

8

Multiply ” Cw- 1″ e ” d “. Chame esse vetor ” Cw- 1d “. A sua dimensão deve ser igual ao número de variáveis ​​que você tenha incluído na análise.

9

Calcular os coeficientes da função discriminante . Estes coeficientes são proporcionais à ” Cw- 1d “.

10

Coletar dados de interesse ( dados que deseja classificar em grupos ) . Para aplicar corretamente análise discriminante , apenas coletar dados sobre as variáveis ​​de interesse; sabendo de antemão as classificações derrota a finalidade de realizar a análise discriminante .

11

Escreva cada ponto de dados como um vetor. As dimensões dos vectores são as mesmas que as dimensões do conjunto original de dados .

12

Classifique cada ponto de dados . Multiplique cada ponto de dados pelos coeficientes da função discriminante . A saída vai lhe dar a classificação do ponto de dados. Por exemplo, se você estiver usando o nível de escolaridade ea renda anual como variáveis ​​para prever o sexo dos pontos de dados , o número resultante será ou mais perto de “macho ” ou ” fêmea “. O grupo o ponto está mais perto é o grupo , é classificado como .

Deixe um comentário