Como usar análise discriminante

análise discriminante é um método de classificação que usa medidas estatísticas como covariância e medições geométricas como distância euclidiana para determinar qual grupo um ponto de dados desconhecido pertence. Usando a análise discriminante requer duas etapas principais : encontrar os coeficientes discriminantes de um conjunto bem compreendido de dados e aplicação dos coeficientes de dados desconhecidos para produzir classifications.Things grupo que você precisa
Statistical Software (R, SPSS, SAS ou S + )
Show Mais instruções
1

decidir sobre as variáveis ​​que você deseja incluir no estudo. Estas variáveis ​​devem ser características que você acha que vai ajudar a classificar os pontos de dados em grupos específicos, que se excluem mutuamente . Por exemplo, se os grupos estão a ser "homens e mulheres", possíveis variáveis ​​incluem o número de filhos , anos de escolaridade e renda anual.
2

Coletar um conjunto de dados que podem ser classificados em mutuamente grupos exclusivos (por exemplo , homens e mulheres , compradores e vendedores , ou chineses e taiwaneses ). Coletar dados sobre as variáveis ​​que você já decididas para cada ponto de dados.
3

Calcular os centróides para cada grupo. O cálculo dos centróides depende do número de variáveis ​​que você escolheu para incluir na análise. Por exemplo, se você decidiu investigar apenas duas variáveis ​​, então seus centróides existirá em euclidiana 2- espaço.
4

Calcule a distância entre os dois centróides , e denotam a distância como um vetor , "D ". O vetor será tantas dimensões quanto o número de variáveis ​​de interesse. No caso que você está investigando duas variáveis, o seu vetor, "d ", será bidimensional.
5

Calcula a soma dentro do grupo de praças matrizes para cada grupo. Chamar essas matrizes " W1 " e " W2 ".
6

Piscina a soma dentro do grupo de matrizes quadradas para produzir uma matriz de covariância dentro do grupo . Chame essa matriz " Cw ".
7

Calcule o inverso da " Cw ". Chame essa matriz inversa " Cw- 1. "
8

Multiply " Cw- 1" e " d ". Chame esse vetor " Cw- 1d ". A sua dimensão deve ser igual ao número de variáveis ​​que você tenha incluído na análise.
9

Calcular os coeficientes da função discriminante . Estes coeficientes são proporcionais à " Cw- 1d ".
10

Coletar dados de interesse ( dados que deseja classificar em grupos ) . Para aplicar corretamente análise discriminante , apenas coletar dados sobre as variáveis ​​de interesse ; sabendo de antemão as classificações derrota a finalidade de realizar a análise discriminante .
11

Escreva cada ponto de dados como um vetor. As dimensões dos vectores são as mesmas que as dimensões do conjunto original de dados .
12

Classifique cada ponto de dados . Multiplique cada ponto de dados pelos coeficientes da função discriminante . A saída vai lhe dar a classificação do ponto de dados. Por exemplo, se você estiver usando o nível de escolaridade ea renda anual como variáveis ​​para prever o sexo dos pontos de dados , o número resultante será ou mais perto de "macho " ou " fêmea ". O grupo o ponto está mais perto é o grupo , é classificado como .