Como usar análise discriminante
análise discriminante é um método de classificação que usa medidas estatísticas como covariância e medições geométricas como distância euclidiana para determinar qual grupo um ponto de dados desconhecido pertence. Usando a análise discriminante requer duas etapas principais : encontrar os coeficientes discriminantes de um conjunto bem compreendido de dados e aplicação dos coeficientes de dados desconhecidos para produzir classifications.Things grupo que você precisa
Statistical Software (R, SPSS, SAS ou S + )
Show Mais instruções
1
decidir sobre as variáveis que você deseja incluir no estudo. Estas variáveis devem ser características que você acha que vai ajudar a classificar os pontos de dados em grupos específicos, que se excluem mutuamente . Por exemplo, se os grupos estão a ser “homens e mulheres”, possíveis variáveis incluem o número de filhos , anos de escolaridade e renda anual.
2
Coletar um conjunto de dados que podem ser classificados em mutuamente grupos exclusivos (por exemplo , homens e mulheres , compradores e vendedores , ou chineses e taiwaneses ). Coletar dados sobre as variáveis que você já decididas para cada ponto de dados.
3
Calcular os centróides para cada grupo. O cálculo dos centróides depende do número de variáveis que você escolheu para incluir na análise. Por exemplo, se você decidiu investigar apenas duas variáveis , então seus centróides existirá em euclidiana 2- espaço.
4
Calcule a distância entre os dois centróides , e denotam a distância como um vetor , “D “. O vetor será tantas dimensões quanto o número de variáveis de interesse. No caso que você está investigando duas variáveis, o seu vetor, “d “, será bidimensional.
5
Calcula a soma dentro do grupo de praças matrizes para cada grupo. Chamar essas matrizes ” W1 ” e ” W2 “.
6
Piscina a soma dentro do grupo de matrizes quadradas para produzir uma matriz de covariância dentro do grupo . Chame essa matriz ” Cw “.
7
Calcule o inverso da ” Cw “. Chame essa matriz inversa ” Cw- 1. ”
8
Multiply ” Cw- 1″ e ” d “. Chame esse vetor ” Cw- 1d “. A sua dimensão deve ser igual ao número de variáveis que você tenha incluído na análise.
9
Calcular os coeficientes da função discriminante . Estes coeficientes são proporcionais à ” Cw- 1d “.
10
Coletar dados de interesse ( dados que deseja classificar em grupos ) . Para aplicar corretamente análise discriminante , apenas coletar dados sobre as variáveis de interesse; sabendo de antemão as classificações derrota a finalidade de realizar a análise discriminante .
11
Escreva cada ponto de dados como um vetor. As dimensões dos vectores são as mesmas que as dimensões do conjunto original de dados .
12
Classifique cada ponto de dados . Multiplique cada ponto de dados pelos coeficientes da função discriminante . A saída vai lhe dar a classificação do ponto de dados. Por exemplo, se você estiver usando o nível de escolaridade ea renda anual como variáveis para prever o sexo dos pontos de dados , o número resultante será ou mais perto de “macho ” ou ” fêmea “. O grupo o ponto está mais perto é o grupo , é classificado como .