SHOGUN: LDA.cpp Source File

Go to the documentation of this file.
 /*
  * This program is free software; you can redistribute it and/or modify
  * it under the terms of the GNU General Public License as published by
  * the Free Software Foundation; either version 3 of the License, or
  * (at your option) any later version.
  *
  * Written (W) 1999-2009 Soeren Sonnenburg
  * Copyright (C) 1999-2009 Fraunhofer Institute FIRST and Max-Planck-Society
  */
 
 #include <shogun/lib/common.h>
 
 #ifdef HAVE_LAPACK
 #include <shogun/machine/Machine.h>
 #include <shogun/machine/LinearMachine.h>
 #include <shogun/classifier/LDA.h>
 #include <shogun/labels/Labels.h>
 #include <shogun/labels/BinaryLabels.h>
 #include <shogun/mathematics/Math.h>
 #include <shogun/mathematics/lapack.h>
 
 using namespace shogun;
 
 CLDA::CLDA(float64_t gamma)
 : CLinearMachine(), m_gamma(gamma)
 {
 }
 
 CLDA::CLDA(float64_t gamma, CDenseFeatures<float64_t>* traindat, CLabels* trainlab)
 : CLinearMachine(), m_gamma(gamma)
 {
     set_features(traindat);
     set_labels(trainlab);
 }
 
 
 CLDA::~CLDA()
 {
 }
 
 bool CLDA::train_machine(CFeatures* data)
 {
     ASSERT(m_labels);
     if (data)
     {
         if (!data->has_property(FP_DOT))
             SG_ERROR("Specified features are not of type CDotFeatures\n");
         set_features((CDotFeatures*) data);
     }
     ASSERT(features);
     SGVector<int32_t> train_labels=((CBinaryLabels*) m_labels)->get_int_labels();
     ASSERT(train_labels.vector);
 
     int32_t num_feat=features->get_dim_feature_space();
     int32_t num_vec=features->get_num_vectors();
     ASSERT(num_vec==train_labels.vlen);
 
     int32_t* classidx_neg=SG_MALLOC(int32_t, num_vec);
     int32_t* classidx_pos=SG_MALLOC(int32_t, num_vec);
 
     int32_t i=0;
     int32_t j=0;
     int32_t num_neg=0;
     int32_t num_pos=0;
     for (i=0; i<train_labels.vlen; i++)
     {
         if (train_labels.vector[i]==-1)
             classidx_neg[num_neg++]=i;
         else if (train_labels.vector[i]==+1)
             classidx_pos[num_pos++]=i;
         else
         {
             SG_ERROR( "found label != +/- 1 bailing...");
             return false;
         }
     }
 
     if (num_neg<=0 || num_pos<=0)
     {
         SG_ERROR( "whooooo ? only a single class found\n");
         return false;
     }
 
     w=SGVector<float64_t>(num_feat);
 
     float64_t* mean_neg=SG_MALLOC(float64_t, num_feat);
     memset(mean_neg,0,num_feat*sizeof(float64_t));
 
     float64_t* mean_pos=SG_MALLOC(float64_t, num_feat);
     memset(mean_pos,0,num_feat*sizeof(float64_t));
 
     /* calling external lib */
     double* scatter=SG_MALLOC(double, num_feat*num_feat);
     double* buffer=SG_MALLOC(double, num_feat*CMath::max(num_neg, num_pos));
     int nf = (int) num_feat;
 
     CDenseFeatures<float64_t>* rf = (CDenseFeatures<float64_t>*) features;
     //mean neg
     for (i=0; i<num_neg; i++)
     {
         int32_t vlen;
         bool vfree;
         float64_t* vec=
             rf->get_feature_vector(classidx_neg[i], vlen, vfree);
         ASSERT(vec);
 
         for (j=0; j<vlen; j++)
         {
             mean_neg[j]+=vec[j];
             buffer[num_feat*i+j]=vec[j];
         }
 
         rf->free_feature_vector(vec, classidx_neg[i], vfree);
     }
 
     for (j=0; j<num_feat; j++)
         mean_neg[j]/=num_neg;
 
     for (i=0; i<num_neg; i++)
     {
         for (j=0; j<num_feat; j++)
             buffer[num_feat*i+j]-=mean_neg[j];
     }
     cblas_dgemm(CblasColMajor, CblasNoTrans, CblasTrans, nf, nf,
         (int) num_neg, 1.0, buffer, nf, buffer, nf, 0, scatter, nf);
 
     //mean pos
     for (i=0; i<num_pos; i++)
     {
         int32_t vlen;
         bool vfree;
         float64_t* vec=
             rf->get_feature_vector(classidx_pos[i], vlen, vfree);
         ASSERT(vec);
 
         for (j=0; j<vlen; j++)
         {
             mean_pos[j]+=vec[j];
             buffer[num_feat*i+j]=vec[j];
         }
 
         rf->free_feature_vector(vec, classidx_pos[i], vfree);
     }
 
     for (j=0; j<num_feat; j++)
         mean_pos[j]/=num_pos;
 
     for (i=0; i<num_pos; i++)
     {
         for (j=0; j<num_feat; j++)
             buffer[num_feat*i+j]-=mean_pos[j];
     }
     cblas_dgemm(CblasColMajor, CblasNoTrans, CblasTrans, nf, nf, (int) num_pos,
         1.0/(train_labels.vlen-1), buffer, nf, buffer, nf,
         1.0/(train_labels.vlen-1), scatter, nf);
 
     float64_t trace=SGMatrix<float64_t>::trace((float64_t*) scatter, num_feat, num_feat);
 
     double s=1.0-m_gamma; /* calling external lib; indirectly */
     for (i=0; i<num_feat*num_feat; i++)
         scatter[i]*=s;
 
     for (i=0; i<num_feat; i++)
         scatter[i*num_feat+i]+= trace*m_gamma/num_feat;
 
     double* inv_scatter= (double*) SGMatrix<float64_t>::pinv(
         scatter, num_feat, num_feat, NULL);
 
     float64_t* w_pos=buffer;
     float64_t* w_neg=&buffer[num_feat];
 
     cblas_dsymv(CblasColMajor, CblasUpper, nf, 1.0, inv_scatter, nf,
         (double*) mean_pos, 1, 0., (double*) w_pos, 1);
     cblas_dsymv(CblasColMajor, CblasUpper, nf, 1.0, inv_scatter, nf,
         (double*) mean_neg, 1, 0, (double*) w_neg, 1);
 
     bias=0.5*(SGVector<float64_t>::dot(w_neg, mean_neg, num_feat)-SGVector<float64_t>::dot(w_pos, mean_pos, num_feat));
     for (i=0; i<num_feat; i++)
         w.vector[i]=w_pos[i]-w_neg[i];
 
 #ifdef DEBUG_LDA
     SG_PRINT("bias: %f\n", bias);
     SGVector<float64_t>::display_vector(w.vector, num_feat, "w");
     SGVector<float64_t>::display_vector(w_pos, num_feat, "w_pos");
     SGVector<float64_t>::display_vector(w_neg, num_feat, "w_neg");
     SGVector<float64_t>::display_vector(mean_pos, num_feat, "mean_pos");
     SGVector<float64_t>::display_vector(mean_neg, num_feat, "mean_neg");
 #endif
 
     SG_FREE(mean_neg);
     SG_FREE(mean_pos);
     SG_FREE(scatter);
     SG_FREE(inv_scatter);
     SG_FREE(classidx_neg);
     SG_FREE(classidx_pos);
     SG_FREE(buffer);
     return true;
 }
 #endif