en/latest/GMM_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * Written (W) 2011 Alesis Novik

  * Copyright (C) 2011 Berlin Institute of Technology and Max-Planck-Society

  */

 #include <shogun/lib/config.h>


 #ifdef HAVE_LAPACK


 #include <shogun/clustering/GMM.h>

 #include <shogun/clustering/KMeans.h>

 #include <shogun/distance/EuclideanDistance.h>

 #include <shogun/base/Parameter.h>

 #include <shogun/mathematics/Math.h>

 #include <shogun/mathematics/lapack.h>

 #include <shogun/labels/MulticlassLabels.h>

 #include <shogun/multiclass/KNN.h>


 #include <vector>


 using namespace shogun;

 using namespace std;


 CGMM::CGMM() : CDistribution(), m_components(), m_coefficients()

 {

     register_params();

 }


 CGMM::CGMM(int32_t n, ECovType cov_type) : CDistribution(), m_components(), m_coefficients()

 {

     m_coefficients.vector=SG_MALLOC(float64_t, n);

     m_coefficients.vlen=n;

     m_components = vector<CGaussian*>(n);


     for (int32_t i=0; i<n; i++)

     {

         m_components[i]=new CGaussian();

         SG_REF(m_components[i]);

         m_components[i]->set_cov_type(cov_type);

     }


     register_params();

 }


 CGMM::CGMM(vector<CGaussian*> components, SGVector<float64_t> coefficients, bool copy) : CDistribution()

 {

     ASSERT(int32_t(components.size())==coefficients.vlen)


     if (!copy)

     {

         m_components=components;

         m_coefficients=coefficients;

         for (int32_t i=0; i<int32_t(components.size()); i++)

         {

             SG_REF(m_components[i]);

         }

     }

     else

     {

         m_coefficients = coefficients;

         m_components = vector<CGaussian*>(components.size());


         for (int32_t i=0; i<int32_t(components.size()); i++)

         {

             m_components[i]=new CGaussian();

             SG_REF(m_components[i]);

             m_components[i]->set_cov_type(components[i]->get_cov_type());


             SGVector<float64_t> old_mean=components[i]->get_mean();

             SGVector<float64_t> new_mean(old_mean.vlen);

             memcpy(new_mean.vector, old_mean.vector, old_mean.vlen*sizeof(float64_t));

             m_components[i]->set_mean(new_mean);


             SGVector<float64_t> old_d=components[i]->get_d();

             SGVector<float64_t> new_d(old_d.vlen);

             memcpy(new_d.vector, old_d.vector, old_d.vlen*sizeof(float64_t));

             m_components[i]->set_d(new_d);


             if (components[i]->get_cov_type()==FULL)

             {

                 SGMatrix<float64_t> old_u=components[i]->get_u();

                 SGMatrix<float64_t> new_u(old_u.num_rows, old_u.num_cols);

                 memcpy(new_u.matrix, old_u.matrix, old_u.num_rows*old_u.num_cols*sizeof(float64_t));

                 m_components[i]->set_u(new_u);

             }


             m_coefficients[i]=coefficients[i];

         }

     }


     register_params();

 }


 CGMM::~CGMM()

 {

     if (!m_components.empty())

         cleanup();

 }


 void CGMM::cleanup()

 {

     for (int32_t i = 0; i < int32_t(m_components.size()); i++)

         SG_UNREF(m_components[i]);


     m_components = vector<CGaussian*>();

     m_coefficients = SGVector<float64_t>();

 }


 bool CGMM::train(CFeatures* data)

 {

     ASSERT(m_components.size() != 0)


     if (data)

     {

         if (!data->has_property(FP_DOT))

                 SG_ERROR("Specified features are not of type CDotFeatures\n")

         set_features(data);

     }


     return true;

 }


 float64_t CGMM::train_em(float64_t min_cov, int32_t max_iter, float64_t min_change)

 {

     if (!features)

         SG_ERROR("No features to train on.\n")


     CDotFeatures* dotdata=(CDotFeatures *) features;

     int32_t num_vectors=dotdata->get_num_vectors();


     SGMatrix<float64_t> alpha;


     /* compute initialization via kmeans if none is present */

     if (m_components[0]->get_mean().vector==NULL)

     {

         CKMeans* init_k_means=new CKMeans(int32_t(m_components.size()), new CEuclideanDistance());

         init_k_means->train(dotdata);

         SGMatrix<float64_t> init_means=init_k_means->get_cluster_centers();


         alpha=alpha_init(init_means);


         SG_UNREF(init_k_means);


         max_likelihood(alpha, min_cov);

     }

     else

         alpha=SGMatrix<float64_t>(num_vectors,int32_t(m_components.size()));


     int32_t iter=0;

     float64_t log_likelihood_prev=0;

     float64_t log_likelihood_cur=0;

     float64_t* logPxy=SG_MALLOC(float64_t, num_vectors*m_components.size());

     float64_t* logPx=SG_MALLOC(float64_t, num_vectors);

     //float64_t* logPost=SG_MALLOC(float64_t, num_vectors*m_components.vlen);


     while (iter<max_iter)

     {

         log_likelihood_prev=log_likelihood_cur;

         log_likelihood_cur=0;


         for (int32_t i=0; i<num_vectors; i++)

         {

             logPx[i]=0;

             SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(i);

             for (int32_t j=0; j<int32_t(m_components.size()); j++)

             {

                 logPxy[i*m_components.size()+j]=m_components[j]->compute_log_PDF(v)+CMath::log(m_coefficients[j]);

                 logPx[i]+=CMath::exp(logPxy[i*m_components.size()+j]);

             }


             logPx[i]=CMath::log(logPx[i]);

             log_likelihood_cur+=logPx[i];


             for (int32_t j=0; j<int32_t(m_components.size()); j++)

             {

                 //logPost[i*m_components.vlen+j]=logPxy[i*m_components.vlen+j]-logPx[i];

                 alpha.matrix[i*m_components.size()+j]=CMath::exp(logPxy[i*m_components.size()+j]-logPx[i]);

             }

         }


         if (iter>0 && log_likelihood_cur-log_likelihood_prev<min_change)

             break;


         max_likelihood(alpha, min_cov);


         iter++;

     }


     SG_FREE(logPxy);

     SG_FREE(logPx);


     return log_likelihood_cur;

 }


 float64_t CGMM::train_smem(int32_t max_iter, int32_t max_cand, float64_t min_cov, int32_t max_em_iter, float64_t min_change)

 {

     if (!features)

         SG_ERROR("No features to train on.\n")


     if (m_components.size()<3)

         SG_ERROR("Can't run SMEM with less than 3 component mixture model.\n")


     CDotFeatures* dotdata=(CDotFeatures *) features;

     int32_t num_vectors=dotdata->get_num_vectors();


     float64_t cur_likelihood=train_em(min_cov, max_em_iter, min_change);


     int32_t iter=0;

     float64_t* logPxy=SG_MALLOC(float64_t, num_vectors*m_components.size());

     float64_t* logPx=SG_MALLOC(float64_t, num_vectors);

     float64_t* logPost=SG_MALLOC(float64_t, num_vectors*m_components.size());

     float64_t* logPostSum=SG_MALLOC(float64_t, m_components.size());

     float64_t* logPostSum2=SG_MALLOC(float64_t, m_components.size());

     float64_t* logPostSumSum=SG_MALLOC(float64_t, m_components.size()*(m_components.size()-1)/2);

     float64_t* split_crit=SG_MALLOC(float64_t, m_components.size());

     float64_t* merge_crit=SG_MALLOC(float64_t, m_components.size()*(m_components.size()-1)/2);

     int32_t* split_ind=SG_MALLOC(int32_t, m_components.size());

     int32_t* merge_ind=SG_MALLOC(int32_t, m_components.size()*(m_components.size()-1)/2);


     while (iter<max_iter)

     {

         memset(logPostSum, 0, m_components.size()*sizeof(float64_t));

         memset(logPostSum2, 0, m_components.size()*sizeof(float64_t));

         memset(logPostSumSum, 0, (m_components.size()*(m_components.size()-1)/2)*sizeof(float64_t));

         for (int32_t i=0; i<num_vectors; i++)

         {

             logPx[i]=0;

             SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(i);

             for (int32_t j=0; j<int32_t(m_components.size()); j++)

             {

                 logPxy[i*m_components.size()+j]=m_components[j]->compute_log_PDF(v)+CMath::log(m_coefficients[j]);

                 logPx[i]+=CMath::exp(logPxy[i*m_components.size()+j]);

             }


             logPx[i]=CMath::log(logPx[i]);


             for (int32_t j=0; j<int32_t(m_components.size()); j++)

             {

                 logPost[i*m_components.size()+j]=logPxy[i*m_components.size()+j]-logPx[i];

                 logPostSum[j]+=CMath::exp(logPost[i*m_components.size()+j]);

                 logPostSum2[j]+=CMath::exp(2*logPost[i*m_components.size()+j]);

             }


             int32_t counter=0;

             for (int32_t j=0; j<int32_t(m_components.size()); j++)

             {

                 for (int32_t k=j+1; k<int32_t(m_components.size()); k++)

                 {

                     logPostSumSum[counter]+=CMath::exp(logPost[i*m_components.size()+j]+logPost[i*m_components.size()+k]);

                     counter++;

                 }

             }

         }


         int32_t counter=0;

         for (int32_t i=0; i<int32_t(m_components.size()); i++)

         {

             logPostSum[i]=CMath::log(logPostSum[i]);

             split_crit[i]=0;

             split_ind[i]=i;

             for (int32_t j=0; j<num_vectors; j++)

             {

                 split_crit[i]+=(logPost[j*m_components.size()+i]-logPostSum[i]-logPxy[j*m_components.size()+i]+CMath::log(m_coefficients[i]))*

                                 (CMath::exp(logPost[j*m_components.size()+i])/CMath::exp(logPostSum[i]));

             }

             for (int32_t j=i+1; j<int32_t(m_components.size()); j++)

             {

                 merge_crit[counter]=CMath::log(logPostSumSum[counter])-(0.5*CMath::log(logPostSum2[i]))-(0.5*CMath::log(logPostSum2[j]));

                 merge_ind[counter]=i*m_components.size()+j;

                 counter++;

             }

         }

         CMath::qsort_backward_index(split_crit, split_ind, int32_t(m_components.size()));

         CMath::qsort_backward_index(merge_crit, merge_ind, int32_t(m_components.size()*(m_components.size()-1)/2));


         bool better_found=false;

         int32_t candidates_checked=0;

         for (int32_t i=0; i<int32_t(m_components.size()); i++)

         {

             for (int32_t j=0; j<int32_t(m_components.size()*(m_components.size()-1)/2); j++)

             {

                 if (merge_ind[j]/int32_t(m_components.size()) != split_ind[i] && int32_t(merge_ind[j]%m_components.size()) != split_ind[i])

                 {

                     candidates_checked++;

                     CGMM* candidate=new CGMM(m_components, m_coefficients, true);

                     candidate->train(features);

                     candidate->partial_em(split_ind[i], merge_ind[j]/int32_t(m_components.size()), merge_ind[j]%int32_t(m_components.size()), min_cov, max_em_iter, min_change);

                     float64_t cand_likelihood=candidate->train_em(min_cov, max_em_iter, min_change);


                     if (cand_likelihood>cur_likelihood)

                     {

                         cur_likelihood=cand_likelihood;

                         set_comp(candidate->get_comp());

                         set_coef(candidate->get_coef());


                         for (int32_t k=0; k<int32_t(candidate->get_comp().size()); k++)

                         {

                             SG_UNREF(candidate->get_comp()[k]);

                         }


                         better_found=true;

                         break;

                     }

                     else

                         delete candidate;


                     if (candidates_checked>=max_cand)

                         break;

                 }

             }

             if (better_found || candidates_checked>=max_cand)

                 break;

         }

         if (!better_found)

             break;

         iter++;

     }


     SG_FREE(logPxy);

     SG_FREE(logPx);

     SG_FREE(logPost);

     SG_FREE(split_crit);

     SG_FREE(merge_crit);

     SG_FREE(logPostSum);

     SG_FREE(logPostSum2);

     SG_FREE(logPostSumSum);

     SG_FREE(split_ind);

     SG_FREE(merge_ind);


     return cur_likelihood;

 }


 void CGMM::partial_em(int32_t comp1, int32_t comp2, int32_t comp3, float64_t min_cov, int32_t max_em_iter, float64_t min_change)

 {

     CDotFeatures* dotdata=(CDotFeatures *) features;

     int32_t num_vectors=dotdata->get_num_vectors();


     float64_t* init_logPxy=SG_MALLOC(float64_t, num_vectors*m_components.size());

     float64_t* init_logPx=SG_MALLOC(float64_t, num_vectors);

     float64_t* init_logPx_fix=SG_MALLOC(float64_t, num_vectors);

     float64_t* post_add=SG_MALLOC(float64_t, num_vectors);


     for (int32_t i=0; i<num_vectors; i++)

     {

         init_logPx[i]=0;

         init_logPx_fix[i]=0;


         SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(i);

         for (int32_t j=0; j<int32_t(m_components.size()); j++)

         {

             init_logPxy[i*m_components.size()+j]=m_components[j]->compute_log_PDF(v)+CMath::log(m_coefficients[j]);

             init_logPx[i]+=CMath::exp(init_logPxy[i*m_components.size()+j]);

             if (j!=comp1 && j!=comp2 && j!=comp3)

             {

                 init_logPx_fix[i]+=CMath::exp(init_logPxy[i*m_components.size()+j]);

             }

         }


         init_logPx[i]=CMath::log(init_logPx[i]);

         post_add[i]=CMath::log(CMath::exp(init_logPxy[i*m_components.size()+comp1]-init_logPx[i])+

                     CMath::exp(init_logPxy[i*m_components.size()+comp2]-init_logPx[i])+

                     CMath::exp(init_logPxy[i*m_components.size()+comp3]-init_logPx[i]));

     }


     vector<CGaussian*> components(3);

     SGVector<float64_t> coefficients(3);

     components[0]=m_components[comp1];

     components[1]=m_components[comp2];

     components[2]=m_components[comp3];

     coefficients.vector[0]=m_coefficients.vector[comp1];

     coefficients.vector[1]=m_coefficients.vector[comp2];

     coefficients.vector[2]=m_coefficients.vector[comp3];

     float64_t coef_sum=coefficients.vector[0]+coefficients.vector[1]+coefficients.vector[2];


     int32_t dim_n=components[0]->get_mean().vlen;


     float64_t alpha1=coefficients.vector[1]/(coefficients.vector[1]+coefficients.vector[2]);

     float64_t alpha2=coefficients.vector[2]/(coefficients.vector[1]+coefficients.vector[2]);


     float64_t noise_mag=SGVector<float64_t>::twonorm(components[0]->get_mean().vector, dim_n)*0.1/

                         CMath::sqrt((float64_t)dim_n);


     SGVector<float64_t>::add(components[1]->get_mean().vector, alpha1, components[1]->get_mean().vector, alpha2,

                 components[2]->get_mean().vector, dim_n);


     for (int32_t i=0; i<dim_n; i++)

     {

         components[2]->get_mean().vector[i]=components[0]->get_mean().vector[i]+CMath::randn_double()*noise_mag;

         components[0]->get_mean().vector[i]=components[0]->get_mean().vector[i]+CMath::randn_double()*noise_mag;

     }


     coefficients.vector[1]=coefficients.vector[1]+coefficients.vector[2];

     coefficients.vector[2]=coefficients.vector[0]*0.5;

     coefficients.vector[0]=coefficients.vector[0]*0.5;


     if (components[0]->get_cov_type()==FULL)

     {

         SGMatrix<float64_t> c1=components[1]->get_cov();

         SGMatrix<float64_t> c2=components[2]->get_cov();

         SGVector<float64_t>::add(c1.matrix, alpha1, c1.matrix, alpha2, c2.matrix, dim_n*dim_n);


         components[1]->set_d(SGVector<float64_t>(SGMatrix<float64_t>::compute_eigenvectors(c1.matrix, dim_n, dim_n), dim_n));

         components[1]->set_u(c1);


         float64_t new_d=0;

         for (int32_t i=0; i<dim_n; i++)

         {

             new_d+=CMath::log(components[0]->get_d().vector[i]);

             for (int32_t j=0; j<dim_n; j++)

             {

                 if (i==j)

                 {

                     components[0]->get_u().matrix[i*dim_n+j]=1;

                     components[2]->get_u().matrix[i*dim_n+j]=1;

                 }

                 else

                 {

                     components[0]->get_u().matrix[i*dim_n+j]=0;

                     components[2]->get_u().matrix[i*dim_n+j]=0;

                 }

             }

         }

         new_d=CMath::exp(new_d*(1./dim_n));

         for (int32_t i=0; i<dim_n; i++)

         {

             components[0]->get_d().vector[i]=new_d;

             components[2]->get_d().vector[i]=new_d;

         }

     }

     else if(components[0]->get_cov_type()==DIAG)

     {

         SGVector<float64_t>::add(components[1]->get_d().vector, alpha1, components[1]->get_d().vector,

                     alpha2, components[2]->get_d().vector, dim_n);


         float64_t new_d=0;

         for (int32_t i=0; i<dim_n; i++)

         {

             new_d+=CMath::log(components[0]->get_d().vector[i]);

         }

         new_d=CMath::exp(new_d*(1./dim_n));

         for (int32_t i=0; i<dim_n; i++)

         {

             components[0]->get_d().vector[i]=new_d;

             components[2]->get_d().vector[i]=new_d;

         }

     }

     else if(components[0]->get_cov_type()==SPHERICAL)

     {

         components[1]->get_d().vector[0]=alpha1*components[1]->get_d().vector[0]+

                                                 alpha2*components[2]->get_d().vector[0];


         components[2]->get_d().vector[0]=components[0]->get_d().vector[0];

     }


     CGMM* partial_candidate=new CGMM(components, coefficients);

     partial_candidate->train(features);


     float64_t log_likelihood_prev=0;

     float64_t log_likelihood_cur=0;

     int32_t iter=0;

     SGMatrix<float64_t> alpha(num_vectors, 3);

     float64_t* logPxy=SG_MALLOC(float64_t, num_vectors*3);

     float64_t* logPx=SG_MALLOC(float64_t, num_vectors);

     //float64_t* logPost=SG_MALLOC(float64_t, num_vectors*m_components.vlen);


     while (iter<max_em_iter)

     {

         log_likelihood_prev=log_likelihood_cur;

         log_likelihood_cur=0;


         for (int32_t i=0; i<num_vectors; i++)

         {

             logPx[i]=0;

             SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(i);

             for (int32_t j=0; j<3; j++)

             {

                 logPxy[i*3+j]=components[j]->compute_log_PDF(v)+CMath::log(coefficients[j]);

                 logPx[i]+=CMath::exp(logPxy[i*3+j]);

             }


             logPx[i]=CMath::log(logPx[i]+init_logPx_fix[i]);

             log_likelihood_cur+=logPx[i];


             for (int32_t j=0; j<3; j++)

             {

                 //logPost[i*m_components.vlen+j]=logPxy[i*m_components.vlen+j]-logPx[i];

                 alpha.matrix[i*3+j]=CMath::exp(logPxy[i*3+j]-logPx[i]+post_add[i]);

             }

         }


         if (iter>0 && log_likelihood_cur-log_likelihood_prev<min_change)

             break;


         partial_candidate->max_likelihood(alpha, min_cov);

         partial_candidate->get_coef().vector[0]=partial_candidate->get_coef().vector[0]*coef_sum;

         partial_candidate->get_coef().vector[1]=partial_candidate->get_coef().vector[1]*coef_sum;

         partial_candidate->get_coef().vector[2]=partial_candidate->get_coef().vector[2]*coef_sum;

         iter++;

     }


     m_coefficients.vector[comp1]=coefficients.vector[0];

     m_coefficients.vector[comp2]=coefficients.vector[1];

     m_coefficients.vector[comp3]=coefficients.vector[2];


     delete partial_candidate;

     SG_FREE(logPxy);

     SG_FREE(logPx);

     SG_FREE(init_logPxy);

     SG_FREE(init_logPx);

     SG_FREE(init_logPx_fix);

     SG_FREE(post_add);

 }


 void CGMM::max_likelihood(SGMatrix<float64_t> alpha, float64_t min_cov)

 {

     CDotFeatures* dotdata=(CDotFeatures *) features;

     int32_t num_dim=dotdata->get_dim_feature_space();


     float64_t alpha_sum;

     float64_t alpha_sum_sum=0;

     float64_t* mean_sum;

     float64_t* cov_sum=NULL;


     for (int32_t i=0; i<alpha.num_cols; i++)

     {

         alpha_sum=0;

         mean_sum=SG_MALLOC(float64_t, num_dim);

         memset(mean_sum, 0, num_dim*sizeof(float64_t));


         for (int32_t j=0; j<alpha.num_rows; j++)

         {

             alpha_sum+=alpha.matrix[j*alpha.num_cols+i];

             SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(j);

             SGVector<float64_t>::add(mean_sum, alpha.matrix[j*alpha.num_cols+i], v.vector, 1, mean_sum, v.vlen);

         }


         for (int32_t j=0; j<num_dim; j++)

             mean_sum[j]/=alpha_sum;


         m_components[i]->set_mean(SGVector<float64_t>(mean_sum, num_dim));


         ECovType cov_type=m_components[i]->get_cov_type();


         if (cov_type==FULL)

         {

             cov_sum=SG_MALLOC(float64_t, num_dim*num_dim);

             memset(cov_sum, 0, num_dim*num_dim*sizeof(float64_t));

         }

         else if(cov_type==DIAG)

         {

             cov_sum=SG_MALLOC(float64_t, num_dim);

             memset(cov_sum, 0, num_dim*sizeof(float64_t));

         }

         else if(cov_type==SPHERICAL)

         {

             cov_sum=SG_MALLOC(float64_t, 1);

             cov_sum[0]=0;

         }


         for (int32_t j=0; j<alpha.num_rows; j++)

         {

             SGVector<float64_t> v=dotdata->get_computed_dot_feature_vector(j);

             SGVector<float64_t>::add(v.vector, 1, v.vector, -1, mean_sum, v.vlen);


             switch (cov_type)

             {

                 case FULL:

                     cblas_dger(CblasRowMajor, num_dim, num_dim, alpha.matrix[j*alpha.num_cols+i], v.vector, 1, v.vector,

                                  1, (double*) cov_sum, num_dim);


                     break;

                 case DIAG:

                     for (int32_t k=0; k<num_dim; k++)

                         cov_sum[k]+=v.vector[k]*v.vector[k]*alpha.matrix[j*alpha.num_cols+i];


                     break;

                 case SPHERICAL:

                     float64_t temp=0;


                     for (int32_t k=0; k<num_dim; k++)

                         temp+=v.vector[k]*v.vector[k];


                     cov_sum[0]+=temp*alpha.matrix[j*alpha.num_cols+i];

                     break;

             }

         }


         switch (cov_type)

         {

             case FULL:

                 for (int32_t j=0; j<num_dim*num_dim; j++)

                     cov_sum[j]/=alpha_sum;


                 float64_t* d0;

                 d0=SGMatrix<float64_t>::compute_eigenvectors(cov_sum, num_dim, num_dim);

                 for (int32_t j=0; j<num_dim; j++)

                     d0[j]=CMath::max(min_cov, d0[j]);


                 m_components[i]->set_d(SGVector<float64_t>(d0, num_dim));

                 m_components[i]->set_u(SGMatrix<float64_t>(cov_sum, num_dim, num_dim));


                 break;

             case DIAG:

                 for (int32_t j=0; j<num_dim; j++)

                 {

                     cov_sum[j]/=alpha_sum;

                     cov_sum[j]=CMath::max(min_cov, cov_sum[j]);

                 }


                 m_components[i]->set_d(SGVector<float64_t>(cov_sum, num_dim));


                 break;

             case SPHERICAL:

                 cov_sum[0]/=alpha_sum*num_dim;

                 cov_sum[0]=CMath::max(min_cov, cov_sum[0]);


                 m_components[i]->set_d(SGVector<float64_t>(cov_sum, 1));


                 break;

         }


         m_coefficients.vector[i]=alpha_sum;

         alpha_sum_sum+=alpha_sum;

     }


     for (int32_t i=0; i<alpha.num_cols; i++)

         m_coefficients.vector[i]/=alpha_sum_sum;

 }


 int32_t CGMM::get_num_model_parameters()

 {

     return 1;

 }


 float64_t CGMM::get_log_model_parameter(int32_t num_param)

 {

     ASSERT(num_param==1)


     return CMath::log(m_components.size());

 }


 index_t CGMM::get_num_components() const

 {

     return m_components.size();

 }


 CDistribution* CGMM::get_component(index_t index) const

 {

     return m_components[index];

 }


 float64_t CGMM::get_log_derivative(int32_t num_param, int32_t num_example)

 {

     SG_NOTIMPLEMENTED

     return 0;

 }


 float64_t CGMM::get_log_likelihood_example(int32_t num_example)

 {

     SG_NOTIMPLEMENTED

     return 1;

 }


 float64_t CGMM::get_likelihood_example(int32_t num_example)

 {

     float64_t result=0;


     ASSERT(features);

     ASSERT(features->get_feature_class() == C_DENSE);

     ASSERT(features->get_feature_type() == F_DREAL);


     for (int32_t i=0; i<int32_t(m_components.size()); i++)

     {

         SGVector<float64_t> point= ((CDenseFeatures<float64_t>*) features)->get_feature_vector(num_example);

         result+=CMath::exp(m_components[i]->compute_log_PDF(point)+CMath::log(m_coefficients[i]));

     }


     return result;

 }


 SGVector<float64_t> CGMM::get_nth_mean(int32_t num)

 {

     ASSERT(num<int32_t(m_components.size()))

     return m_components[num]->get_mean();

 }


 void CGMM::set_nth_mean(SGVector<float64_t> mean, int32_t num)

 {

     ASSERT(num<int32_t(m_components.size()))

     m_components[num]->set_mean(mean);

 }


 SGMatrix<float64_t> CGMM::get_nth_cov(int32_t num)

 {

     ASSERT(num<int32_t(m_components.size()))

     return m_components[num]->get_cov();

 }


 void CGMM::set_nth_cov(SGMatrix<float64_t> cov, int32_t num)

 {

     ASSERT(num<int32_t(m_components.size()))

     m_components[num]->set_cov(cov);

 }


 SGVector<float64_t> CGMM::get_coef()

 {

     return m_coefficients;

 }


 void CGMM::set_coef(const SGVector<float64_t> coefficients)

 {

     m_coefficients=coefficients;

 }


 vector<CGaussian*> CGMM::get_comp()

 {

     return m_components;

 }


 void CGMM::set_comp(vector<CGaussian*> components)

 {

     for (int32_t i=0; i<int32_t(m_components.size()); i++)

     {

         SG_UNREF(m_components[i]);

     }


     m_components=components;


     for (int32_t i=0; i<int32_t(m_components.size()); i++)

     {

         SG_REF(m_components[i]);

     }

 }


 SGMatrix<float64_t> CGMM::alpha_init(SGMatrix<float64_t> init_means)

 {

     CDotFeatures* dotdata=(CDotFeatures *) features;

     int32_t num_vectors=dotdata->get_num_vectors();


     SGVector<float64_t> label_num(init_means.num_cols);


     for (int32_t i=0; i<init_means.num_cols; i++)

         label_num.vector[i]=i;


     CKNN* knn=new CKNN(1, new CEuclideanDistance(), new CMulticlassLabels(label_num));

     knn->train(new CDenseFeatures<float64_t>(init_means));

     CMulticlassLabels* init_labels=(CMulticlassLabels*) knn->apply(features);


     SGMatrix<float64_t> alpha(num_vectors, int32_t(m_components.size()));

     memset(alpha.matrix, 0, num_vectors*m_components.size()*sizeof(float64_t));


     for (int32_t i=0; i<num_vectors; i++)

         alpha.matrix[i*m_components.size()+init_labels->get_int_label(i)]=1;


     SG_UNREF(init_labels);


     return alpha;

 }


 SGVector<float64_t> CGMM::sample()

 {

     REQUIRE(m_components.size()>0, "Number of mixture components is %d but "

             "must be positive\n", m_components.size());

     float64_t rand_num=CMath::random(float64_t(0), float64_t(1));

     float64_t cum_sum=0;

     for (int32_t i=0; i<m_coefficients.vlen; i++)

     {

         cum_sum+=m_coefficients.vector[i];

         if (cum_sum>=rand_num)

         {

             SG_DEBUG("Sampling from mixture component %d\n", i);

             return m_components[i]->sample();

         }

     }

     return m_components[m_coefficients.vlen-1]->sample();

 }


 SGVector<float64_t> CGMM::cluster(SGVector<float64_t> point)

 {

     SGVector<float64_t> answer(m_components.size()+1);

     answer.vector[m_components.size()]=0;


     for (int32_t i=0; i<int32_t(m_components.size()); i++)

     {

         answer.vector[i]=m_components[i]->compute_log_PDF(point)+CMath::log(m_coefficients[i]);

         answer.vector[m_components.size()]+=CMath::exp(answer.vector[i]);

     }

     answer.vector[m_components.size()]=CMath::log(answer.vector[m_components.size()]);


     return answer;

 }


 void CGMM::register_params()

 {

     //TODO serialization broken

     //m_parameters->add((SGVector<CSGObject*>*) &m_components, "m_components", "Mixture components");

     m_parameters->add(&m_coefficients, "m_coefficients", "Mixture coefficients.");

 }


 #endif

shogun::SGVector::twonorm
static T twonorm(const T *x, int32_t len)
|| x ||_2

shogun::CGMM::get_likelihood_example
virtual float64_t get_likelihood_example(int32_t num_example)
Definition: GMM.cpp:669

GMM.h

shogun::CGMM::get_num_model_parameters
virtual int32_t get_num_model_parameters()
Definition: GMM.cpp:635

shogun::CGMM::m_coefficients
SGVector< float64_t > m_coefficients
Definition: GMM.h:249

shogun::CGMM::train_smem
float64_t train_smem(int32_t max_iter=100, int32_t max_cand=5, float64_t min_cov=1e-9, int32_t max_em_iter=1000, float64_t min_change=1e-9)
Definition: GMM.cpp:200

shogun::CDenseFeatures< float64_t >

Math.h

shogun::CGMM::m_components
std::vector< CGaussian * > m_components
Definition: GMM.h:247

shogun::CDistribution::features
CFeatures * features
Definition: Distribution.h:209

shogun::SGMatrix::matrix
T * matrix
Definition: SGMatrix.h:372

index_t
int32_t index_t
Definition: common.h:62

shogun::CGMM::CGMM
CGMM()
Definition: GMM.cpp:28

shogun::CDistribution::set_features
virtual void set_features(CFeatures *f)
Definition: Distribution.h:160

Parameter.h

shogun::CGMM::get_log_derivative
virtual float64_t get_log_derivative(int32_t num_param, int32_t num_example)
Definition: GMM.cpp:657

shogun::CGMM::max_likelihood
void max_likelihood(SGMatrix< float64_t > alpha, float64_t min_cov)
Definition: GMM.cpp:519

shogun::CGaussian
Gaussian distribution interface.
Definition: Gaussian.h:49

shogun::CFeatures::get_num_vectors
virtual int32_t get_num_vectors() const =0

config.h

shogun::CGMM::set_nth_mean
virtual void set_nth_mean(SGVector< float64_t > mean, int32_t num)
Definition: GMM.cpp:692

std
Definition: basetag.h:132

shogun::CMath::randn_double
static float64_t randn_double()
Definition: Math.h:1132

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

REQUIRE
#define REQUIRE(x,...)
Definition: SGIO.h:206

SG_NOTIMPLEMENTED
#define SG_NOTIMPLEMENTED
Definition: SGIO.h:139

shogun::CSGObject::m_parameters
Parameter * m_parameters
Definition: SGObject.h:546

shogun::SGMatrix::num_cols
index_t num_cols
Definition: SGMatrix.h:376

shogun::CGMM::get_coef
virtual SGVector< float64_t > get_coef()
Definition: GMM.cpp:710

shogun::CDistribution
Base class Distribution from which all methods implementing a distribution are derived.
Definition: Distribution.h:44

shogun::CDotFeatures
Features that support dot products among other operations.
Definition: DotFeatures.h:44

SG_REF
#define SG_REF(x)
Definition: SGObject.h:54

shogun::SGMatrix::num_rows
index_t num_rows
Definition: SGMatrix.h:374

shogun::FULL
full covariance
Definition: Gaussian.h:35

shogun::SGMatrix< float64_t >

shogun::CMath::random
static uint64_t random()
Definition: Math.h:1019

shogun::CDotFeatures::get_dim_feature_space
virtual int32_t get_dim_feature_space() const =0

shogun::SPHERICAL
spherical covariance
Definition: Gaussian.h:39

shogun::CMulticlassLabels
Multiclass Labels for multi-class classification.
Definition: MulticlassLabels.h:36

shogun::Parameter::add
void add(bool *param, const char *name, const char *description="")
Definition: Parameter.cpp:37

shogun::SGVector::vlen
index_t vlen
Definition: SGVector.h:494

shogun::CGMM::~CGMM
virtual ~CGMM()
Definition: GMM.cpp:98

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::F_DREAL
Definition: FeatureTypes.h:32

ASSERT
#define ASSERT(x)
Definition: SGIO.h:201

shogun::CGMM::sample
SGVector< float64_t > sample()
Definition: GMM.cpp:765

shogun::CKMeans
KMeans clustering, partitions the data into k (a-priori specified) clusters.
Definition: KMeans.h:45

shogun::CGMM::train_em
float64_t train_em(float64_t min_cov=1e-9, int32_t max_iter=1000, float64_t min_change=1e-9)
Definition: GMM.cpp:128

shogun::SGVector< float64_t >

shogun::CGMM::get_nth_mean
virtual SGVector< float64_t > get_nth_mean(int32_t num)
Definition: GMM.cpp:686

shogun::CGMM::get_component
CDistribution * get_component(index_t index) const
Definition: GMM.cpp:652

shogun::CDenseLabels::get_int_label
int32_t get_int_label(int32_t idx)
Definition: DenseLabels.cpp:191

shogun::CGMM::get_comp
virtual std::vector< CGaussian * > get_comp()
Definition: GMM.cpp:720

float64_t
double float64_t
Definition: common.h:50

shogun::ECovType
ECovType
Definition: Gaussian.h:32

EuclideanDistance.h

shogun::CFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const =0

shogun::CMath::max
static T max(T a, T b)
Definition: Math.h:168

shogun::CGMM::cleanup
void cleanup()
Definition: GMM.cpp:104

shogun::CKNN
Class KNN, an implementation of the standard k-nearest neigbor classifier.
Definition: KNN.h:68

shogun::C_DENSE
Definition: FeatureTypes.h:41

shogun::DIAG
diagonal covariance
Definition: Gaussian.h:37

shogun::CGMM::set_coef
virtual void set_coef(const SGVector< float64_t > coefficients)
Definition: GMM.cpp:715

shogun::CGMM::set_nth_cov
virtual void set_nth_cov(SGMatrix< float64_t > cov, int32_t num)
Definition: GMM.cpp:704

shogun::CGMM::cluster
SGVector< float64_t > cluster(SGVector< float64_t > point)
Definition: GMM.cpp:783

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:55

MulticlassLabels.h

SG_DEBUG
#define SG_DEBUG(...)
Definition: SGIO.h:107

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CGMM::get_log_likelihood_example
virtual float64_t get_log_likelihood_example(int32_t num_example)
Definition: GMM.cpp:663

shogun::CGMM::get_log_model_parameter
virtual float64_t get_log_model_parameter(int32_t num_param)
Definition: GMM.cpp:640

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

KNN.h

shogun::CGMM::get_nth_cov
virtual SGMatrix< float64_t > get_nth_cov(int32_t num)
Definition: GMM.cpp:698

shogun::CMath::exp
static float64_t exp(float64_t x)
Definition: Math.h:621

shogun::CMachine::train
virtual bool train(CFeatures *data=NULL)
Definition: Machine.cpp:39

shogun::CMath::log
static float64_t log(float64_t v)
Definition: Math.h:922

shogun::CKMeansBase::get_cluster_centers
SGMatrix< float64_t > get_cluster_centers()
Definition: KMeansBase.cpp:237

shogun::CDotFeatures::get_computed_dot_feature_vector
SGVector< float64_t > get_computed_dot_feature_vector(int32_t num)
Definition: DotFeatures.cpp:305

shogun::FP_DOT
Definition: FeatureTypes.h:68

shogun::CMath::sqrt
static float32_t sqrt(float32_t x)
Definition: Math.h:459

shogun::CGMM::train
virtual bool train(CFeatures *data=NULL)
Definition: GMM.cpp:113

shogun::CFeatures::has_property
bool has_property(EFeatureProperty p) const
Definition: Features.cpp:295

lapack.h

shogun::CGMM::set_comp
virtual void set_comp(std::vector< CGaussian * > components)
Definition: GMM.cpp:725

shogun::CGMM
Gaussian Mixture Model interface.
Definition: GMM.h:38

shogun::CEuclideanDistance
class EuclideanDistance
Definition: EuclideanDistance.h:58

shogun::SGMatrix::compute_eigenvectors
static SGVector< float64_t > compute_eigenvectors(SGMatrix< float64_t > matrix)
Definition: SGMatrix.cpp:891

shogun::CMath::qsort_backward_index
static void qsort_backward_index(T1 *output, T2 *index, int32_t size)
Definition: Math.h:2246

shogun::CFeatures::get_feature_type
virtual EFeatureType get_feature_type() const =0

shogun::CGMM::get_num_components
index_t get_num_components() const
Definition: GMM.cpp:647

KMeans.h

shogun::SGVector::add
void add(const SGVector< T > x)
Definition: SGVector.cpp:279