en/latest/MulticlassOneVsOneStrategy_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * Written (W) 2012 Chiyuan Zhang

  * Written (W) 2013 Shell Hu and Heiko Strathmann

  * Copyright (C) 2012 Chiyuan Zhang

  */


 #include <shogun/multiclass/MulticlassOneVsOneStrategy.h>

 #include <shogun/labels/BinaryLabels.h>

 #include <shogun/labels/MulticlassLabels.h>

 #include <shogun/mathematics/Math.h>


 using namespace shogun;


 CMulticlassOneVsOneStrategy::CMulticlassOneVsOneStrategy()

     :CMulticlassStrategy(), m_num_machines(0), m_num_samples(SGVector<int32_t>())

 {

     register_parameters();

 }


 CMulticlassOneVsOneStrategy::CMulticlassOneVsOneStrategy(EProbHeuristicType prob_heuris)

     :CMulticlassStrategy(prob_heuris), m_num_machines(0), m_num_samples(SGVector<int32_t>())

 {

     register_parameters();

 }


 void CMulticlassOneVsOneStrategy::register_parameters()

 {

     //SG_ADD(&m_num_samples, "num_samples", "Number of samples in each training machine", MS_NOT_AVAILABLE);

     SG_WARNING("%s::CMulticlassOneVsOneStrategy(): register parameters!\n", get_name());

 }


 void CMulticlassOneVsOneStrategy::train_start(CMulticlassLabels *orig_labels, CBinaryLabels *train_labels)

 {

     CMulticlassStrategy::train_start(orig_labels, train_labels);

     m_num_machines=m_num_classes*(m_num_classes-1)/2;


     m_train_pair_idx_1 = 0;

     m_train_pair_idx_2 = 1;


     m_num_samples.resize_vector(m_num_machines);

 }


 bool CMulticlassOneVsOneStrategy::train_has_more()

 {

     return m_train_iter < m_num_machines;

 }


 SGVector<int32_t> CMulticlassOneVsOneStrategy::train_prepare_next()

 {

     CMulticlassStrategy::train_prepare_next();


     SGVector<int32_t> subset(m_orig_labels->get_num_labels());

     int32_t tot=0;

     for (int32_t k=0; k < m_orig_labels->get_num_labels(); ++k)

     {

         if (((CMulticlassLabels*) m_orig_labels)->get_int_label(k)==m_train_pair_idx_1)

         {

             ((CBinaryLabels*) m_train_labels)->set_label(k, +1.0);

             subset[tot]=k;

             tot++;

         }

         else if (((CMulticlassLabels*) m_orig_labels)->get_int_label(k)==m_train_pair_idx_2)

         {

             ((CBinaryLabels*) m_train_labels)->set_label(k, -1.0);

             subset[tot]=k;

             tot++;

         }

     }


     m_train_pair_idx_2++;

     if (m_train_pair_idx_2 >= m_num_classes)

     {

         m_train_pair_idx_1++;

         m_train_pair_idx_2=m_train_pair_idx_1+1;

     }


     // collect num samples each machine

     m_num_samples[m_train_iter-1] = tot;


     subset.resize_vector(tot);

     return subset;

 }


 int32_t CMulticlassOneVsOneStrategy::decide_label(SGVector<float64_t> outputs)

 {

     // if OVO with prob outputs, find max posterior

     if (outputs.vlen==m_num_classes)

         return CMath::arg_max(outputs.vector, 1, outputs.vlen);


     int32_t s=0;

     SGVector<int32_t> votes(m_num_classes);

     SGVector<int32_t> dec_vals(m_num_classes);

     votes.zero();

     dec_vals.zero();


     for (int32_t i=0; i<m_num_classes; i++)

     {

         for (int32_t j=i+1; j<m_num_classes; j++)

         {

             if (outputs[s]>0)

             {

                 votes[i]++;

                 dec_vals[i] += CMath::abs(outputs[s]);

             }

             else

             {

                 votes[j]++;

                 dec_vals[j] += CMath::abs(outputs[s]);

             }

             s++;

         }

     }


     int32_t i_max=0;

     int32_t vote_max=-1;

     float64_t dec_val_max=-1;


     for (int32_t i=0; i < m_num_classes; ++i)

     {

         if (votes[i] > vote_max)

         {

             i_max = i;

             vote_max = votes[i];

             dec_val_max = dec_vals[i];

         }

         else if (votes[i] == vote_max)

         {

             if (dec_vals[i] > dec_val_max)

             {

                 i_max = i;

                 dec_val_max = dec_vals[i];

             }

         }

     }


     return i_max;

 }


 void CMulticlassOneVsOneStrategy::rescale_outputs(SGVector<float64_t> outputs)

 {

     if (m_num_machines < 1)

         return;


     SGVector<int32_t> indx1(m_num_machines);

     SGVector<int32_t> indx2(m_num_machines);


     int32_t tot = 0;

     for (int32_t j=0; j<m_num_classes; j++)

     {

         for (int32_t k=j+1; k<m_num_classes; k++)

         {

             indx1[tot] = j;

             indx2[tot] = k;

             tot++;

         }

     }


     if(tot!=m_num_machines)

         SG_ERROR("%s::rescale_output(): size(outputs) is not num_machines.\n", get_name());


     switch(get_prob_heuris_type())

     {

         case OVO_PRICE:

             rescale_heuris_price(outputs,indx1,indx2);

             break;

         case OVO_HASTIE:

             rescale_heuris_hastie(outputs,indx1,indx2);

             break;

         case OVO_HAMAMURA:

             rescale_heuris_hamamura(outputs,indx1,indx2);

             break;

         case PROB_HEURIS_NONE:

             break;

         default:

             SG_ERROR("%s::rescale_outputs(): Unknown OVO probability heuristic type!\n", get_name());

             break;

     }

 }


 void CMulticlassOneVsOneStrategy::rescale_heuris_price(SGVector<float64_t> outputs,

         const SGVector<int32_t> indx1, const SGVector<int32_t> indx2)

 {

     if (m_num_machines != outputs.vlen)

     {

         SG_ERROR("%s::rescale_heuris_price(): size(outputs) = %d != m_num_machines = %d\n",

                 get_name(), outputs.vlen, m_num_machines);

     }


     SGVector<float64_t> new_outputs(m_num_classes);

     new_outputs.zero();


     for (int32_t j=0; j<m_num_classes; j++)

     {

         for (int32_t m=0; m<m_num_machines; m++)

         {

             if (indx1[m]==j)

                 new_outputs[j] += 1.0 / (outputs[m]+1E-12);

             if (indx2[m]==j)

                 new_outputs[j] += 1.0 / (1.0-outputs[m]+1E-12);

         }


         new_outputs[j] = 1.0 / (new_outputs[j] - m_num_classes + 2);

     }


     //outputs.resize_vector(m_num_classes);


     float64_t norm = SGVector<float64_t>::sum(new_outputs);

     for (int32_t i=0; i<new_outputs.vlen; i++)

         outputs[i] = new_outputs[i] / norm;

 }


 void CMulticlassOneVsOneStrategy::rescale_heuris_hastie(SGVector<float64_t> outputs,

         const SGVector<int32_t> indx1, const SGVector<int32_t> indx2)

 {

     if (m_num_machines != outputs.vlen)

     {

         SG_ERROR("%s::rescale_heuris_hastie(): size(outputs) = %d != m_num_machines = %d\n",

                 get_name(), outputs.vlen, m_num_machines);

     }


     SGVector<float64_t> new_outputs(m_num_classes);

     new_outputs.zero();


     for (int32_t j=0; j<m_num_classes; j++)

     {

         for (int32_t m=0; m<m_num_machines; m++)

         {

             if (indx1[m]==j)

                 new_outputs[j] += outputs[m];

             if (indx2[m]==j)

                 new_outputs[j] += 1.0-outputs[m];

         }


         new_outputs[j] *= 2.0 / (m_num_classes * (m_num_classes - 1));

         new_outputs[j] += 1E-10;

     }


     SGVector<float64_t> mu(m_num_machines);

     SGVector<float64_t> prev_outputs(m_num_classes);

     float64_t gap = 1.0;


     while (gap > 1E-12)

     {

         prev_outputs = new_outputs.clone();


         for (int32_t m=0; m<m_num_machines; m++)

             mu[m] = new_outputs[indx1[m]] / (new_outputs[indx1[m]] + new_outputs[indx2[m]]);


         for (int32_t j=0; j<m_num_classes; j++)

         {

             float64_t numerator = 0.0;

             float64_t denominator = 0.0;

             for (int32_t m=0; m<m_num_machines; m++)

             {

                 if (indx1[m]==j)

                 {

                     numerator += m_num_samples[m] * outputs[m];

                     denominator += m_num_samples[m] * mu[m];

                 }


                 if (indx2[m]==j)

                 {

                     numerator += m_num_samples[m] * (1.0-outputs[m]);

                     denominator += m_num_samples[m] * (1.0-mu[m]);

                 }

             }


             // update posterior

             new_outputs[j] *= numerator / denominator;

         }


         float64_t norm = SGVector<float64_t>::sum(new_outputs);

         for (int32_t i=0; i<new_outputs.vlen; i++)

             new_outputs[i] /= norm;


         // gap is Euclidean distance

         for (int32_t i=0; i<new_outputs.vlen; i++)

             prev_outputs[i] -= new_outputs[i];


         gap = SGVector<float64_t>::qsq(prev_outputs.vector, prev_outputs.vlen, 2);

         SG_DEBUG("[Hastie's heuristic] gap = %.12f\n", gap);

     }


     for (int32_t i=0; i<new_outputs.vlen; i++)

         outputs[i] = new_outputs[i];

 }


 void CMulticlassOneVsOneStrategy::rescale_heuris_hamamura(SGVector<float64_t> outputs,

         const SGVector<int32_t> indx1, const SGVector<int32_t> indx2)

 {

     if (m_num_machines != outputs.vlen)

     {

         SG_ERROR("%s::rescale_heuris_hamamura(): size(outputs) = %d != m_num_machines = %d\n",

                 get_name(), outputs.vlen, m_num_machines);

     }


     SGVector<float64_t> new_outputs(m_num_classes);

     SGVector<float64_t>::fill_vector(new_outputs.vector, new_outputs.vlen, 1.0);


     for (int32_t j=0; j<m_num_classes; j++)

     {

         for (int32_t m=0; m<m_num_machines; m++)

         {

             if (indx1[m]==j)

                 new_outputs[j] *= outputs[m];

             if (indx2[m]==j)

                 new_outputs[j] *= 1-outputs[m];

         }


         new_outputs[j] += 1E-10;

     }


     float64_t norm = SGVector<float64_t>::sum(new_outputs);


     for (int32_t i=0; i<new_outputs.vlen; i++)

         outputs[i] = new_outputs[i] / norm;

 }


shogun::CMulticlassOneVsOneStrategy::train_prepare_next
virtual SGVector< int32_t > train_prepare_next()
Definition: MulticlassOneVsOneStrategy.cpp:53

shogun::CMulticlassOneVsOneStrategy::m_train_pair_idx_2
int32_t m_train_pair_idx_2
2nd index of current submachine being trained
Definition: MulticlassOneVsOneStrategy.h:119

shogun::PROB_HEURIS_NONE
Definition: MulticlassStrategy.h:38

shogun::SGVector::fill_vector
static void fill_vector(T *vec, int32_t len, T value)
Definition: SGVector.cpp:221

shogun::CMulticlassOneVsOneStrategy::rescale_heuris_hamamura
void rescale_heuris_hamamura(SGVector< float64_t > outputs, const SGVector< int32_t > indx1, const SGVector< int32_t > indx2)
Definition: MulticlassOneVsOneStrategy.cpp:293

shogun::CMulticlassStrategy::m_orig_labels
CMulticlassLabels * m_orig_labels
original multiclass labels
Definition: MulticlassStrategy.h:174

shogun::CMath::arg_max
static int32_t arg_max(T *vec, int32_t inc, int32_t len, T *maxv_ptr=NULL)
Definition: Math.h:262

Math.h

shogun::CDenseLabels::get_num_labels
virtual int32_t get_num_labels() const
Definition: DenseLabels.cpp:201

shogun::CMulticlassOneVsOneStrategy::train_start
virtual void train_start(CMulticlassLabels *orig_labels, CBinaryLabels *train_labels)
Definition: MulticlassOneVsOneStrategy.cpp:37

shogun::CMulticlassOneVsOneStrategy::m_train_pair_idx_1
int32_t m_train_pair_idx_1
1st index of current submachine being trained
Definition: MulticlassOneVsOneStrategy.h:118

shogun::CMulticlassOneVsOneStrategy::m_num_samples
SGVector< int32_t > m_num_samples
number of samples per machine
Definition: MulticlassOneVsOneStrategy.h:120

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

shogun::OVO_PRICE
Definition: MulticlassStrategy.h:41

shogun::CMulticlassOneVsOneStrategy::CMulticlassOneVsOneStrategy
CMulticlassOneVsOneStrategy()
Definition: MulticlassOneVsOneStrategy.cpp:19

shogun::CMulticlassStrategy::m_num_classes
int32_t m_num_classes
number of classes in this problem
Definition: MulticlassStrategy.h:176

BinaryLabels.h

shogun::CMulticlassLabels
Multiclass Labels for multi-class classification.
Definition: MulticlassLabels.h:36

shogun::CMulticlassOneVsOneStrategy::rescale_heuris_hastie
void rescale_heuris_hastie(SGVector< float64_t > outputs, const SGVector< int32_t > indx1, const SGVector< int32_t > indx2)
Definition: MulticlassOneVsOneStrategy.cpp:217

shogun::SGVector::vlen
index_t vlen
Definition: SGVector.h:494

shogun::SGVector::zero
void zero()
Definition: SGVector.cpp:136

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::CMulticlassStrategy::m_train_iter
int32_t m_train_iter
index of current iterations
Definition: MulticlassStrategy.h:175

shogun::CMulticlassOneVsOneStrategy::get_name
virtual const char * get_name() const
Definition: MulticlassOneVsOneStrategy.h:66

shogun::OVO_HAMAMURA
Definition: MulticlassStrategy.h:43

shogun::SGVector
shogun vector
Definition: base/Parameter.h:28

float64_t
double float64_t
Definition: common.h:50

shogun::CMulticlassOneVsOneStrategy::rescale_outputs
virtual void rescale_outputs(SGVector< float64_t > outputs)
Definition: MulticlassOneVsOneStrategy.cpp:144

shogun::OVO_HASTIE
Definition: MulticlassStrategy.h:42

shogun::SGVector::sum
static T sum(T *vec, int32_t len)
Return sum(vec)
Definition: SGVector.h:354

shogun::CMulticlassOneVsOneStrategy::train_has_more
virtual bool train_has_more()
Definition: MulticlassOneVsOneStrategy.cpp:48

shogun::CMulticlassOneVsOneStrategy::rescale_heuris_price
void rescale_heuris_price(SGVector< float64_t > outputs, const SGVector< int32_t > indx1, const SGVector< int32_t > indx2)
Definition: MulticlassOneVsOneStrategy.cpp:185

MulticlassLabels.h

SG_DEBUG
#define SG_DEBUG(...)
Definition: SGIO.h:107

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CMulticlassStrategy::m_train_labels
CBinaryLabels * m_train_labels
labels used to train the submachines
Definition: MulticlassStrategy.h:173

MulticlassOneVsOneStrategy.h

shogun::CMulticlassOneVsOneStrategy::m_num_machines
int32_t m_num_machines
number of machines
Definition: MulticlassOneVsOneStrategy.h:117

shogun::SGVector::clone
SGVector< T > clone() const
Definition: SGVector.cpp:207

shogun::CBinaryLabels
Binary Labels for binary classification.
Definition: BinaryLabels.h:37

shogun::CMulticlassStrategy
class MulticlassStrategy used to construct generic multiclass classifiers with ensembles of binary cl...
Definition: MulticlassStrategy.h:49

shogun::SGVector::qsq
static T qsq(T *x, int32_t len, float64_t q)
|| x ||_q^q
Definition: SGVector.cpp:724

shogun::SGVector::resize_vector
void resize_vector(int32_t n)
Definition: SGVector.cpp:257

shogun::CMulticlassStrategy::train_prepare_next
virtual SGVector< int32_t > train_prepare_next()
Definition: MulticlassStrategy.cpp:57

SG_WARNING
#define SG_WARNING(...)
Definition: SGIO.h:128

shogun::EProbHeuristicType
EProbHeuristicType
Definition: MulticlassStrategy.h:36

shogun::CMulticlassStrategy::train_start
virtual void train_start(CMulticlassLabels *orig_labels, CBinaryLabels *train_labels)
Definition: MulticlassStrategy.cpp:46

shogun::CMulticlassStrategy::get_prob_heuris_type
EProbHeuristicType get_prob_heuris_type()
Definition: MulticlassStrategy.h:130

shogun::CMath::abs
static T abs(T a)
Definition: Math.h:179

shogun::CMulticlassOneVsOneStrategy::decide_label
virtual int32_t decide_label(SGVector< float64_t > outputs)
Definition: MulticlassOneVsOneStrategy.cpp:89