en/current/MKLMulticlass_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * Written (W) 2009 Alexander Binder

  * Copyright (C) 2009 Fraunhofer Institute FIRST and Max-Planck-Society

  *

  * Update to patch 0.10.0 - thanks to Eric aka Yoo (thereisnoknife@gmail.com)

  *

  */


 #include <shogun/multiclass/MulticlassOneVsRestStrategy.h>

 #include <shogun/classifier/mkl/MKLMulticlass.h>

 #include <shogun/io/SGIO.h>

 #include <shogun/labels/MulticlassLabels.h>


 #include <vector>


 using namespace shogun;


 CMKLMulticlass::CMKLMulticlass()

 : CMulticlassSVM(new CMulticlassOneVsRestStrategy())

 {

     svm=NULL;

     lpw=NULL;


     mkl_eps=0.01;

     max_num_mkl_iters=999;

     pnorm=1;

 }


 CMKLMulticlass::CMKLMulticlass(float64_t C, CKernel* k, CLabels* lab)

 : CMulticlassSVM(new CMulticlassOneVsRestStrategy(), C, k, lab)

 {

     svm=NULL;

     lpw=NULL;


     mkl_eps=0.01;

     max_num_mkl_iters=999;

     pnorm=1;

 }


 CMKLMulticlass::~CMKLMulticlass()

 {

     SG_UNREF(svm);

     svm=NULL;

     delete lpw;

     lpw=NULL;

 }


 CMKLMulticlass::CMKLMulticlass( const CMKLMulticlass & cm)

 : CMulticlassSVM(new CMulticlassOneVsRestStrategy())

 {

     svm=NULL;

     lpw=NULL;

     SG_ERROR(

          " CMKLMulticlass::CMKLMulticlass(const CMKLMulticlass & cm): must "

             "not be called, glpk structure is currently not copyable");

 }


 CMKLMulticlass CMKLMulticlass::operator=( const CMKLMulticlass & cm)

 {

         SG_ERROR(

          " CMKLMulticlass CMKLMulticlass::operator=(...): must "

             "not be called, glpk structure is currently not copyable");

     return (*this);

 }


 void CMKLMulticlass::initsvm()

 {

    if (!m_labels)

     {

       SG_ERROR("CMKLMulticlass::initsvm(): the set labels is NULL\n")

     }


     SG_UNREF(svm);

     svm=new CGMNPSVM;

     SG_REF(svm);


    svm->set_C(get_C());

    svm->set_epsilon(get_epsilon());


    if (m_labels->get_num_labels()<=0)

     {

       SG_ERROR("CMKLMulticlass::initsvm(): the number of labels is "

                 "nonpositive, do not know how to handle this!\n");

     }


    svm->set_labels(m_labels);

 }


 void CMKLMulticlass::initlpsolver()

 {

    if (!m_kernel)

     {

       SG_ERROR("CMKLMulticlass::initlpsolver(): the set kernel is NULL\n")

     }


    if (m_kernel->get_kernel_type()!=K_COMBINED)

     {

       SG_ERROR("CMKLMulticlass::initlpsolver(): given kernel is not of type"

             " K_COMBINED %d required by Multiclass Mkl \n",

             m_kernel->get_kernel_type());

     }


    int numker=dynamic_cast<CCombinedKernel *>(m_kernel)->get_num_subkernels();


     ASSERT(numker>0)

     /*

     if (lpw)

     {

         delete lpw;

     }

     */


    //lpw=new MKLMulticlassGLPK;

     if(pnorm>1)

     {

       lpw=new MKLMulticlassGradient;

         lpw->set_mkl_norm(pnorm);

     }

     else

     {

       lpw=new MKLMulticlassGLPK;

     }

     lpw->setup(numker);


 }


 bool CMKLMulticlass::evaluatefinishcriterion(const int32_t

         numberofsilpiterations)

 {

     if ( (max_num_mkl_iters>0) && (numberofsilpiterations>=max_num_mkl_iters) )

         return true;


     if (weightshistory.size()>1)

     {

         std::vector<float64_t> wold,wnew;


         wold=weightshistory[ weightshistory.size()-2 ];

         wnew=weightshistory.back();

         float64_t delta=0;


         ASSERT (wold.size()==wnew.size())


         if((pnorm<=1)&&(!normweightssquared.empty()))

         {

             //check dual gap part for mkl


             delta=oldalphaterm-curalphaterm;


             int32_t maxind=0;

             float64_t maxval=normweightssquared[maxind];

             for (size_t i=0;i< wnew.size();++i)

             {

                 delta+=-0.5*oldnormweightssquared[i]*wold[i];

                 if(normweightssquared[i]>maxval)

                 {

                     maxind=i;

                     maxval=normweightssquared[i];

                 }

             }

             delta+=0.5*normweightssquared[maxind];

             //delta=fabs(delta);

             SG_SINFO("L1 Norm chosen, MKL part of duality gap %f \n",delta)

             if( (delta < mkl_eps) && (numberofsilpiterations>=1) )

             {

                 return true;

             }


         }

         else

         {

             delta=0;


             float64_t deltaold=oldalphaterm,deltanew=curalphaterm;

             for (size_t i=0;i< wnew.size();++i)

             {

                 delta+=(wold[i]-wnew[i])*(wold[i]-wnew[i]);

                 deltaold+= -0.5*oldnormweightssquared[i]*wold[i];

                 deltanew+= -0.5*normweightssquared[i]*wnew[i];

             }

             if(deltanew>0)

             {

             delta=1-deltanew/deltaold;

             }

             else

             {

             SG_SWARNING("CMKLMulticlass::evaluatefinishcriterion(...): deltanew<=0.Switching back to weight norsm difference as criterion.\n")

                 delta=sqrt(delta);

             }

                 SG_SINFO("weight delta %f \n",delta)


             if( (delta < mkl_eps) && (numberofsilpiterations>=1) )

             {

                 return true;

             }


         }

     }


     return false;

 }


 void CMKLMulticlass::addingweightsstep( const std::vector<float64_t> &

         curweights)

 {


     if (weightshistory.size()>2)

     {

         weightshistory.erase(weightshistory.begin());

     }


    //float64_t* weights(NULL);

    //weights=new float64_t[curweights.size()];

    SGVector<float64_t> weights(curweights.size());

    std::copy(curweights.begin(),curweights.end(),weights.vector);


    m_kernel->set_subkernel_weights(weights);

    //delete[] weights;

    //weights=NULL;


     initsvm();


    svm->set_kernel(m_kernel);

     svm->train();


     float64_t sumofsignfreealphas=getsumofsignfreealphas();

     curalphaterm=sumofsignfreealphas;


     int32_t numkernels=

          dynamic_cast<CCombinedKernel *>(m_kernel)->get_num_subkernels();


     normweightssquared.resize(numkernels);

     for (int32_t ind=0; ind < numkernels; ++ind )

     {

         normweightssquared[ind]=getsquarenormofprimalcoefficients( ind );

     }


     lpw->addconstraint(normweightssquared,sumofsignfreealphas);

 }


 float64_t CMKLMulticlass::getsumofsignfreealphas()

 {


    std::vector<int> trainlabels2(m_labels->get_num_labels());

    SGVector<int32_t> lab=((CMulticlassLabels*) m_labels)->get_int_labels();

    std::copy(lab.vector,lab.vector+lab.vlen, trainlabels2.begin());


     ASSERT (trainlabels2.size()>0)

     float64_t sum=0;


    for (int32_t nc=0; nc< ((CMulticlassLabels*) m_labels)->get_num_classes();++nc)

     {

         CSVM * sm=svm->get_svm(nc);


         float64_t bia=sm->get_bias();

         sum+= 0.5*bia*bia;


         SG_UNREF(sm);

     }


     index_t basealphas_y = 0, basealphas_x = 0;

     float64_t* basealphas = svm->get_basealphas_ptr(&basealphas_y,

                                                     &basealphas_x);


     for (size_t lb=0; lb< trainlabels2.size();++lb)

     {

       for (int32_t nc=0; nc< ((CMulticlassLabels*) m_labels)->get_num_classes();++nc)

         {

             CSVM * sm=svm->get_svm(nc);


             if ((int)nc!=trainlabels2[lb])

             {

                 CSVM * sm2=svm->get_svm(trainlabels2[lb]);


                 float64_t bia1=sm2->get_bias();

                 float64_t bia2=sm->get_bias();

                 SG_UNREF(sm2);


                 sum+= -basealphas[lb*basealphas_y + nc]*(bia1-bia2-1);

             }

             SG_UNREF(sm);

         }

     }


     return sum;

 }


 float64_t CMKLMulticlass::getsquarenormofprimalcoefficients(

         const int32_t ind)

 {

    CKernel * ker=dynamic_cast<CCombinedKernel *>(m_kernel)->get_kernel(ind);


     float64_t tmp=0;


    for (int32_t classindex=0; classindex< ((CMulticlassLabels*) m_labels)->get_num_classes();

             ++classindex)

     {

         CSVM * sm=svm->get_svm(classindex);


         for (int32_t i=0; i < sm->get_num_support_vectors(); ++i)

         {

             float64_t alphai=sm->get_alpha(i);

             int32_t svindi= sm->get_support_vector(i);


             for (int32_t k=0; k < sm->get_num_support_vectors(); ++k)

             {

                 float64_t alphak=sm->get_alpha(k);

                 int32_t svindk=sm->get_support_vector(k);


                 tmp+=alphai*ker->kernel(svindi,svindk)

                 *alphak;


             }

         }

         SG_UNREF(sm);

     }

     SG_UNREF(ker);

     ker=NULL;


     return tmp;

 }


 bool CMKLMulticlass::train_machine(CFeatures* data)

 {

    ASSERT(m_kernel)

    ASSERT(m_labels && m_labels->get_num_labels())

    ASSERT(m_labels->get_label_type() == LT_MULTICLASS)


    int numcl=((CMulticlassLabels*) m_labels)->get_num_classes();


     if (data)

     {

       if (m_labels->get_num_labels() != data->get_num_vectors())

       {

          SG_ERROR("%s::train_machine(): Number of training vectors (%d) does"

                " not match number of labels (%d)\n", get_name(),

                data->get_num_vectors(), m_labels->get_num_labels());

       }

       m_kernel->init(data, data);

     }


     initlpsolver();


     weightshistory.clear();


     int32_t numkernels=

          dynamic_cast<CCombinedKernel *>(m_kernel)->get_num_subkernels();


     ::std::vector<float64_t> curweights(numkernels,1.0/numkernels);

     weightshistory.push_back(curweights);


     addingweightsstep(curweights);


     oldalphaterm=curalphaterm;

     oldnormweightssquared=normweightssquared;


     int32_t numberofsilpiterations=0;

     bool final=false;

     while (!final)

     {


         //curweights.clear();

         lpw->computeweights(curweights);

         weightshistory.push_back(curweights);


         addingweightsstep(curweights);


         //new weights new biasterm


         final=evaluatefinishcriterion(numberofsilpiterations);


         oldalphaterm=curalphaterm;

         oldnormweightssquared=normweightssquared;


         ++numberofsilpiterations;


     } // while(false==final)


     //set alphas, bias, support vecs

     ASSERT(numcl>=1)

    create_multiclass_svm(numcl);


     for (int32_t i=0; i<numcl; i++)

     {

         CSVM* osvm=svm->get_svm(i);

         CSVM* nsvm=new CSVM(osvm->get_num_support_vectors());


         for (int32_t k=0; k<osvm->get_num_support_vectors() ; k++)

         {

             nsvm->set_alpha(k, osvm->get_alpha(k) );

             nsvm->set_support_vector(k,osvm->get_support_vector(k) );

         }

         nsvm->set_bias(osvm->get_bias() );

         set_svm(i, nsvm);


         SG_UNREF(osvm);

         osvm=NULL;

     }


     SG_UNREF(svm);

     svm=NULL;

     if (lpw)

     {

         delete lpw;

     }

     lpw=NULL;

     return true;

 }


 float64_t* CMKLMulticlass::getsubkernelweights(int32_t & numweights)

 {

     if ( weightshistory.empty() )

     {

         numweights=0;

         return NULL;

     }


     std::vector<float64_t> subkerw=weightshistory.back();

     numweights=weightshistory.back().size();


     float64_t* res=new float64_t[numweights];

     std::copy(weightshistory.back().begin(), weightshistory.back().end(),res);

     return res;

 }


 void CMKLMulticlass::set_mkl_epsilon(float64_t eps )

 {

     mkl_eps=eps;

 }


 void CMKLMulticlass::set_max_num_mkliters(int32_t maxnum)

 {

     max_num_mkl_iters=maxnum;

 }


 void CMKLMulticlass::set_mkl_norm(float64_t norm)

 {

     pnorm=norm;

     if(pnorm<1 )

       SG_ERROR("CMKLMulticlass::set_mkl_norm(float64_t norm) : parameter pnorm<1")

 }

shogun::CMulticlassSVM::set_epsilon
void set_epsilon(float64_t eps)
Definition: MulticlassSVM.h:167

shogun::CMKLMulticlass::oldnormweightssquared
std::vector< float64_t > oldnormweightssquared
Definition: MKLMulticlass.h:204

shogun::CKernel::init
virtual bool init(CFeatures *lhs, CFeatures *rhs)
Definition: Kernel.cpp:98

shogun::CKernelMachine::get_num_support_vectors
int32_t get_num_support_vectors()
Definition: KernelMachine.cpp:169

shogun::CMKLMulticlass::~CMKLMulticlass
virtual ~CMKLMulticlass()
Definition: MKLMulticlass.cpp:47

shogun::CMulticlassSVM::get_epsilon
float64_t get_epsilon()
Definition: MulticlassSVM.h:105

shogun::CKernelMulticlassMachine::m_kernel
CKernel * m_kernel
Definition: KernelMulticlassMachine.h:100

norm
double norm(double *v, double p, int n)
Definition: epph.cpp:452

shogun::CLabels::get_label_type
virtual ELabelType get_label_type() const =0

shogun::CMKLMulticlass
MKLMulticlass is a class for L1-norm Multiclass MKL.
Definition: MKLMulticlass.h:40

index_t
int32_t index_t
Definition: common.h:62

shogun::CKernelMulticlassMachine::set_kernel
void set_kernel(CKernel *k)
Definition: KernelMulticlassMachine.cpp:114

shogun::CLabels
The class Labels models labels, i.e. class assignments of objects.
Definition: Labels.h:43

shogun::CLabels::get_num_labels
virtual int32_t get_num_labels() const =0

SGIO.h

LT_MULTICLASS
multi-class labels 0,1,...
Definition: LabelTypes.h:20

shogun::MKLMulticlassGLPK
MKLMulticlassGLPK is a helper class for MKLMulticlass.
Definition: MKLMulticlassGLPK.h:29

SG_SWARNING
#define SG_SWARNING(...)
Definition: SGIO.h:178

shogun::MKLMulticlassOptimizationBase::set_mkl_norm
virtual void set_mkl_norm(float64_t norm)
Definition: MKLMulticlassOptimizationBase.cpp:33

shogun::CFeatures::get_num_vectors
virtual int32_t get_num_vectors() const =0

shogun::CGMNPSVM::get_basealphas_ptr
float64_t * get_basealphas_ptr(index_t *y, index_t *x)
Definition: GMNPSVM.cpp:186

shogun::CMachine::m_labels
CLabels * m_labels
Definition: Machine.h:361

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

shogun::CKernel::kernel
float64_t kernel(int32_t idx_a, int32_t idx_b)
Definition: Kernel.h:206

shogun::CMKLMulticlass::pnorm
float64_t pnorm
Definition: MKLMulticlass.h:195

shogun::CMKLMulticlass::addingweightsstep
void addingweightsstep(const std::vector< float64_t > &curweights)
Definition: MKLMulticlass.cpp:214

SG_REF
#define SG_REF(x)
Definition: SGObject.h:51

shogun::CMKLMulticlass::CMKLMulticlass
CMKLMulticlass()
Definition: MKLMulticlass.cpp:24

MKLMulticlass.h

shogun::CMKLMulticlass::set_mkl_norm
virtual void set_mkl_norm(float64_t norm)
Definition: MKLMulticlass.cpp:454

shogun::CMKLMulticlass::mkl_eps
float64_t mkl_eps
Definition: MKLMulticlass.h:185

shogun::CMKLMulticlass::operator=
CMKLMulticlass operator=(const CMKLMulticlass &cm)
Definition: MKLMulticlass.cpp:65

shogun::CMKLMulticlass::evaluatefinishcriterion
virtual bool evaluatefinishcriterion(const int32_t numberofsilpiterations)
Definition: MKLMulticlass.cpp:136

shogun::CMulticlassLabels
Multiclass Labels for multi-class classification.
Definition: MulticlassLabels.h:36

shogun::CMKLMulticlass::curalphaterm
float64_t curalphaterm
Definition: MKLMulticlass.h:207

shogun::CMulticlassSVM::get_C
float64_t get_C()
Definition: MulticlassSVM.h:115

shogun::CMKLMulticlass::initlpsolver
void initlpsolver()
Definition: MKLMulticlass.cpp:97

shogun::K_COMBINED
Definition: Kernel.h:80

shogun::CMKLMulticlass::getsquarenormofprimalcoefficients
float64_t getsquarenormofprimalcoefficients(const int32_t ind)
Definition: MKLMulticlass.cpp:300

ASSERT
#define ASSERT(x)
Definition: SGIO.h:201

shogun::CMulticlassSVM
class MultiClassSVM
Definition: MulticlassSVM.h:28

shogun::CKernelMachine::set_bias
void set_bias(float64_t bias)
Definition: KernelMachine.cpp:129

shogun::SGVector< float64_t >

shogun::MKLMulticlassOptimizationBase::setup
virtual void setup(const int32_t numkernels2)
Definition: MKLMulticlassOptimizationBase.cpp:27

shogun::MKLMulticlassOptimizationBase::addconstraint
virtual void addconstraint(const ::std::vector< float64_t > &normw2, const float64_t sumofpositivealphas)
Definition: MKLMulticlassOptimizationBase.cpp:39

shogun::CMKLMulticlass::svm
CGMNPSVM * svm
Definition: MKLMulticlass.h:174

float64_t
double float64_t
Definition: common.h:50

shogun::CMKLMulticlass::weightshistory
::std::vector< std::vector< float64_t > > weightshistory
Definition: MKLMulticlass.h:180

shogun::CKernelMachine::set_alpha
bool set_alpha(int32_t idx, float64_t val)
Definition: KernelMachine.cpp:159

shogun::CMKLMulticlass::getsumofsignfreealphas
float64_t getsumofsignfreealphas()
Definition: MKLMulticlass.cpp:253

shogun::CKernelMulticlassMachine::get_kernel
CKernel * get_kernel()
Definition: KernelMulticlassMachine.cpp:122

shogun::CMulticlassSVM::set_C
void set_C(float64_t C)
Definition: MulticlassSVM.h:162

shogun::CKernelMachine::get_alpha
float64_t get_alpha(int32_t idx)
Definition: KernelMachine.cpp:140

shogun::CMKLMulticlass::getsubkernelweights
float64_t * getsubkernelweights(int32_t &numweights)
Definition: MKLMulticlass.cpp:428

shogun::CCombinedKernel
The Combined kernel is used to combine a number of kernels into a single CombinedKernel object by lin...
Definition: CombinedKernel.h:49

shogun::CKernelMachine::set_support_vector
bool set_support_vector(int32_t idx, int32_t val)
Definition: KernelMachine.cpp:149

shogun::CMKLMulticlass::oldalphaterm
float64_t oldalphaterm
Definition: MKLMulticlass.h:209

shogun::CKernelMachine::get_support_vector
int32_t get_support_vector(int32_t idx)
Definition: KernelMachine.cpp:134

shogun::CKernel::set_subkernel_weights
virtual void set_subkernel_weights(SGVector< float64_t > weights)
Definition: Kernel.cpp:887

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:52

shogun::CMKLMulticlass::lpw
MKLMulticlassOptimizationBase * lpw
Definition: MKLMulticlass.h:177

MulticlassLabels.h

shogun::CMKLMulticlass::initsvm
void initsvm()
Definition: MKLMulticlass.cpp:74

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CKernel::get_kernel_type
virtual EKernelType get_kernel_type()=0

shogun::CGMNPSVM
Class GMNPSVM implements a one vs. rest MultiClass SVM.
Definition: GMNPSVM.h:26

MulticlassOneVsRestStrategy.h

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::CMulticlassSVM::create_multiclass_svm
bool create_multiclass_svm(int32_t num_classes)
Definition: MulticlassSVM.cpp:48

SG_SINFO
#define SG_SINFO(...)
Definition: SGIO.h:173

shogun::CMachine::train
virtual bool train(CFeatures *data=NULL)
Definition: Machine.cpp:39

shogun::CMKLMulticlass::normweightssquared
std::vector< float64_t > normweightssquared
Definition: MKLMulticlass.h:201

shogun::CMKLMulticlass::set_mkl_epsilon
void set_mkl_epsilon(float64_t eps)
Definition: MKLMulticlass.cpp:444

shogun::CSVM
A generic Support Vector Machine Interface.
Definition: SVM.h:49

shogun::CKernel
The Kernel base class.
Definition: Kernel.h:158

shogun::CMulticlassOneVsRestStrategy
multiclass one vs rest strategy used to train generic multiclass machines for K-class problems with b...
Definition: MulticlassOneVsRestStrategy.h:33

shogun::CMulticlassSVM::set_svm
bool set_svm(int32_t num, CSVM *svm)
Definition: MulticlassSVM.cpp:63

shogun::CKernelMachine::get_bias
float64_t get_bias()
Definition: KernelMachine.cpp:124

shogun::CMKLMulticlass::train_machine
virtual bool train_machine(CFeatures *data=NULL)
Definition: MKLMulticlass.cpp:336

delta
#define delta
Definition: sfa.cpp:23

shogun::CMKLMulticlass::get_name
virtual const char * get_name() const
Definition: MKLMulticlass.h:167

shogun::CMulticlassMachine::set_labels
virtual void set_labels(CLabels *lab)
Definition: MulticlassMachine.cpp:52

shogun::CMulticlassSVM::get_svm
CSVM * get_svm(int32_t num)
Definition: MulticlassSVM.h:76

shogun::MKLMulticlassOptimizationBase::computeweights
virtual void computeweights(std::vector< float64_t > &weights2)
Definition: MKLMulticlassOptimizationBase.cpp:48

shogun::CMKLMulticlass::set_max_num_mkliters
void set_max_num_mkliters(int32_t maxnum)
Definition: MKLMulticlass.cpp:449

shogun::MKLMulticlassGradient
MKLMulticlassGradient is a helper class for MKLMulticlass.
Definition: MKLMulticlassGradient.h:30

shogun::CMKLMulticlass::max_num_mkl_iters
int32_t max_num_mkl_iters
Definition: MKLMulticlass.h:190