en/current/libp3bm_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * libppbm.h: Implementation of the Proximal Point BM solver for SO training

  *

  * Copyright (C) 2012 Michal Uricar, uricamic@cmp.felk.cvut.cz

  *

  * Implementation of the Proximal Point P-BMRM (p3bm)

  *--------------------------------------------------------------------- */


 #include <shogun/structure/libp3bm.h>

 #include <shogun/lib/external/libqp.h>

 #include <shogun/lib/Time.h>

  #include <shogun/mathematics/Math.h>


 namespace shogun

 {

 static const uint32_t QPSolverMaxIter=0xFFFFFFFF;

 static const float64_t epsilon=0.0;


 static float64_t *H, *H2;


 /*----------------------------------------------------------------------

   Returns pointer at i-th column of Hessian matrix.

   ----------------------------------------------------------------------*/

 static const float64_t *get_col( uint32_t i)

 {

     return( &H2[ BufSize*i ] );

 }


 BmrmStatistics svm_p3bm_solver(

         CDualLibQPBMSOSVM *machine,

         float64_t*      W,

         float64_t       TolRel,

         float64_t       TolAbs,

         float64_t       _lambda,

         uint32_t        _BufSize,

         bool            cleanICP,

         uint32_t        cleanAfter,

         float64_t       K,

         uint32_t        Tmax,

         uint32_t        cp_models,

         bool            verbose)

 {

     BmrmStatistics p3bmrm;

     libqp_state_T qp_exitflag={0, 0, 0, 0}, qp_exitflag_good={0, 0, 0, 0};

     float64_t *b, *b2, *beta, *beta_good, *beta_start, *diag_H, *diag_H2;

     float64_t R, *Rt, **subgrad_t, *A, QPSolverTolRel, *C=NULL;

     float64_t *prevW, *wt, alpha, alpha_start, alpha_good=0.0, Fd_alpha0=0.0;

     float64_t lastFp, wdist, gamma=0.0;

     floatmax_t rsum, sq_norm_W, sq_norm_Wdiff, sq_norm_prevW, eps;

     uint32_t *I, *I2, *I_start, *I_good;

     uint8_t *S=NULL;

     uint32_t qp_cnt=0;

     bmrm_ll *CPList_head, *CPList_tail, *cp_ptr, *cp_ptr2, *cp_list=NULL;

     float64_t *A_1=NULL;

     bool *map=NULL, tuneAlpha=true, flag=true;

     bool alphaChanged=false, isThereGoodSolution=false;

     TMultipleCPinfo **info=NULL;

     CStructuredModel* model=machine->get_model();

     CSOSVMHelper* helper = NULL;

     uint32_t nDim=model->get_dim();

     uint32_t to=0, N=0, cp_i=0;


     CTime ttime;

     float64_t tstart, tstop;


     tstart=ttime.cur_time_diff(false);


     BufSize=_BufSize*cp_models;

     QPSolverTolRel=1e-9;


     H=NULL;

     b=NULL;

     beta=NULL;

     A=NULL;

     subgrad_t=NULL;

     diag_H=NULL;

     I=NULL;

     prevW=NULL;

     wt=NULL;

     diag_H2=NULL;

     b2=NULL;

     I2=NULL;

     H2=NULL;

     I_good=NULL;

     I_start=NULL;

     beta_start=NULL;

     beta_good=NULL;


     alpha=0.0;


     H= (float64_t*) LIBBMRM_CALLOC(BufSize*BufSize, float64_t);


     A= (float64_t*) LIBBMRM_CALLOC(nDim*BufSize, float64_t);


     b= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     beta= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     subgrad_t= (float64_t**) LIBBMRM_CALLOC(cp_models, float64_t*);


     Rt= (float64_t*) LIBBMRM_CALLOC(cp_models, float64_t);


     diag_H= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     I= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);


     cp_list= (bmrm_ll*) LIBBMRM_CALLOC(1, bmrm_ll);


     prevW= (float64_t*) LIBBMRM_CALLOC(nDim, float64_t);


     wt= (float64_t*) LIBBMRM_CALLOC(nDim, float64_t);


     C= (float64_t*) LIBBMRM_CALLOC(cp_models, float64_t);


     S= (uint8_t*) LIBBMRM_CALLOC(cp_models, uint8_t);


     info= (TMultipleCPinfo**) LIBBMRM_CALLOC(cp_models, TMultipleCPinfo*);


     CFeatures* features = model->get_features();

     int32_t num_feats = features->get_num_vectors();

     SG_UNREF(features);


     /* CP cleanup variables */

     ICP_stats icp_stats;

     icp_stats.maxCPs = BufSize;

     icp_stats.ICPcounter= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);

     icp_stats.ICPs= (float64_t**) LIBBMRM_CALLOC(BufSize, float64_t*);

     icp_stats.ACPs= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);

     icp_stats.H_buff= (float64_t*) LIBBMRM_CALLOC(BufSize*BufSize, float64_t);


     if (H==NULL || A==NULL || b==NULL || beta==NULL || subgrad_t==NULL ||

             diag_H==NULL || I==NULL || icp_stats.ICPcounter==NULL ||

             icp_stats.ICPs==NULL || icp_stats.ACPs==NULL ||

             cp_list==NULL || prevW==NULL || wt==NULL || Rt==NULL || C==NULL ||

             S==NULL || info==NULL || icp_stats.H_buff==NULL)

     {

         p3bmrm.exitflag=-2;

         goto cleanup;

     }


     /* multiple cutting plane model init */


     to=0;

     N= (uint32_t) round( (float64_t) ((float64_t)num_feats / (float64_t) cp_models));


     for (uint32_t p=0; p<cp_models; ++p)

     {

         S[p]=1;

         C[p]=1.0;

         info[p]=(TMultipleCPinfo*)LIBBMRM_CALLOC(1, TMultipleCPinfo);

         subgrad_t[p]=(float64_t*)LIBBMRM_CALLOC(nDim, float64_t);


         if (subgrad_t[p]==NULL || info[p]==NULL)

         {

             p3bmrm.exitflag=-2;

             goto cleanup;

         }


         info[p]->m_from=to;

         to=((p+1)*N > (uint32_t)num_feats) ? (uint32_t)num_feats : (p+1)*N;

         info[p]->m_N=to-info[p]->m_from;

     }


     map= (bool*) LIBBMRM_CALLOC(BufSize, bool);


     if (map==NULL)

     {

         p3bmrm.exitflag=-2;

         goto cleanup;

     }


     memset( (bool*) map, true, BufSize);


     /* Temporary buffers */

     beta_start= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     beta_good= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     b2= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     diag_H2= (float64_t*) LIBBMRM_CALLOC(BufSize, float64_t);


     H2= (float64_t*) LIBBMRM_CALLOC(BufSize*BufSize, float64_t);


     I_start= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);


     I_good= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);


     I2= (uint32_t*) LIBBMRM_CALLOC(BufSize, uint32_t);


     if (beta_start==NULL || beta_good==NULL || b2==NULL || diag_H2==NULL ||

             I_start==NULL || I_good==NULL || I2==NULL || H2==NULL)

     {

         p3bmrm.exitflag=-2;

         goto cleanup;

     }


     p3bmrm.hist_Fp.resize_vector(BufSize);

     p3bmrm.hist_Fd.resize_vector(BufSize);

     p3bmrm.hist_wdist.resize_vector(BufSize);


     /* Iinitial solution */

     Rt[0] = machine->risk(subgrad_t[0], W, info[0]);


     p3bmrm.nCP=0;

     p3bmrm.nIter=0;

     p3bmrm.exitflag=0;


     b[0]=-Rt[0];


     /* Cutting plane auxiliary double linked list */

     LIBBMRM_MEMCPY(A, subgrad_t[0], nDim*sizeof(float64_t));

     map[0]=false;

     cp_list->address=&A[0];

     cp_list->idx=0;

     cp_list->prev=NULL;

     cp_list->next=NULL;

     CPList_head=cp_list;

     CPList_tail=cp_list;


     for (uint32_t p=1; p<cp_models; ++p)

     {

         Rt[p] = machine->risk(subgrad_t[p], W, info[p]);

         b[p]=CMath::dot(subgrad_t[p], W, nDim) - Rt[p];

         add_cutting_plane(&CPList_tail, map, A, find_free_idx(map, BufSize), subgrad_t[p], nDim);

     }


     /* Compute initial value of Fp, Fd, assuming that W is zero vector */

     R=0.0;


     for (uint32_t p=0; p<cp_models; ++p)

         R+=Rt[p];


     sq_norm_W=CMath::dot(W, W, nDim);

     sq_norm_Wdiff=0.0;


     for (uint32_t j=0; j<nDim; ++j)

     {

         sq_norm_Wdiff+=(W[j]-prevW[j])*(W[j]-prevW[j]);

     }


     wdist=CMath::sqrt(sq_norm_Wdiff);


     p3bmrm.Fp=R+0.5*_lambda*sq_norm_W + alpha*sq_norm_Wdiff;

     p3bmrm.Fd=-LIBBMRM_PLUS_INF;

     lastFp=p3bmrm.Fp;


     /* if there is initial W, then set K to be 0.01 times its norm */

     K = (sq_norm_W == 0.0) ? 0.4 : 0.01*CMath::sqrt(sq_norm_W);


     LIBBMRM_MEMCPY(prevW, W, nDim*sizeof(float64_t));


     tstop=ttime.cur_time_diff(false);


     /* Keep history of Fp, Fd, and wdist */

     p3bmrm.hist_Fp[0]=p3bmrm.Fp;

     p3bmrm.hist_Fd[0]=p3bmrm.Fd;

     p3bmrm.hist_wdist[0]=wdist;


     /* Verbose output */

     if (verbose)

         SG_SDEBUG("%4d: tim=%.3lf, Fp=%lf, Fd=%lf, R=%lf, K=%lf, CPmodels=%d\n",

                 p3bmrm.nIter, tstop-tstart, p3bmrm.Fp, p3bmrm.Fd, R, K, cp_models);


     if (verbose)

         helper = machine->get_helper();


     /* main loop */

     while (p3bmrm.exitflag==0)

     {

         tstart=ttime.cur_time_diff(false);

         p3bmrm.nIter++;


         /* Update H */

         if (p3bmrm.nIter==1)

         {

             cp_ptr=CPList_head;


             for (cp_i=0; cp_i<cp_models; ++cp_i)  /* for all cutting planes */

             {

                 A_1=get_cutting_plane(cp_ptr);


                 for (uint32_t p=0; p<cp_models; ++p)

                 {

                     rsum=CMath::dot(A_1, subgrad_t[p], nDim);


                     H[LIBBMRM_INDEX(p, cp_i, BufSize)]=rsum;

                 }


                 cp_ptr=cp_ptr->next;

             }

         }

         else

         {

             cp_ptr=CPList_head;


             for (cp_i=0; cp_i<p3bmrm.nCP+cp_models; ++cp_i)  /* for all cutting planes */

             {

                 A_1=get_cutting_plane(cp_ptr);


                 for (uint32_t p=0; p<cp_models; ++p)

                 {

                     rsum=CMath::dot(A_1, subgrad_t[p], nDim);


                     H[LIBBMRM_INDEX(p3bmrm.nCP+p, cp_i, BufSize)]=rsum;

                 }


                 cp_ptr=cp_ptr->next;

             }


             for (uint32_t i=0; i<p3bmrm.nCP; ++i)

                 for (uint32_t j=0; j<cp_models; ++j)

                     H[LIBBMRM_INDEX(i, p3bmrm.nCP+j, BufSize)]=

                         H[LIBBMRM_INDEX(p3bmrm.nCP+j, i, BufSize)];

         }


         for (uint32_t p=0; p<cp_models; ++p)

             diag_H[p3bmrm.nCP+p]=H[LIBBMRM_INDEX(p3bmrm.nCP+p, p3bmrm.nCP+p, BufSize)];


         p3bmrm.nCP+=cp_models;


         /* tune alpha cycle */

         /* ------------------------------------------------------------------------ */

         flag=true;

         isThereGoodSolution=false;


         for (uint32_t p=0; p<cp_models; ++p)

         {

             I[p3bmrm.nCP-cp_models+p]=p+1;

             beta[p3bmrm.nCP-cp_models+p]=0.0;

         }


         LIBBMRM_MEMCPY(beta_start, beta, p3bmrm.nCP*sizeof(float64_t));

         LIBBMRM_MEMCPY(I_start, I, p3bmrm.nCP*sizeof(uint32_t));

         qp_cnt=0;


         if (tuneAlpha)

         {

             alpha_start=alpha; alpha=0.0;

             LIBBMRM_MEMCPY(I2, I_start, p3bmrm.nCP*sizeof(uint32_t));


             /* add alpha-dependent terms to H, diag_h and b */

             cp_ptr=CPList_head;


             for (uint32_t i=0; i<p3bmrm.nCP; ++i)

             {

                 A_1=get_cutting_plane(cp_ptr);

                 cp_ptr=cp_ptr->next;


                 rsum = CMath::dot(A_1, prevW, nDim);


                 b2[i]=b[i]-((2*alpha)/(_lambda+2*alpha))*rsum;

                 diag_H2[i]=diag_H[i]/(_lambda+2*alpha);


                 for (uint32_t j=0; j<p3bmrm.nCP; ++j)

                     H2[LIBBMRM_INDEX(i, j, BufSize)]=

                         H[LIBBMRM_INDEX(i, j, BufSize)]/(_lambda+2*alpha);


             }


             /* solve QP with current alpha */

             qp_exitflag=libqp_splx_solver(&get_col, diag_H2, b2, C, I2, S, beta,

                     p3bmrm.nCP, QPSolverMaxIter, 0.0, QPSolverTolRel, -LIBBMRM_PLUS_INF, 0);

             p3bmrm.qp_exitflag=qp_exitflag.exitflag;

             qp_cnt++;

             Fd_alpha0=-qp_exitflag.QP;


             /* obtain w_t and check if norm(w_{t+1} -w_t) <= K */

             memset(wt, 0, sizeof(float64_t)*nDim);

             SGVector<float64_t>::vec1_plus_scalar_times_vec2(wt, 2*alpha/(_lambda+2*alpha), prevW, nDim);

             cp_ptr=CPList_head;

             for (uint32_t j=0; j<p3bmrm.nCP; ++j)

             {

                 A_1=get_cutting_plane(cp_ptr);

                 cp_ptr=cp_ptr->next;

                 SGVector<float64_t>::vec1_plus_scalar_times_vec2(wt, -beta[j]/(_lambda+2*alpha), A_1, nDim);

             }


             sq_norm_Wdiff=0.0;


             for (uint32_t i=0; i<nDim; ++i)

                 sq_norm_Wdiff+=(wt[i]-prevW[i])*(wt[i]-prevW[i]);


             if (CMath::sqrt(sq_norm_Wdiff) <= K)

             {

                 flag=false;


                 if (alpha!=alpha_start)

                     alphaChanged=true;

             }

             else

             {

                 alpha=alpha_start;

             }


             while(flag)

             {

                 LIBBMRM_MEMCPY(I2, I_start, p3bmrm.nCP*sizeof(uint32_t));

                 LIBBMRM_MEMCPY(beta, beta_start, p3bmrm.nCP*sizeof(float64_t));


                 /* add alpha-dependent terms to H, diag_h and b */

                 cp_ptr=CPList_head;


                 for (uint32_t i=0; i<p3bmrm.nCP; ++i)

                 {

                     A_1=get_cutting_plane(cp_ptr);

                     cp_ptr=cp_ptr->next;


                     rsum = CMath::dot(A_1, prevW, nDim);


                     b2[i]=b[i]-((2*alpha)/(_lambda+2*alpha))*rsum;

                     diag_H2[i]=diag_H[i]/(_lambda+2*alpha);


                     for (uint32_t j=0; j<p3bmrm.nCP; ++j)

                         H2[LIBBMRM_INDEX(i, j, BufSize)]=H[LIBBMRM_INDEX(i, j, BufSize)]/(_lambda+2*alpha);

                 }


                 /* solve QP with current alpha */

                 qp_exitflag=libqp_splx_solver(&get_col, diag_H2, b2, C, I2, S, beta,

                         p3bmrm.nCP, QPSolverMaxIter, 0.0, QPSolverTolRel, -LIBBMRM_PLUS_INF, 0);

                 p3bmrm.qp_exitflag=qp_exitflag.exitflag;

                 qp_cnt++;


                 /* obtain w_t and check if norm(w_{t+1}-w_t) <= K */

                 memset(wt, 0, sizeof(float64_t)*nDim);

                 SGVector<float64_t>::vec1_plus_scalar_times_vec2(wt, 2*alpha/(_lambda+2*alpha), prevW, nDim);

                 cp_ptr=CPList_head;

                 for (uint32_t j=0; j<p3bmrm.nCP; ++j)

                 {

                     A_1=get_cutting_plane(cp_ptr);

                     cp_ptr=cp_ptr->next;

                     SGVector<float64_t>::vec1_plus_scalar_times_vec2(wt, -beta[j]/(_lambda+2*alpha), A_1, nDim);

                 }


                 sq_norm_Wdiff=0.0;


                 for (uint32_t i=0; i<nDim; ++i)

                     sq_norm_Wdiff+=(wt[i]-prevW[i])*(wt[i]-prevW[i]);


                 if (CMath::sqrt(sq_norm_Wdiff) > K)

                 {

                     /* if there is a record of some good solution (i.e. adjust alpha by division by 2) */


                     if (isThereGoodSolution)

                     {

                         LIBBMRM_MEMCPY(beta, beta_good, p3bmrm.nCP*sizeof(float64_t));

                         LIBBMRM_MEMCPY(I2, I_good, p3bmrm.nCP*sizeof(uint32_t));

                         alpha=alpha_good;

                         qp_exitflag=qp_exitflag_good;

                         flag=false;

                     }

                     else

                     {

                         if (alpha == 0)

                         {

                             alpha=1.0;

                             alphaChanged=true;

                         }

                         else

                         {

                             alpha*=2;

                             alphaChanged=true;

                         }

                     }

                 }

                 else

                 {

                     if (alpha > 0)

                     {

                         /* keep good solution and try for alpha /= 2 if previous alpha was 1 */

                         LIBBMRM_MEMCPY(beta_good, beta, p3bmrm.nCP*sizeof(float64_t));

                         LIBBMRM_MEMCPY(I_good, I2, p3bmrm.nCP*sizeof(uint32_t));

                         alpha_good=alpha;

                         qp_exitflag_good=qp_exitflag;

                         isThereGoodSolution=true;


                         if (alpha!=1.0)

                         {

                             alpha/=2.0;

                             alphaChanged=true;

                         }

                         else

                         {

                             alpha=0.0;

                             alphaChanged=true;

                         }

                     }

                     else

                     {

                         flag=false;

                     }

                 }

             }

         }

         else

         {

             alphaChanged=false;

             LIBBMRM_MEMCPY(I2, I_start, p3bmrm.nCP*sizeof(uint32_t));

             LIBBMRM_MEMCPY(beta, beta_start, p3bmrm.nCP*sizeof(float64_t));


             /* add alpha-dependent terms to H, diag_h and b */

             cp_ptr=CPList_head;


             for (uint32_t i=0; i<p3bmrm.nCP; ++i)

             {

                 A_1=get_cutting_plane(cp_ptr);

                 cp_ptr=cp_ptr->next;


                 rsum = CMath::dot(A_1, prevW, nDim);


                 b2[i]=b[i]-((2*alpha)/(_lambda+2*alpha))*rsum;

                 diag_H2[i]=diag_H[i]/(_lambda+2*alpha);


                 for (uint32_t j=0; j<p3bmrm.nCP; ++j)

                     H2[LIBBMRM_INDEX(i, j, BufSize)]=H[LIBBMRM_INDEX(i, j, BufSize)]/(_lambda+2*alpha);

             }


             /* solve QP with current alpha */

             qp_exitflag=libqp_splx_solver(&get_col, diag_H2, b2, C, I2, S, beta,

                     p3bmrm.nCP, QPSolverMaxIter, 0.0, QPSolverTolRel, -LIBBMRM_PLUS_INF, 0);

             p3bmrm.qp_exitflag=qp_exitflag.exitflag;

             qp_cnt++;

         }

         /* ----------------------------------------------------------------------------------------------- */


         /* Update ICPcounter (add one to unused and reset used) + compute number of active CPs */

         p3bmrm.nzA=0;


         for (uint32_t aaa=0; aaa<p3bmrm.nCP; ++aaa)

         {

             if (beta[aaa]>epsilon)

             {

                 ++p3bmrm.nzA;

                 icp_stats.ICPcounter[aaa]=0;

             }

             else

             {

                 icp_stats.ICPcounter[aaa]+=1;

             }

         }


         /* W update */

         memset(W, 0, sizeof(float64_t)*nDim);

         SGVector<float64_t>::vec1_plus_scalar_times_vec2(W, 2*alpha/(_lambda+2*alpha), prevW, nDim);

         cp_ptr=CPList_head;

         for (uint32_t j=0; j<p3bmrm.nCP; ++j)

         {

             A_1=get_cutting_plane(cp_ptr);

             cp_ptr=cp_ptr->next;

             SGVector<float64_t>::vec1_plus_scalar_times_vec2(W, -beta[j]/(_lambda+2*alpha), A_1, nDim);

         }


         /* risk and subgradient computation */

         R=0.0;


         for (uint32_t p=0; p<cp_models; ++p)

         {

             Rt[p] = machine->risk(subgrad_t[p], W, info[p]);

             b[p3bmrm.nCP+p] = CMath::dot(subgrad_t[p], W, nDim) - Rt[p];

             add_cutting_plane(&CPList_tail, map, A, find_free_idx(map, BufSize), subgrad_t[p], nDim);

             R+=Rt[p];

         }


         sq_norm_W=CMath::dot(W, W, nDim);

         sq_norm_prevW=CMath::dot(prevW, prevW, nDim);

         sq_norm_Wdiff=0.0;


         for (uint32_t j=0; j<nDim; ++j)

         {

             sq_norm_Wdiff+=(W[j]-prevW[j])*(W[j]-prevW[j]);

         }


         /* compute Fp and Fd */

         p3bmrm.Fp=R+0.5*_lambda*sq_norm_W + alpha*sq_norm_Wdiff;

         p3bmrm.Fd=-qp_exitflag.QP + ((alpha*_lambda)/(_lambda + 2*alpha))*sq_norm_prevW;


         /* gamma + tuneAlpha flag */

         if (alphaChanged)

         {

             eps=1.0-(p3bmrm.Fd/p3bmrm.Fp);

             gamma=(lastFp*(1-eps)-Fd_alpha0)/(Tmax*(1-eps));

         }


         if ((lastFp-p3bmrm.Fp) <= gamma)

         {

             tuneAlpha=true;

         }

         else

         {

             tuneAlpha=false;

         }


         /* Stopping conditions - set only with nonzero alpha */

         if (alpha==0.0)

         {

             if (p3bmrm.Fp-p3bmrm.Fd<=TolRel*LIBBMRM_ABS(p3bmrm.Fp))

                 p3bmrm.exitflag=1;


             if (p3bmrm.Fp-p3bmrm.Fd<=TolAbs)

                 p3bmrm.exitflag=2;

         }


         if (p3bmrm.nCP>=BufSize)

             p3bmrm.exitflag=-1;


         tstop=ttime.cur_time_diff(false);


         /* compute wdist (= || W_{t+1} - W_{t} || ) */

         sq_norm_Wdiff=0.0;


         for (uint32_t i=0; i<nDim; ++i)

         {

             sq_norm_Wdiff+=(W[i]-prevW[i])*(W[i]-prevW[i]);

         }


         wdist=CMath::sqrt(sq_norm_Wdiff);


         /* Keep history of Fp, Fd and wdist */

         p3bmrm.hist_Fp[p3bmrm.nIter]=p3bmrm.Fp;

         p3bmrm.hist_Fd[p3bmrm.nIter]=p3bmrm.Fd;

         p3bmrm.hist_wdist[p3bmrm.nIter]=wdist;


         /* Verbose output */

         if (verbose)

             SG_SDEBUG("%4d: tim=%.3lf, Fp=%lf, Fd=%lf, (Fp-Fd)=%lf, (Fp-Fd)/Fp=%lf, R=%lf, nCP=%d, nzA=%d, wdist=%lf, alpha=%lf, qp_cnt=%d, gamma=%lf, tuneAlpha=%d\n",

                     p3bmrm.nIter, tstop-tstart, p3bmrm.Fp, p3bmrm.Fd, p3bmrm.Fp-p3bmrm.Fd,

                     (p3bmrm.Fp-p3bmrm.Fd)/p3bmrm.Fp, R, p3bmrm.nCP, p3bmrm.nzA, wdist, alpha,

                     qp_cnt, gamma, tuneAlpha);


         /* Check size of Buffer */

         if (p3bmrm.nCP>=BufSize)

         {

             p3bmrm.exitflag=-2;

             SG_SERROR("Buffer exceeded.\n")

         }


         /* keep w_t + Fp */

         LIBBMRM_MEMCPY(prevW, W, nDim*sizeof(float64_t));

         lastFp=p3bmrm.Fp;


         /* Inactive Cutting Planes (ICP) removal */

         if (cleanICP)

         {

             clean_icp(&icp_stats, p3bmrm, &CPList_head,

                     &CPList_tail, H, diag_H, beta, map,

                     cleanAfter, b, I, cp_models);

         }


         // next CP would exceed BufSize

         if (p3bmrm.nCP+1 >= BufSize)

             p3bmrm.exitflag=-1;


         /* Debug: compute objective and training error */

         if (verbose)

         {

             SGVector<float64_t> w_debug(W, nDim, false);

             float64_t primal = CSOSVMHelper::primal_objective(w_debug, model, _lambda);

             float64_t train_error = CSOSVMHelper::average_loss(w_debug, model);

             helper->add_debug_info(primal, p3bmrm.nIter, train_error);

         }

     } /* end of main loop */


     if (verbose)

     {

         helper->terminate();

         SG_UNREF(helper);

     }


     p3bmrm.hist_Fp.resize_vector(p3bmrm.nIter);

     p3bmrm.hist_Fd.resize_vector(p3bmrm.nIter);

     p3bmrm.hist_wdist.resize_vector(p3bmrm.nIter);


     cp_ptr=CPList_head;


     while(cp_ptr!=NULL)

     {

         cp_ptr2=cp_ptr;

         cp_ptr=cp_ptr->next;

         LIBBMRM_FREE(cp_ptr2);

         cp_ptr2=NULL;

     }


     cp_list=NULL;


 cleanup:


     LIBBMRM_FREE(H);

     LIBBMRM_FREE(b);

     LIBBMRM_FREE(beta);

     LIBBMRM_FREE(A);

     LIBBMRM_FREE(diag_H);

     LIBBMRM_FREE(I);

     LIBBMRM_FREE(icp_stats.ICPcounter);

     LIBBMRM_FREE(icp_stats.ICPs);

     LIBBMRM_FREE(icp_stats.ACPs);

     LIBBMRM_FREE(icp_stats.H_buff);

     LIBBMRM_FREE(map);

     LIBBMRM_FREE(prevW);

     LIBBMRM_FREE(wt);

     LIBBMRM_FREE(beta_start);

     LIBBMRM_FREE(beta_good);

     LIBBMRM_FREE(I_start);

     LIBBMRM_FREE(I_good);

     LIBBMRM_FREE(I2);

     LIBBMRM_FREE(b2);

     LIBBMRM_FREE(diag_H2);

     LIBBMRM_FREE(H2);

     LIBBMRM_FREE(C);

     LIBBMRM_FREE(S);

     LIBBMRM_FREE(Rt);


     if (cp_list)

         LIBBMRM_FREE(cp_list);


     for (uint32_t p=0; p<cp_models; ++p)

     {

         LIBBMRM_FREE(subgrad_t[p]);

         LIBBMRM_FREE(info[p]);

     }


     LIBBMRM_FREE(subgrad_t);

     LIBBMRM_FREE(info);


     SG_UNREF(model);


     return(p3bmrm);

 }

 }

LIBBMRM_CALLOC
#define LIBBMRM_CALLOC(x, y)
Definition: libbmrm.h:24

shogun::CTime
Class Time that implements a stopwatch based on either cpu time or wall clock time.
Definition: Time.h:47

shogun::ICP_stats
Definition: libbmrm.h:50

shogun::H
static float64_t * H
Definition: libbmrm.cpp:27

shogun::get_col
static const double * get_col(uint32_t j)
Definition: malsar_clustered.cpp:28

Math.h

shogun::ICP_stats::H_buff
float64_t * H_buff
Definition: libbmrm.h:65

shogun::CDualLibQPBMSOSVM
Class DualLibQPBMSOSVM that uses Bundle Methods for Regularized Risk Minimization algorithms for stru...
Definition: DualLibQPBMSOSVM.h:49

shogun::get_cutting_plane
float64_t * get_cutting_plane(bmrm_ll *ptr)
Definition: libbmrm.h:120

shogun::bmrm_ll::idx
uint32_t idx
Definition: libbmrm.h:46

shogun::H2
static float64_t * H2
Definition: libp3bm.cpp:24

shogun::CStructuredOutputMachine::get_helper
CSOSVMHelper * get_helper() const
Definition: StructuredOutputMachine.cpp:186

shogun::CSOSVMHelper::terminate
void terminate()
Definition: SOSVMHelper.cpp:157

shogun::BmrmStatistics::hist_wdist
SGVector< float64_t > hist_wdist
Definition: BmrmStatistics.h:85

shogun::bmrm_ll::next
bmrm_ll * next
Definition: libbmrm.h:42

Time.h

shogun::CFeatures::get_num_vectors
virtual int32_t get_num_vectors() const =0

shogun::TMultipleCPinfo::m_N
uint32_t m_N
Definition: StructuredModel.h:45

shogun::ICP_stats::ACPs
uint32_t * ACPs
Definition: libbmrm.h:62

shogun::BmrmStatistics::hist_Fd
SGVector< float64_t > hist_Fd
Definition: BmrmStatistics.h:79

shogun::CSOSVMHelper::primal_objective
static float64_t primal_objective(SGVector< float64_t > w, CStructuredModel *model, float64_t lbda)
Definition: SOSVMHelper.cpp:57

libp3bm.h

shogun::CStructuredModel::get_dim
virtual int32_t get_dim() const =0

shogun::find_free_idx
uint32_t find_free_idx(bool *map, uint32_t size)
Definition: libbmrm.h:128

shogun::BmrmStatistics::nCP
uint32_t nCP
Definition: BmrmStatistics.h:54

shogun::epsilon
static const float64_t epsilon
Definition: libbmrm.cpp:25

shogun::CTime::cur_time_diff
float64_t cur_time_diff(bool verbose=false)
Definition: Time.cpp:68

shogun::BmrmStatistics::qp_exitflag
int8_t qp_exitflag
Definition: BmrmStatistics.h:66

LIBBMRM_FREE
#define LIBBMRM_FREE(x)
Definition: libbmrm.h:26

LIBBMRM_ABS
#define LIBBMRM_ABS(A)
Definition: libbmrm.h:30

shogun::QPSolverMaxIter
static const uint32_t QPSolverMaxIter
Definition: libbmrm.cpp:24

shogun::SGVector< float64_t >

shogun::bmrm_ll::prev
bmrm_ll * prev
Definition: libbmrm.h:40

float64_t
double float64_t
Definition: common.h:50

floatmax_t
long double floatmax_t
Definition: common.h:51

shogun::BmrmStatistics::nzA
uint32_t nzA
Definition: BmrmStatistics.h:57

shogun::CSOSVMHelper
class CSOSVMHelper contains helper functions to compute primal objectives, dual objectives, average training losses, duality gaps etc. These values will be recorded to check convergence. This class is inspired by the matlab implementation of the block coordinate Frank-Wolfe SOSVM solver [1].
Definition: SOSVMHelper.h:31

shogun::CStructuredOutputMachine::risk
virtual float64_t risk(float64_t *subgrad, float64_t *W, TMultipleCPinfo *info=0, EStructRiskType rtype=N_SLACK_MARGIN_RESCALING)
Definition: StructuredOutputMachine.cpp:157

shogun::TMultipleCPinfo::m_from
uint32_t m_from
Definition: StructuredModel.h:43

shogun::BmrmStatistics::hist_Fp
SGVector< float64_t > hist_Fp
Definition: BmrmStatistics.h:76

shogun::CMath::dot
static float64_t dot(const bool *v1, const bool *v2, int32_t n)
Compute dot product between v1 and v2 (blas optimized)
Definition: Math.h:627

LIBBMRM_MEMCPY
#define LIBBMRM_MEMCPY(x, y, z)
Definition: libbmrm.h:27

shogun::ICP_stats::ICPs
float64_t ** ICPs
Definition: libbmrm.h:59

shogun::CSOSVMHelper::average_loss
static float64_t average_loss(SGVector< float64_t > w, CStructuredModel *model, bool is_ub=false)
Definition: SOSVMHelper.cpp:88

shogun::SGVector::vec1_plus_scalar_times_vec2
static void vec1_plus_scalar_times_vec2(T *vec1, const T scalar, const T *vec2, int32_t n)
x=x+alpha*y
Definition: SGVector.cpp:531

shogun::ICP_stats::maxCPs
uint32_t maxCPs
Definition: libbmrm.h:53

shogun::CStructuredModel
Class CStructuredModel that represents the application specific model and contains most of the applic...
Definition: StructuredModel.h:101

LIBBMRM_INDEX
#define LIBBMRM_INDEX(ROW, COL, NUM_ROWS)
Definition: libbmrm.h:29

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:52

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::bmrm_ll
Definition: libbmrm.h:38

SG_SDEBUG
#define SG_SDEBUG(...)
Definition: SGIO.h:168

shogun::CSOSVMHelper::add_debug_info
virtual void add_debug_info(float64_t primal, float64_t eff_pass, float64_t train_error, float64_t dual=-1, float64_t dgap=-1)
Definition: SOSVMHelper.cpp:108

shogun::add_cutting_plane
void add_cutting_plane(bmrm_ll **tail, bool *map, float64_t *A, uint32_t free_idx, float64_t *cp_data, uint32_t dim)
Definition: libbmrm.cpp:30

shogun::ICP_stats::ICPcounter
uint32_t * ICPcounter
Definition: libbmrm.h:56

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::BmrmStatistics
Definition: BmrmStatistics.h:24

SG_SERROR
#define SG_SERROR(...)
Definition: SGIO.h:179

shogun::bmrm_ll::address
float64_t * address
Definition: libbmrm.h:44

shogun::svm_p3bm_solver
BmrmStatistics svm_p3bm_solver(CDualLibQPBMSOSVM *machine, float64_t *W, float64_t TolRel, float64_t TolAbs, float64_t _lambda, uint32_t _BufSize, bool cleanICP, uint32_t cleanAfter, float64_t K, uint32_t Tmax, uint32_t cp_models, bool verbose)
Definition: libp3bm.cpp:34

shogun::CStructuredOutputMachine::get_model
CStructuredModel * get_model() const
Definition: StructuredOutputMachine.cpp:50

shogun::SGVector::resize_vector
void resize_vector(int32_t n)
Definition: SGVector.cpp:259

shogun::TMultipleCPinfo
Definition: StructuredModel.h:35

shogun::CMath::sqrt
static float32_t sqrt(float32_t x)
Definition: Math.h:459

LIBBMRM_PLUS_INF
#define LIBBMRM_PLUS_INF
Definition: libbmrm.h:23

shogun::CStructuredModel::get_features
CFeatures * get_features()
Definition: StructuredModel.cpp:99

shogun::BmrmStatistics::nIter
uint32_t nIter
Definition: BmrmStatistics.h:48

shogun::BmrmStatistics::exitflag
int8_t exitflag
Definition: BmrmStatistics.h:73

shogun::BmrmStatistics::Fd
float64_t Fd
Definition: BmrmStatistics.h:63

shogun::clean_icp
void clean_icp(ICP_stats *icp_stats, BmrmStatistics &bmrm, bmrm_ll **head, bmrm_ll **tail, float64_t *&Hmat, float64_t *&diag_H, float64_t *&beta, bool *&map, uint32_t cleanAfter, float64_t *&b, uint32_t *&I, uint32_t cp_models)
Definition: libbmrm.cpp:93

shogun::BmrmStatistics::Fp
float64_t Fp
Definition: BmrmStatistics.h:60

shogun::BufSize
uint32_t BufSize
Definition: libbmrm.cpp:28