en/latest/SVRGMinimizer_8cpp_source.html

  /*

  * Copyright (c) The Shogun Machine Learning Toolbox

  * Written (w) 2015 Wu Lin

  * All rights reserved.

  *

  * Redistribution and use in source and binary forms, with or without

  * modification, are permitted provided that the following conditions are met:

  *

  * 1. Redistributions of source code must retain the above copyright notice, this

  *    list of conditions and the following disclaimer.

  * 2. Redistributions in binary form must reproduce the above copyright notice,

  *    this list of conditions and the following disclaimer in the documentation

  *    and/or other materials provided with the distribution.

  *

  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND

  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED

  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE

  * DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR

  * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES

  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;

  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND

  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT

  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS

  * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.

  *

  * The views and conclusions contained in the software and documentation are those

  * of the authors and should not be interpreted as representing official policies,

  * either expressed or implied, of the Shogun Development Team.

  *

  */

 #include <shogun/optimization/SVRGMinimizer.h>

 #include <shogun/optimization/SGDMinimizer.h>

 #include <shogun/base/Parameter.h>

 using namespace shogun;


 SVRGMinimizer::SVRGMinimizer()

     :FirstOrderStochasticMinimizer()

 {

     init();

 }


 SVRGMinimizer::~SVRGMinimizer()

 {

 }


 SVRGMinimizer::SVRGMinimizer(FirstOrderSAGCostFunction *fun)

     :FirstOrderStochasticMinimizer(fun)

 {

     init();

 }


 void SVRGMinimizer::init()

 {

     m_num_sgd_passes=0;

     m_svrg_interval=0;

     m_average_gradient=SGVector<float64_t>();

     m_previous_variable=SGVector<float64_t>();


     SG_ADD(&m_num_sgd_passes, "SVRGMinimizer__m_num_sgd_passes",

         "num_sgd_passes in SVRGMinimizer", MS_NOT_AVAILABLE);

     SG_ADD(&m_svrg_interval, "SVRGMinimizer__m_svrg_interval",

         "svrg_interval in SVRGMinimizer", MS_NOT_AVAILABLE);

     SG_ADD(&m_average_gradient, "SVRGMinimizer__m_average_gradient",

         "average_gradient in SVRGMinimizer", MS_NOT_AVAILABLE);

     SG_ADD(&m_previous_variable, "SVRGMinimizer__m_previous_variable",

         "previous_variable in SVRGMinimizer", MS_NOT_AVAILABLE);

 }


 void SVRGMinimizer::init_minimization()

 {

     FirstOrderStochasticMinimizer::init_minimization();

     REQUIRE(m_num_sgd_passes>=0, "sgd_passes must set\n");

     REQUIRE(m_svrg_interval>0, "svrg_interval must set\n");

     FirstOrderSAGCostFunction *fun=dynamic_cast<FirstOrderSAGCostFunction *>(m_fun);

     REQUIRE(fun,"the cost function must be a stochastic average gradient cost function\n");

     if (m_num_sgd_passes>0)

     {

         SGDMinimizer sgd(fun);

         sgd.set_number_passes(m_num_sgd_passes);

         sgd.set_gradient_updater(m_gradient_updater);

         sgd.set_penalty_weight(m_penalty_weight);

         sgd.set_penalty_type(m_penalty_type);

         sgd.set_learning_rate(m_learning_rate);

         sgd.minimize();

         m_iter_counter+=sgd.get_iteration_counter();

     }

 }


 float64_t SVRGMinimizer::minimize()

 {

     init_minimization();


     SGVector<float64_t> variable_reference=m_fun->obtain_variable_reference();

     FirstOrderSAGCostFunction *fun=dynamic_cast<FirstOrderSAGCostFunction *>(m_fun);

     REQUIRE(fun,"the cost function must be a stochastic average gradient cost function\n");

     for(;m_cur_passes<(m_num_passes-m_num_sgd_passes);m_cur_passes++)

     {

         if(m_cur_passes%m_svrg_interval==0)

         {

             if(m_previous_variable.vlen==0)

                 m_previous_variable=SGVector<float64_t>(variable_reference.vlen);


             std::copy(variable_reference.vector, variable_reference.vector+variable_reference.vlen, m_previous_variable.vector);

             m_average_gradient=fun->get_average_gradient();

         }

         fun->begin_sample();

         while(fun->next_sample())

         {

             m_iter_counter++;

             float64_t learning_rate=1.0;

             if(m_learning_rate)

                 learning_rate=m_learning_rate->get_learning_rate(m_iter_counter);


             SGVector<float64_t> grad_new=m_fun->get_gradient();

             SGVector<float64_t> var(variable_reference.vlen);

             std::copy(variable_reference.vector, variable_reference.vector+variable_reference.vlen, var.vector);


             std::copy(m_previous_variable.vector, m_previous_variable.vector+m_previous_variable.vlen, variable_reference.vector);

             SGVector<float64_t> grad_old=m_fun->get_gradient();


             std::copy(var.vector, var.vector+var.vlen, variable_reference.vector);

             for(index_t idx=0; idx<grad_new.vlen; idx++)

                 grad_new[idx]+=(m_average_gradient[idx]-grad_old[idx]);


             update_gradient(grad_new,variable_reference);

             m_gradient_updater->update_variable(variable_reference,grad_new,learning_rate);


             do_proximal_operation(variable_reference);

         }

     }

     float64_t cost=m_fun->get_cost();

     return cost+get_penalty(variable_reference);

 }

shogun::FirstOrderCostFunction::get_gradient
virtual SGVector< float64_t > get_gradient()=0

shogun::FirstOrderSAGCostFunction
The class is about a stochastic cost function for stochastic average minimizers.
Definition: FirstOrderSAGCostFunction.h:70

shogun::SVRGMinimizer::minimize
virtual float64_t minimize()
Definition: SVRGMinimizer.cpp:89

shogun::FirstOrderStochasticMinimizer::m_gradient_updater
DescendUpdater * m_gradient_updater
Definition: FirstOrderStochasticMinimizer.h:150

shogun::FirstOrderStochasticMinimizer::set_learning_rate
virtual void set_learning_rate(LearningRate *learning_rate)
Definition: FirstOrderStochasticMinimizer.cpp:61

shogun::FirstOrderMinimizer::m_penalty_weight
float64_t m_penalty_weight
Definition: FirstOrderMinimizer.h:152

index_t
int32_t index_t
Definition: common.h:62

Parameter.h

shogun::FirstOrderStochasticMinimizer::init_minimization
virtual void init_minimization()
Definition: FirstOrderStochasticMinimizer.cpp:87

shogun::FirstOrderStochasticCostFunction::begin_sample
virtual void begin_sample()=0

shogun::FirstOrderMinimizer::set_penalty_type
virtual void set_penalty_type(Penalty *penalty_type)
Definition: FirstOrderMinimizer.cpp:53

shogun::FirstOrderMinimizer::m_fun
FirstOrderCostFunction * m_fun
Definition: FirstOrderMinimizer.h:146

REQUIRE
#define REQUIRE(x,...)
Definition: SGIO.h:206

SGDMinimizer.h

shogun::FirstOrderStochasticMinimizer::m_iter_counter
int32_t m_iter_counter
Definition: FirstOrderStochasticMinimizer.h:159

shogun::SVRGMinimizer::SVRGMinimizer
SVRGMinimizer()
Definition: SVRGMinimizer.cpp:36

shogun::DescendUpdater::update_variable
virtual void update_variable(SGVector< float64_t > variable_reference, SGVector< float64_t > negative_descend_direction, float64_t learning_rate)=0

shogun::SGDMinimizer::minimize
virtual float64_t minimize()
Definition: SGDMinimizer.cpp:52

shogun::FirstOrderStochasticMinimizer
The base class for stochastic first-order gradient-based minimizers.
Definition: FirstOrderStochasticMinimizer.h:69

shogun::MS_NOT_AVAILABLE
Definition: SGObject.h:92

shogun::FirstOrderMinimizer::set_penalty_weight
virtual void set_penalty_weight(float64_t penalty_weight)
Definition: FirstOrderMinimizer.cpp:63

shogun::SVRGMinimizer::init_minimization
virtual void init_minimization()
Definition: SVRGMinimizer.cpp:69

shogun::FirstOrderStochasticMinimizer::m_cur_passes
int32_t m_cur_passes
Definition: FirstOrderStochasticMinimizer.h:156

shogun::SGVector::vlen
index_t vlen
Definition: SGVector.h:494

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::FirstOrderMinimizer::update_gradient
virtual void update_gradient(SGVector< float64_t > gradient, SGVector< float64_t > var)
Definition: FirstOrderMinimizer.cpp:81

shogun::SGVector< float64_t >

shogun::FirstOrderStochasticMinimizer::m_learning_rate
LearningRate * m_learning_rate
Definition: FirstOrderStochasticMinimizer.h:162

shogun::SVRGMinimizer::m_previous_variable
SGVector< float64_t > m_previous_variable
Definition: SVRGMinimizer.h:129

float64_t
double float64_t
Definition: common.h:50

shogun::SVRGMinimizer::m_average_gradient
SGVector< float64_t > m_average_gradient
Definition: SVRGMinimizer.h:126

shogun::FirstOrderStochasticMinimizer::set_number_passes
virtual void set_number_passes(int32_t num_passes)
Definition: FirstOrderStochasticMinimizer.cpp:55

shogun::FirstOrderMinimizer::m_penalty_type
Penalty * m_penalty_type
Definition: FirstOrderMinimizer.h:149

shogun::FirstOrderStochasticMinimizer::do_proximal_operation
virtual void do_proximal_operation(SGVector< float64_t >variable_reference)
Definition: FirstOrderStochasticMinimizer.cpp:71

shogun::FirstOrderMinimizer::get_penalty
virtual float64_t get_penalty(SGVector< float64_t > var)
Definition: FirstOrderMinimizer.cpp:69

shogun::FirstOrderStochasticMinimizer::set_gradient_updater
virtual void set_gradient_updater(DescendUpdater *gradient_updater)
Definition: FirstOrderStochasticMinimizer.cpp:38

shogun::FirstOrderCostFunction::get_cost
virtual float64_t get_cost()=0

shogun::FirstOrderSAGCostFunction::get_average_gradient
virtual SGVector< float64_t > get_average_gradient()=0

shogun::SVRGMinimizer::~SVRGMinimizer
virtual ~SVRGMinimizer()
Definition: SVRGMinimizer.cpp:42

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::SVRGMinimizer::m_num_sgd_passes
int32_t m_num_sgd_passes
Definition: SVRGMinimizer.h:120

shogun::FirstOrderStochasticCostFunction::next_sample
virtual bool next_sample()=0

shogun::LearningRate::get_learning_rate
virtual float64_t get_learning_rate(int32_t iter_counter)=0

SG_ADD
#define SG_ADD(...)
Definition: SGObject.h:84

shogun::FirstOrderCostFunction::obtain_variable_reference
virtual SGVector< float64_t > obtain_variable_reference()=0

shogun::SVRGMinimizer::m_svrg_interval
int32_t m_svrg_interval
Definition: SVRGMinimizer.h:123

SVRGMinimizer.h

shogun::SGDMinimizer
The class implements the stochastic gradient descend (SGD) minimizer.
Definition: SGDMinimizer.h:45

shogun::FirstOrderStochasticMinimizer::m_num_passes
int32_t m_num_passes
Definition: FirstOrderStochasticMinimizer.h:153

shogun::FirstOrderStochasticMinimizer::get_iteration_counter
virtual int32_t get_iteration_counter()
Definition: FirstOrderStochasticMinimizer.h:136