en/latest/NeuralNetwork_8h_source.html

 /*

  * Copyright (c) 2014, Shogun Toolbox Foundation

  * All rights reserved.

  *

  * Redistribution and use in source and binary forms, with or without

  * modification, are permitted provided that the following conditions are met:


  * 1. Redistributions of source code must retain the above copyright notice,

  * this list of conditions and the following disclaimer.

  *

  * 2. Redistributions in binary form must reproduce the above copyright notice,

  * this list of conditions and the following disclaimer in the documentation

  * and/or other materials provided with the distribution.

  *

  * 3. Neither the name of the copyright holder nor the names of its

  * contributors may be used to endorse or promote products derived from this

  * software without specific prior written permission.


  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

  * POSSIBILITY OF SUCH DAMAGE.

  *

  * Written (W) 2014 Khaled Nasr

  */


 #ifndef __NEURALNETWORK_H__

 #define __NEURALNETWORK_H__


 #include <shogun/lib/common.h>

 #include <shogun/machine/Machine.h>

 #include <shogun/lib/SGVector.h>

 #include <shogun/lib/SGMatrix.h>


 namespace shogun

 {

 template<class T> class CDenseFeatures;

 class CDynamicObjectArray;

 class CNeuralLayer;


 enum ENNOptimizationMethod

 {

     NNOM_GRADIENT_DESCENT=0,

     NNOM_LBFGS=1

 };


 class CNeuralNetwork : public CMachine

 {

 friend class CDeepBeliefNetwork;


 public:

     CNeuralNetwork();


     CNeuralNetwork(CDynamicObjectArray* layers);


     virtual void set_layers(CDynamicObjectArray* layers);


     virtual void connect(int32_t i, int32_t j);


     virtual void quick_connect();


     virtual void disconnect(int32_t i, int32_t j);


     virtual void disconnect_all();


     virtual void initialize_neural_network(float64_t sigma = 0.01f);


     virtual ~CNeuralNetwork();


     virtual CBinaryLabels* apply_binary(CFeatures* data);

     virtual CRegressionLabels* apply_regression(CFeatures* data);

     virtual CMulticlassLabels* apply_multiclass(CFeatures* data);


     virtual CDenseFeatures<float64_t>* transform(

         CDenseFeatures<float64_t>* data);


     virtual void set_labels(CLabels* lab);


     virtual EMachineType get_classifier_type() { return CT_NEURALNETWORK; }


     virtual EProblemType get_machine_problem_type() const;


     virtual float64_t check_gradients(float64_t approx_epsilon=1.0e-3,

             float64_t s = 1.0e-9);


     SGVector<float64_t>* get_layer_parameters(int32_t i);


     int32_t get_num_parameters() { return m_total_num_parameters; }


     SGVector<float64_t> get_parameters() { return m_params; }


     int32_t get_num_inputs() { return m_num_inputs; }


     int32_t get_num_outputs();


     CDynamicObjectArray* get_layers();


     virtual const char* get_name() const { return "NeuralNetwork";}


     void set_optimization_method(ENNOptimizationMethod optimization_method)

     {

         m_optimization_method = optimization_method;

     }


     ENNOptimizationMethod get_optimization_method() const

     {

         return m_optimization_method;

     }

     void set_l2_coefficient(float64_t l2_coefficient)

     {

         m_l2_coefficient = l2_coefficient;

     }


     float64_t get_l2_coefficient() const

     {

         return m_l2_coefficient;

     }

     void set_l1_coefficient(float64_t l1_coefficient)

     {

         m_l1_coefficient = l1_coefficient;

     }


     float64_t get_l1_coefficient() const

     {

         return m_l1_coefficient;

     }


     void set_dropout_hidden(float64_t dropout_hidden)

     {

         m_dropout_hidden = dropout_hidden;

     }


     float64_t get_dropout_hidden() const

     {

         return m_dropout_hidden;

     }


     void set_dropout_input(float64_t dropout_input)

     {

         m_dropout_input = dropout_input;

     }


     float64_t get_dropout_input() const

     {

         return m_dropout_input;

     }


     void set_max_norm(float64_t max_norm)

     {

         m_max_norm = max_norm;

     }


     float64_t get_max_norm() const

     {

         return m_max_norm;

     }


     void set_epsilon(float64_t epsilon)

     {

         m_epsilon = epsilon;

     }


     float64_t get_epsilon() const

     {

         return m_epsilon;

     }


     void set_max_num_epochs(int32_t max_num_epochs)

     {

         m_max_num_epochs = max_num_epochs;

     }


     int32_t get_max_num_epochs() const

     {

         return m_max_num_epochs;

     }


     void set_gd_mini_batch_size(int32_t gd_mini_batch_size)

     {

         m_gd_mini_batch_size = gd_mini_batch_size;

     }


     int32_t get_gd_mini_batch_size() const

     {

         return m_gd_mini_batch_size;

     }


     void set_gd_learning_rate(float64_t gd_learning_rate)

     {

         m_gd_learning_rate = gd_learning_rate;

     }


     float64_t get_gd_learning_rate() const

     {

         return m_gd_learning_rate;

     }


     void set_gd_learning_rate_decay(float64_t gd_learning_rate_decay)

     {

         m_gd_learning_rate_decay = gd_learning_rate_decay;

     }


     float64_t get_gd_learning_rate_decay() const

     {

         return m_gd_learning_rate_decay;

     }


     void set_gd_momentum(float64_t gd_momentum)

     {

         m_gd_momentum = gd_momentum;

     }


     float64_t get_gd_momentum() const

     {

         return m_gd_momentum;

     }


     void set_gd_error_damping_coeff(float64_t gd_error_damping_coeff)

     {

         m_gd_error_damping_coeff = gd_error_damping_coeff;

     }


     float64_t get_gd_error_damping_coeff() const

     {

         return m_gd_error_damping_coeff;

     }


 protected:

     virtual bool train_machine(CFeatures* data=NULL);


     virtual bool train_gradient_descent(SGMatrix<float64_t> inputs,

             SGMatrix<float64_t> targets);


     virtual bool train_lbfgs(SGMatrix<float64_t> inputs,

             SGMatrix<float64_t> targets);


     virtual SGMatrix<float64_t> forward_propagate(CFeatures* data, int32_t j=-1);


     virtual SGMatrix<float64_t> forward_propagate(SGMatrix<float64_t> inputs, int32_t j=-1);


     virtual void set_batch_size(int32_t batch_size);


     virtual float64_t compute_gradients(SGMatrix<float64_t> inputs,

             SGMatrix<float64_t> targets, SGVector<float64_t> gradients);


     virtual float64_t compute_error(SGMatrix<float64_t> inputs,

             SGMatrix<float64_t> targets);


     virtual float64_t compute_error(SGMatrix<float64_t> targets);


     virtual bool is_label_valid(CLabels *lab) const;


     CNeuralLayer* get_layer(int32_t i);


     SGMatrix<float64_t> features_to_matrix(CFeatures* features);


     SGMatrix<float64_t> labels_to_matrix(CLabels* labs);


 private:

     void init();


     static float64_t lbfgs_evaluate(void *userdata,

             const float64_t *W,

             float64_t *grad,

             const int32_t n,

             const float64_t step);


     static int lbfgs_progress(void *instance,

             const float64_t *x,

             const float64_t *g,

             const float64_t fx,

             const float64_t xnorm,

             const float64_t gnorm,

             const float64_t step,

             int n,

             int k,

             int ls

             );


     template<class T>

     SGVector<T> get_section(SGVector<T> v, int32_t i);


 protected:

     int32_t m_num_inputs;


     int32_t m_num_layers;


     CDynamicObjectArray* m_layers;


     SGMatrix<bool> m_adj_matrix;


     int32_t m_total_num_parameters;


     SGVector<float64_t> m_params;


     SGVector<bool> m_param_regularizable;


     SGVector<int32_t> m_index_offsets;


     int32_t m_batch_size;


     bool m_is_training;


     ENNOptimizationMethod m_optimization_method;


     float64_t m_l2_coefficient;


     float64_t m_l1_coefficient;


     float64_t m_dropout_hidden;


     float64_t m_dropout_input;


     float64_t m_max_norm;


     float64_t m_epsilon;


     int32_t m_max_num_epochs;


     int32_t m_gd_mini_batch_size;


     float64_t m_gd_learning_rate;


     float64_t m_gd_learning_rate_decay;


     float64_t m_gd_momentum;


     float64_t m_gd_error_damping_coeff;


 private:

     const SGMatrix<float64_t>* m_lbfgs_temp_inputs;

     const SGMatrix<float64_t>* m_lbfgs_temp_targets;

 };


 }

 #endif

shogun::CNeuralNetwork::set_gd_learning_rate
void set_gd_learning_rate(float64_t gd_learning_rate)
Definition: NeuralNetwork.h:387

shogun::EMachineType
EMachineType
Definition: Machine.h:33

shogun::CNeuralNetwork::m_index_offsets
SGVector< int32_t > m_index_offsets
Definition: NeuralNetwork.h:613

shogun::CNeuralNetwork::m_epsilon
float64_t m_epsilon
Definition: NeuralNetwork.h:667

shogun::CNeuralNetwork::apply_binary
virtual CBinaryLabels * apply_binary(CFeatures *data)
Definition: NeuralNetwork.cpp:158

shogun::CNeuralNetwork::set_gd_momentum
void set_gd_momentum(float64_t gd_momentum)
Definition: NeuralNetwork.h:425

shogun::CRegressionLabels
Real Labels are real-valued labels.
Definition: RegressionLabels.h:36

shogun::CNeuralNetwork::initialize_neural_network
virtual void initialize_neural_network(float64_t sigma=0.01f)
Definition: NeuralNetwork.cpp:98

shogun::CDenseFeatures< float64_t >

shogun::CNeuralNetwork::get_gd_mini_batch_size
int32_t get_gd_mini_batch_size() const
Definition: NeuralNetwork.h:378

shogun::CNeuralNetwork::get_l2_coefficient
float64_t get_l2_coefficient() const
Definition: NeuralNetwork.h:258

shogun::CNeuralNetwork::get_num_parameters
int32_t get_num_parameters()
Definition: NeuralNetwork.h:218

shogun::CNeuralNetwork::get_name
virtual const char * get_name() const
Definition: NeuralNetwork.h:232

shogun::CNeuralNetwork::get_gd_learning_rate
float64_t get_gd_learning_rate() const
Definition: NeuralNetwork.h:393

shogun::CNeuralNetwork::set_max_norm
void set_max_norm(float64_t max_norm)
Definition: NeuralNetwork.h:322

shogun::CNeuralNetwork::set_gd_mini_batch_size
void set_gd_mini_batch_size(int32_t gd_mini_batch_size)
Definition: NeuralNetwork.h:372

shogun::CNeuralNetwork::m_batch_size
int32_t m_batch_size
Definition: NeuralNetwork.h:618

shogun::CLabels
The class Labels models labels, i.e. class assignments of objects.
Definition: Labels.h:43

shogun::CNeuralNetwork::m_l1_coefficient
float64_t m_l1_coefficient
Definition: NeuralNetwork.h:632

shogun::CNeuralNetwork::get_parameters
SGVector< float64_t > get_parameters()
Definition: NeuralNetwork.h:221

shogun::CNeuralNetwork::m_gd_error_damping_coeff
float64_t m_gd_error_damping_coeff
Definition: NeuralNetwork.h:711

shogun::CNeuralNetwork::m_num_inputs
int32_t m_num_inputs
Definition: NeuralNetwork.h:585

shogun::CNeuralNetwork::train_machine
virtual bool train_machine(CFeatures *data=NULL)
Definition: NeuralNetwork.cpp:229

shogun::CNeuralNetwork::m_params
SGVector< float64_t > m_params
Definition: NeuralNetwork.h:602

shogun::NNOM_GRADIENT_DESCENT
Definition: NeuralNetwork.h:51

shogun::CNeuralNetwork::set_dropout_hidden
void set_dropout_hidden(float64_t dropout_hidden)
Definition: NeuralNetwork.h:286

shogun::CNeuralNetwork
A generic multi-layer neural network.
Definition: NeuralNetwork.h:110

shogun::NNOM_LBFGS
Definition: NeuralNetwork.h:52

shogun::CNeuralNetwork::get_dropout_input
float64_t get_dropout_input() const
Definition: NeuralNetwork.h:312

shogun::CNeuralNetwork::get_gd_learning_rate_decay
float64_t get_gd_learning_rate_decay() const
Definition: NeuralNetwork.h:410

shogun::CNeuralNetwork::m_adj_matrix
SGMatrix< bool > m_adj_matrix
Definition: NeuralNetwork.h:596

shogun::CNeuralNetwork::features_to_matrix
SGMatrix< float64_t > features_to_matrix(CFeatures *features)
Definition: NeuralNetwork.cpp:614

shogun::CNeuralNetwork::disconnect
virtual void disconnect(int32_t i, int32_t j)
Definition: NeuralNetwork.cpp:88

SGMatrix.h

shogun::CNeuralLayer
Base class for neural network layers.
Definition: NeuralLayer.h:87

shogun::CNeuralNetwork::train_gradient_descent
virtual bool train_gradient_descent(SGMatrix< float64_t > inputs, SGMatrix< float64_t > targets)
Definition: NeuralNetwork.cpp:261

shogun::CNeuralNetwork::quick_connect
virtual void quick_connect()
Definition: NeuralNetwork.cpp:81

shogun::CNeuralNetwork::get_gd_error_damping_coeff
float64_t get_gd_error_damping_coeff() const
Definition: NeuralNetwork.h:454

shogun::CNeuralNetwork::set_max_num_epochs
void set_max_num_epochs(int32_t max_num_epochs)
Definition: NeuralNetwork.h:356

shogun::CNeuralNetwork::compute_error
virtual float64_t compute_error(SGMatrix< float64_t > inputs, SGMatrix< float64_t > targets)
Definition: NeuralNetwork.cpp:546

shogun::CMachine
A generic learning machine interface.
Definition: Machine.h:143

shogun::SGMatrix< float64_t >

shogun::CNeuralNetwork::m_dropout_hidden
float64_t m_dropout_hidden
Definition: NeuralNetwork.h:642

shogun::CNeuralNetwork::set_epsilon
void set_epsilon(float64_t epsilon)
Definition: NeuralNetwork.h:340

shogun::CNeuralNetwork::get_gd_momentum
float64_t get_gd_momentum() const
Definition: NeuralNetwork.h:431

shogun::CNeuralNetwork::m_param_regularizable
SGVector< bool > m_param_regularizable
Definition: NeuralNetwork.h:607

shogun::CNeuralNetwork::m_dropout_input
float64_t m_dropout_input
Definition: NeuralNetwork.h:652

shogun::CNeuralNetwork::apply_multiclass
virtual CMulticlassLabels * apply_multiclass(CFeatures *data)
Definition: NeuralNetwork.cpp:199

shogun::CMulticlassLabels
Multiclass Labels for multi-class classification.
Definition: MulticlassLabels.h:36

shogun::CNeuralNetwork::m_max_num_epochs
int32_t m_max_num_epochs
Definition: NeuralNetwork.h:673

shogun::CNeuralNetwork::m_l2_coefficient
float64_t m_l2_coefficient
Definition: NeuralNetwork.h:629

shogun::CDeepBeliefNetwork
A Deep Belief Network.
Definition: DeepBeliefNetwork.h:90

shogun::CNeuralNetwork::get_max_num_epochs
int32_t get_max_num_epochs() const
Definition: NeuralNetwork.h:362

shogun::EProblemType
EProblemType
Definition: Machine.h:110

shogun::CNeuralNetwork::m_layers
CDynamicObjectArray * m_layers
Definition: NeuralNetwork.h:591

shogun::SGVector< float64_t >

shogun::CNeuralNetwork::connect
virtual void connect(int32_t i, int32_t j)
Definition: NeuralNetwork.cpp:75

shogun::CNeuralNetwork::set_batch_size
virtual void set_batch_size(int32_t batch_size)
Definition: NeuralNetwork.cpp:604

shogun::CNeuralNetwork::disconnect_all
virtual void disconnect_all()
Definition: NeuralNetwork.cpp:93

float64_t
double float64_t
Definition: common.h:50

shogun::CNeuralNetwork::~CNeuralNetwork
virtual ~CNeuralNetwork()
Definition: NeuralNetwork.cpp:153

shogun::CNeuralNetwork::m_total_num_parameters
int32_t m_total_num_parameters
Definition: NeuralNetwork.h:599

shogun::CNeuralNetwork::apply_regression
virtual CRegressionLabels * apply_regression(CFeatures *data)
Definition: NeuralNetwork.cpp:187

shogun::CNeuralNetwork::get_optimization_method
ENNOptimizationMethod get_optimization_method() const
Definition: NeuralNetwork.h:244

shogun::CNeuralNetwork::set_gd_error_damping_coeff
void set_gd_error_damping_coeff(float64_t gd_error_damping_coeff)
Definition: NeuralNetwork.h:449

shogun::CNeuralNetwork::set_l2_coefficient
void set_l2_coefficient(float64_t l2_coefficient)
Definition: NeuralNetwork.h:252

shogun::CDynamicObjectArray
Dynamic array class for CSGObject pointers that creates an array that can be used like a list or an a...
Definition: DynamicObjectArray.h:31

shogun::CNeuralNetwork::m_optimization_method
ENNOptimizationMethod m_optimization_method
Definition: NeuralNetwork.h:626

shogun::CNeuralNetwork::m_gd_learning_rate_decay
float64_t m_gd_learning_rate_decay
Definition: NeuralNetwork.h:689

shogun::CNeuralNetwork::get_layers
CDynamicObjectArray * get_layers()
Definition: NeuralNetwork.cpp:744

shogun::CNeuralNetwork::get_max_norm
float64_t get_max_norm() const
Definition: NeuralNetwork.h:328

shogun::CNeuralNetwork::CNeuralNetwork
CNeuralNetwork()
Definition: NeuralNetwork.cpp:43

shogun::CNeuralNetwork::m_gd_mini_batch_size
int32_t m_gd_mini_batch_size
Definition: NeuralNetwork.h:679

shogun::CNeuralNetwork::check_gradients
virtual float64_t check_gradients(float64_t approx_epsilon=1.0e-3, float64_t s=1.0e-9)
Definition: NeuralNetwork.cpp:554

shogun::CNeuralNetwork::m_gd_momentum
float64_t m_gd_momentum
Definition: NeuralNetwork.h:699

shogun::CNeuralNetwork::get_layer
CNeuralLayer * get_layer(int32_t i)
Definition: NeuralNetwork.cpp:723

shogun::CNeuralNetwork::m_max_norm
float64_t m_max_norm
Definition: NeuralNetwork.h:659

shogun::CNeuralNetwork::is_label_valid
virtual bool is_label_valid(CLabels *lab) const
Definition: NeuralNetwork.cpp:689

Machine.h

shogun::CNeuralNetwork::transform
virtual CDenseFeatures< float64_t > * transform(CDenseFeatures< float64_t > *data)
Definition: NeuralNetwork.cpp:222

shogun::CNeuralNetwork::get_dropout_hidden
float64_t get_dropout_hidden() const
Definition: NeuralNetwork.h:292

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CNeuralNetwork::set_labels
virtual void set_labels(CLabels *lab)
Definition: NeuralNetwork.cpp:696

shogun::CNeuralNetwork::set_l1_coefficient
void set_l1_coefficient(float64_t l1_coefficient)
Definition: NeuralNetwork.h:266

shogun::CNeuralNetwork::train_lbfgs
virtual bool train_lbfgs(SGMatrix< float64_t > inputs, SGMatrix< float64_t > targets)
Definition: NeuralNetwork.cpp:357

shogun::CNeuralNetwork::m_is_training
bool m_is_training
Definition: NeuralNetwork.h:623

shogun::CNeuralNetwork::get_classifier_type
virtual EMachineType get_classifier_type()
Definition: NeuralNetwork.h:188

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::CNeuralNetwork::m_num_layers
int32_t m_num_layers
Definition: NeuralNetwork.h:588

shogun::CNeuralNetwork::labels_to_matrix
SGMatrix< float64_t > labels_to_matrix(CLabels *labs)
Definition: NeuralNetwork.cpp:630

shogun::CNeuralNetwork::forward_propagate
virtual SGMatrix< float64_t > forward_propagate(CFeatures *data, int32_t j=-1)
Definition: NeuralNetwork.cpp:439

common.h

shogun::CNeuralNetwork::get_l1_coefficient
float64_t get_l1_coefficient() const
Definition: NeuralNetwork.h:272

shogun::CNeuralNetwork::get_num_outputs
int32_t get_num_outputs()
Definition: NeuralNetwork.cpp:739

shogun::CNeuralNetwork::get_machine_problem_type
virtual EProblemType get_machine_problem_type() const
Definition: NeuralNetwork.cpp:675

shogun::CNeuralNetwork::set_gd_learning_rate_decay
void set_gd_learning_rate_decay(float64_t gd_learning_rate_decay)
Definition: NeuralNetwork.h:404

shogun::CBinaryLabels
Binary Labels for binary classification.
Definition: BinaryLabels.h:37

shogun::CNeuralNetwork::set_layers
virtual void set_layers(CDynamicObjectArray *layers)
Definition: NeuralNetwork.cpp:55

shogun::CNeuralNetwork::set_optimization_method
void set_optimization_method(ENNOptimizationMethod optimization_method)
Definition: NeuralNetwork.h:238

shogun::CNeuralNetwork::get_num_inputs
int32_t get_num_inputs()
Definition: NeuralNetwork.h:224

shogun::CNeuralNetwork::get_layer_parameters
SGVector< float64_t > * get_layer_parameters(int32_t i)
Definition: NeuralNetwork.cpp:712

SGVector.h

shogun::CNeuralNetwork::m_gd_learning_rate
float64_t m_gd_learning_rate
Definition: NeuralNetwork.h:682

shogun::ENNOptimizationMethod
ENNOptimizationMethod
Definition: NeuralNetwork.h:49

shogun::CT_NEURALNETWORK
Definition: Machine.h:90

shogun::CNeuralNetwork::get_epsilon
float64_t get_epsilon() const
Definition: NeuralNetwork.h:346

shogun::CNeuralNetwork::compute_gradients
virtual float64_t compute_gradients(SGMatrix< float64_t > inputs, SGMatrix< float64_t > targets, SGVector< float64_t > gradients)
Definition: NeuralNetwork.cpp:467

shogun::CNeuralNetwork::set_dropout_input
void set_dropout_input(float64_t dropout_input)
Definition: NeuralNetwork.h:306