en/latest/NeuralConvolutionalLayer_8cpp_source.html

 /*

  * Copyright (c) 2014, Shogun Toolbox Foundation

  * All rights reserved.

  *

  * Redistribution and use in source and binary forms, with or without

  * modification, are permitted provided that the following conditions are met:


  * 1. Redistributions of source code must retain the above copyright notice,

  * this list of conditions and the following disclaimer.

  *

  * 2. Redistributions in binary form must reproduce the above copyright notice,

  * this list of conditions and the following disclaimer in the documentation

  * and/or other materials provided with the distribution.

  *

  * 3. Neither the name of the copyright holder nor the names of its

  * contributors may be used to endorse or promote products derived from this

  * software without specific prior written permission.


  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

  * POSSIBILITY OF SUCH DAMAGE.

  *

  * Written (W) 2014 Khaled Nasr

  */


 #include <shogun/neuralnets/NeuralConvolutionalLayer.h>

 #include <shogun/mathematics/Math.h>

 #include <shogun/lib/SGVector.h>


 using namespace shogun;


 CNeuralConvolutionalLayer::CNeuralConvolutionalLayer() : CNeuralLayer()

 {

     init();

 }


 CNeuralConvolutionalLayer::CNeuralConvolutionalLayer(

         EConvMapActivationFunction function,

         int32_t num_maps,

         int32_t radius_x, int32_t radius_y,

         int32_t pooling_width, int32_t pooling_height,

         int32_t stride_x, int32_t stride_y,

         EInitializationMode initialization_mode) : CNeuralLayer()

 {

     init();

     m_num_maps = num_maps;

     m_radius_x = radius_x;

     m_radius_y = radius_y;

     m_pooling_width = pooling_width;

     m_pooling_height = pooling_height;

     m_stride_x = stride_x;

     m_stride_y = stride_y;

     m_initialization_mode = initialization_mode;

 }


 void CNeuralConvolutionalLayer::set_batch_size(int32_t batch_size)

 {

     CNeuralLayer::set_batch_size(batch_size);


     if (autoencoder_position==NLAP_NONE)

         m_convolution_output = SGMatrix<float64_t>(m_num_maps*

             (m_input_width/m_stride_x)*(m_input_height/m_stride_y), batch_size);

     else

         m_convolution_output = SGMatrix<float64_t>(

             m_num_maps*m_input_width*m_input_height, batch_size);


     m_max_indices = SGMatrix<float64_t>(m_num_neurons, m_batch_size);


     m_convolution_output_gradients = SGMatrix<float64_t>(

         m_convolution_output.num_rows, m_convolution_output.num_cols);

 }


 void CNeuralConvolutionalLayer::initialize_neural_layer(CDynamicObjectArray* layers,

         SGVector< int32_t > input_indices)

 {

     CNeuralLayer* first_input_layer =

         (CNeuralLayer*)layers->element(input_indices[0]);


     m_input_width = first_input_layer->get_width();

     m_input_height = first_input_layer->get_height();


     SG_UNREF(first_input_layer);


     if (autoencoder_position==NLAP_NONE)

     {

         m_width = m_input_width/(m_stride_x*m_pooling_width);

         m_height = m_input_height/(m_stride_y*m_pooling_height);

     }

     else

     {

         m_width = m_input_width;

         m_height = m_input_height;

     }


     m_num_neurons = m_width*m_height*m_num_maps;


     CNeuralLayer::initialize_neural_layer(layers, input_indices);


     m_input_num_channels = 0;

     for (int32_t l=0; l<input_indices.vlen; l++)

     {

         CNeuralLayer* layer =

             (CNeuralLayer*)layers->element(input_indices[l]);


         m_input_num_channels += layer->get_num_neurons()/(m_input_height*m_input_width);


         SG_UNREF(layer);

     }


     // one bias for each map and one weight matrix between each map in this

     // layer and each channel in the input layers

     m_num_parameters =

         m_num_maps*(1 + m_input_num_channels*(2*m_radius_x+1)*(2*m_radius_y+1));

 }


 void CNeuralConvolutionalLayer::initialize_parameters(SGVector<float64_t> parameters,

         SGVector<bool> parameter_regularizable,

         float64_t sigma)

 {

     int32_t num_parameters_per_map =

         1 + m_input_num_channels*(2*m_radius_x+1)*(2*m_radius_y+1);


     for (int32_t m=0; m<m_num_maps; m++)

     {

         float64_t* map_params = parameters.vector+m*num_parameters_per_map;

         bool* map_param_regularizable =

             parameter_regularizable.vector+m*num_parameters_per_map;


         for (int32_t i=0; i<num_parameters_per_map; i++)

         {

             if (m_initialization_mode == NORMAL)

             {

                 map_params[i] = CMath::normal_random(0.0, sigma);

                 // turn off regularization for the bias, on for the rest of the parameters

                 map_param_regularizable[i] = (i != 0);

             }

             else // for the case when m_initialization_mode = RE_NORMAL

             {

                 map_params[i] = CMath::normal_random(0.0,

                     CMath::sqrt(2.0/(m_input_height*m_input_width*m_input_num_channels)));

                 // initialize b=0

                 map_param_regularizable[i] = 0;

             }

         }

     }

 }


 void CNeuralConvolutionalLayer::compute_activations(

         SGVector<float64_t> parameters,

         CDynamicObjectArray* layers)

 {

     int32_t num_parameters_per_map =

         1 + m_input_num_channels*(2*m_radius_x+1)*(2*m_radius_y+1);


     for (int32_t m=0; m<m_num_maps; m++)

     {

         SGVector<float64_t> map_params(

             parameters.vector+m*num_parameters_per_map,

             num_parameters_per_map, false);


         CConvolutionalFeatureMap map(m_input_width, m_input_height,

             m_radius_x, m_radius_y, m_stride_x, m_stride_y, m,

             m_activation_function, autoencoder_position);


         map.compute_activations(map_params, layers, m_input_indices,

             m_convolution_output);


         map.pool_activations(m_convolution_output,

             m_pooling_width, m_pooling_height, m_activations, m_max_indices);

     }

 }


 void CNeuralConvolutionalLayer::compute_gradients(

         SGVector<float64_t> parameters,

         SGMatrix<float64_t> targets,

         CDynamicObjectArray* layers,

         SGVector<float64_t> parameter_gradients)

 {

     if (targets.num_rows != 0)

     {

         // sqaured error measure

         // local_gradients = activations-targets

         int32_t length = m_num_neurons*m_batch_size;

         for (int32_t i=0; i<length; i++)

             m_activation_gradients[i] = (m_activations[i]-targets[i])/m_batch_size;

     }


     if (dropout_prop>0.0)

     {

         int32_t len = m_num_neurons*m_batch_size;

         for (int32_t i=0; i<len; i++)

             m_activation_gradients[i] *= m_dropout_mask[i];

     }


     // compute the pre-pooling activation gradients

     m_convolution_output_gradients.zero();

     for (int32_t i=0; i<m_num_neurons; i++)

         for (int32_t j=0; j<m_batch_size; j++)

             if (m_max_indices(i,j)!=-1.0)

                 m_convolution_output_gradients(m_max_indices(i,j),j) =

                     m_activation_gradients(i,j);


     int32_t num_parameters_per_map =

         1 + m_input_num_channels*(2*m_radius_x+1)*(2*m_radius_y+1);


     for (int32_t m=0; m<m_num_maps; m++)

     {

         SGVector<float64_t> map_params(

             parameters.vector+m*num_parameters_per_map,

             num_parameters_per_map, false);


         SGVector<float64_t> map_gradients(

             parameter_gradients.vector+m*num_parameters_per_map,

             num_parameters_per_map, false);


         CConvolutionalFeatureMap map(m_input_width, m_input_height,

             m_radius_x, m_radius_y, m_stride_x, m_stride_y, m,

             m_activation_function, autoencoder_position);


         map.compute_gradients(map_params, m_convolution_output,

             m_convolution_output_gradients, layers,

             m_input_indices, map_gradients);

     }

 }


 float64_t CNeuralConvolutionalLayer::compute_error(SGMatrix<float64_t> targets)

 {

     // error = 0.5*(sum(targets-activations)^2)/batch_size

     float64_t sum = 0;

     int32_t length = m_num_neurons*m_batch_size;

     for (int32_t i=0; i<length; i++)

         sum += (targets[i]-m_activations[i])*(targets[i]-m_activations[i]);

     sum *= (0.5/m_batch_size);

     return sum;

 }


 void CNeuralConvolutionalLayer::enforce_max_norm(SGVector<float64_t> parameters,

         float64_t max_norm)

 {

     int32_t num_weights = (2*m_radius_x+1)*(2*m_radius_y+1);


     int32_t num_parameters_per_map = 1 + m_input_num_channels*num_weights;


     for (int32_t offset=1; offset<parameters.vlen; offset+=num_parameters_per_map)

     {

         float64_t* weights = parameters.vector+offset;


         float64_t norm =

                 SGVector<float64_t>::twonorm(weights, num_weights);


         if (norm > max_norm)

         {

             float64_t multiplier = max_norm/norm;

             for (int32_t i=0; i<num_weights; i++)

                 weights[i] *= multiplier;

         }

     }

 }


 void CNeuralConvolutionalLayer::init()

 {

     m_num_maps = 1;

     m_input_width = 0;

     m_input_height = 0;

     m_input_num_channels = 0;

     m_radius_x = 0;

     m_radius_y = 0;

     m_pooling_width = 1;

     m_pooling_height = 1;

     m_stride_x = 1;

     m_stride_y = 1;

     m_initialization_mode = NORMAL;

     m_activation_function = CMAF_IDENTITY;


     SG_ADD(&m_num_maps, "num_maps", "Number of maps", MS_NOT_AVAILABLE);

     SG_ADD(&m_input_width, "input_width", "Input Width", MS_NOT_AVAILABLE);

     SG_ADD(&m_input_height, "input_height", "Input Height", MS_NOT_AVAILABLE);

     SG_ADD(&m_input_num_channels, "input_num_channels", "Input's number of channels",

         MS_NOT_AVAILABLE);

     SG_ADD(&m_radius_x, "radius_x", "X Radius", MS_NOT_AVAILABLE);

     SG_ADD(&m_radius_y, "radius_y", "Y Radius", MS_NOT_AVAILABLE);

     SG_ADD(&m_pooling_width, "pooling_width", "Pooling Width", MS_NOT_AVAILABLE);

     SG_ADD(&m_pooling_height, "pooling_height", "Pooling Height", MS_NOT_AVAILABLE);

     SG_ADD(&m_stride_x, "stride_x", "X Stride", MS_NOT_AVAILABLE);

     SG_ADD(&m_stride_y, "stride_y", "Y Stride", MS_NOT_AVAILABLE);


     SG_ADD((machine_int_t*) &m_initialization_mode, "initialization_mode", "Initialization Mode",

         MS_NOT_AVAILABLE);


     SG_ADD((machine_int_t*) &m_activation_function, "activation_function",

         "Activation Function", MS_NOT_AVAILABLE);


     SG_ADD(&m_convolution_output, "convolution_output",

         "Convolution Output", MS_NOT_AVAILABLE);


     SG_ADD(&m_convolution_output_gradients, "convolution_output_gradients",

         "Convolution Output Gradients", MS_NOT_AVAILABLE);

 }

shogun::CNeuralConvolutionalLayer::CNeuralConvolutionalLayer
CNeuralConvolutionalLayer()
Definition: NeuralConvolutionalLayer.cpp:40

shogun::SGVector::twonorm
static T twonorm(const T *x, int32_t len)
|| x ||_2

shogun::CMAF_IDENTITY
Definition: ConvolutionalFeatureMap.h:49

Math.h

shogun::CNeuralConvolutionalLayer::m_num_maps
int32_t m_num_maps
Definition: NeuralConvolutionalLayer.h:217

shogun::CNeuralConvolutionalLayer::m_activation_function
EConvMapActivationFunction m_activation_function
Definition: NeuralConvolutionalLayer.h:247

shogun::CNeuralConvolutionalLayer::compute_activations
virtual void compute_activations(SGVector< float64_t > parameters, CDynamicObjectArray *layers)
Definition: NeuralConvolutionalLayer.cpp:157

shogun::CMath::normal_random
static float32_t normal_random(float32_t mean, float32_t std_dev)
Definition: Math.h:1095

shogun::CNeuralConvolutionalLayer::m_pooling_height
int32_t m_pooling_height
Definition: NeuralConvolutionalLayer.h:238

shogun::CNeuralConvolutionalLayer::set_batch_size
virtual void set_batch_size(int32_t batch_size)
Definition: NeuralConvolutionalLayer.cpp:64

shogun::CNeuralLayer::m_height
int32_t m_height
Definition: NeuralLayer.h:357

shogun::CNeuralConvolutionalLayer::m_pooling_width
int32_t m_pooling_width
Definition: NeuralConvolutionalLayer.h:235

shogun::CNeuralLayer::m_activations
SGMatrix< float64_t > m_activations
Definition: NeuralLayer.h:376

shogun::CNeuralLayer::initialize_neural_layer
virtual void initialize_neural_layer(CDynamicObjectArray *layers, SGVector< int32_t > input_indices)
Definition: NeuralLayer.cpp:61

shogun::CNeuralConvolutionalLayer::m_initialization_mode
EInitializationMode m_initialization_mode
Definition: NeuralConvolutionalLayer.h:259

shogun::CNeuralConvolutionalLayer::enforce_max_norm
virtual void enforce_max_norm(SGVector< float64_t > parameters, float64_t max_norm)
Definition: NeuralConvolutionalLayer.cpp:246

shogun::SGMatrix::num_cols
index_t num_cols
Definition: SGMatrix.h:376

shogun::CNeuralConvolutionalLayer::m_convolution_output_gradients
SGMatrix< float64_t > m_convolution_output_gradients
Definition: NeuralConvolutionalLayer.h:253

shogun::CNeuralLayer::m_num_parameters
int32_t m_num_parameters
Definition: NeuralLayer.h:360

shogun::CNeuralConvolutionalLayer::compute_gradients
virtual void compute_gradients(SGVector< float64_t > parameters, SGMatrix< float64_t > targets, CDynamicObjectArray *layers, SGVector< float64_t > parameter_gradients)
Definition: NeuralConvolutionalLayer.cpp:182

shogun::CNeuralLayer::get_num_neurons
virtual int32_t get_num_neurons()
Definition: NeuralLayer.h:251

shogun::CNeuralConvolutionalLayer::m_input_height
int32_t m_input_height
Definition: NeuralConvolutionalLayer.h:223

shogun::CNeuralLayer::m_input_indices
SGVector< int32_t > m_input_indices
Definition: NeuralLayer.h:363

shogun::CNeuralLayer
Base class for neural network layers.
Definition: NeuralLayer.h:87

shogun::CNeuralLayer::m_activation_gradients
SGMatrix< float64_t > m_activation_gradients
Definition: NeuralLayer.h:381

shogun::SGMatrix::zero
void zero()
Definition: SGMatrix.cpp:136

shogun::SGMatrix::num_rows
index_t num_rows
Definition: SGMatrix.h:374

shogun::NLAP_NONE
Definition: NeuralLayer.h:52

shogun::SGMatrix< float64_t >

shogun::MS_NOT_AVAILABLE
Definition: SGObject.h:92

shogun::CConvolutionalFeatureMap
Handles convolution and gradient calculation for a single feature map in a convolutional neural netwo...
Definition: ConvolutionalFeatureMap.h:65

shogun::CNeuralLayer::get_height
virtual int32_t get_height()
Definition: NeuralLayer.h:265

shogun::SGVector::vlen
index_t vlen
Definition: SGVector.h:494

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::SGVector< int32_t >

shogun::CDynamicObjectArray::element
CSGObject * element(int32_t idx1, int32_t idx2=0, int32_t idx3=0)
Definition: DynamicObjectArray.h:208

shogun::CNeuralLayer::autoencoder_position
ENLAutoencoderPosition autoencoder_position
Definition: NeuralLayer.h:343

float64_t
double float64_t
Definition: common.h:50

shogun::CNeuralConvolutionalLayer::m_stride_x
int32_t m_stride_x
Definition: NeuralConvolutionalLayer.h:241

shogun::CConvolutionalFeatureMap::compute_activations
void compute_activations(SGVector< float64_t > parameters, CDynamicObjectArray *layers, SGVector< int32_t > input_indices, SGMatrix< float64_t > activations)
Definition: ConvolutionalFeatureMap.cpp:77

shogun::CNeuralConvolutionalLayer::initialize_parameters
virtual void initialize_parameters(SGVector< float64_t > parameters, SGVector< bool > parameter_regularizable, float64_t sigma)
Definition: NeuralConvolutionalLayer.cpp:125

shogun::NORMAL
Definition: NeuralConvolutionalLayer.h:50

shogun::CDynamicObjectArray
Dynamic array class for CSGObject pointers that creates an array that can be used like a list or an a...
Definition: DynamicObjectArray.h:31

shogun::CNeuralConvolutionalLayer::initialize_neural_layer
virtual void initialize_neural_layer(CDynamicObjectArray *layers, SGVector< int32_t > input_indices)
Definition: NeuralConvolutionalLayer.cpp:82

shogun::CNeuralLayer::get_width
virtual int32_t get_width()
Definition: NeuralLayer.h:258

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:55

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CNeuralLayer::dropout_prop
float64_t dropout_prop
Definition: NeuralLayer.h:327

shogun::CNeuralConvolutionalLayer::m_input_width
int32_t m_input_width
Definition: NeuralConvolutionalLayer.h:220

shogun::CNeuralLayer::set_batch_size
virtual void set_batch_size(int32_t batch_size)
Definition: NeuralLayer.cpp:75

machine_int_t
int machine_int_t
Definition: common.h:59

shogun::EInitializationMode
EInitializationMode
Definition: NeuralConvolutionalLayer.h:46

shogun::CNeuralConvolutionalLayer::m_radius_x
int32_t m_radius_x
Definition: NeuralConvolutionalLayer.h:229

shogun::CNeuralConvolutionalLayer::m_max_indices
SGMatrix< float64_t > m_max_indices
Definition: NeuralConvolutionalLayer.h:256

shogun::CNeuralLayer::m_batch_size
int32_t m_batch_size
Definition: NeuralLayer.h:371

shogun::CNeuralConvolutionalLayer::m_stride_y
int32_t m_stride_y
Definition: NeuralConvolutionalLayer.h:244

shogun::CNeuralConvolutionalLayer::compute_error
virtual float64_t compute_error(SGMatrix< float64_t > targets)
Definition: NeuralConvolutionalLayer.cpp:235

shogun::CNeuralLayer::m_num_neurons
int32_t m_num_neurons
Definition: NeuralLayer.h:347

shogun::EConvMapActivationFunction
EConvMapActivationFunction
Determines the activation function for neurons in a convolutional feature map.
Definition: ConvolutionalFeatureMap.h:46

SG_ADD
#define SG_ADD(...)
Definition: SGObject.h:84

shogun::CNeuralConvolutionalLayer::m_radius_y
int32_t m_radius_y
Definition: NeuralConvolutionalLayer.h:232

shogun::CNeuralConvolutionalLayer::m_input_num_channels
int32_t m_input_num_channels
Definition: NeuralConvolutionalLayer.h:226

shogun::CNeuralConvolutionalLayer::m_convolution_output
SGMatrix< float64_t > m_convolution_output
Definition: NeuralConvolutionalLayer.h:250

shogun::CMath::sqrt
static float32_t sqrt(float32_t x)
Definition: Math.h:459

SGVector.h

shogun::CConvolutionalFeatureMap::compute_gradients
void compute_gradients(SGVector< float64_t > parameters, SGMatrix< float64_t > activations, SGMatrix< float64_t > activation_gradients, CDynamicObjectArray *layers, SGVector< int32_t > input_indices, SGVector< float64_t > parameter_gradients)
Definition: ConvolutionalFeatureMap.cpp:131

shogun::CNeuralLayer::m_width
int32_t m_width
Definition: NeuralLayer.h:352

shogun::CNeuralLayer::m_dropout_mask
SGMatrix< bool > m_dropout_mask
Definition: NeuralLayer.h:393

shogun::CConvolutionalFeatureMap::pool_activations
void pool_activations(SGMatrix< float64_t > activations, int32_t pooling_width, int32_t pooling_height, SGMatrix< float64_t > pooled_activations, SGMatrix< float64_t > max_indices)
Definition: ConvolutionalFeatureMap.cpp:197

NeuralConvolutionalLayer.h