en/current/PolyFeatures_8cpp_source.html

 #include <shogun/features/PolyFeatures.h>


 using namespace shogun;


 CPolyFeatures::CPolyFeatures() :CDotFeatures()

 {

     m_feat=NULL;

     m_degree=0;

     m_normalize=false;

     m_input_dimensions=0;

     m_multi_index=NULL;

     m_multinomial_coefficients=NULL;

     m_normalization_values=NULL;

     m_output_dimensions=0;


     register_parameters();

 }


 CPolyFeatures::CPolyFeatures(CDenseFeatures<float64_t>* feat, int32_t degree, bool normalize)

     : CDotFeatures(), m_multi_index(NULL), m_multinomial_coefficients(NULL),

         m_normalization_values(NULL)

 {

     ASSERT(feat)


     m_feat = feat;

     SG_REF(m_feat);

     m_degree=degree;

     m_normalize=normalize;

     m_input_dimensions=feat->get_num_features();

     m_output_dimensions=calc_feature_space_dimensions(m_input_dimensions, m_degree);


     store_multi_index();

     store_multinomial_coefficients();

     if (m_normalize)

         store_normalization_values();


     register_parameters();

 }


 CPolyFeatures::~CPolyFeatures()

 {

     SG_FREE(m_multi_index);

     SG_FREE(m_multinomial_coefficients);

     SG_FREE(m_normalization_values);

     SG_UNREF(m_feat);

 }


 CPolyFeatures::CPolyFeatures(const CPolyFeatures & orig)

 {

     SG_PRINT("CPolyFeatures:\n")

     SG_NOTIMPLEMENTED

 };


 int32_t CPolyFeatures::get_dim_feature_space() const

 {

     return m_output_dimensions;

 }


 int32_t CPolyFeatures::get_nnz_features_for_vector(int32_t num)

 {

     return m_output_dimensions;

 }


 EFeatureType CPolyFeatures::get_feature_type() const

 {

     return F_UNKNOWN;

 }


 EFeatureClass CPolyFeatures::get_feature_class() const

 {

     return C_POLY;

 }


 int32_t CPolyFeatures::get_num_vectors() const

 {

     if (m_feat)

         return m_feat->get_num_vectors();

     else

         return 0;


 }


 void* CPolyFeatures::get_feature_iterator(int32_t vector_index)

 {

     SG_NOTIMPLEMENTED

     return NULL;

 }


 bool CPolyFeatures::get_next_feature(int32_t& index, float64_t& value, void* iterator)

 {

     SG_NOTIMPLEMENTED

     return false;

 }


 void CPolyFeatures::free_feature_iterator(void* iterator)

 {

     SG_NOTIMPLEMENTED

 }


 float64_t CPolyFeatures::dot(int32_t vec_idx1, CDotFeatures* df, int32_t vec_idx2)

 {

     ASSERT(df)

     ASSERT(df->get_feature_type() == get_feature_type())

     ASSERT(df->get_feature_class() == get_feature_class())


     CPolyFeatures* pf=(CPolyFeatures*) df;


     int32_t len1;

     bool do_free1;

     float64_t* vec1 = m_feat->get_feature_vector(vec_idx1, len1, do_free1);


     int32_t len2;

     bool do_free2;

     float64_t* vec2 = pf->m_feat->get_feature_vector(vec_idx2, len2, do_free2);


     float64_t sum=0;

     int cnt=0;

     for (int j=0; j<m_output_dimensions; j++)

     {

         float64_t out1=m_multinomial_coefficients[j];

         float64_t out2=m_multinomial_coefficients[j];

         for (int k=0; k<m_degree; k++)

         {

             out1*=vec1[m_multi_index[cnt]];

             out2*=vec2[m_multi_index[cnt]];

             cnt++;

         }

         sum+=out1*out2;

     }

     m_feat->free_feature_vector(vec1, len1, do_free1);

     pf->m_feat->free_feature_vector(vec2, len2, do_free2);


     return sum;

 }


 float64_t CPolyFeatures::dense_dot(int32_t vec_idx1, const float64_t* vec2, int32_t vec2_len)

 {

     if (vec2_len != m_output_dimensions)

         SG_ERROR("Dimensions don't match, vec2_dim=%d, m_output_dimensions=%d\n", vec2_len, m_output_dimensions)


     int32_t len;

     bool do_free;

     float64_t* vec = m_feat->get_feature_vector(vec_idx1, len, do_free);


     int cnt=0;

     float64_t sum=0;

     for (int j=0; j<vec2_len; j++)

     {

         float64_t output=m_multinomial_coefficients[j];

         for (int k=0; k<m_degree; k++)

         {

             output*=vec[m_multi_index[cnt]];

             cnt++;

         }

         sum+=output*vec2[j];

     }

     if (m_normalize)

         sum = sum/m_normalization_values[vec_idx1];


     m_feat->free_feature_vector(vec, len, do_free);

     return sum;

 }

 void CPolyFeatures::add_to_dense_vec(float64_t alpha, int32_t vec_idx1, float64_t* vec2, int32_t vec2_len, bool abs_val)

 {

     if (vec2_len != m_output_dimensions)

         SG_ERROR("Dimensions don't match, vec2_dim=%d, m_output_dimensions=%d\n", vec2_len, m_output_dimensions)


     int32_t len;

     bool do_free;

     float64_t* vec = m_feat->get_feature_vector(vec_idx1, len, do_free);


     int cnt=0;

     float32_t norm_val=1;

     if (m_normalize)

         norm_val = m_normalization_values[vec_idx1];

     alpha/=norm_val;

     for (int j=0; j<vec2_len; j++)

     {

         float64_t output=m_multinomial_coefficients[j];

         for (int k=0; k<m_degree; k++)

         {

             output*=vec[m_multi_index[cnt]];

             cnt++;

         }

         if (abs_val)

             output=CMath::abs(output);


         vec2[j]+=alpha*output;

     }

     m_feat->free_feature_vector(vec, len, do_free);

 }

 void CPolyFeatures::store_normalization_values()

 {

     SG_FREE(m_normalization_values);


     int32_t num_vec = this->get_num_vectors();


     m_normalization_values=SG_MALLOC(float32_t, num_vec);

     for (int i=0; i<num_vec; i++)

     {

         float64_t tmp = CMath::sqrt(dot(i, this,i));

         if (tmp==0)

             // trap division by zero

             m_normalization_values[i]=1;

         else

             m_normalization_values[i]=tmp;

     }


 }


 void CPolyFeatures::store_multi_index()

 {

     SG_FREE(m_multi_index);


         m_multi_index=SG_MALLOC(uint16_t, m_output_dimensions*m_degree);


         uint16_t* exponents = SG_MALLOC(uint16_t, m_input_dimensions);

         if (!exponents)

         SG_ERROR("Error allocating mem \n")

     /*copy adress: otherwise it will be overwritten in recursion*/

         uint16_t* index = m_multi_index;

         enumerate_multi_index(0, &index, exponents, m_degree);


     SG_FREE(exponents);

 }


 void CPolyFeatures::enumerate_multi_index(const int32_t feat_idx, uint16_t** index, uint16_t* exponents, const int32_t degree)

 {

     if (feat_idx==m_input_dimensions-1 || degree==0)

     {

         if (feat_idx==m_input_dimensions-1)

             exponents[feat_idx] = degree;

         if (degree==0)

             exponents[feat_idx] = 0;

         int32_t i, j;

         for (j=0; j<feat_idx+1; j++)

             for (i=0; i<exponents[j]; i++)

             {

                 **index = j;

                 (*index)++;

             }

         exponents[feat_idx] = 0;

         return;

     }

     int32_t k;

     for (k=0; k<=degree; k++)

     {

         exponents[feat_idx] =  k;

         enumerate_multi_index(feat_idx+1, index,  exponents, degree-k);

     }

     return;


 }


 void CPolyFeatures::store_multinomial_coefficients()

 {

     SG_FREE(m_multinomial_coefficients);


     m_multinomial_coefficients = SG_MALLOC(float64_t, m_output_dimensions);

     int32_t* exponents = SG_MALLOC(int32_t, m_input_dimensions);

     if (!exponents)

         SG_ERROR("Error allocating mem \n")

     int32_t j=0;

     for (j=0; j<m_input_dimensions; j++)

         exponents[j] = 0;

     int32_t k, cnt=0;

     for (j=0; j<m_output_dimensions; j++)

     {

         for (k=0; k<m_degree; k++)

         {

             exponents[m_multi_index[cnt]] ++;

             cnt++;

         }

         m_multinomial_coefficients[j] =  sqrt((double) multinomialcoef(exponents, m_input_dimensions));

         for (k=0; k<m_input_dimensions; k++)

         {

             exponents[k]=0;

         }

     }

     SG_FREE(exponents);

 }


 int32_t CPolyFeatures::bico2(int32_t n, int32_t k)

 {


     /* for this problem k is usually small (<=degree),

      * thus it is efficient to

      * to use recursion and prune end recursions*/

     if (n<k)

         return 0;

     if (k>n/2)

         k = n-k;

     if (k<0)

         return 0;

     if (k==0)

         return 1;

     if (k==1)

         return n;

     if (k<4)

         return bico2(n-1, k-1)+bico2(n-1, k);


     /* call function as implemented in numerical recipies:

      * much more efficient for large binomial coefficients*/

     return bico(n, k);


 }


 int32_t CPolyFeatures::calc_feature_space_dimensions(int32_t N, int32_t D)

 {

     if (N==1)

         return 1;

     if (D==0)

         return 1;

     int32_t d;

     int32_t ret = 0;

     for (d=0; d<=D; d++)

         ret += calc_feature_space_dimensions(N-1, d);


     return ret;

 }


 int32_t CPolyFeatures::multinomialcoef(int32_t* exps, int32_t len)

 {

     int32_t ret = 1, i;

     int32_t n = 0;

     for (i=0; i<len; i++)

     {

         n += exps[i];

         ret *= bico2(n, exps[i]);

     }

     return ret;

 }


 /* gammln as implemented in the

  * second edition of Numerical Recipes in C */

 float64_t CPolyFeatures::gammln(float64_t xx)

 {

     float64_t x,y,tmp,ser;

     static float64_t cof[6]={76.18009172947146,    -86.50532032941677,

                           24.01409824083091,    -1.231739572450155,

                           0.1208650973866179e-2,-0.5395239384953e-5};

     int32_t j;


     y=x=xx;

     tmp=x+5.5;

     tmp -= (x+0.5)*log(tmp);

     ser=1.000000000190015;

     for (j=0;j<=5;j++) ser += cof[j]/++y;

     return -tmp+log(2.5066282746310005*ser/x);

 }


 float64_t CPolyFeatures::factln(int32_t n)

 {

     static float64_t a[101];


     if (n < 0) SG_ERROR("Negative factorial in routine factln\n")

     if (n <= 1) return 0.0;

     if (n <= 100) return a[n] ? a[n] : (a[n]=gammln(n+1.0));

     else return gammln(n+1.0);

 }


 int32_t CPolyFeatures::bico(int32_t n, int32_t k)

 {

     /* use floor to clean roundoff errors*/

     return (int32_t) floor(0.5+exp(factln(n)-factln(k)-factln(n-k)));

 }

 CFeatures* CPolyFeatures::duplicate() const

 {

     return new CPolyFeatures(*this);

 }


 void CPolyFeatures::register_parameters()

 {

     m_parameters->add((CSGObject**) &m_feat, "features",

                 "Features in original space.");

     m_parameters->add(&m_degree, "degree", "Degree of the polynomial kernel.");

     m_parameters->add(&m_normalize, "normalize", "Normalize?");

     m_parameters->add(&m_input_dimensions, "input_dimensions",

             "Dimensions of the input space.");

     m_parameters->add(&m_output_dimensions, "output_dimensions",

             "Dimensions of the feature space of the polynomial kernel.");


     multi_index_length=m_output_dimensions*m_degree;

     m_parameters->add_vector(

             &m_multi_index,

             &multi_index_length,

             "multi_index",

             "Flattened matrix of all multi indices that sum do the"

             " degree of the polynomial kernel.");


     multinomial_coefficients_length=m_output_dimensions;

     m_parameters->add_vector(&m_multinomial_coefficients,

             &multinomial_coefficients_length, "multinomial_coefficients",

             "Multinomial coefficients for all multi-indices.");


     normalization_values_length=get_num_vectors();

     m_parameters->add_vector(&m_normalization_values,

             &normalization_values_length, "normalization_values",

             "Norm of each training example.");

 }

shogun::CPolyFeatures::get_feature_type
virtual EFeatureType get_feature_type() const
Definition: PolyFeatures.cpp:65

shogun::F_UNKNOWN
Definition: FeatureTypes.h:21

shogun::CDenseFeatures< float64_t >

shogun::CPolyFeatures::store_normalization_values
void store_normalization_values()
Definition: PolyFeatures.cpp:197

shogun::CPolyFeatures::get_dim_feature_space
virtual int32_t get_dim_feature_space() const
Definition: PolyFeatures.cpp:55

shogun::CDenseFeatures::get_feature_vector
ST * get_feature_vector(int32_t num, int32_t &len, bool &dofree)
Definition: DenseFeatures.cpp:89

shogun::CDenseFeatures::get_num_features
int32_t get_num_features() const
Definition: DenseFeatures.cpp:426

shogun::CPolyFeatures::bico2
int32_t bico2(int32_t n, int32_t k)
Definition: PolyFeatures.cpp:288

shogun::CPolyFeatures::bico
int32_t bico(int32_t n, int32_t k)
Definition: PolyFeatures.cpp:367

shogun::CPolyFeatures::store_multinomial_coefficients
void store_multinomial_coefficients()
Definition: PolyFeatures.cpp:260

shogun::CPolyFeatures::~CPolyFeatures
virtual ~CPolyFeatures()
Definition: PolyFeatures.cpp:41

shogun::CPolyFeatures::m_output_dimensions
int32_t m_output_dimensions
Definition: PolyFeatures.h:225

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

SG_NOTIMPLEMENTED
#define SG_NOTIMPLEMENTED
Definition: SGIO.h:139

shogun::CSGObject::m_parameters
Parameter * m_parameters
Definition: SGObject.h:378

shogun::CPolyFeatures::dot
virtual float64_t dot(int32_t vec_idx1, CDotFeatures *df, int32_t vec_idx2)
Definition: PolyFeatures.cpp:103

shogun::CPolyFeatures::free_feature_iterator
virtual void free_feature_iterator(void *iterator)
Definition: PolyFeatures.cpp:96

shogun::C_POLY
Definition: FeatureTypes.h:49

shogun::CPolyFeatures::get_next_feature
virtual bool get_next_feature(int32_t &index, float64_t &value, void *iterator)
Definition: PolyFeatures.cpp:90

shogun::CPolyFeatures::m_multi_index
uint16_t * m_multi_index
Definition: PolyFeatures.h:228

shogun::CDotFeatures
Features that support dot products among other operations.
Definition: DotFeatures.h:44

SG_REF
#define SG_REF(x)
Definition: SGObject.h:51

shogun::EFeatureClass
EFeatureClass
shogun feature class
Definition: FeatureTypes.h:38

shogun::CPolyFeatures::m_normalization_values
float32_t * m_normalization_values
Definition: PolyFeatures.h:232

shogun::CPolyFeatures::store_multi_index
void store_multi_index()
Definition: PolyFeatures.cpp:216

shogun::CPolyFeatures::add_to_dense_vec
void add_to_dense_vec(float64_t alpha, int32_t vec_idx1, float64_t *vec2, int32_t vec2_len, bool abs_val)
Definition: PolyFeatures.cpp:167

shogun::Parameter::add
void add(bool *param, const char *name, const char *description="")
Definition: Parameter.cpp:37

SG_PRINT
#define SG_PRINT(...)
Definition: SGIO.h:137

ASSERT
#define ASSERT(x)
Definition: SGIO.h:201

shogun::CSGObject
Class SGObject is the base class of all shogun objects.
Definition: SGObject.h:112

shogun::CPolyFeatures::duplicate
CFeatures * duplicate() const
Definition: PolyFeatures.cpp:372

shogun::CDenseFeatures::get_num_vectors
virtual int32_t get_num_vectors() const
Definition: DenseFeatures.cpp:421

PolyFeatures.h

shogun::CPolyFeatures::enumerate_multi_index
void enumerate_multi_index(const int32_t feat_idx, uint16_t **index, uint16_t *exponents, const int32_t degree)
Definition: PolyFeatures.cpp:232

float64_t
double float64_t
Definition: common.h:50

shogun::CPolyFeatures::m_multinomial_coefficients
float64_t * m_multinomial_coefficients
Definition: PolyFeatures.h:230

shogun::CPolyFeatures::m_feat
CDenseFeatures< float64_t > * m_feat
Definition: PolyFeatures.h:217

shogun::CPolyFeatures::get_nnz_features_for_vector
virtual int32_t get_nnz_features_for_vector(int32_t num)
Definition: PolyFeatures.cpp:60

shogun::CFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const =0

shogun::CPolyFeatures::factln
float64_t factln(int32_t n)
Definition: PolyFeatures.cpp:357

shogun::CPolyFeatures::get_feature_iterator
virtual void * get_feature_iterator(int32_t vector_index)
Definition: PolyFeatures.cpp:84

shogun::CPolyFeatures::m_degree
int32_t m_degree
Definition: PolyFeatures.h:219

float32_t
float float32_t
Definition: common.h:49

shogun::EFeatureType
EFeatureType
shogun feature type
Definition: FeatureTypes.h:19

shogun::CPolyFeatures::get_num_vectors
virtual int32_t get_num_vectors() const
Definition: PolyFeatures.cpp:75

shogun::CPolyFeatures::dense_dot
float64_t dense_dot(int32_t vec_idx1, const float64_t *vec2, int32_t vec2_len)
Definition: PolyFeatures.cpp:139

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:52

shogun::CPolyFeatures::calc_feature_space_dimensions
int32_t calc_feature_space_dimensions(int32_t N, int32_t D)
Definition: PolyFeatures.cpp:313

shogun::Parameter::add_vector
void add_vector(bool **param, index_t *length, const char *name, const char *description="")
Definition: Parameter.cpp:334

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CDenseFeatures::free_feature_vector
void free_feature_vector(ST *feat_vec, int32_t num, bool dofree)
Definition: DenseFeatures.cpp:191

shogun::CPolyFeatures::CPolyFeatures
CPolyFeatures()
Definition: PolyFeatures.cpp:5

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::CPolyFeatures::m_input_dimensions
int32_t m_input_dimensions
Definition: PolyFeatures.h:223

shogun::CPolyFeatures::gammln
float64_t gammln(float64_t xx)
Definition: PolyFeatures.cpp:341

shogun::CPolyFeatures::m_normalize
bool m_normalize
Definition: PolyFeatures.h:221

shogun::CPolyFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const
Definition: PolyFeatures.cpp:70

shogun::CPolyFeatures
implement DotFeatures for the polynomial kernel
Definition: PolyFeatures.h:27

shogun::CMath::sqrt
static float32_t sqrt(float32_t x)
Definition: Math.h:459

shogun::CFeatures::get_feature_type
virtual EFeatureType get_feature_type() const =0

shogun::CMath::abs
static T abs(T a)
Definition: Math.h:179

shogun::CPolyFeatures::multinomialcoef
int32_t multinomialcoef(int32_t *exps, int32_t len)
Definition: PolyFeatures.cpp:327