en/current/BinnedDotFeatures_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * Copyright (C) 2012 Soeren Sonnenburg

  */


 #include <shogun/features/BinnedDotFeatures.h>

 #include <shogun/base/Parameter.h>


 using namespace shogun;


 CBinnedDotFeatures::CBinnedDotFeatures(int32_t size)

     : CDotFeatures(size)

 {

     init();

 }


 CBinnedDotFeatures::CBinnedDotFeatures(const CBinnedDotFeatures & orig)

     : CDotFeatures(orig), m_bins(orig.m_bins), m_fill(orig.m_fill),

     m_norm_one(orig.m_norm_one)

 {

     init();

 }


 CBinnedDotFeatures::CBinnedDotFeatures(CDenseFeatures<float64_t>* sf, SGMatrix<float64_t> bins)

 {

     init();

     set_simple_features(sf);

     set_bins(bins);


 }


 CBinnedDotFeatures::~CBinnedDotFeatures()

 {

     SG_UNREF(m_features);

 }


 int32_t CBinnedDotFeatures::get_dim_feature_space() const

 {

     return m_bins.num_rows*m_bins.num_cols;

 }


 float64_t CBinnedDotFeatures::dot(int32_t vec_idx1, CDotFeatures* df, int32_t vec_idx2)

 {

     ASSERT(df)

     ASSERT(df->get_feature_type() == get_feature_type())

     ASSERT(df->get_feature_class() == get_feature_class())


     float64_t result=0;

     double sum1=0;

     double sum2=0;


     SGVector<float64_t> vec1=m_features->get_feature_vector(vec_idx1);

     SGVector<float64_t> vec2=((CBinnedDotFeatures*) df)->m_features->get_feature_vector(vec_idx2);


     for (int32_t i=0; i<m_bins.num_cols; i++)

     {

         float64_t v1=vec1.vector[i];

         float64_t v2=vec2.vector[i];

         float64_t* col=m_bins.get_column_vector(i);


         for (int32_t j=0; j<m_bins.num_rows; j++)

         {

             if (m_fill)

             {

                 if (col[j]<=v1)

                 {

                     sum1+=1.0;


                     if (col[j]<=v2)

                     {

                         sum2+=1.0;

                         result+=1.0;

                     }

                 }

                 else

                 {

                     if (col[j]<=v2)

                         sum2+=1.0;

                     else

                         break;

                 }


                 /* the above is the fast version of

                 if (col[j]<=v1 && col[j]<=v2)

                     result+=1.0;


                 if (col[j]<=v1)

                     sum1+=1.0;


                 if (col[j]<=v2)

                     sum2+=1.0;

                 */

             }

             else

             {

                 if (col[j]<=v1 && (j+1)<m_bins.num_rows && col[j+1]>v1 &&

                         col[j]<=v2 && (j+1)<m_bins.num_rows && col[j+1]>v2)

                 {

                     result+=1;

                     break;

                 }

             }

         }

     }

     m_features->free_feature_vector(vec1, vec_idx1);

     ((CBinnedDotFeatures*) df)->m_features->free_feature_vector(vec2, vec_idx2);


     if (m_fill && m_norm_one && sum1!=0 && sum2!=0)

         result/=CMath::sqrt(sum1*sum2);


     return result;


 }


 float64_t CBinnedDotFeatures::dense_dot(int32_t vec_idx1, const float64_t* vec2, int32_t vec2_len)

 {

     assert_shape(vec2_len);


     float64_t result=0;

     double sum=0;


     SGVector<float64_t> vec1=m_features->get_feature_vector(vec_idx1);


     for (int32_t i=0; i<m_bins.num_cols; i++)

     {

         float64_t v=vec1.vector[i];

         float64_t* col=m_bins.get_column_vector(i);

         int32_t offs=i*m_bins.num_rows;


         for (int32_t j=0; j<m_bins.num_rows; j++)

         {

             if (m_fill)

             {

                 if (col[j]<=v)

                 {

                     result+=vec2[offs+j];

                     sum+=1.0;

                 }

             }

             else

             {

                 if (col[j]<=v && (j+1)<m_bins.num_rows && col[j+1]>v)

                 {

                     result+=vec2[offs+j];

                     break;

                 }

             }

         }

     }

     m_features->free_feature_vector(vec1, vec_idx1);


     if (m_fill && m_norm_one && sum!=0)

         result/=CMath::sqrt(sum);


     return result;

 }


 void CBinnedDotFeatures::add_to_dense_vec(float64_t alpha, int32_t vec_idx1, float64_t* vec2, int32_t vec2_len, bool abs_val)

 {

     assert_shape(vec2_len);

     SGVector<float64_t> vec1=m_features->get_feature_vector(vec_idx1);


     if (m_fill && m_norm_one)

     {

         float64_t alpha_correction=0;

         for (int32_t i=0; i<m_bins.num_cols; i++)

         {

             float64_t v=vec1.vector[i];

             float64_t* col=m_bins.get_column_vector(i);


             for (int32_t j=0; j<m_bins.num_rows; j++)

             {

                 if (col[j]<=v)

                     alpha_correction+=1.0;

             }

         }


         if (alpha_correction==0.0)

             return;


         alpha/=CMath::sqrt(alpha_correction);

     }


     for (int32_t i=0; i<m_bins.num_cols; i++)

     {

         float64_t v=vec1.vector[i];

         float64_t* col=m_bins.get_column_vector(i);

         int32_t offs=i*m_bins.num_rows;


         for (int32_t j=0; j<m_bins.num_rows; j++)

         {

             if (m_fill)

             {

                 if (col[j]<=v)

                     vec2[offs+j]+=alpha;

             }

             else

             {

                 if (col[j]<=v && (j+1)<m_bins.num_rows && col[j+1]>v)

                 {

                     vec2[offs+j]+=alpha;

                     break;

                 }

             }

         }

     }

     m_features->free_feature_vector(vec1, vec_idx1);

 }


 void CBinnedDotFeatures::assert_shape(int32_t vec2_len)

 {

     if (m_bins.num_cols*m_bins.num_rows != vec2_len)

     {

         SG_ERROR("Bin matrix has shape (%d,%d) = %d entries, not matching vector"

                 " length %d\n", m_bins.num_cols,m_bins.num_rows,

                 m_bins.num_cols*m_bins.num_rows,vec2_len);

     }


     if (m_features && m_bins.num_cols != m_features->get_num_features())

     {

         SG_ERROR("Number of colums (%d) doesn't match number of features "

                 "(%d)\n", m_bins.num_cols, m_features->get_num_features());

     }


 }


 int32_t CBinnedDotFeatures::get_nnz_features_for_vector(int32_t num)

 {

     if (m_fill)

         return m_bins.num_rows;

     else

         return 1;

 }


 void* CBinnedDotFeatures::get_feature_iterator(int32_t vector_index)

 {

     SG_NOTIMPLEMENTED

     return NULL;

 }


 bool CBinnedDotFeatures::get_next_feature(int32_t& index, float64_t& value, void* iterator)

 {

     SG_NOTIMPLEMENTED

     return false;

 }


 void CBinnedDotFeatures::free_feature_iterator(void* iterator)

 {

     SG_NOTIMPLEMENTED

 }


 bool CBinnedDotFeatures::get_fill()

 {

     return m_fill;

 }


 void CBinnedDotFeatures::set_fill(bool fill)

 {

     m_fill=fill;

 }


 bool CBinnedDotFeatures::get_norm_one()

 {

     return m_fill;

 }


 void CBinnedDotFeatures::set_norm_one(bool norm_one)

 {

     m_norm_one=norm_one;

 }


 void CBinnedDotFeatures::set_bins(SGMatrix<float64_t> bins)

 {

     m_bins=bins;

 }


 SGMatrix<float64_t> CBinnedDotFeatures::get_bins()

 {

     return m_bins;

 }


 void CBinnedDotFeatures::set_simple_features(CDenseFeatures<float64_t>* features)

 {

     SG_REF(features);

     m_features=features;

 }


 CDenseFeatures<float64_t>* CBinnedDotFeatures::get_simple_features()

 {

     SG_REF(m_features);

     return m_features;

 }


 void CBinnedDotFeatures::init()

 {

     m_features=NULL;

     m_fill=true;

     m_norm_one=false;

 }


 const char* CBinnedDotFeatures::get_name() const

 {

     return "BinnedDotFeatures";

 }


 CFeatures* CBinnedDotFeatures::duplicate() const

 {

     return new CBinnedDotFeatures(*this);

 }


 EFeatureType CBinnedDotFeatures::get_feature_type() const

 {

     return F_DREAL;

 }


 EFeatureClass CBinnedDotFeatures::get_feature_class() const

 {

     return C_BINNED_DOT;

 }


 int32_t CBinnedDotFeatures::get_num_vectors() const

 {

     ASSERT(m_features)

     return m_features->get_num_vectors();

 }

shogun::CBinnedDotFeatures::get_simple_features
CDenseFeatures< float64_t > * get_simple_features()
Definition: BinnedDotFeatures.cpp:294

shogun::CBinnedDotFeatures::dense_dot
virtual float64_t dense_dot(int32_t vec_idx1, const float64_t *vec2, int32_t vec2_len)
Definition: BinnedDotFeatures.cpp:120

shogun::CDenseFeatures< float64_t >

shogun::CDenseFeatures::get_feature_vector
ST * get_feature_vector(int32_t num, int32_t &len, bool &dofree)
Definition: DenseFeatures.cpp:89

shogun::CDenseFeatures::get_num_features
int32_t get_num_features() const
Definition: DenseFeatures.cpp:426

shogun::CBinnedDotFeatures::set_norm_one
void set_norm_one(bool norm_one)
Definition: BinnedDotFeatures.cpp:273

shogun::CBinnedDotFeatures::CBinnedDotFeatures
CBinnedDotFeatures(int32_t size=0)
Definition: BinnedDotFeatures.cpp:15

Parameter.h

shogun::CBinnedDotFeatures::set_fill
void set_fill(bool fill)
Definition: BinnedDotFeatures.cpp:263

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

SG_NOTIMPLEMENTED
#define SG_NOTIMPLEMENTED
Definition: SGIO.h:139

shogun::CBinnedDotFeatures::m_features
CDenseFeatures< float64_t > * m_features
underlying features
Definition: BinnedDotFeatures.h:234

shogun::SGMatrix::num_cols
index_t num_cols
Definition: SGMatrix.h:378

shogun::CBinnedDotFeatures::set_simple_features
void set_simple_features(CDenseFeatures< float64_t > *features)
Definition: BinnedDotFeatures.cpp:288

shogun::CDotFeatures
Features that support dot products among other operations.
Definition: DotFeatures.h:44

shogun::CBinnedDotFeatures::get_next_feature
virtual bool get_next_feature(int32_t &index, float64_t &value, void *iterator)
Definition: BinnedDotFeatures.cpp:247

SG_REF
#define SG_REF(x)
Definition: SGObject.h:51

shogun::SGMatrix::num_rows
index_t num_rows
Definition: SGMatrix.h:376

shogun::EFeatureClass
EFeatureClass
shogun feature class
Definition: FeatureTypes.h:38

shogun::SGMatrix< float64_t >

shogun::C_BINNED_DOT
Definition: FeatureTypes.h:54

shogun::CBinnedDotFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const
Definition: BinnedDotFeatures.cpp:323

shogun::CBinnedDotFeatures
The class BinnedDotFeatures contains a 0-1 conversion of features into bins.
Definition: BinnedDotFeatures.h:43

BinnedDotFeatures.h

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::F_DREAL
Definition: FeatureTypes.h:32

ASSERT
#define ASSERT(x)
Definition: SGIO.h:201

shogun::CDenseFeatures::get_num_vectors
virtual int32_t get_num_vectors() const
Definition: DenseFeatures.cpp:421

shogun::SGVector< float64_t >

shogun::CBinnedDotFeatures::get_nnz_features_for_vector
virtual int32_t get_nnz_features_for_vector(int32_t num)
Definition: BinnedDotFeatures.cpp:233

float64_t
double float64_t
Definition: common.h:50

shogun::CBinnedDotFeatures::m_bins
SGMatrix< float64_t > m_bins
bins with limits
Definition: BinnedDotFeatures.h:237

shogun::CBinnedDotFeatures::add_to_dense_vec
virtual void add_to_dense_vec(float64_t alpha, int32_t vec_idx1, float64_t *vec2, int32_t vec2_len, bool abs_val=false)
Definition: BinnedDotFeatures.cpp:164

shogun::CFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const =0

shogun::SGMatrix::get_column_vector
T * get_column_vector(index_t col) const
Definition: SGMatrix.h:115

shogun::CBinnedDotFeatures::set_bins
void set_bins(SGMatrix< float64_t > bins)
Definition: BinnedDotFeatures.cpp:278

shogun::CBinnedDotFeatures::m_fill
bool m_fill
fill up with 1's or flag just one column
Definition: BinnedDotFeatures.h:240

shogun::CBinnedDotFeatures::get_fill
bool get_fill()
Definition: BinnedDotFeatures.cpp:258

shogun::CBinnedDotFeatures::get_dim_feature_space
virtual int32_t get_dim_feature_space() const
Definition: BinnedDotFeatures.cpp:42

shogun::CBinnedDotFeatures::duplicate
virtual CFeatures * duplicate() const
Definition: BinnedDotFeatures.cpp:312

shogun::EFeatureType
EFeatureType
shogun feature type
Definition: FeatureTypes.h:19

shogun::CBinnedDotFeatures::get_name
virtual const char * get_name() const
Definition: BinnedDotFeatures.cpp:307

shogun::CBinnedDotFeatures::free_feature_iterator
virtual void free_feature_iterator(void *iterator)
Definition: BinnedDotFeatures.cpp:253

SG_UNREF
#define SG_UNREF(x)
Definition: SGObject.h:52

shogun::CBinnedDotFeatures::get_norm_one
bool get_norm_one()
Definition: BinnedDotFeatures.cpp:268

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CDenseFeatures::free_feature_vector
void free_feature_vector(ST *feat_vec, int32_t num, bool dofree)
Definition: DenseFeatures.cpp:191

shogun::CBinnedDotFeatures::~CBinnedDotFeatures
virtual ~CBinnedDotFeatures()
Definition: BinnedDotFeatures.cpp:37

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::CBinnedDotFeatures::m_norm_one
bool m_norm_one
normalize vectors to have norm one
Definition: BinnedDotFeatures.h:243

shogun::CBinnedDotFeatures::get_bins
SGMatrix< float64_t > get_bins()
Definition: BinnedDotFeatures.cpp:283

shogun::CMath::sqrt
static float32_t sqrt(float32_t x)
Definition: Math.h:459

shogun::CBinnedDotFeatures::dot
virtual float64_t dot(int32_t vec_idx1, CDotFeatures *df, int32_t vec_idx2)
Definition: BinnedDotFeatures.cpp:47

shogun::CBinnedDotFeatures::get_feature_iterator
virtual void * get_feature_iterator(int32_t vector_index)
Definition: BinnedDotFeatures.cpp:241

shogun::CFeatures::get_feature_type
virtual EFeatureType get_feature_type() const =0

shogun::CBinnedDotFeatures::get_num_vectors
virtual int32_t get_num_vectors() const
Definition: BinnedDotFeatures.cpp:328

shogun::CBinnedDotFeatures::get_feature_type
virtual EFeatureType get_feature_type() const
Definition: BinnedDotFeatures.cpp:317