cn/current/StreamingDenseFeatures_8cpp_source.html

 /*

  * This program is free software; you can redistribute it and/or modify

  * it under the terms of the GNU General Public License as published by

  * the Free Software Foundation; either version 3 of the License, or

  * (at your option) any later version.

  *

  * Written (W) 2011 Shashwat Lal Das

  * Written (W) 2012 Heiko Strathmann

  * Copyright (C) 2011 Berlin Institute of Technology and Max-Planck-Society

  */


 #include <shogun/mathematics/Math.h>

 #include <shogun/features/streaming/StreamingDenseFeatures.h>

 #include <shogun/io/streaming/StreamingFileFromDenseFeatures.h>


 namespace shogun

 {

 template<class T>

 CStreamingDenseFeatures<T>::CStreamingDenseFeatures() :

         CStreamingDotFeatures()

 {

     set_read_functions();

     init();

     parser.set_free_vector_after_release(false);

 }


 template<class T>

 CStreamingDenseFeatures<T>::CStreamingDenseFeatures(CStreamingFile* file,

         bool is_labelled, int32_t size) :

         CStreamingDotFeatures()

 {

     init(file, is_labelled, size);

     set_read_functions();

     parser.set_free_vector_after_release(false);

 }


 template<class T> CStreamingDenseFeatures<T>::CStreamingDenseFeatures(

         CDenseFeatures<T>* dense_features, float64_t* lab) :

         CStreamingDotFeatures()

 {

     REQUIRE(dense_features, "%s::CStreamingDenseFeatures(): Features needed!\n")


     CStreamingFileFromDenseFeatures<T>* file;

     bool is_labelled;

     int32_t size=1024;


     is_labelled=lab;

     file=new CStreamingFileFromDenseFeatures<T>(dense_features, lab);

     init(file, is_labelled, size);

     set_read_functions();

     parser.set_free_vector_after_release(false);

     parser.set_free_vectors_on_destruct(false);

     seekable=true;

 }


 template<class T> CStreamingDenseFeatures<T>::~CStreamingDenseFeatures()

 {

     SG_DEBUG("entering %s::~CStreamingDenseFeatures()\n", get_name())

     /* needed to prevent double free memory errors */

     current_vector.vector=NULL;

     current_vector.vlen=0;

     SG_DEBUG("leaving %s::~CStreamingDenseFeatures()\n", get_name())

 }


 template<class T> void CStreamingDenseFeatures<T>::reset_stream()

 {

     if (seekable)

     {

         ((CStreamingFileFromDenseFeatures<T>*)working_file)->reset_stream();

         parser.exit_parser();

         parser.init(working_file, has_labels, 1);

         parser.set_free_vector_after_release(false);

         parser.start_parser();

     }

 }


 template<class T> float32_t CStreamingDenseFeatures<T>::dense_dot(

         const float32_t* vec2, int32_t vec2_len)

 {

     ASSERT(vec2_len==current_vector.vlen)

     float32_t result=0;


     for (int32_t i=0; i<current_vector.vlen; i++)

         result+=current_vector[i]*vec2[i];


     return result;

 }


 template<class T> float64_t CStreamingDenseFeatures<T>::dense_dot(

         const float64_t* vec2, int32_t vec2_len)

 {

     ASSERT(vec2_len==current_vector.vlen)

     float64_t result=0;


     for (int32_t i=0; i<current_vector.vlen; i++)

         result+=current_vector[i]*vec2[i];


     return result;

 }


 template<class T> void CStreamingDenseFeatures<T>::add_to_dense_vec(

         float32_t alpha, float32_t* vec2, int32_t vec2_len, bool abs_val)

 {

     ASSERT(vec2_len==current_vector.vlen)


     if (abs_val)

     {

         for (int32_t i=0; i<current_vector.vlen; i++)

             vec2[i]+=alpha*CMath::abs(current_vector[i]);

     }

     else

     {

         for (int32_t i=0; i<current_vector.vlen; i++)

             vec2[i]+=alpha*current_vector[i];

     }

 }


 template<class T> void CStreamingDenseFeatures<T>::add_to_dense_vec(

         float64_t alpha, float64_t* vec2, int32_t vec2_len, bool abs_val)

 {

     ASSERT(vec2_len==current_vector.vlen)


     if (abs_val)

     {

         for (int32_t i=0; i<current_vector.vlen; i++)

             vec2[i]+=alpha*CMath::abs(current_vector[i]);

     }

     else

     {

         for (int32_t i=0; i<current_vector.vlen; i++)

             vec2[i]+=alpha*current_vector[i];

     }

 }


 template<class T> int32_t CStreamingDenseFeatures<T>::get_nnz_features_for_vector()

 {

     return current_vector.vlen;

 }


 template<class T> CFeatures* CStreamingDenseFeatures<T>::duplicate() const

 {

     return new CStreamingDenseFeatures<T>(*this);

 }


 template<class T> int32_t CStreamingDenseFeatures<T>::get_num_vectors() const

 {

     return 1;

 }


 template<class T>

 void CStreamingDenseFeatures<T>::set_vector_reader()

 {

     parser.set_read_vector(&CStreamingFile::get_vector);

 }


 template<class T>

 void CStreamingDenseFeatures<T>::set_vector_and_label_reader()

 {

     parser.set_read_vector_and_label(&CStreamingFile::get_vector_and_label);

 }


 #define GET_FEATURE_TYPE(f_type, sg_type)               \

 template<> EFeatureType CStreamingDenseFeatures<sg_type>::get_feature_type() const \

 {                                   \

     return f_type;                          \

 }


 GET_FEATURE_TYPE(F_BOOL, bool)

 GET_FEATURE_TYPE(F_CHAR, char)

 GET_FEATURE_TYPE(F_BYTE, uint8_t)

 GET_FEATURE_TYPE(F_BYTE, int8_t)

 GET_FEATURE_TYPE(F_SHORT, int16_t)

 GET_FEATURE_TYPE(F_WORD, uint16_t)

 GET_FEATURE_TYPE(F_INT, int32_t)

 GET_FEATURE_TYPE(F_UINT, uint32_t)

 GET_FEATURE_TYPE(F_LONG, int64_t)

 GET_FEATURE_TYPE(F_ULONG, uint64_t)

 GET_FEATURE_TYPE(F_SHORTREAL, float32_t)

 GET_FEATURE_TYPE(F_DREAL, float64_t)

 GET_FEATURE_TYPE(F_LONGREAL, floatmax_t)

 #undef GET_FEATURE_TYPE


 template<class T>

 void CStreamingDenseFeatures<T>::init()

 {

     working_file=NULL;

     seekable=false;


     /* needed to prevent double free memory errors */

     current_vector.vector=NULL;

     current_vector.vlen=-1;


     set_generic<T>();

 }


 template<class T>

 void CStreamingDenseFeatures<T>::init(CStreamingFile* file, bool is_labelled,

         int32_t size)

 {

     init();

     has_labels=is_labelled;

     working_file=file;

     SG_REF(working_file);

     parser.init(file, is_labelled, size);

     seekable=false;

 }


 template<class T>

 void CStreamingDenseFeatures<T>::start_parser()

 {

     if (!parser.is_running())

         parser.start_parser();

 }


 template<class T>

 void CStreamingDenseFeatures<T>::end_parser()

 {

     parser.end_parser();

 }


 template<class T>

 bool CStreamingDenseFeatures<T>::get_next_example()

 {

     SG_DEBUG("entering\n");

     bool ret_value;

     ret_value=(bool)parser.get_next_example(current_vector.vector,

             current_vector.vlen, current_label);


     SG_DEBUG("leaving\n");

     return ret_value;

 }


 template<class T>

 SGVector<T> CStreamingDenseFeatures<T>::get_vector()

 {

     return current_vector;

 }


 template<class T>

 float64_t CStreamingDenseFeatures<T>::get_label()

 {

     ASSERT(has_labels)


     return current_label;

 }


 template<class T>

 void CStreamingDenseFeatures<T>::release_example()

 {

     parser.finalize_example();

 }


 template<class T>

 int32_t CStreamingDenseFeatures<T>::get_dim_feature_space() const

 {

     return current_vector.vlen;

 }


 template<class T>

 float32_t CStreamingDenseFeatures<T>::dot(CStreamingDotFeatures* df)

 {

     ASSERT(df)

     ASSERT(df->get_feature_type() == get_feature_type())

     ASSERT(df->get_feature_class() == get_feature_class())

     CStreamingDenseFeatures<T>* sf=(CStreamingDenseFeatures<T>*)df;


     SGVector<T> other_vector=sf->get_vector();


     return CMath::dot(current_vector.vector, other_vector.vector, current_vector.vlen);

 }


 template<class T>

 float32_t CStreamingDenseFeatures<T>::dot(SGVector<T> sgvec1)

 {

     int32_t len1;

     len1=sgvec1.vlen;


     if (len1!=current_vector.vlen)

         SG_ERROR(

                 "Lengths %d and %d not equal while computing dot product!\n", len1, current_vector.vlen);


     return CMath::dot(current_vector.vector, sgvec1.vector, len1);

 }


 template<class T>

 int32_t CStreamingDenseFeatures<T>::get_num_features()

 {

     return current_vector.vlen;

 }


 template<class T>

 EFeatureClass CStreamingDenseFeatures<T>::get_feature_class() const

 {

     return C_STREAMING_DENSE;

 }


 template<class T>

 CFeatures* CStreamingDenseFeatures<T>::get_streamed_features(

         index_t num_elements)

 {

     SG_DEBUG("entering\n");

     SG_DEBUG("Streaming %d elements\n", num_elements)


     REQUIRE(num_elements>0, "Requested number of feature vectors (%d) must be "

             "positive\n", num_elements);


     /* init matrix empty, as we dont know the dimension yet */

     SGMatrix<T> matrix;


     for (index_t i=0; i<num_elements; ++i)

     {

         /* check if we run out of data */

         if (!get_next_example())

         {

             SG_WARNING("Ran out of streaming data, reallocating matrix and "

                     "returning!\n");


             /* allocating space for data so far, not this mighe be 0 bytes */

             SGMatrix<T> so_far(matrix.num_rows, i);


             /* copy */

             memcpy(so_far.matrix, matrix.matrix,

                     so_far.num_rows*so_far.num_cols*sizeof(T));


             matrix=so_far;

             break;

         }

         else

         {

             /* allocate matrix memory in first iteration */

             if (!matrix.matrix)

             {

                 SG_DEBUG("Allocating %dx%d matrix\n",

                         current_vector.vlen, num_elements);

                 matrix=SGMatrix<T>(current_vector.vlen, num_elements);

             }


             /* get an example from stream and copy to feature matrix */

             SGVector<T> vec=get_vector();


             /* check for inconsistent dimensions */

             REQUIRE(vec.vlen==matrix.num_rows,

                     "Dimension of streamed vector (%d) does not match "

                     "dimensions of previous vectors (%d)\n",

                     vec.vlen, matrix.num_rows);


             /* copy vector into matrix */

             memcpy(&matrix.matrix[current_vector.vlen*i], vec.vector,

                     vec.vlen*sizeof(T));


             /* clean up */

             release_example();

         }


     }


     /* create new feature object from collected data */

     CDenseFeatures<T>* result=new CDenseFeatures<T>(matrix);


     SG_DEBUG("leaving returning %dx%d matrix\n", matrix.num_rows,

             matrix.num_cols);


     return result;

 }


 template class CStreamingDenseFeatures<bool> ;

 template class CStreamingDenseFeatures<char> ;

 template class CStreamingDenseFeatures<int8_t> ;

 template class CStreamingDenseFeatures<uint8_t> ;

 template class CStreamingDenseFeatures<int16_t> ;

 template class CStreamingDenseFeatures<uint16_t> ;

 template class CStreamingDenseFeatures<int32_t> ;

 template class CStreamingDenseFeatures<uint32_t> ;

 template class CStreamingDenseFeatures<int64_t> ;

 template class CStreamingDenseFeatures<uint64_t> ;

 template class CStreamingDenseFeatures<float32_t> ;

 template class CStreamingDenseFeatures<float64_t> ;

 template class CStreamingDenseFeatures<floatmax_t> ;

 }

shogun::CStreamingDenseFeatures::get_dim_feature_space
virtual int32_t get_dim_feature_space() const
Definition: StreamingDenseFeatures.cpp:254

shogun::CStreamingDenseFeatures::get_streamed_features
virtual CFeatures * get_streamed_features(index_t num_elements)
Definition: StreamingDenseFeatures.cpp:298

shogun::F_ULONG
Definition: FeatureTypes.h:30

shogun::F_UINT
Definition: FeatureTypes.h:28

shogun::F_BOOL
Definition: FeatureTypes.h:22

shogun::CDenseFeatures< T >

Math.h

shogun::CStreamingFileFromDenseFeatures
Class CStreamingFileFromDenseFeatures is a derived class of CStreamingFile which creates an input sou...
Definition: StreamingFileFromDenseFeatures.h:29

shogun::CStreamingDenseFeatures
This class implements streaming features with dense feature vectors.
Definition: StreamingDenseFeatures.h:30

shogun::SGMatrix::matrix
T * matrix
Definition: SGMatrix.h:374

index_t
int32_t index_t
Definition: common.h:62

shogun::F_SHORT
Definition: FeatureTypes.h:25

shogun::CStreamingDenseFeatures::get_vector
SGVector< T > get_vector()
Definition: StreamingDenseFeatures.cpp:234

shogun::CStreamingDenseFeatures::duplicate
virtual CFeatures * duplicate() const
Definition: StreamingDenseFeatures.cpp:140

shogun::CStreamingDenseFeatures::add_to_dense_vec
virtual void add_to_dense_vec(float32_t alpha, float32_t *vec2, int32_t vec2_len, bool abs_val=false)
Definition: StreamingDenseFeatures.cpp:101

shogun::CStreamingFile::get_vector
virtual void get_vector(bool *&vector, int32_t &len)

SG_ERROR
#define SG_ERROR(...)
Definition: SGIO.h:129

REQUIRE
#define REQUIRE(x,...)
Definition: SGIO.h:206

GET_FEATURE_TYPE
#define GET_FEATURE_TYPE(f_type, sg_type)
Definition: StreamingDenseFeatures.cpp:162

shogun::CStreamingDenseFeatures::get_next_example
virtual bool get_next_example()
Definition: StreamingDenseFeatures.cpp:222

shogun::SGMatrix::num_cols
index_t num_cols
Definition: SGMatrix.h:378

shogun::CStreamingDenseFeatures::reset_stream
virtual void reset_stream()
Definition: StreamingDenseFeatures.cpp:65

StreamingDenseFeatures.h

shogun::CStreamingDenseFeatures::dense_dot
virtual float32_t dense_dot(const float32_t *vec2, int32_t vec2_len)
Definition: StreamingDenseFeatures.cpp:77

shogun::CStreamingDenseFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const
Definition: StreamingDenseFeatures.cpp:292

SG_REF
#define SG_REF(x)
Definition: SGObject.h:51

shogun::SGMatrix::num_rows
index_t num_rows
Definition: SGMatrix.h:376

shogun::EFeatureClass
EFeatureClass
shogun feature class
Definition: FeatureTypes.h:38

shogun::SGMatrix
shogun matrix
Definition: base/Parameter.h:26

shogun::CStreamingFile
A Streaming File access class.
Definition: StreamingFile.h:34

shogun::F_SHORTREAL
Definition: FeatureTypes.h:31

shogun::SGVector::vlen
index_t vlen
Definition: SGVector.h:494

shogun::SGVector::vector
T * vector
Definition: SGVector.h:492

shogun::F_DREAL
Definition: FeatureTypes.h:32

shogun::CStreamingDenseFeatures::set_vector_and_label_reader
virtual void set_vector_and_label_reader()
Definition: StreamingDenseFeatures.cpp:157

ASSERT
#define ASSERT(x)
Definition: SGIO.h:201

StreamingFileFromDenseFeatures.h

shogun::CStreamingDenseFeatures::parser
CInputParser< T > parser
The parser object, which reads from input and returns parsed example objects.
Definition: StreamingDenseFeatures.h:302

shogun::CStreamingDenseFeatures::set_vector_reader
virtual void set_vector_reader()
Definition: StreamingDenseFeatures.cpp:151

shogun::SGVector
shogun vector
Definition: base/Parameter.h:28

float64_t
double float64_t
Definition: common.h:50

shogun::F_CHAR
Definition: FeatureTypes.h:23

floatmax_t
long double floatmax_t
Definition: common.h:51

shogun::CStreamingDenseFeatures::dot
virtual float32_t dot(SGVector< T > vec)
Definition: StreamingDenseFeatures.cpp:273

shogun::CStreamingDenseFeatures::release_example
virtual void release_example()
Definition: StreamingDenseFeatures.cpp:248

shogun::F_LONG
Definition: FeatureTypes.h:29

shogun::CFeatures::get_feature_class
virtual EFeatureClass get_feature_class() const =0

shogun::CMath::dot
static float64_t dot(const bool *v1, const bool *v2, int32_t n)
Compute dot product between v1 and v2 (blas optimized)
Definition: Math.h:627

shogun::CStreamingDotFeatures
Streaming features that support dot products among other operations.
Definition: StreamingDotFeatures.h:47

shogun::C_STREAMING_DENSE
Definition: FeatureTypes.h:50

float32_t
float float32_t
Definition: common.h:49

shogun::CStreamingDenseFeatures::end_parser
virtual void end_parser()
Definition: StreamingDenseFeatures.cpp:216

shogun::F_BYTE
Definition: FeatureTypes.h:24

shogun::F_WORD
Definition: FeatureTypes.h:26

shogun::CStreamingFile::get_vector_and_label
virtual void get_vector_and_label(bool *&vector, int32_t &len, float64_t &label)

SG_DEBUG
#define SG_DEBUG(...)
Definition: SGIO.h:107

shogun
all of classes and functions are contained in the shogun namespace
Definition: class_list.h:18

shogun::CStreamingDenseFeatures::~CStreamingDenseFeatures
~CStreamingDenseFeatures()
Definition: StreamingDenseFeatures.cpp:56

shogun::CStreamingFeatures::set_read_functions
void set_read_functions()
Definition: StreamingFeatures.cpp:29

shogun::F_LONGREAL
Definition: FeatureTypes.h:33

shogun::CStreamingFeatures::seekable
bool seekable
Whether the stream is seekable.
Definition: StreamingFeatures.h:207

shogun::CFeatures
The class Features is the base class of all feature objects.
Definition: Features.h:68

shogun::CStreamingDenseFeatures::get_num_features
int32_t get_num_features()
Definition: StreamingDenseFeatures.cpp:286

shogun::CStreamingDenseFeatures::CStreamingDenseFeatures
CStreamingDenseFeatures()
Definition: StreamingDenseFeatures.cpp:19

shogun::CStreamingDenseFeatures::get_num_vectors
virtual int32_t get_num_vectors() const
Definition: StreamingDenseFeatures.cpp:145

shogun::F_INT
Definition: FeatureTypes.h:27

SG_WARNING
#define SG_WARNING(...)
Definition: SGIO.h:128

shogun::CStreamingDenseFeatures::start_parser
virtual void start_parser()
Definition: StreamingDenseFeatures.cpp:209

shogun::CStreamingDenseFeatures::get_nnz_features_for_vector
virtual int32_t get_nnz_features_for_vector()
Definition: StreamingDenseFeatures.cpp:135

shogun::CFeatures::get_feature_type
virtual EFeatureType get_feature_type() const =0

shogun::CStreamingDenseFeatures::get_label
virtual float64_t get_label()
Definition: StreamingDenseFeatures.cpp:240

shogun::CMath::abs
static T abs(T a)
Definition: Math.h:179