dgmdoc/a00464_source.html

 #include "TrainNodeCvRF.h"
 #include "SamplesAccumulator.h"
 #include "macroses.h"

 namespace DirectGraphicalModels
 {
 // Constructor
 CTrainNodeCvRF::CTrainNodeCvRF(byte nStates, word nFeatures, TrainNodeCvRFParams params) : CBaseRandomModel(nStates), CTrainNode(nStates, nFeatures)
 {
     init(params);
 }

 // Constructor
 CTrainNodeCvRF::CTrainNodeCvRF(byte nStates, word nFeatures, size_t maxSamples) : CBaseRandomModel(nStates), CTrainNode(nStates, nFeatures)
 {
     TrainNodeCvRFParams params  = TRAIN_NODE_CV_RF_PARAMS_DEFAULT;
     params.maxSamples           = maxSamples;
     init(params);
 }

 void CTrainNodeCvRF::init(TrainNodeCvRFParams params)
 {
     m_pSamplesAcc = new CSamplesAccumulator(m_nStates, params.maxSamples);

     m_pRF = ml::RTrees::create();
     m_pRF->setMaxDepth(params.max_depth);
     m_pRF->setMinSampleCount(params.min_sample_count);
     m_pRF->setRegressionAccuracy(params.regression_accuracy);
     m_pRF->setUseSurrogates(params.use_surrogates);
     m_pRF->setMaxCategories(params.max_categories);
     m_pRF->setCalculateVarImportance(params.calc_var_importance);
     m_pRF->setActiveVarCount(params.nactive_vars);
     m_pRF->setTermCriteria(TermCriteria(params.term_criteria_type, params.maxCount, params.epsilon));
 }

 // Destructor
 CTrainNodeCvRF::~CTrainNodeCvRF(void)
 {
     delete m_pSamplesAcc;
 }

 void CTrainNodeCvRF::reset(void)
 {
     m_pSamplesAcc->reset();
     m_pRF->clear();
 }

 void CTrainNodeCvRF::save(const std::string &path, const std::string &name, short idx) const
 {
     std::string fileName = generateFileName(path, name.empty() ? "TrainNodeCvRF" : name, idx);
     m_pRF->save(fileName.c_str());
 }

 void CTrainNodeCvRF::load(const std::string &path, const std::string &name, short idx)
 {
     std::string fileName = generateFileName(path, name.empty() ? "TrainNodeCvRF" : name, idx);
     m_pRF = Algorithm::load<ml::RTrees>(fileName.c_str());
 }

 void CTrainNodeCvRF::addFeatureVec(const Mat &featureVector, byte gt)
 {
     m_pSamplesAcc->addSample(featureVector, gt);
 }

 void CTrainNodeCvRF::train(bool doClean)
 {
 #ifdef DEBUG_PRINT_INFO
     printf("\n");
 #endif

     // Filling the <samples> and <classes>
     Mat samples, classes;
     for (byte s = 0; s < m_nStates; s++) {                      // states
         int nSamples = m_pSamplesAcc->getNumSamples(s);
 #ifdef DEBUG_PRINT_INFO
         printf("State[%d] - %d of %d samples\n", s, nSamples, m_pSamplesAcc->getNumInputSamples(s));
 #endif
         samples.push_back(m_pSamplesAcc->getSamplesContainer(s));
         classes.push_back(Mat(nSamples, 1, CV_32FC1, Scalar(s)));
         if (doClean) m_pSamplesAcc->release(s);             // free memory
     } // s
     samples.convertTo(samples, CV_32FC1);

     // Filling <var_type>
     Mat var_type(getNumFeatures() + 1, 1, CV_8UC1, Scalar(ml::VAR_NUMERICAL));      // all inputs are numerical
     var_type.at<byte>(getNumFeatures(), 0) = ml::VAR_CATEGORICAL;

     // Training
     try {
         m_pRF->train(ml::TrainData::create(samples, ml::ROW_SAMPLE, classes, noArray(), noArray(), noArray(), var_type));
     } catch (std::exception &e) {
         printf("EXCEPTION: %s\n", e.what());
         printf("Try to reduce the maximal depth of the forest or switch to x64.\n");
         getchar();
         exit(-1);
     }
 }

 Mat CTrainNodeCvRF::getFeatureImportance(void) const
 {
     return m_pRF->getVarImportance();
 }

 void CTrainNodeCvRF::calculateNodePotentials(const Mat &featureVector, Mat &potential, Mat &mask) const
 {
     Mat fv;
     featureVector.convertTo(fv, CV_32FC1);
     float res = m_pRF->predict(fv.t());
     byte s = static_cast<byte>(res);
     potential.at<float>(s, 0) = 1.0f;
     potential += 0.1f;

     //Mat votes;
     //m_pRF->getVotes(fv.t(), votes, ml::RTrees::Flags::PREDICT_MAX_VOTE);
     //int sum = 0;
     //for (int x = 0; x < votes.cols; x++) {
     //  byte s = static_cast<byte>(votes.at<int>(0, x));
     //  int nVotes = votes.at<int>(1, x);
     //  potential.at<float>(s, 0) = static_cast<float>(nVotes);
     //  sum += nVotes;
     //} // s
     //if (sum) potential /= sum;
 }

 }
DirectGraphicalModels::CTrainNodeCvRF::init
void init(TrainNodeCvRFParams params)
Definition: TrainNodeCvRF.cpp:21

DirectGraphicalModels::CTrainNodeCvRF::load
void load(const std::string &path, const std::string &name=std::string(), short idx=-1)
Loads the training data.
Definition: TrainNodeCvRF.cpp:54

DirectGraphicalModels::CTrainNodeCvRF::CTrainNodeCvRF
CTrainNodeCvRF(byte nStates, word nFeatures, TrainNodeCvRFParams params=TRAIN_NODE_CV_RF_PARAMS_DEFAULT)
Constructor.
Definition: TrainNodeCvRF.cpp:8

DirectGraphicalModels::TrainNodeCvRFParams::maxSamples
size_t maxSamples
Maximum number of samples to be used in training. 0 means using all the samples.
Definition: TrainNodeCvRF.h:24

DirectGraphicalModels::CTrainNodeCvRF::m_pRF
Ptr< ml::RTrees > m_pRF
Random Forest.
Definition: TrainNodeCvRF.h:94

DirectGraphicalModels::TrainNodeCvRFParams
OpenCV Random Forest parameters.
Definition: TrainNodeCvRF.h:13

DirectGraphicalModels::ITrain::getNumFeatures
word getNumFeatures(void) const
Returns number of features.
Definition: ITrain.h:37

DirectGraphicalModels::CBaseRandomModel::generateFileName
std::string generateFileName(const std::string &path, const std::string &name, short idx) const
Generates name of the data file for storing random model parameters.
Definition: BaseRandomModel.cpp:28

DirectGraphicalModels::CSamplesAccumulator::getNumSamples
int getNumSamples(byte state) const
Returns the number of stored samples in container for the state (class) state.
Definition: SamplesAccumulator.cpp:29

DirectGraphicalModels::TrainNodeCvRFParams::max_categories
int max_categories
Max number of categories (use sub-optimal algorithm for larger numbers)
Definition: TrainNodeCvRF.h:18

DirectGraphicalModels::TrainNodeCvRFParams::use_surrogates
bool use_surrogates
Compute surrogate split, no missing data.
Definition: TrainNodeCvRF.h:17

DirectGraphicalModels::CTrainNodeCvRF::~CTrainNodeCvRF
~CTrainNodeCvRF(void)
Definition: TrainNodeCvRF.cpp:37

DirectGraphicalModels::CTrainNodeCvRF::addFeatureVec
void addFeatureVec(const Mat &featureVector, byte gt)
Adds new feature vector.
Definition: TrainNodeCvRF.cpp:60

DirectGraphicalModels::CTrainNodeCvRF::getFeatureImportance
Mat getFeatureImportance(void) const
Returns the feature importance vector.
Definition: TrainNodeCvRF.cpp:99

DirectGraphicalModels::CTrainNodeCvRF::save
void save(const std::string &path, const std::string &name=std::string(), short idx=-1) const
Saves the training data.
Definition: TrainNodeCvRF.cpp:48

DirectGraphicalModels::CTrainNodeCvRF::m_pSamplesAcc
CSamplesAccumulator * m_pSamplesAcc
Samples Accumulator.
Definition: TrainNodeCvRF.h:95

DirectGraphicalModels
Definition: AveragePrecision.cpp:4

DirectGraphicalModels::TrainNodeCvRFParams::min_sample_count
int min_sample_count
Min sample count (1% of all data)
Definition: TrainNodeCvRF.h:15

DirectGraphicalModels::CTrainNodeCvRF::reset
void reset(void)
Resets class variables.
Definition: TrainNodeCvRF.cpp:42

DirectGraphicalModels::CBaseRandomModel
Base abstract class for random model training.
Definition: BaseRandomModel.h:24

DirectGraphicalModels::CSamplesAccumulator::release
void release(byte state)
Releases memory of container for the state (class) state.
Definition: SamplesAccumulator.cpp:41

DirectGraphicalModels::CSamplesAccumulator::addSample
void addSample(const Mat &featureVector, byte state)
Adds new sample to the accumulator.
Definition: SamplesAccumulator.cpp:13

DirectGraphicalModels::CSamplesAccumulator::reset
void reset(void)
Resets the accumulator.
Definition: SamplesAccumulator.cpp:7

DirectGraphicalModels::CTrainNodeCvRF::calculateNodePotentials
void calculateNodePotentials(const Mat &featureVector, Mat &potential, Mat &mask) const
Calculates the node potential, based on the feature vector.
Definition: TrainNodeCvRF.cpp:104

DirectGraphicalModels::TrainNodeCvRFParams::max_depth
int max_depth
Max depth.
Definition: TrainNodeCvRF.h:14

DirectGraphicalModels::CSamplesAccumulator
Samples accumulator abstract class.
Definition: SamplesAccumulator.h:15

DirectGraphicalModels::TRAIN_NODE_CV_RF_PARAMS_DEFAULT
const TrainNodeCvRFParams TRAIN_NODE_CV_RF_PARAMS_DEFAULT
Definition: TrainNodeCvRF.h:30

DirectGraphicalModels::TrainNodeCvRFParams::term_criteria_type
int term_criteria_type
Termination cirteria type (according the the two previous parameters)
Definition: TrainNodeCvRF.h:23

DirectGraphicalModels::CTrainNode
Base abstract class for node potentials training.
Definition: TrainNode.h:47

DirectGraphicalModels::TrainNodeCvRFParams::calc_var_importance
bool calc_var_importance
Calculate variable importance (must be true in order to use CTrainNodeCvRF::getFeatureImportance func...
Definition: TrainNodeCvRF.h:19

DirectGraphicalModels::CTrainNodeCvRF::train
void train(bool doClean=false)
Random model training.
Definition: TrainNodeCvRF.cpp:65

DirectGraphicalModels::CSamplesAccumulator::getSamplesContainer
Mat getSamplesContainer(byte state) const
Returns samples container for the state (class) state.
Definition: SamplesAccumulator.h:50

DirectGraphicalModels::TrainNodeCvRFParams::epsilon
double epsilon
Forest accuracy.
Definition: TrainNodeCvRF.h:22

DirectGraphicalModels::CSamplesAccumulator::getNumInputSamples
int getNumInputSamples(byte state) const
Returns the number of input samples in container for the state (class) state.
Definition: SamplesAccumulator.cpp:35

DirectGraphicalModels::TrainNodeCvRFParams::maxCount
int maxCount
Max number of trees in the forest (time / accuracy)
Definition: TrainNodeCvRF.h:21

DirectGraphicalModels::TrainNodeCvRFParams::regression_accuracy
float regression_accuracy
Regression accuracy (0 means N/A here)
Definition: TrainNodeCvRF.h:16

DirectGraphicalModels::CBaseRandomModel::m_nStates
byte m_nStates
The number of states (classes)
Definition: BaseRandomModel.h:87

DirectGraphicalModels::TrainNodeCvRFParams::nactive_vars
int nactive_vars
Number of variables randomly selected at node and used to find the best split(s). (0 means the ) ...
Definition: TrainNodeCvRF.h:20