Content - 14d6a1cba01f37a72503c326b2afa4d38c3d18a3 - 69bbf02/learning/NeuralNet.h

NeuralNet.h
#pragma once
#include "util/MathUtil.h"
#include <caffe/net.hpp>
#include <caffe/caffe.hpp>
#include <caffe/layers/memory_data_layer.hpp>
#include <mutex>

class cNNSolver;

class cNeuralNet
{
public:
	typedef double tNNData;

	struct tProblem
	{
		tProblem();

		Eigen::MatrixXd mX;
		Eigen::MatrixXd mY;
		int mPassesPerStep;

		bool HasData() const;
	};

	static void PrintParams(const caffe::Net<tNNData>& net);
	static int CalcNumParams(const caffe::Net<tNNData>& net);
	static void CopyModel(const caffe::Net<tNNData>& src, caffe::Net<tNNData>& dst);
	static void CopyParams(const std::vector<caffe::Blob<tNNData>*>& src_params, const std::vector<caffe::Blob<tNNData>*>& dst_params);
	static bool CompareModel(const caffe::Net<tNNData>& a, const caffe::Net<tNNData>& b);
	static bool CompareParams(const std::vector<caffe::Blob<tNNData>*>& a_params, const std::vector<caffe::Blob<tNNData>*>& b_params);

	cNeuralNet();
	virtual ~cNeuralNet();

	virtual void LoadNet(const std::string& net_file);
	virtual void LoadModel(const std::string& model_file);
	virtual void LoadSolver(const std::string& solver_file, bool async = false);
	virtual void LoadScale(const std::string& scale_file);

	virtual void Clear();
	virtual void Train(const tProblem& prob);
	virtual double ForwardBackward(const tProblem& prob);
	virtual void StepSolver(int iters);
	virtual void ResetSolver();
	virtual void CalcOffsetScale(const Eigen::MatrixXd& X, Eigen::VectorXd& out_offset, Eigen::VectorXd& out_scale) const;
	virtual void SetInputOffsetScale(const Eigen::VectorXd& offset, const Eigen::VectorXd& scale);
	virtual void SetOutputOffsetScale(const Eigen::VectorXd& offset, const Eigen::VectorXd& scale);

	virtual const Eigen::VectorXd& GetInputOffset() const;
	virtual const Eigen::VectorXd& GetInputScale() const;
	virtual const Eigen::VectorXd& GetOutputOffset() const;
	virtual const Eigen::VectorXd& GetOutputScale() const;

	virtual void Eval(const Eigen::VectorXd& x, Eigen::VectorXd& out_y) const;
	virtual void EvalBatch(const Eigen::MatrixXd& X, Eigen::MatrixXd& out_Y) const;
	virtual void Backward(const Eigen::VectorXd& y_diff, Eigen::VectorXd& out_x_diff) const;
	
	virtual int GetInputSize() const;
	virtual int GetOutputSize() const;
	virtual int GetBatchSize() const;
	virtual int CalcNumParams() const;

	virtual void OutputModel(const std::string& out_file) const;
	virtual void PrintParams() const;

	virtual bool HasNet() const;
	virtual bool HasSolver() const;
	virtual bool HasLayer(const std::string layer_name) const;
	virtual bool HasValidModel() const;

	virtual void NormalizeInput(Eigen::MatrixXd& X) const;
	virtual void NormalizeInput(Eigen::VectorXd& x) const;
	virtual void NormalizeInputDiff(Eigen::VectorXd& x_diff) const;
	virtual void UnnormalizeInput(Eigen::VectorXd& x) const;
	virtual void UnnormalizeInputDiff(Eigen::VectorXd& x_diff) const;
	virtual void NormalizeOutput(Eigen::VectorXd& y) const;
	virtual void NormalizeOutputDiff(Eigen::VectorXd& y_diff) const;
	virtual void UnnormalizeOutput(Eigen::VectorXd& y) const;
	virtual void UnnormalizeOutputDiff(Eigen::VectorXd& y_diff) const;

	virtual void CopyModel(const cNeuralNet& other);
	virtual void LerpModel(const cNeuralNet& other, double lerp);
	virtual void BlendModel(const cNeuralNet& other, double this_weight, double other_weight);
	virtual void BuildNetParams(caffe::NetParameter& out_params) const;
	virtual bool CompareModel(const cNeuralNet& other) const;

	virtual void ForwardInjectNoisePrefilled(double mean, double stdev, const std::string& layer_name, Eigen::VectorXd& out_y) const;
	virtual void GetLayerState(const std::string& layer_name, Eigen::VectorXd& out_state) const;
	virtual void SetLayerState(const Eigen::VectorXd& state, const std::string& layer_name) const;

	virtual const std::vector<caffe::Blob<tNNData>*>& GetParams() const;
	virtual void SyncSolverParams();
	virtual void SyncNetParams();

	virtual void CopyGrad(const cNeuralNet& other);

protected:
	class cCaffeNetWrapper : public caffe::Net<tNNData>
	{
	public:
		cCaffeNetWrapper(const std::string& net_file, caffe::Phase phase);
		virtual ~cCaffeNetWrapper();

		virtual int GetLayerIdx(const std::string& layer_name) const;
	};

	static std::mutex gOutputLock;

	bool mValidModel;
	bool mAsync;

	std::unique_ptr<cCaffeNetWrapper> mNet;
	std::shared_ptr<cNNSolver> mSolver;
	std::string mSolverFile;
	
	Eigen::VectorXd mInputOffset;
	Eigen::VectorXd mInputScale;
	Eigen::VectorXd mOutputOffset;
	Eigen::VectorXd mOutputScale;

	virtual bool ValidOffsetScale() const;
	virtual void InitOffsetScale();

	virtual void FetchOutput(const std::vector<caffe::Blob<tNNData>*>& results_arr, Eigen::VectorXd& out_y) const;
	virtual void FetchInput(Eigen::VectorXd& out_x) const;
	virtual void EvalBatchNet(const Eigen::MatrixXd& X, Eigen::MatrixXd& out_Y) const;
	virtual void EvalBatchSolver(const Eigen::MatrixXd& X, Eigen::MatrixXd& out_Y) const;

	virtual boost::shared_ptr<caffe::Net<tNNData>> GetTrainNet() const;
	virtual boost::shared_ptr<caffe::MemoryDataLayer<tNNData>> GetTrainDataLayer() const;
	virtual void LoadTrainData(const Eigen::MatrixXd& X, const Eigen::MatrixXd& Y);

	virtual bool WriteData(const Eigen::MatrixXd& X, const Eigen::MatrixXd& Y, const std::string& out_file);
	virtual std::string GetOffsetScaleFile(const std::string& model_file) const;

	virtual void WriteOffsetScale(const std::string& scale_file) const;
	virtual const std::string& GetInputLayerName() const;
	virtual const std::string& GetOutputLayerName() const;
};