明光大正

论文结构学习一

本篇学习目标是《Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning》关于Introduction介绍背景和做了哪些东西，现有更多

09-22 研究生生活 paper

关于虚拟机Ubuntu安装Tensorflow

今天的安装非常顺利，没有遇到奇奇怪怪的问题，因为写DQN需要Tensorflow这个库，所以在我的虚拟机内安装一下。http://www.cnblogs.com/lanxuezaipiao/p/3613497.html这个教程非常的好。固更多

09-14 ML Tensorflow

在blog中插入公式，mathjax是一个十分好用的工具。以往都是直接在hexo的主题的某个模块上直接修改代码，现在只需要安装一个hexo-math就可以自动使用。 hexo-math的github12345$ npm install h 更多

09-13 hexo设置

策略梯度策略梯度以一种不同的方式给出了衰减期望的目标函数。 L(\theta )=E(r\_{1} +\gamma r\_{2} + \gamma^{2} r\_{3}+…|\pi (,\theta))构造损失函数 L(\theta )=\ 更多

09-12 ML

研究生生活这个目录呢，记录研究生期间都在做些什么，生活的状态和一些对于研究生的反思。每一篇都以一段时间的状态来开展，希望能够记录下自己的两年半的时光。对于，换电脑写blog的反思： software：hexo（nodejs） git：G 更多

09-05 研究生生活