-
论文结构学习一
本篇学习目标是《Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning》 关于Introduction介绍背景和做了哪些东西,现有 更多 -
关于虚拟机Ubuntu安装Tensorflow
今天的安装非常顺利,没有遇到奇奇怪怪的问题,因为写DQN需要Tensorflow这个库,所以在我的虚拟机内安装一下。http://www.cnblogs.com/lanxuezaipiao/p/3613497.html这个教程非常的好。 固 更多 -
hexo下使用mathjax的相关问题
在blog中插入公式,mathjax是一个十分好用的工具。 以往都是直接在hexo的主题的某个模块上直接修改代码,现在只需要安装一个hexo-math就可以自动使用。 hexo-math的github12345$ npm install h 更多 -
策略梯度
策略梯度策略梯度以一种不同的方式给出了衰减期望的目标函数。 L(\theta )=E(r\_{1} +\gamma r\_{2} + \gamma^{2} r\_{3}+…|\pi (,\theta))构造损失函数 L(\theta )=\ 更多 -
研究生生活(零)
研究生生活这个目录呢,记录研究生期间都在做些什么,生活的状态和一些对于研究生的反思。 每一篇都以一段时间的状态来开展,希望能够记录下自己的两年半的时光。 对于,换电脑写blog的反思: software:hexo(nodejs) git:G 更多