明 光 大 正

一些改变,我回来了

    生活     UNREAL

想着再回来分享一些,记录一些东西

看了下上次文章的时间,16年的10月17号。我上次断了diary的时候分别是15年的12月29和16年的4月16,都是在四五个月后才回来的,不过特点都是放了假,寒假
或者是暑假,这次也不例外,时间上也很相同,间隔也很相同,同样也是因为放了寒假。

于是,这个记录的方式还是有问题的,不过呢,这个和记录的载体也还不太一样,好朋友老刘的blog停在了去年的8月,不过他是写完整blog的,工作后也很忙了。

这几个月,发生了一些翻天覆地的变化,一是国庆节前的一桩事,其实算是喜事。二是国庆节后的一桩事,真的是一件喜事,遇见了她。

UNREAL unsupervised reinforcement auxiliary learning

16年11月份DeepMind的文章,讲述了DL和RL的最新结合力作,在Atari上的效果优于人类8倍,在一个3D仿真实验场景下到达了人类水平的87%,当真也是翻天覆地的改变。

针对反馈难以观察,而且就算额外反馈很多,sensorimotor stream中也会含有很多可能的学习目标,同时对于非监督性学习来说,适用于重建学习目标,像是前后帧间的像素。

页阅读量:  ・  站访问量:  ・  站访客数: