一些改变,我回来了
想着再回来分享一些,记录一些东西
看了下上次文章的时间,16年的10月17号。我上次断了diary的时候分别是15年的12月29和16年的4月16,都是在四五个月后才回来的,不过特点都是放了假,寒假
或者是暑假,这次也不例外,时间上也很相同,间隔也很相同,同样也是因为放了寒假。
于是,这个记录的方式还是有问题的,不过呢,这个和记录的载体也还不太一样,好朋友老刘的blog停在了去年的8月,不过他是写完整blog的,工作后也很忙了。
这几个月,发生了一些翻天覆地的变化,一是国庆节前的一桩事,其实算是喜事。二是国庆节后的一桩事,真的是一件喜事,遇见了她。
UNREAL unsupervised reinforcement auxiliary learning
16年11月份DeepMind的文章,讲述了DL和RL的最新结合力作,在Atari上的效果优于人类8倍,在一个3D仿真实验场景下到达了人类水平的87%,当真也是翻天覆地的改变。
针对反馈难以观察,而且就算额外反馈很多,sensorimotor stream中也会含有很多可能的学习目标,同时对于非监督性学习来说,适用于重建学习目标,像是前后帧间的像素。