All Posts

半监督学习2019年最新进展

ICT 问题:不同的一致性正则化技术选择不同的未标记数据扰动。随机扰动是一个简单的方案,但其对于高维度数据十分低效。VAT等模型探索能够使模型预测变化最大化的扰动,但这类方法需要额外的计算,而且有研究表明对抗性扰动训练可能会影响泛化表现。

深度强化学习之DQN系列

基础(Q-Learning) Q即为Q(s,a),就是在某一时刻的 s 状态下,采取动作a动作能够获得奖励的期望。环境会根据智能体的动作反馈相应的奖励 r。算法的主要思想就是将状态(state)与动作(action)构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。Q-Learning的算法如下:

深度强化学习总览

概念 强化学习的基本思想是通过最大化智能体(Agent)从环境中获得的累计奖赏值,以学习到完成目标的最优策略。强化学习中的基本要素包括:

半监督深度学习

深度学习发展初期,训练深度的网络比较困难。对神经网络来说,一个好的初始化可以让结果更稳定,迭代次数更少,因此利用无标签数据让网络有一个好的初始化成为一个研究热点。

半监督学习再探

概述 传统监督学习通过对大量有标记的训练样例进行学习以建立模型用于预测未知样例的标记。在实际应用中,往往可以容易地收集到大量未标记的样本,而对这些数据赋予标记则往往需要耗费大量的人力物力。例如在进行计算机辅助医学影像分析时, 可以从医院获得大量医学影像, 但如果希望医学专家把影像中的病灶全都标识出来则是不现实的。

半监督学习总览

半监督学习定义:使用大量无标签样例和少量有标签样例进行学习。 出现的原因:在许多实际应用中(如自然语言处理、计算机视觉和生物学等领域),无类标签的样例很容易得到,而对样例的标记代价昂贵。

使用Keras做花卉图像分类

本文使用Keras预训练的模型做图片分类,下载花卉图像数据集的方法参考TensorFlow教程。此数据集共有5种花卉,将花卉图片重新组织为训练集和测试集。

图神经网络初探

背景 深度学习取得成功的领域主要来源于欧几里得数据(如2维网格的图像和1维序列的文本),但现实生活中还存在大量的非欧几里得数据,如社交网络、电商网络、生物网络和交通网络等。尚未出现对这些数据的有效分析。例如,在电子商务领域,一个基于图的学习系统能够利用用户和产品之间的交互以实现高度精准的推荐。在化学领域,分子被建模为图,新药研发需要测定其生物活性。在论文引用网络中,论文之间通过引用关系互相连接,需要将它们分成不同的类别。

Relation Networks for Object Detection阅读笔记

来源:https://arxiv.org/abs/1711.11575 会议: CVPR 2018 ORAL 作者: Han Hu / Jiayuan Gu / Zheng Zhang / Jifeng Dai / Yichen Wei / 机构: Microsoft Research Asia / Department of Machine Intelligence, School of EECS, Peking University

[转载]有关晚清、民国现实思考的浮光掠影

来源:豆瓣,对格式略有整理,本文发布于2009年。 最近重看《走向共和》以及看了一些关于民国、晚清的文章,很有感触。中国是个从来没有停止过折腾的国家,总是在绕弯子了想图省便,吝啬抗争,结果比任何一个开明国家走的更曲折、流了更多血。一个民族经此曲折,至今依然矛盾重重,很难相信中国人总在表扬自己的有智慧。一些感触散乱记下,供学史的人一笑。