中文博客和一些笔记 (Blogs and notes in Mandarin)

  • Dec 26, 2023

    我们需要什么样的语义理解——研究生阶段的工作回顾

    本文以时间顺序描述了笔者在学期间对被业内常称为语义解析(semantic parsing,SP,或语义分析、剖析等)这一特定任务的认识过程,以作为将来可以用于回顾或进行元研究的文字素材。另一方面,也希望借此对科研进行一定的祛魅,相信无论是研究各行各业的真实需求,还是分析某个科学共同体的热点话题,都不是可以从现实中独立摘出的意向过程。而与形而上学进行互动能帮助我们对研究工作进行有效的审视,并作为海量研究论文的读者找到被论文所无意间蒙蔽的方向。

  • Apr 30, 2023

    关于构式历时性的几个想法——以“刷墙”为例

    在介绍构式的所谓“动态性”时,牛保义等[1]提出了几个“刷墙”构式能产性的例子,即“刷卡”、“刷脸”、“刷屏”等, 并认为其能产性是随着社会发展、由经济文化政治等多方面因素共同作用的效果。 本文打算简单分析一下这几个例子,称不上历时语法,所以简单叫做历时性,主要关心这几个构式如何产生的。 另外牛保义等[1]认为所举例的这几个构式之间有历时意义上的关系,我们并未做实证分析,但将该命题记为假设1并作为后续讨论的基础。

  • Dec 28, 2020

    一则VAE推导的记忆方法

    时隔多年又要把VAE捡起来用,回忆了一下怎么推导,找到一种比较好记的办法。在这里记一下。

  • Dec 30, 2019

    框架和面向理解的语义

    框架是一种知识表示。知识表示狭义地理解就是把人类的知识表达成计算机能处理的形式,毋庸置疑这是实现人工智能非常重要的一步。在知识表示发展的过程中,框架是一种非常有代表性的方法,至今仍然具有旺盛的生命力。

  • Jun 22, 2019

    N元关系的表示模型

    前做了个N元关系表示的调研,这篇文章对此概念做个简要的介绍。本文将首先说明知识图谱和语义网的一些背景,再介绍为什么要表示N元关系,最后介绍多个表示方法。

  • Mar 14, 2019

    图神经网络一撇

    本文大概是一篇综述的浓缩,综合了一些感觉比较关键的东西,不涉及图网络的能力分析等很多别的东西,参考了三篇综述[1-3]和其他一些文章,充当一个快速入门。

  • Jan 2, 2019

    概率方法小结

    本学期一直在上计算所的《概率方法与随机图》课程,原本以为它是“概率图模型”,结果发现其实是一门讲概率和算法的课。但也多亏这一巧合认识了这是多门有趣的一个内容,和高级算法有一些联系,本文是课程一部分的总结,在本文最后会给出一些参考资料。由于英文世界已经有足够多的相关资料了,本文用中文写。本文的预备知识只需要基本的概率论和一点算法知识,具体来说是随机变量、期望和方差的定义和性质,以及了解最大割问题和图论的基本概念。

  • Nov 7, 2018

    macOS上启用2K显示器的HiDPI支持

    最近购入了一台 AOC 的 2K 显示器,收到才发现不能直接在系统里开启 HiDPI 功能,即用4个物理像素显示1个点。 在 retina MacBook Pro 上,这样的效果能让眼睛更舒服,一旦体验就再也回不去了。 这里记录一下在 2K 显示器上开启此功能的过程,并总结一下搜到的其他帖子。

  • Oct 22, 2018

    积极心理学

    这是自动化所每年固定开设的必修课《积极心理学》的课堂笔记。 由于积极心理学对于每个人来说都很有用,记录并分享出来希望能提高心理意识。 尽力会记录一些授课老师口述的内容或者案例,这部分东西不包含在PPT里。 授课内容包括7个topic,每周更新。

  • Aug 20, 2017

    从 dump 数据构建 Wikipedia 的 Category Hierarchy

    整理 Wikipedia 数据花了一天,简单记一下提取类别体系构建上下位关系的一些问题。

  • Aug 18, 2017

    Python 开发常用实践

    本文是给组里 wiki 写的一点分享资料,面向 python 刚入门不久的新人。也放在这里分享一下,希望能帮助到人。

  • Aug 10, 2016

    代码的未来(伪)

    想想博客这种东西写点务虚的讨论应该也没关系,所以扯一点最近的想法,也许会比较可笑,看看就好。

  • May 16, 2016

    聚类理论笔记

    记录一些基本的基本聚类方法的入门笔记,以便后续查找。阅读材料中的工作仅截止到2007年。后续的一些新进展没有考虑。谱聚类本来也想多写一点,然而感觉对来龙去脉还没有对混合密度这么清楚,等实现了几个算法之后再说吧。

  • Mar 27, 2016

    从参数估计到线性判别函数

    前一篇的一个补充提纲,实在不知道怎么改前一篇只好另写一个.

  • Mar 17, 2016

    贝叶斯估计概要复述

    从 Duda 的书《Pattern Classification》整理而来的一个轮廓,希望能对理解贝叶斯估计有所帮助。
    新的更宏观的来龙去脉可以看新的一篇:从参数估计到线性判别函数

  • Jan 29, 2016

    ClueWeb09 数据集把玩日记(下)

    这篇主要包括怎么抽取一个网页的内容,和怎么发现瓶颈并优化性能的。代码都放在 GitHub 上面。有的正则表达式和代码逻辑直接看代码可能更清楚一点。前一篇在此:ClueWeb09 数据集把玩日记(上)

  • Jan 28, 2016

    ClueWeb09 数据集把玩日记(上)

    作为一月份开始的一些工作记录,写下来备忘。发现写太长了,先把数据集文件部分放上来,后面继续(

  • Aug 20, 2015

    研究生生活的一些期望

    开学在即,整理一下自己对研究生生活的预期,希望能够完成。这里包括了一些想做的事情,一些研究生生活需要注意的事情,一些文章的总结和摘抄等。
    要感谢曾经的三个leader,过去几年里共事过的同事们,停下来的这几个月里对业内有了更多的理解,对自己的定位也更加清晰了。

  • Apr 4, 2015

    选择读研或者工作

    这周终于向直属 leader 提出了要离职去读研的想法,收获了不少建议,在这里记录一二。

  • Jan 3, 2015

    用 zotero 管理文献和个人知识库

    这周开始用了一下 zotero
    这是一款非常好用的文献管理工具,但它更像是一个多功能的收藏夹,或者说是一个知识、笔记、文献的综合管理工具。
    入门的时候搜到了阳志平老师的几个图文并茂的教程,这里也推荐一下:http://www.yangzhiping.com/tech/zotero1.html

  • Jan 3, 2015

    用 tower 制作年度计划

    制定年度计划是个人比较好的习惯,但是追踪计划和目标的完成情况往往就需要一些工具辅助。
    tower 是我们团队之前一直使用的团队协作工具,但由于设计简单,用于个人年度计划也挺好用。

  • Dec 9, 2012

    C++程序员的JavaScript修养

    Javascript被称为披着C语言外衣的lisp,现在用途逐渐发展到后端,就函数式语言中来说可能是能让C语言用户看起来最亲切的。虽然在网页里跟DOM和各大浏览器对象(document,window)等结合得乱七八糟,但如果能单独剥离出来看其语言特性的话,javascript是一个自由度非常高的语言。除了google一下就能查到的API使用之外,javascript提供的语言特性不多但却足够强大,可以写出各种各样的风格,包装出各种各样的特性。

  • May 9, 2011

    Windows线程同步小结

    为了做毕设从上个月末开始就在纠结这些问题了,头疼到今天才总算有一点成果,写个小结。

单独的笔记页面:在这里

subscribe via RSS