Posts

  • Dec 31, 2017

    回顾2017

    这一年相对而言平淡得多了,大体上没有离开过北京。主要是真正开展了硕士期间的研究工作,也为以后开了一个头。

  • Aug 20, 2017

    从 dump 数据构建 Wikipedia 的 Category Hierarchy

    整理 Wikipedia 数据花了一天,简单记一下提取类别体系构建上下位关系的一些问题。

  • Aug 18, 2017

    Python 开发常用实践

    本文是给组里 wiki 写的一点分享资料,面向 python 刚入门不久的新人。也放在这里分享一下,希望能帮助到人。

  • Dec 31, 2016

    回顾2016

    今年基本是从来到北京开始的,结束了哈尔滨的上学期生活后就来了北京。上半年时还陆陆续续写了一些月度总结,后来实在没办法把阶段成果和自然月重叠起来就放弃了。这里就连上后半年没写的东西大概梳理一下。

  • Aug 10, 2016

    代码的未来(伪)

    想想博客这种东西写点务虚的讨论应该也没关系,所以扯一点最近的想法,也许会比较可笑,看看就好。

  • Jul 31, 2016

    七月工作小结

    这个月终于进入了读论文模式,然而大部分点子都还比较琐碎,没有办法串起来。还好暑期还算长,慢慢来。

  • Jun 30, 2016

    六月工作小结

    做项目还是一件很无聊的事,对科研用处不大,不过考虑到以后专门从事这方面,希望能把这套系统尽快跑起来,能持续维护以体现出自己的成果和改进。

  • May 31, 2016

    五月工作小结

    又是一个月没有实质进展,感觉药丸啊

  • May 16, 2016

    聚类理论笔记

    记录一些基本的基本聚类方法的入门笔记,以便后续查找。阅读材料中的工作仅截止到2007年。后续的一些新进展没有考虑。谱聚类本来也想多写一点,然而感觉对来龙去脉还没有对混合密度这么清楚,等实现了几个算法之后再说吧。

  • May 1, 2016

    四月工作小结

    introduction

  • Mar 31, 2016

    三月工作小结

    三月结束得挺快,最近的工作没有什么营养,不过还是总结一下.

  • Mar 27, 2016

    从参数估计到线性判别函数

    前一篇的一个补充提纲,实在不知道怎么改前一篇只好另写一个.

  • Mar 17, 2016

    贝叶斯估计概要复述

    从 Duda 的书《Pattern Classification》整理而来的一个轮廓,希望能对理解贝叶斯估计有所帮助。
    新的更宏观的来龙去脉可以看新的一篇:从参数估计到线性判别函数

  • Feb 28, 2016

    二月工作小结

    二月由于春节假期,打乱了一下节奏,也没有干什么别的,主要就是三件事。
    一个,就是写了一个脚本用的框架。
    第二,就是了解了 java 组织和编译代码的方式。
    第三个,就是总结了一些 python debug 的经验。
    如果说还有一个那就是研究了 LCS 和 diff,这个对于调试 CoreNLP Server 有很大的关系,还有肉眼看出编码也是很大的。
    但那些都是次要的,主要就是三件事。很惭愧,做了点微小的工作,谢谢大家。

  • Jan 29, 2016

    ClueWeb09 数据集把玩日记(下)

    这篇主要包括怎么抽取一个网页的内容,和怎么发现瓶颈并优化性能的。代码都放在 GitHub 上面。有的正则表达式和代码逻辑直接看代码可能更清楚一点。前一篇在此:ClueWeb09 数据集把玩日记(上)

  • Jan 28, 2016

    ClueWeb09 数据集把玩日记(上)

    作为一月份开始的一些工作记录,写下来备忘。发现写太长了,先把数据集文件部分放上来,后面继续(

  • Dec 31, 2015

    2015 年终总结

    今年想做的几件事似乎都是失败了。

  • Aug 20, 2015

    研究生生活的一些期望

    开学在即,整理一下自己对研究生生活的预期,希望能够完成。这里包括了一些想做的事情,一些研究生生活需要注意的事情,一些文章的总结和摘抄等。
    要感谢曾经的三个leader,过去几年里共事过的同事们,停下来的这几个月里对业内有了更多的理解,对自己的定位也更加清晰了。

  • Apr 4, 2015

    选择读研或者工作

    这周终于向直属 leader 提出了要离职去读研的想法,收获了不少建议,在这里记录一二。

  • Jan 3, 2015

    用 zotero 管理文献和个人知识库

    这周开始用了一下 zotero
    这是一款非常好用的文献管理工具,但它更像是一个多功能的收藏夹,或者说是一个知识、笔记、文献的综合管理工具。
    入门的时候搜到了阳志平老师的几个图文并茂的教程,这里也推荐一下:http://www.yangzhiping.com/tech/zotero1.html

  • Jan 3, 2015

    用 tower 制作年度计划

    制定年度计划是个人比较好的习惯,但是追踪计划和目标的完成情况往往就需要一些工具辅助。
    tower 是我们团队之前一直使用的团队协作工具,但由于设计简单,用于个人年度计划也挺好用。

subscribe via RSS