做项目还是一件很无聊的事,对科研用处不大,不过考虑到以后专门从事这方面,希望能把这套系统尽快跑起来,能持续维护以体现出自己的成果和改进。

读书

解读中国经济(增订版) 林毅夫
林教授是老牌中国经济学家,这本书以逻辑见长,解释了很多必然的政策抉择,回顾过去让人唏嘘。看书名以及目录也许很无聊,但是读下去发现完全停不下来,五星推荐。 评论里也有人批评说他是典型的经济学家,还是对很多西方经济学的理论教熟悉的。但是很多经济学模型拿到中国这样的人口和社会体量可能就不再适用了,据此而认为他的格局还是有限。 总之外行只能看个热闹,从书里读出自己的东西就行。

烹饪学 戴桂宝,王圣果
神奇的书,而且写的还不错,真亏作者能把做饭那么复杂的动作用文字无图片描写出来,然而做菜还是实践大于理论的,光看书也就只能玩玩。

The Elements of Statistical Learning Trevor Hastie et al.
考试前用的,著名得不能再著名了,没什么好说的,后面用到的一些章节还是没有讲得很细致,但是把所有机器学习相关的书收集齐,并对照翻阅效果拔群。

支付战争 : 互联网金融创世纪 埃里克 杰克逊
神一般的五道口金融学院翻译出版,引进得比较晚了,原书早在2003年就已出版。虽然作者不是 PayPal 的决策高层,但是基本反映了 PayPal 创业整个过程。 现在看来和滴滴打车惊人地相似——从创业远景、招人、烧钱补贴、和竞争对手过招、合并、与执法和监管机构的冲突、游说政府等等,另外有一段说到技术盲目大跃进,和当初搜搜也挺像的。 十分值得一看,五星好评。创业的人真应该站到那个地方想想自己遇到类似的问题该怎么做。

预知梦 东野圭吾
神探伽利略第二部与第一部不太一样,几个短篇焦点都是有点迷信的案件,然而最后都有奇迹般的改变,还算有点看点。

腾讯方法 : 一个市值1500亿美元公司的产品真经 潘东燕、王晓明
最值得参考的是讲敏捷开发的那几页,但只有在这方面摸爬滚打过,才能真的理解做事高效的精髓。最大看点还是当微信游戏上线之前,腾讯如何迅速调集人马做天天系列手游的。 做技术的人了解管理侧面的一个必读书,四星推荐。只会骂腾讯抄袭的话,格局就太低了一点。

林徽因传 张清平
在读这本书之前都不知道,原来这对夫妻一手缔造了中国建筑史,如何像徐霞客一样走遍中国10多个省调研古建筑,整理资料, 甚至丢了很多私人信件、也丢了很多保管在天津租界外国银行保险库里的资料, 但始终把珍贵的建筑资料在抗战期间从北京搬到长沙、到昆明西南联大、到四川小村子,然后最后是如何看着抗战期间都没有损坏的北京城在建国之后被拆掉。
林徽因本人也从一个情情爱爱的浪漫主义少女,成长成一个深明大义的人。这份经历非常幸运,相比之下,张爱玲就没有这样的格局了。
当然书里也有林和徐志摩、金岳霖等人的一些爱情纠缠故事,所谓民国绿茶婊第一人,但是在读过这本传记之后我已经抛弃了这种想法。这对夫妻真的太了不起了。
做一个当代知识分子,把读书当成留学移民的敲门砖实在有点 low,虽然并无不可,然而不该是最终目标,但是读书也绝不是为了充当统一思想的工具的。非常伤感。

恋文 连城三纪彦
再冷的冰也可以消融,作者真的很爱他的角色。认真去爱的人都很不容易,而沟通却往往很难甚至不现实。哪怕冒着说谎的风险,也要放开去爱。 虽然现在还是没想清楚怎么评价一个虚构文学作品,但还是可以五星好评。

其他不适很有印象的书,看过也就看过了。

  • 彷徨之刃.东野圭吾, 未成年人犯恶劣罪行的问题也算老生常谈了,社会机器的无情是社会机器运转的秘籍
  • 过得刚好.郭德纲, 没什么好看的
  • 定位技术.杨恒, 以为能好好讲一下作为 LBS 应用的基础,罗列了一些东西然而完全没看明白
  • 失乐园.渡边淳一,实在很无聊,无趣而麻烦的情爱描写,不论婚外情的探讨,最后就得出自杀死亡的结局,序言里就把没多少情节的故事全透了。
  • 再爱一次.渡边淳一,一个老男人怎么重振雄风?如果说前一本还算是有著名小说光环的话这一本直接让人再也不想读渡边淳一了

工作

问答系统:

  • 读了大部分前人代码,疏通里面的内容
  • 学习 lua,用 OpenResty 搭建整套服务,这个选择有一个意料之外的好处,就是 nginx 本身就很适合做 proxy,而 lua 难以实现的部分也可以退化为用 nginx 把这些功能外包到其他语言实现的微服务上去

百度爬虫:

  • 主要是把需求和一个学弟沟通,加上了一些特性,但是他实现得让我非常失望,花了三周写出来的东西不如我看2个小时,这份工作应该不怕麻烦先自己调研一下难度再写的
  • 可能我的沟通和说明问题的能力还是差太远了

didi 竞赛:

  • 学习羽喵的随机森林
  • 理顺了自己原来的想法和普通线性回归之间的关系,但是可惜忙着考试没来得及写

学习

正常向:

  • 模式识别考前复习笔记 这份东西还整理了三五天,感觉把很多要点都写清楚了,不明白的东西虽然还有很多然而用不到,不会继续深入了,有机会再说。

生活

这个月似乎沉迷 steam 有点过火了,还打了3天保卫萝卜3,虽然现在基本3天就能从一个小游戏里解毒,但是小游戏的数目还是挺可观的,需要好好反省一下…

问答系统的项目做到最后发现还是在知识源上处理会花很久,之前想把搜索功能扔给百度地图去发现还是行不通,需要爬一个很小的子集下来子集索引才行。
自己玩下来感觉还是挺喜欢做问答的,之后结束了手头项目会花时间整理一下设计写个总结,并作为一个服务提供一些公众号或 tg bot 的方式开放出去,持续优化改进。

7月马上有个中文信息学会的暑期班,可以迅速了解一些自己未曾深入过的理论,还是蛮期待的。争取把现在的项目完成,并完成一个问答的简单综述,以及怎么入手DL的改进等等。

月中还参加了一个本科隔壁寝室同学的婚礼,第一次当伴郎感觉还是蛮麻烦的。

看了一下独立日2的 IMAX,在三体和星际穿越把科幻抬高到哲学高度的现在,虽然说故事很杂情节很弱,但开飞机 biubiubiu 的题材果然还是我最爱看的, 这大概就是沉迷 Faster Than Light 的原因(死)。 而且剧本本来就是别人写的,只要能说得通并且没有致命错误的话都应该可以接受。

下半年希望能真做出点东西来,年底开始写论文。这个产出效率真的很急人,工作方式也有点问题,但是可能科研真的不能急吧….

Fight