二零一八即将过去,二零一九正将到来。此文回顾过去一年的点点滴滴。照例贴上往年的年终总结和思考。

写在回家之前-研一下半学期总结

聊聊二零一七半年纪事

写在2016年最后一天

差不多二零一七年最后一天的博客中引用了一张图,那张图写道:“今晚过十二点肯定有一群傻屌在那说什么新的一年新的开始,呵呵,还新的开始,2018年你也还是这屌样,洗洗睡吧。”

2018年即将过去,是,我将上句话中的2018改为2019,就洗洗睡去了,画面自行脑补。

前言

二零一八年正在进行或者已经完成的,对我而言的大事如下:

一. 一作小论文正式发表;二作小论文正式发表;二作WWW2019论文审稿中;

二. 完成京东的实习,并拿到口头Offer;

三. 完成在Eigen的实习,实习转正,拿到人生中第一个正式Offer;

四. 驾照正在备考中,科目一通过,科目三因为灯光挂了;

关于工作

2017年年末拿到的实习Offer,2018年年初完成实习,在狗厂还拿到了东哥的新年包裹,看来东哥确实把我们当兄弟,包裹里面都是一些零食,吃了一周就吃完了。三个月实习结束后回学校,在学校呆了两个月,读了两个月的CV方向的论文,CV研讨班举办了一期。差不多七月初想去杭州实习,其实有些公司这个时候已经开始了秋招,比如大疆。中间经过一些内推,面试了爱艺奇,旷世科技(Face++)两家公司,最后去了Eigen,误打误撞进了NLP的组,做NLP相关的实习。从开始想实习,到最终落定Eigen,期间还是有一段波折的心路历程的,写了一篇文章给几个好朋友看一看就私下保留了,不能发布出来。三个月实习结束,回校。因为驾照再不考就没时间了。考虑了一段时间,选择在Eigen转正,实习四轮面试,转正又是公司各个领导的远程面谈,我坐在学校走廊的小隔间中结束了转正面谈。Eigen是一家AI初创公司,团队个人认为很不错,在我的实习总结博客中大致做了描述。有很多朋友问起,为啥不去大厂,比如阿里?其实,实习开始的时候差不多是内推的黄金期,实习结束的时候差不多秋招已经结束。实习期间专注于自己的项目,虽然不知道到底应不应该去大厂,但是知道的是去大厂的意愿显然不是很强,蚂蚁金服内推不成功后,我一份简历也就没投出去过,其实可能冥冥之中,就已经选择了Eigen了吧。

经常看到有人问这样的问题“到底应该去大厂还是去创业公司?”,既然这样的问题一直存在,那问题的答案必然也是有争议的,我选择了后者而已。假设京东算大厂的话,也算去逗留过了,不做过多评论。无论怎样,如果你觉得大厂好那就尽可能去大厂,觉得创业公司棒,那就去创业公司。无奈很多人可能根本就不清楚自己喜欢哪种类型的公司,这个时候下,为啥不顺应主流价值取向,去大厂看一看呢?

所以,最终还是成为了一名光荣的NLP算法工程师。

关于研究

2018年在研究上的划分非常明显。在京东完成了CV方向的实习,期间正式开始深度学习的研究,尤其指向CV的分支。结束实习后回学校,组织了CV的研讨班,主要围绕CV中的检测,分割,追踪,应用等方面进行论文阅读和代码讨论,这个阶段的工作一直持续到开始想找新的实习工作结束,因为实习工作误打误撞做了NLP的方向。又要从零开始做起,实习期间的工作在我的实习总结博客中已经描述的相对清晰,这里不再梳理。实习结束后,基本确定以后自己的研究方向就是NLP了,心里倒也是挺开心的。之前做过数据挖掘和CV,最终的方向不清晰,确实走了一些弯路,在上文中已经提到这个严重的问题。研究方向确定后,差不多就是确定了短期的职业发展方向,于是回校期间,延续实习期间的节奏,读了大量NLP的论文。所以,整个2018年的研究阶段划分基本就是这样的:

京东的CV实习项目+回校读大量CV的论文(想idea)+Eigen的NLP实习项目+回校读大量NLP的论文(想idea)

其实在研究CV的时候已经打了一些DL方面的基础,所以虽然不做CV了,但是对DL的一些共性问题的认识帮助了自己对NLP的理解。对NLP的体系构建差不多是按照自顶向下的方式,这是自己喜欢的风格。我一直想,完整的知识体系有助于帮助自己看清知识的边界在哪里,前研的发展脉络是什么,从而更好的校正对自己在未来某个时间所做工作的认识,而这种认识对我而言非常重要。我知道有些组的同学从进入研究生阶段开始,就去做一个问题,最后可能会产出一篇好的论文。这种自底向上,由点到面的方式也是可行的,只是我不喜欢而已。之前室友从进入研究生阶段开始就去做DL,当时自己觉得不可行,但是现在想想,其实也没啥不可行的,就是研究的路子有点野而已。

年初发完小论文后,基本认为可以毕业了,所以,一门心思放在想发一篇顶会,当然,直到现在,我还没有一篇顶会文章,但是今年对写文章的认识加深了太多。导师是做进化优化方向的大牛,所以团队DL方向的研究基本靠自学,我相信不只是我们团队是这样的,大多数团队应该是没有牛导来带的。加之团队在DL相关方向积累不深,所以很多时候需要自己去试错,去尝试找到适合自己的路子。读论文,想想法基本成了大家的常态。但是这样的结果是,自己想了一堆的想法(现在基本看了论文,就能有一些想法),总感觉是incremental的,不能够做成顶会的,但是作为研究生的研究课题,个人觉得也不是不行。于是放弃,重新想想法,这样就会形成一个循环。这个循环自己并不认为是良性的,直到现在还没找到自己认为可以发顶会的想法,也许短期内也不会了。每当这个时候,就会觉得其实自己是非常需要一个能够带自己的导师去做一些事情的。反映出的问题可能还是自己对于问题看得不透彻,不清晰。另一方面,认识到好文章是需要好的写作的,讲故事的能力不是虚的,也是需要刻意习得,而这种习得,估计也是需要一些时间和沉淀。当然,看了太多的顶会文章,尤其是后半年读NLP方面的文章,会有一些对实验结果的失望,也有对文章讲故事能力的自叹不如。

从七月份实习开始到现在,读过的NLP相关的论文保守接近100篇,当然有几篇比较长的综述(到年底了,综述文章很多),一些需要精读的文章,大部分都是粗读。文章有老的,也有新的,大部分是新的,有些可能就是前几天的arXiv上挂的文章,比如XiaoIce的论文等。

对现在的自己而言,NLP做的一些事情,前沿的一些研究,方法的优劣才感觉算是有了一点认识。一个重要的心得是,在某个时刻,你会觉得自己无所不知,无所不晓;那么,在未来的某个时刻,你又会觉得自己啥也不知道,啥也不清楚;然而,此刻,或许又会感觉对边界的认知又扩大了一圈。

我个人对于做真正前沿研究的研究者表示敬佩。此外,我也慢慢领会到,顶会论文并不意味着工作solid。

关于做研究,想想法,做实验,写文章有太多的思考,此处就不详细写了。总之,我想,文章我还是会一直读,想法会继续想,发顶会的梦会继续做。

关于比赛

京东实习结束后,为了加深对Faster RCNN的理解,参加了ECCV2018的VisDrone Challenge,目的是调调参数,看下模型效果到底是怎样的。花了大概两周时间,提交了一个结果,最终结果排名出来的时候,还不错,竟然还被邀请为该workshop文章的co-author,算是第一次与计算机视觉顶会ECCV有了一点交集吧。期间很早把代码放在了Github,被福州大学的一个研究生和德州农工的博士生使用过,后来《先知》公众号转发了我的代码地址,骗了不少赞。Eigen实习结束后,觉得还是要参加一个NLP相关的比赛练练手,于是选了天池刚开始的一个知识图谱相关的比赛,比赛的目的是了解知识图谱的概念,核心流程。于是在比赛开始没几天,很快写了一个自认为相当不错的baseline放在Github,从代码的star和fork数目,还有一些受到的邮件来看,用这个代码的估计不少。实际上,我们团队也基于该baseline获得了初赛前十的成绩。

关于休闲

今年休闲时的大部分时间都泡在知乎微博Github上,知乎统计的结果是,阅读过26113个问题下的48399个回答,共计43892189个字,因此获得了理性率真的好奇星人称号关键词是前沿,底蕴和好奇。对于数字还是挺惊讶的,不过对称号和关键词,还是挺满意的,哈哈。微博终于突破了1000条大关,多是吐槽一些文章,想到的一些想法而已,粉丝始终维持在300左右,估计上不去了,通过微博也认识了一些相关方向的网友,讨论一些问题。Github近几个月骗了不少star和fork,同时也涨了几十个follower,估计与自己第一时间放了一些BERT的代码并被某些公众号转载有关,总之,三个社交账号中,只有Github算是发展最好的了。

技术博客,30篇左右。

电影,今年差不多评分高的基本都看了。

电视剧,只追过且正在追的《大江大河》。其实,喜欢年代剧的,此处安利一波《平凡的世界》,雷东宝的角色和孙少安的角色都会让你喜欢的,正如我同时喜欢宋运萍和田晓霞。

书,读了赫拉利的《未来简史》,还有师弟赵源强烈推荐的《斯通纳》。

篮球,校级亚军,差三分拿下今年的学校总冠军,冠军被生物工程学院给拿走了。

关于自己

从2018年开始,似乎更加的关注对自己的探索了,我想无论怎样这都是一件好事情。活在这个世界上已经二十七年了,说完全的脱离社会生活在校园中倒也不至于,算了下从本科到研究生累计实习时间肯定不止十五个月,实习的地点包括北京,上海,杭州等地,在国内各个互联网高地做短暂的停留,感受一下互联网发展的氛围,倒也是一件挺好的事情。

开始愿意去关注一下技术之外的事情,作为旁观者去观察其他人的生活和圈子。见识一下人性的丑陋面,看透一些生活的谎言,思考一下自身以及所处的时空。学会按照自然规律和社会法则,接受一些不情愿接受的存在。在人性和生活的黑暗面下,认识到自己的渺小。大抵明白有些事情能做,有些事情不能做,有些话能说,有些话不能说。

虽然看见一些不好的存在,但是庆幸的是我仍然能够真实而又坦然的对待身边的人,所谓开始出世入世吧。

虽然常说,大多数人是因为吃过苦头后,才会将锋芒毕露的自己掩盖起来,所谓被生活磨平了棱角等等。其实或许不必一定要去找苦头吃,也不需要被动吃苦,多观察周边的事情,多思考本质原因就会意识到更年轻时候的自己可能根本不是锋芒毕露,而是急躁冒进。到了一定的阶段,有些事情可能突然就明白了背后的道理,所谓“更加成熟”吧。

再优秀的人,都会被其他人说成是SB;再SB的人,都会有一群人称道优秀;看到过很多人和事情,慢慢的可能就不太在意这些东西了,毕竟看到的不一定是真相,真相是什么?哪有什么真相啊,大多数普通人距离真相太远,我如果能够更早意识到自己是个普通人,那么可能会活的会更加通透,更加畅快一些。

知道很多坏人和坏事,但是大多数时候可以选择做个好人。我想我应该更多的关注到自己,更加努力的去尝试搞明白自己究竟是个什么样的人?也许有一天,可以开心地对着镜子里的那个人说,“嗨,伙计,咱俩很熟啊!”

关于未来

我自己其实挺喜欢“永远年轻,永远热泪盈眶”,“愿你出走半生,归来仍是少年”这样的句子,我也很羡慕别人形容四十岁的王小川的好奇心保持的特别好,四十五岁的朴树双眸永远清澈。但是,树总会有年轮。

我很少会去思考我自己的未来是怎样的?因为总是得不到一个满意的答案。好不容易,哆哆嗦嗦,战战兢兢在我自己的公众号开篇语中写下“简单地生活,深刻地思考,求实问道,只为下一个十年。”

明年就要离开校园,成为一个彻底的社会人了。工作上,明年年底能够拿出一些研究上或者业内比较硬核的成果;家庭上,节假日回家陪爸妈,常回家看看。对另一半的寻找,随缘吧。灵魂上,要有趣啊。

最后祝大家新年快乐吧。