本科(懵懂乱撞)

本科在美丽的江南大学就读,是被调剂到计算机的,总之刚开始很不爽。不知道如何安排计算机的学习,不知道未来的职业发展是怎样的?虽然不爽,但是大一还是在繁重的课业负担和对大学生活的新鲜感中度过。后来阴差阳错,加入hiCamp实验室,遇到老翟(后去中科院计算所读博)。老翟给我讲了很多关于计算机的事情,开阔了眼界也同时解决了自己的一些顾虑。在老翟的鼓励下,本科的多数时光是在hiCamp实验室中度过的,预习,看书,写代码,做项目,技术分享等。清楚的记得,为了把C学习好,市面上的多数关于C的经典图书都刷过了。后来在老翟的强烈建议下读CSAPP和算导,也自发参与到ACM和智能小车的培训,认识了健神等人,再后来是周浩杰老师等。后来遇到本科最好的朋友韩少,目前仍旧认为是本科专业实力最强的,没有之一(学习态度和代码能力),清楚的记得,大二的时候我们和两个女生,花了不到一周的时间,扣公式读懂一篇CVPR2009的文章并且用Java实现了算法Demo,课上演示的时候简直太骄傲了。这些优秀的小伙伴们目前大多在BAT等不错的团队工作。

总之,因为本科遇到的这些人,使自己慢慢积累了一些信心,同时也培养了兴趣。大一时,自己差不多是第一个用纯C实现电话本管理系统的同学,当时将代码分享在QQ空间,的确是一件非常自豪的事情。后来不记得因为什么原因,代码没了。在感冒流着鼻涕的情况下,很快又写了一版。虽然后来做了一些可能听起来更加高大上的项目,但是这个小项目确实我到现在仍旧不能忘。

本科毕业的时候,也算专业中小有名气。

本科后传-研究生前传(短暂的辛苦并开心的创业经历)

本科实际上并不是一个学霸,绩点比较低,不能保研,于是考研到老翟那儿吧。后来进入翘课,做题的循环中连续几个月,初试过后,对读研倒也没有太多的期待了。恰逢遇到飒哥拉自己入伙,那段时间虽然累点但是觉得非常的开心。记得计算所老师打来电话邀请面试时,我们正在苏州谈一个事情,当时拒绝了面试,也就拒绝了读研。

再后来,回到学校,准备二战考研南京大学,亮哥说只要你能过线,至少你可以来我们组。结果是没过线,调剂回了母校-美丽的江南大学,开始自己的研究生生涯。

这一年,公司的事情,家里的变故,自己的失败选择和重新选择,失败后的绝处逢生,统统发生在这一年,非常艰难。现在想想,这些都是为成长付出的代价,弯路是走了,教训是得到了,学费是交了。我从不去想,如果当时去了计算所是不是会更好?因为这没有意义,对现在的自己,这几年我并没有很多遗憾。

研一(满腔学术热情,碰壁沮丧)

虽然是被调剂回来的,但是经历过生活的摧残之后,会对即将开启的研究生生涯格外的珍惜,那种小心翼翼的呵护。在开学之前,对即将开始的三年研究生生涯做了大量的调研,调整了心态,对即将开始的学术生活有所期待。但是渐渐地发现,老板并不能给自己带来很多实质意义上的学术指导。也就基本意味着,放养状态下仍旧需要作出一些成绩,满腔学术热情终究化成了一堆狗屎。

研一上(读机器学习相关的书)

大概在大二的时候就开始接触了机器学习,当时的Ng还是在Stanford的大教室上课,当时还没有西瓜书,没有花书。主要读《集体智慧编程》,《ESL》,《PRML》等这些书。转眼到了现在,学术资源,课程资源等大量出现,大大降低了入门的门槛。

研一下(读论文,找想法,一心想发论文)

在发论文的压力下,要不断去找想法。老板为啥不给想法?老板给了啊,此处略去一万字。研究方向刚开始定的是大规模机器学习。研究了半年的分布式优化,头秃没成果,放弃。现在看到知乎黑推Bound的研究,心里倒还有一丝窃喜。后来,沿着师姐的工作,做了一个采样算法的改进,发了小论文,达到了毕业要求。由发顶会到发一篇满足毕业最低要求的小论文,一腔热情就这样喂了狗。整个研究生生涯最压抑的一段时光大抵就是如此吧。

研二(实习带给了自己一道光)

随着数据挖掘和机器学习的流行,业界也出现了各种竞赛平台,比如天池,比如Kaggle,比如Kesci等。由于实验室没有特别适合自己的项目,所以做比赛成了自己当时最好的选择。在现在看来,对于志不在学术界的同学,打比赛仍旧是积累经验的好方法。

研二上(打比赛)

第一个参加的比赛是天池的口碑商家流量预测比赛,排名Top10%。首次参赛,追求框架和模型的复杂,第一个比赛没有思考方法本身,过度追求集成效果。之后就是其他各个平台的比赛了,期间研究了大量的比赛方案,在当时,主流的比赛都是数据挖掘相关的,多是分析表格数据。现在来看,深度学习的比赛较多。跌跌撞撞,参加了一些比赛,熬了一些夜,取得了一些成绩。

研二下(京东实习)

因为自己技术博客中一篇关于Focal Loss的分析短文,认识了志标。后来,在研二下学期快要结束的时候,被志标内推到了京东无界零售实验室,于是网友成了同事。实习期间,大概是2017年年末,2018年年初了,这个时间点也正是自己入坑深度学习的时间。实习期间主要做计算机视觉相关的事情,活体检测,图片质量评价等,当时小白,什么也不懂。新哥给自己一个List,总结了CV各个分支的经典文章,代码,博客等,说希望我实习结束的时候,读的差不多。华哥是我mentor,期间安排了两个分享,分别是关于CVPR2018的一篇文章和PyTorch的技术分享。同时认识了黄博,当时正值黄博博士毕业找工作阶段,耳濡目染了一些非常开阔眼界的东西。

从锡城一路北上,来到帝都。还记得入职前逛五道口的场景,记得和在北京的朋友约饭遛清北的情形,当然记得北京常常灰蒙蒙的天空。

本科那么多实习中,第一次在赵工的新图云创,拿着2000块钱一个月的实习工资是最幸福的一段时间。后来,在别的地方,也拿过6000块钱一个月的实习工资,但是幸福感远没有那么强烈。

研究生在京东的实习,是最幸福的一段时间。后来在Eigen拿了更高的实习工资,更好的工作环境,但是第一次总是令人印象深刻。

实习像一道光照耀进自己的生活,但是同时也面临着一个尴尬的问题。实习前做数据挖掘,实习做计算机视觉,以后怎么办呢?

研三(研究方向确定,大步向前)

三个月的实习很快结束了,返回学校。研三上学期,需要思考毕业后的工作问题了。从本科到研究生,北京,上海,杭州都实习过,从长远角度考虑,最终决定工作还是要去杭州。于是差不多七月初就被朝哥拉到了Eigen,又一次阴差阳错上了NLP的船。这次实习又是和在京东一样,一切从头开始。NLP的基本任务,数据,模型等。

研究方向确定了,就意味着可以聚焦,可以收敛了。每每想到在未来的很长很长一段时间自己都有可能做相同的方向,那种对日益精深的期待会使得自己无比的幸福,可能经历过很迷茫的阶段之后,才能更好的体会这种方向感明确的踏实感觉吧。

研三上(大量读NLP论文+读代码+写代码)

在Eigen实习期间,有大量的时间读论文,也读了大量的论文。配合工作期间同事不间断的技术分享,实习结束的时候,已经对NLP要解决的问题有个大致的印象了。

后来很快转正。转正之后,在经历了数据挖掘,计算机视觉和NLP之后,我的方向算是终于定了!又是一段非常令人感到幸福的时光。

在仔细规划之后要做的事情之后,觉得首先要去读大量的论文,真的是扎扎实实读到了2019年春节那会儿。那会儿读论文更像是做调研,对NLP的研究的问题重新做一个系统的梳理,对要解决的问题,数据,模型和最新的进展都做一个相对系统的梳理。以至于,春节过后到现在,已经反胃了。

研三下(写代码,写博客)

整个研三上基本没怎么好好写几篇博客,也许是积累到了一定程度,春节后差不多连续更了好多篇博客,也有很多想法去写了。返校后,大多是写代码了,自己Github上几个相对有人气的Repo也差不多是这段时间完成的。

读不读博?

这个问题就像需要回答去大厂还是去小厂一样?正如选择去了小厂一样,我不读博。原因不多说了,在此也对辜负老板的苦口婆心深表歉意。既然这样的问题一直存在,那么就存在争论的必要性。至于在将来的某一天是否会后悔,一切就交给时间吧。

本科部分经历(成果)

1.实习-无锡新图云创科技有限公司(无锡):参与云编译系统研发

2.实习-宁波智能制造产业研究院:OA系统研发

3.实习-无锡中建科仪有限公司:ICU床边机移动客户端开发

4.创业经历-无锡乐云教育科技有限公司:后端团队搭建和研途网系统架构与研发

5.实习-上海合合信息科技有限公司:爬虫系统研发

6.第一负责人完成大学生创新项目一项-江南大学图书馆图书推荐系统

7.担任hiCamp实验室的技术主讲,协助实验室的发展和壮大

8.不正当经历。帮好朋友熬夜写代码做一个第二天情人节使用的动态页面(是好朋友表白,不是我)等

研究生部分经历(成果)

1.实习-京东数据业务创新部(计算机视觉): 参与活体检测模型和图片质量评价模型研究等

2.实习-杭州艾耕科技有限公司(机器学习算法部,自然语言处理): 参与中文语法检纠错项目

3.研究生数学建模竞赛-基于监控视频的智能分析,三等奖

4.社会竞赛获奖,包括但不限于:PAC2017(人工智能组银奖),天池等其他平台的获奖等

5.写的一些代码,被微博账号:爱可可-爱生活,微信公众号:专知等技术号转发,推荐和收藏

6.个人技术博客持续更新三年,截止这篇总结文章,共有文章近130篇,多是原创

7.已发表中文期刊文章两篇(姑且算是成果吧),在投顶会文章三篇

8.组织江南大学算法讨论班,团队成员在各个竞赛平台取得了耀眼的成绩,两位同学已经分别拿到了今日头条AI Lab和腾讯AI Lab的实习Offer

9.不正当经历。当过私教(带一个科罗拉州大学大三的同学学习C++/数据结构),干过枪手(帮一个佐治亚理工的同学做过数据挖掘的考试作业),客串过技术顾问(帮助一个信息部门的工程师梳理技术思路,完成大论文)等

总结

实势造英雄,而非英雄造实势。计算机行业在国内的发展历史非常短,可能和我的年龄差不多。虽然历史短,但是发展速度极快。从2011年上了这趟车,到现在2019年,期间经历了O2O快速发展的一段时期,有幸加入创业公司共同见证了这样一段历史。O2O将线下信息拿到线上,致力于线上线下的融合贯通。研究生期间,同样幸运的是能够成为人工智能发展的一份子,见证近几年人工智能快速发展的潮流。人工智能致力于将信息变为知识。不管怎样,上了车,这一路的风景让人流连忘返,乐在其中。作为从业者的一员,会感受到在其他行业可能无法理解,也无法感受到的一件事情,那就是开源精神。Github是人类文明史的一大奇迹,维基百科更是人类的宝贵财富。要感激自己,更要感激这个不朽的计算机时代,真的太幸运。在这这段话的时候,刚得知深度学习三位大佬喜提2019年的图灵奖,这本身也是很好的激励。

本科,有些许遗憾,重来一遍,或许我可以做的更好。研究生,没什么遗憾的,再来一遍,我估计还是这样(丧,逃)。对于已经过去的事情,我相信“宿命论”,一切都是最好的安排。成长需要付出必要的代价,试错总是有昂贵的成本,有些苦早些时候吃总比晚一天再吃好。对于即将发生的事情,我相信“事在人为”,需要小心设计,合理规划,按部就班,直抵目标。

感谢

老翟,感谢他在我迷茫的时候,带我进入计算机的大门。本科阶段后期,作为hiCamp的主要负责人助力实验室的发展,研究生阶段组织算法讨论班,多是受老翟启发,姑且也算是对老翟的回馈。韩少,本科最铁的哥们儿,最牛的选手,学习态度和技术态度上都给自己做出了很好的榜样,受益终身。杰少,在研究生苦闷的时候,和我分享了很多南京大学LAMDA实验室的人和事,同时给我介绍了实验室的大牛帮助讨论科研,打比赛正是受杰少影响。阿飞,在自己刚开始做NLP第一个比赛的时候,给出了很多有价值的建议。后来又到讨论班给大家做技术分享,现在已经成为自己的日常NLP科研讨论的好友了,也共同合作了一些工作,希望后续有更加深入的合作。

感谢志标,孙旭,新哥,华哥,朝哥,黄博等人在自己即将开启职业发展生涯路上的帮助和诚恳建议。

感谢讨论班的同学们的合作和支持,希望大家携手共进,做的更好。

无论怎样,感谢我老板,搭建了深度学习的集群,偶尔的劳务经费,带我出去开会长见识,没有分配过多的杂活,支持自己的科研选择等等,由衷的感谢我老板。感谢实验室的师兄师姐,师弟师妹,希望团队日益壮大。

最后,最要感谢我老爸,老妈,还有我家二少。感谢你们的经济支持和情感支持,你们就是我继续前行的动力的源泉。

最后的最后,感谢舍友,孤独的夜晚,陪睡三年,逃。

下周一就将开始上班了,咱们江湖再见!

附录

研究生期间,读了一些直接或者间接有过接触的同学的硕士和博士总结,受益匪浅,感触良多。

1.杰少的南大研究生三年总结

2.王赟 Maigo的我的八年博士生涯-CMU王赟写在入职Facebook之前

3.李沐的博士这五年

4.田渊栋的博士五年总结