早上起来,陈然习惯性坐在电脑前,浏览几个学术网站。
就一个领域的专业知识而言,最前沿的信息来自学术会议,大佬云集,智慧的火花交流碰撞,新颖的概念层出不穷。
论文成文要晚半年,量大管饱,但要有足够的分辨能力,一般只有少数具备研究和应用的价值。
专业知识产生的流程,基本是学术研究在前、接着技术应用、最后写进教材。
比如深度学习,2006年发表论文,2010年在Image竞赛异军突起,2016年AlphaGo让它名声大噪,确定广阔前景,2017年编入中学教材,最晚。
其实,有辅脑储备的未来知识,陈然不可能从论文中汲取养份,他了解前沿信息,只是为了不像贸然解决千禧难题一样,太过超前和惊世骇俗。
室友比你更优秀,还比你还更努力,怎么办?
陆少英觉得就像龟兔赛跑,拼的是毅力,哪怕注定赢不了,也要输得好看点儿……
陆少英也十分勤奋,一大早就爬了起来,注意到陈然最近在写的《神经网络的结构细分和动态路由》,他先沾光、一睹为快了。
AI领域当前使用最广泛的是卷积神经网络,它具有分层提取特征的学习能力,在计算机视觉和语音识别方面都能取得最好的性能,缺点是运算量巨大,迁移学习能力差,池化层也丢失了大量信息。
在这篇论文中,陈然提出了一种全新的深度学习模型,将许多神经网络结构集合在一个网络中,全面模拟人脑的思维能力。
不谈其结构的复杂程度,陆少英简直无法想象,“这么庞大的运算量,服务器根本带不动吧?”
陈然的眼睛看着电脑屏幕,头也不抬,“这就不是我的事了……再说了,这个主要是复杂结构难以实现,运算量却没你想象的高,知道为什么吗?”
陈然随口一问,也没认真,但陆少英发现,自己还是被难住了……
见他答不上来,陈然也没勉强,而是认真解释,“神经网络的不同结构,比如卷积、池化、LSTM单元……都是为了提取特征,不过层数少的话,预测效果差,层数一多,又容易丢失信息。”
“但如果将网络的结构功能化,数据通过路由算法给相应的结构单元处理,运算不需要现在的神经络一样整层参与,反而会更少。”
“动态的由每个单元提取特征?”陆少英吃了一惊,他听说过类似的胶囊网络,但还是觉得……这种操作更骚!
“当然。”陈然举了个例子,“整个网络的详细信息都可以保留。比如图像中精确的目标位置、旋转、厚度、倾斜、大小等,又或者语音的语气、情绪、音调……”
“能区分、比对所有特征?”陆少英瞪大眼睛,又追问了一句,“岂不是说,机器学习的效果会更细致,更好?”
“答对了!”陈然淡淡一笑,“相当于用少量的训练数据达到更强的效果。”
“你妹……真是太强了!”陆少英简直泪流满面,亏他还把卷积神经网络当个宝,这尼玛马上可以扫进垃圾堆了,“大佬就是大佬,牛逼!”
“服不服?”
陆少英竖起拇指,“服!”
“喊爸爸!”
“……”
到了该吃早饭的时候,两人去了食堂。
同学们并不经常登陆校园论坛,走在路上,偶尔有人注目,陈然没感觉到明显的变化。
好吧,他从小自带聚光,也无从分辨就是了。
买了稀饭馒头,刚坐下,便有一个高壮的学长端着盘子走过来,后面还跟着李舒涵,学长笑着道:“然哥,早上好!今天蛮巧啊?”
陈然示意两人坐下,向陆少英介绍道:“这位是钱斌学长,硕士在读。李舒涵,你见过的,实验室的新助理。”
介绍陆少英的时候,李舒涵嘻嘻一笑,吐了吐舌头,“好巧!”
巧什么呀,陆少英心里跟明镜似的,实验室助理就是打杂,一般女孩儿哪看得上,绝对是冲着陈然去的。