在给AI建立认知体系的系统工程中,语言处理已经完成,黑科?太昊实验室现在的工作是视觉部分。
说一句题外话,计算机视觉的发展可能超乎很多人的想象。
很早以前,在最权威的竞赛ILSVR上,千类物体识别错误率2011年时高达25.8%,而次年深度学习出现以后,错误率逐年下降到16.4%、11.7%、6.7%、3.7%……16年,已经远低于人类。
最有商业前景的人脸识别,AI做到了误判率低于百万分之一!
这个比例,想必因为张学友演唱会,而被抓到的近百个逃犯,很有发言权了。
一首凉凉,哦不,铁窗泪,可能就是他们的心情。
图像识别高到ILSVR停办,新的计算机视觉竞赛Image也从图像识别,转到图像理解,物体分类、跟踪、定位,场景识别等等。
但神经网络是在像素层面提取数学特征,可以精细区分人类注意不到的细节,但在图像理解,轮廓、形状、物理和结构等难以定量描述的特征,往往容易被忽略。
这一类难度极高,识别准确率暂时Top-1不到87%,距离实际应用差得还远[1]。
有机会进入黑科的实验室工作,陆少英极度兴奋,陈然给指定座位,“以后你就用这一台吧,工作内容我教你。”
陆少英感觉机子很大气,“这是什么电脑?”
一旁的钱斌乐了,“什么电脑,这是工作站!”
“工作站?”
“对。”陈然点头,简单说了一句,“我们对图像处理的要求比较高。”
“戴尔PreT950图形工作台。”陆少英看了一眼铭牌,又打开系统配置表,“4颗15核至强CPU,30线程,512G(ECC)内存……”
“握草,性能爆炸啊!”陆少英惊叫一声,“这要是跑个游戏,还不得飞起来!”
“哈哈哈!”实验室的小伙伴们都笑了起来,“大惊小怪!”
“淡定!丢人不?”陈然捂了把脸,陆少英丝毫不觉得,兴奋道:“这么好的机器,不便宜吧?”
你是刘姥姥进大观园吗?陈然撇了撇嘴,“还好吧,79万。”
陆少英大吃一惊,李舒涵也是瞪目结舌,数一数,1、2、3、4……实验室一共有25台?
光工作站将近两千万,真是壕,无,人,性!
等陈然讲到工作内容,陆少英又吃了一惊。
与深度学习的二维平面图不同,太昊的训练数据是3D视频。比如一个街头远景,红绿灯、十字路口,熙熙攘攘的人群,飞驰的汽车、高楼、蓝天,视角可调,处处是惊人的360度全景。
无盲点覆盖所处场景的全景视频,其实不新鲜,很多的监控、地图、VR就有应用,但给神经网络作为训练数据,却十分罕见。
“二维的平面图,不能让太昊理解空间和结构。”方法太超前,陈然只能解释,“3D不同,有时间和因果关系……太昊可以像初生的婴儿一样,观察真实世界。”
“全景区分、比对所有细节,运算量是指数级暴增啊!”陆少英有专业素养,瞬间感觉头皮发麻,“可怕!你们的服务器配置要高到什么程度?”
陈然微微一笑,陆少英本来就是可造之材,有点眼力。
人机大战,AlphaGo战胜世界围棋冠军,要用1202个CPU和176个GPU。全景的运算超过AlphaGo数个量级,算力需求更是极为庞大。
呆妞李舒涵还想见见稀罕,“服务器呢,在哪儿?”
实验室的男生们生被她逗乐了,“神州超级计算机,找得着算你本事……”
李舒涵还是一脸懵圈,陆少英再次惊叹,“不在这儿,在黑科科学院。”
神州超级计算机由黑科并行计算工程技术中心研制,装有61440块自主研发的“神州1.0”众核处理器,峰值性能18.6亿亿次/秒,持续性能15.3亿亿次/秒,造价57亿!