返回第66章 意图(1 / 2)重生,该抢发论文了首页

把矩阵乘法的计算,通过切割再组装的方式并行运算,可以节省大量的时间消耗。

这对稍微了解过线性代数的人来说,并没有什么难度。

但是在切的顺序上,还是会有一些性能的差异。

以陈斗天的实力,这种顺序也难不倒他。

也就是说余枫在大算子上的优化跟他最多做到平齐,只是因为花了点功夫优化了些小算子,所以结果反超了他。

大意了,没想到有人为了点成绩连蚊子腿都要优化,真恶心啊。

正当他花费了力气,优化这些蚊子腿算子时,却发现自己已经没法提交到OJ上了。

只有一次机会吗?没说啊。

陈斗天举手示意,负责人走了过来。

“为什么不能提交?”

“因为你刚才提交完毕以后,走来走去四处张望,公平起见我们锁定了你的提交。”

没有发出怪叫影响其他考生,只是瞎晃悠,他们就睁一只眼闭一只眼了。

第一个提交的学生,有潜力有水平,我们忍就忍了。

但你还想看了别人的实现再改代码,哪有这种好事。

陈斗天懊恼地捏紧手中的一次性杯子,提前交卷然后巡场这种事情,以前干多了也没什么事,今天算是香槟开太早了。

他安慰自己说,还有两道题,肯定比第一题难,只要够难,就能拉开他与凡夫俗子的差距!

一个小时很快到了,余枫第一,陈斗天第二的排名,没有第三個人能撼动。

第二题也已发布。

余枫养神结束,点击查看第二题。

是在第一题的算子基础上,加上了一些数据传输的函数。

余枫感叹一句,太懂行了。

巨量的计算固然是人工智能训练速度的最大阻碍,但通信成本也是难以忽视的瓶颈之一。

从直觉上思考,大量数据计算本身就意味着从存储设备中读取海量的数据,等到计算单元处理完毕后,再把运算结果写回存储中。

很遗憾的是,如今的CPU还是GPU,其计算的效率远超于数据通信的效率。

因此,通信的优化空间,完全不输给算法本身的优化可能。

由于第二题是在第一题的基础上,没有做出第一题的人,只好先黯然退场了。

大概少了三四位。

一个小时的时间完成应该是绰绰有余,估计本来学校并不是很好,也只是派来凑数的。

考虑到通信问题的话,就不是单纯的算法层面的问题,得建模来解决了。

而这,恰恰是信息竞赛中常见的题型。

这次的陈斗天算是心定了下来,不敢大意。

计算部分已经被优化到了极限,因此所有计算的时长可以当作是一个常数。而通信之间的成本取决于计算资源之间的连接方式。也就是说,此问题可以建模成一个整数线性规划问题来解决。

问题难度中等,有一定的门槛。

这次他还是第一个提交到OJ平台上,并且紧盯着会场前的屏幕,直到看到余枫的名字出现在他之后,他才松了一口气。