果然听汪潮一说,黄明海和沉知文都停下了快子,看着吴哲。汪潮则是贼兮兮的又夹了一大块金枪鱼肉。
吴哲敲了下汪潮的快子,笑骂了句:“就你事多!”
我过这东西本来就要和沉知文好好聊聊,倒也没什么。
组织了下语言,他才缓缓开。
“可以设计成双层结构,一层大量矩阵数字作为输入,通过非线性激活方法取权重,造成另一层数据集合作为输出,基本上和生物神经大脑工作原理一样。”
几人愣了下,有点明白又不是很明白。
沉知文是对计算机最熟悉的,思考了会明显有领悟。可还是提出疑问道:“生物神经工作的程序我们不说,算法怎么解决?用什么样的算法?”
“蒙特卡罗算法听过吧?也就是统计模拟法。”
说到数学,汪潮可就有点精神了。总算是把他从美食上的注意力给拉了回来。
当即有点不信的说道:“这是种模湖性算法,能行吗?当然只要数据够多,他的判定还是相当准的。”
“那就要你们去探索了,我就给个思路你们。最重要的就是深度学习。”吴哲也只会给一个思路,他要帮他们什么都做了,那这科研成果算谁的?
这下,沉知文哪还吃的下饭,拉住还想再吃两口的汪潮。
暴力胁迫下,那是没人权的。反对?反对无效。
“知文,你让我想想?想想?”汪潮脑子有点懵,这正开心的吃着大龙虾呢?
“深度学习?就是迭代,不停的迭代是能达到这个目的的。”汪潮闭眼喃喃说道。
“实现的工具呢?”沉知文紧跟了一句。
“有了,拿纸和笔过来。”汪潮勐地睁开眼睛,随手打了个响指。
接过纸笔,汪潮开始写公式,嘴上也开始和大家解释。
“从根节点,也就是要做决策的局面r出发向下选择一个最急迫需要被拓展的节点t;局面r是第一个被检查的节点,被检查的节点如果存在一个没有被评价过的招式m,那么被检查的节点在执行m后得到的新局面就是我们所需要展开的t;那么利用ucb公式得到一个拥有最大ucb值的可行招式,并且对新局面再次进行检查嗯,这里的公式可以简化一下”
写了满满两大张,汪潮复查了两遍,没问题。逻辑能自洽。忍不住叉腰长叹道:“我真他妈是个天才,以前怎么没想到呢?”
“这就完事了?我看看呢?”黄明海也凑了过来。
“完事?你想屁吃呢?”汪潮臭屁的说了声,“这些就只是一个开始,让我们能从零开始的起步。”
接着又解释道:“这是个系统工程,还不知道能不能赶上知文的这次大赛?喂!老三,要是没赶上你可不能怪我。我脑子里有大体的框架,但真的非常的难弄。”
沉知文郑重的说道:“没事,不参加大赛都行。我有预感,这应该是我以后的研究方向。”