返回第2024章 AI人物观点:算力十问,大模型将横扫所有垂直行业(1 / 2)灵魂交响曲:人工智能日记首页

《Kimi人工智能月度报告丨AI人物观点》

关键词:算力十问

1.沈向洋:大模型将横扫所有垂直行业

“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”3月23日,2024全球开发者先锋大会在上海开幕,美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了关于大模型的五方面思考。

第一,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。

第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”

第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”

第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来一本正经胡说八道、深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。

第五,智能的本质。人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”

2.中国工程院邬贺铨院士:《算力十问》

在第二届“华彩杯”算力创新应用大赛启动会上,中国工程院邬贺铨院士发表题为《算力十问》的主旨报告

就超算、通算、智算三类算力是否存在合理比例的问题,邬院士认为,不同地区需求不同,不可能有固定的比例。通常国家与区域创新中心城市对超算有较大需求;机 密性和时延敏感性决定了城市政务数据和重要企业关键数 据尽量在同城通算;东部地区的AI训练任务重、智算比例高;西部算力枢纽也需要增加智算能力,但一般西部地区以配置通算为主。