第505章 数学AI的训练 四(2 / 2)

请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

“这傢伙,还真是个死脑筋啊。”

徐辰调出了后台的逻辑生成日誌,仔细復盘了ai的整个思考过程。

他发现,这台机器的逻辑推演能力,目前看来相当可靠。哪怕是面对长达二十页的超长文本推理,它依然保持了极其恐怖的逻辑准確性,从头到尾没有出现传统大模型那种“推到一半就忘了前提条件”的幻觉!

这种绝对的逻辑严密性,正是徐辰想要的。在面对n-s方程那种难题时,这种不犯错且持续工作的能力,加强了徐辰攻克ns方程的把握,因为ai可以並行!

但同时,它的缺点也暴露无遗。

在证明的第七页,遇到了一个需要用到“代数几何中某个高阶定理”进行跳步的地方,如果换做是一般的数学竞赛生做这道题,他会凭藉直觉,直接引用那个定理,一笔带过,节省大量篇幅,因为这算是一个比较著名的引理。

但这台ai没有。

因为它目前的参数量相对较小,“记住”的高阶定理和数学常识並不够丰富。更重要的是,它缺乏那种人类数学家独有的、能在不同领域间自由跳跃的“灵感”。

但是严格的逻辑限制又不会让他瞎猜,於是在面对那个障碍的时候,ai选择了最笨的办法。

它没有跳步,而是从最底层的定理出发,硬生生地用穷举和暴力推导的方式,一步步把那个本该直接引用的高级定理给重新证明了一遍!然后再把这个证明结果,带入到原题的步骤中继续往下走。

这也是为什么,一道原本只需要两三页就能写完的题目,被它硬生生写成了二十页的论文;原本半小时能想通的问题,它用几百台lpu算了整整一天一夜。

“直觉偏弱,算力来凑;没有灵感,就用暴力穷举把所有死胡同都撞一遍,直到撞出一条真理大道。”

徐辰看著日誌,忍不住笑出了声。

这台机器,就像是一个极度偏科、死心眼、但体力无限的超级学霸。它不懂得什么叫“技巧”,也不懂得什么叫“优雅”,它只知道认死理,只要你给它一个方向,它就能用最原始的锄头,生生给你挖穿一座大山!

“怎么这么像当年的自己……”徐辰忍不住吐槽道。他想起了最初参加竞赛的自己,那时因为没有参加过系统的奥数培训,脑子里没那么多定理公式,遇到难题也是像这样,现场从底层手推引理来解题。

这个ai,还真让他有点惺惺相惜呢。

……

虽然做法有点笨,但是至少证明了,这套全新的底层模型框架没有任何问题!

目前只是因为参数量不够大,导致它记住的知识点较少、缺乏直觉跳跃的能力。等到后续参数量扩大並且餵入海量算力后,这台机器应该就能真正完成蜕变,一飞冲天了。

“辛苦了,0.1版本。”徐辰微笑著拍了拍显示器的边缘,虽然他也知道代码並不在显示器中跑。

“既然以后要並肩作战,总得给你取个名字吧。”

徐辰想了想,脑海中浮现出刚才日誌里那密密麻麻、不放过任何一个死角的底层推导过程。这种绝不取巧、步步为营、算无遗策的极致严谨,让他不禁联想到了华夏歷史上那位近乎於“智”的化身。

“就叫你『诸葛』架构吧。”

……