第512章 智辅的计算(1/2)
第五百一十二章智辅的计算
计算机自然也可以模拟。
通过大量的人力标注,告诉计算机哪些是斑马线,哪些是路灯,哪些是车辆,区分人和垃圾桶。
李前能够读懂两份文件,它们足够简练,将复杂的知识形象的展现在面前。
这些大量的人工经验反馈给计算机,算法进行比对,就能得出更准确答案,快速分析图像。
此外,还能够人工调整参数权重,以提高回答准确率。
比如计算机分析数字8。
从0-9的数字中,找出数字8。
没有任何经验,计算机可能给出9和6和8三个答案。
人工标注错误的答案,调低9和6的参数,那么下次给出的就是准确答案。
但是,现实生活中的应用,复杂度远不是分辨数字8那样简单。
从静止的街道景物,到一张张图片组成的动态景象,每一秒的计算量都是海量的。
无数的参数在一层又一层的计算中,不停地变化。
计算机计算的过程,产生的那些参数,对于现在的人类来说等同于黑箱,难以研究。
一旦出错,都不知道错在哪里。
因而,调参是一个非常复杂重要的工作。
尤其智辅过于庞大,涉及方方面面。
人的大脑也是一样。
人脑有着几百亿个神经细胞,更多的神经突触。
大脑对人类而言,也是黑箱,思维意识的运转自然神秘无比。
后来,樱花国工程师,提出‘自注意力机制’。
该机制,造就了大语言模型。
使得计算机从识别图像,迈入识别人类语言的阶段。
可以回答问题,推理甚至是学习。
迄今为止,人类积累的所有知识,诞生的全部精神,抽象的数学概念等,都是用语言描述。
而语言的边界,就是世界的边界。
人类不了解认知之外的事情,比如可观测宇宙之外。
宇宙之外又是什么样子?
因为不知道,所以无法用语言描述。
有的人读书多,能够组成更多的词句,所以他思想深刻。
有的人经历得多,面临过各种现实复杂问题并解决,当他遇到新的难题,快速找到问题关键,并想出解决之法。
可以说这个人经验丰富,能力强。
理论而言,世界上所有的一切,都可以使用文字语言描述清楚——除非词穷。
那么大语言模型,是如何认知和使用人类的语言?
阅读到了这里,李前有点儿吃力,他开启通天祗,请教一直静静等待的林朝初和张琳。
林朝初看了眼张琳,张琳道:
“大语言模型使用统计学,推算文字排列组合的概率。”
她接过李前手里的平板,放在茶几上进行演示。
点开浏览器,输入一串文字:
‘这颗星球上最厉害的人是谁?’
“当我点下回车,算法会将这行文字,以单独文字和符号为单位,转化为数列,我们称之为token,token之间以向量连接。”
向量在数学的高维中,可以用空间坐标系表示。
本章未完,点击下一页继续阅读。