您的位置：首页 >关注 >

大语言模型中的涌现现象是不是伪科学？

来源：程序员客栈时间：2023-06-16 15:47:04

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

(资料图片仅供参考)

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf

2.https://arxiv.org/pdf/2301.05217.pdf

标签：

热门资讯

华为手机解锁方式有哪些（华为手机的解锁方式有几种） 1、一般华为手机有四种解锁方式，...
【天天快播报】iOS 17 向第三方应用开放 Cinematic API，电影模式可以调用了 苹果在日前召开的WWDC2023开发者大...
天天热消息：国家发改委：将抓紧出台恢复和扩大消费的政策文件积极推动国家骨干... 6月16日，国家发改委举行6月例行新...
好消息！龚翔宇身体已好，中国女排连续三场比赛，蔡斌或做出调整 北京时间6月16日，2023年世界女排...

观察

图片新闻

补全诗句人生易老天难老岁岁重阳今又重阳战地_人生易老天难老岁岁重阳全诗 1、开筵面场圃，把酒话桑麻。2、待...
银联支付助力激活线上消费新动能 “百行百家App快乐购”活动开启 近日，中国银联携手商业银行等产业...
环球资讯：凤凰花开，跨海相会！海峡论坛奏响两岸融合发展最强音 “凤凰花又开，鹭岛再相聚”。作为...
韩军方称打捞起部分朝鲜航天运载器残骸将进行精密分析 当地时间16日上午，据韩国国防部消...

精彩新闻

从展会看趋势　提高算效让数实融合插上 AI“翅膀” 5G新通话智能交互“解锁”无障碍沟...
全球微动态丨杭州亚运村内部环境首次公开本月将迎来首批运动员入住 6月16日，杭州亚运会刚进入百天倒...
每日动态!展现n型TOPCon全新可能元太光伏亮相Intersolar Europe2023 6月14日,全球规模最大、影响最深的...
全球快资讯：成都高新合作消费券发放领取时间表2023 据显示：合作街道消费券已暂停成都...
环球动态:世界时讯：信用卡逾期会查封车吗?信用卡逾期会不会把车收走? 信用卡逾期会查封车吗?是有可能被...
全球今热点：搭载第四代i-MMD混动系统，东风本田CR-V e:HEV售价19.99万元起 6月16日，东风本田CR-Ve:HEV正式上...
信用卡不小心逾期了怎么办？信用卡已逾期怎么办理分期？|天天时快讯 信用卡不小心逾期了怎么办?信用卡...
机器视觉板块震荡拉升，大华股份尾盘涨停 机器视觉板块震荡拉升，大华股份尾...
环球资讯：凤凰花开，跨海相会！海峡论坛奏响两岸融合发展最强音 “凤凰花又开，鹭岛再相聚”。作为...
英特尔收到171万美元的启动资金要在未来3年内为美国能源部开发和实施2000W CPU... 英特尔目前获得美国能源部高级研究...
深圳惠民保详细介绍成都惠蓉保介绍 深圳惠民保详细介绍深圳惠民保介绍...
怎样种植郁金香种球（水培郁金香正确养法）-快看点 郁金香种球的选择和准备种植郁金香...
全球微速讯：市领导调研特色商业街区规划建设及招商工作 6月14日下午，副市长马志峰到管城...
环球动态:iPhone4S是4G手机吗？i 随着科技的不断发展，移动通信技术...
DNF巴卡尔困难模式材料获取一览 DNF巴卡尔困难模式材料获取怎么获...
今日要闻!冬日暖阳_冬日暖阳的意思 1、冬日暖阳有两方面含义：指寒冷...
全球观察：新手养鱼如何养水？鱼缸换水三大禁忌 想必现在有很多小伙伴对于新手养鱼...
泰永长征：6月14日接受机构调研，国信证券参与|热资讯 2023年6月15日泰永长征002927发布...
刚刚，特斯拉重磅官宣：6月底前购买这款现车享受8000元补贴即时焦点 据特斯拉官方微博，Model3现车6月...
梦幻西游：如果129取代109成为散人最多的等级，物价会怎么样？世界热资讯 目前109这个等级是单开散人玩家最...
今日热闻!“端午经济”再升温！实探节前深圳粽子市场：新老玩家混战，平均毛利率40% “端午经济”再升温！实探节前深圳...
创造与魔法半夏柠澜号获得方法指南全球观焦点 创造与魔法每个版本更新后都会带来...
短讯！激光手臂脱毛后毛发会越来越粗吗 纤纤玉手，是很多美女都比较关注的...
“上元市集”敦煌亮灯梦回汉唐街体验古时“剧艺食趣” 云阙飞仙牌楼、宾至叠瀑、云阙仙宫...
一加Ace 2 Pro曝光配备二代骁龙8与5000万像素主摄全球实时 一加Ace2Pro近期曝光，据悉这款手...
市场监管总局出新规鼓励相关经营主体重塑信用_全球播资讯 据市场监管总局消息，为鼓励支持经...
《北京市医疗机构预付式消费资金管理办法（试行）》公开征求意见|天天看热讯 《北京市医疗机构预付式消费资金管...
【天天快播报】iOS 17 向第三方应用开放 Cinematic API，电影模式可以调用了 苹果在日前召开的WWDC2023开发者大...
6月16日国内镝铽系部分价格下滑 产品价格区间（元吨）均价（元 ...
余承东：问界M5智能驾驶能力全球第一超越特斯拉、国内外所有同行 余承东：问界M5智能驾驶能力全球第...
看点：广西职业技术学院召开2023年教学部门绩效考核工作研讨会 6月15日上午，广西职业技术学院召...
阳过之后，有多少女性月经失调了？-微动态 五味本草坊
孟子心目中的“大丈夫” 环球讯息 在中国思想史上，孟子是孔子“道统...
陕西宝鸡：暖心服务助力小麦归仓 正值“三夏”农忙时节，陕西省宝鸡...
丰台这些医疗机构可以预约“三伏贴”啦！时间、地址都有|微头条 健康丰台三伏贴是什么？三伏贴是指...
微资讯！开出去就是街上最靓的崽！迷彩特斯拉Cybertruck亮相 根据报道，最近有人在美国加利福尼...
大语言模型中的涌现现象是不是伪科学？ Datawhale干货作者：平凡@知乎，诺...
环球今亮点！大庆中考信息管理平台登录 一、大庆中考成绩查询入口：大庆市...
视听盛宴炸裂来袭《蛋仔派对》失重音乐节开启三大演出轮番登台|聚看点 音乐启动，快乐失重！欢乐世界休闲...
【全球时快讯】《装甲核心6》系统介绍公布 《装甲核心6》系统介绍公布是什么...
快资讯：港媒：“印太四边机制”实质是美国主导的利益胁迫工具 海外网6月15日电香港英文报纸《南...
对分摊办公费的侵权行为要勇于说“不” 只有勇于对违法行为说“不”，才能...
天天微动态丨6月16日国内萤石产业链价格走势暂稳 产品6月15日6月16日涨跌幅单位：元...
【环球热闻】睿能科技于上海投资新设自动化技术公司 天眼查显示，近日，上海亿维同创自...
河南省教育厅办公室关于公布2023年1+X证书省级师资培训承办单位名单的通知-全球新动态 各省辖市、济源示范区、省直管县（...
为什么现在房子那么多飘窗 买房的时候，购房者一般都会看样板...
《暗黑破坏神4》大米开启方法 暗黑破坏神系列有着独特的大米副本...
今热点：新华全媒+｜高考考生们，这些“套路”骗局要当心 新华社天津6月15日电（记者刘惟真...
全球简讯:被子头脏了如何清洗 1 被子是我们日常生活中常用的物...
【天天播资讯】中南新能源合作帮南非解“电荒” 图为位于南非迪诺肯野生动物保护区...