您的位置：首页 >观察 >

远见丨对话王小川：国内大模型“百舸争流” AI焦虑症如何破

来源：央广网时间：2023-08-22 20:36:53

【本期话题】今年以来，国内生成式人工智能赛道逐渐火热。国内互联网科技企业几乎“全员下场”，有技术背景的创业公司也纷纷加入，并纷纷发布大模型产品。半年过去，实际落地成果如何？大模型中，“开源模式”和“闭源模式”之间有何异同？决定“谁是中国最好的大模型”的关键因素，是钱和算力吗？本期对话：AI技术专家、百川智能创始人王小川。

(资料图)

最近半年，国内人工智能赛道持续升温。互联网科技企业几乎“全员下场”，既有传统巨头、大平台如百度文心一言、阿里通义千问、腾讯混元大模型；也有科大讯飞、商汤等人工智能领域的老玩家，还有诸多相关背景的创业公司，发布了通用或垂直领域的大模型。据不完全统计，国内发布大模型的企业已经接近百家。

半年过去，国内“百模大战”能看出哪些端倪？怎样看待关于大模型“开源”和“闭源”模式的争论和前景？决定“中国最好大模型”的关键，是钱和算力吗？怎样看待普通人的“人工智能替代焦虑症”？

本期节目，我们对话百川智能创始人兼CEO、原搜狗创始人、清华大学计算机学科顾问委员会委员王小川。

“百模大战，胜负未定”，400亿模型参数是“质变”量级

面对眼下“百模大战”的局面，王小川认为，判断最好大模型的通用标准有三点：（1）模型参数量；（2）测试效果；（3）Chat产品体验。用这三个标准看，国内的通用大模型还没有跑出胜负。王小川说：“从现象来看大家都下场做，每个有技术理想的企业都尝试，所以现在显卡的资源不够用，很难做评价。我从两点来看——不管是十家、百家、千家，最后一定要看两件事，一是能否拿出足够好的AGI（通用模型），比肩GPT4，这件事情大家有相应的距离，我们也没做到。往下看今年内有哪些企业能达到3.5甚至逼近4的能力；二是能否做出超级应用来，大模型很烧钱，应用场景中间是否有超级应用，也有困难，这两个事情还看不清。”

业内的普遍观点是，大模型的发展周期包括三个阶段：（1）以模型和数据为核心的技术驱动阶段；（2）模型产品落地阶段，这个阶段，预计400-500亿参数量级将是产品间拉开“质变”的量级。前面说的“百模大战”，就是指这个阶段；（3）用户驱动阶段，即消费者或企业对此认可、收益并买单。

众所周知，大模型烧钱。但在这场赛跑中，“钱”是否是决定胜负手的最关键因素？创业公司的机会在哪？王小川认为：“关于创业这件事情，我们跟美国不太一样，美国通用大模型、闭源模型的头部几家其实已经定下来了，OpenAI有ChatGPT，Google有一张门票，美国做开源大模型已经没有悬念，投资人也不会再去投。但是中国谁能做最好的大模型，现在并没有结论，有一个大家争取的机会，而且还不一定落在大厂里面。我觉得钱是非常重要的，但最终决定能力的还是人才团队，尤其包括个人能力和组织能力。我认为钱和组织能力应该是关键环节。大厂钱多，人多，算力多，但组织效率不一定够好，创业公司组织效率可能好，也可能不好，现在无法确定大厂小厂到底最后谁能取胜。做应用也是，中美的应用生态也不同，美国有了大模型，可以独立做应用，中国想做应用，发现没有好的模型，支撑就不够，变成了创业公司要一手做模型，一手做应用，这样来看就非常有悬念。”

“开源”与“闭源”，并不是竞争关系

通用大模型分闭源和开源，前者如OpenAI的GPT、谷歌的palm等；后者如Meta（Facebook）的LLaMA、微软Turning-NLG等。二者可以通俗理解为IOS和安卓系统的区别。开源可以促进共享、交流，避免垄断，并集思广益，推动人工智能发展；闭源则倾向于保护知识产权，提高优质公司核心竞争力，更好地保障系统质量和安全。

但王小川认为，不同于IOS和安卓，大模型在C端消费者和B端企业都要落地应用，因此并不矛盾。“今天我们讨论开源、闭源，它本身不代表2C（消费者），不像安卓、IOS用户只能二选一。而从2B（企业）的角度，开源、闭源都需要。我们认为，未来80%的企业可能都会用到开源模型，拿出去优化，开源模型可以做得非常小巧，尤其在很多场景里并不是拿去做数学题。今天让GPT4做数学题也是半吊子，大家拼能力可以，但是实操中，开源模型在很多地方是非常好用的——不同场景需要不同的储备，二者不是竞争关系，而是在不同场景互补。我们更关心的是2C（消费者）怎么做，2B（企业）怎么做，而不是把问题停留在开源、闭源的探讨里面。”王小川说。

普通人缓解“AI焦虑”，建议：行万里路，与机共舞

大模型技术日新月异，“人如何与AI共存”成了各年龄段、各行业的热议话题。对此，王小川的答案是“与机共舞，行万里路”。王小川说：“这是个特别好的问题，大家都关心，年纪大的关心孩子，年纪轻的关心自己的职业发展。这两个答案都会比较一致——‘坐在电脑面前的工作，最后都可能会被瓦解掉’。画个图，机器可以比你画得好，写个文案，机器可能比你写得好。”

“我认为需要‘行万里路’，走出去，跟世界有相应的接触，对于小朋友而言，是鼓励他走出去跟其他小朋友一块玩，在互相磨合当中得到的成长会高于在电脑或书本上得到的知识。成年人的工作也是，更多的工作不应是在电脑面前完成，在电脑面前的时间越长，被取代的可能越大。大模型会取代什么人？不用大模型的人。像我4月10号发了一封邮件，就是模型给我的建议，我问ChatGPT‘我想招优秀的人，该怎么办’，模型给我八条建议，其中第一条就是把想法写下来、发出去，和大家聊一聊，我就这样做了。所以，今天的大模型不是像搜索一样给你提供信息，它是给予你How to do的建议。因此，人要想‘我想成为什么人’，然后跟大模型聊‘我如何成为这样的人’。”

（作者：央广经济之声评论员、商业文化节目《远见》制作人王思远）

标签：