复旦MOSS“备战”高考，这场大考或成大模型“赛马场”

pixabay.com

高考鸣枪在即，今年参加考试的除了高三学子，可能还有各种大模型。在昨天由上海国创科技产业创新发展中心举行的长三角科技产业创新论坛暨AI大模型产业应用高峰论坛上，复旦大学计算机科学技术学院教授邱锡鹏透露，他们计划让国内首个对外发布的对话式大型语言模型MOSS“参加”高考，以测试它的分析和推理能力。

由ChatGPT引爆的AI大模型，正成为全球科技巨头竞相角逐的新战场。今年上半年，国内已有百度、华为、阿里、腾讯、360、商汤、科大讯飞等30多家企业推出了各自的大模型。“百模大战”面临哪些机遇和挑战？与会专家表示，大模型是未来人机交互操作系统底座，充分竞争非常必要，不过也需要错位发展——有人做基座，有人做生态，才能共同进步，由此推动大模型产业健康发展。

国产大模型与GPT-4尚有“代差”

今年2月，复旦大学自然语言处理实验室发布国内首个类ChatGPT模型MOSS，那时的MOSS模型有近200亿参数，大约是ChatGPT规模的十分之一。四个月过去了，MOSS有了哪些进步？邱锡鹏介绍，今年4月，团队又发布了国内首个具有插件版能力的大模型。近期，以“火星”命名的千亿级模型参数的更新版MOSS模型即将上线，他们希望更新版MOSS能在今年的高考上“试试身手”。

事实上，他们已经让ChatGPT做了去年的全国高考题，经过专业严格的打分统计，得分大约在400分上下。对于今年MOSS能拿多少分，邱锡鹏没有给出预测。他表示：“作为聊天软件，国产大模型与ChatGPT差别不太大，但作为生产力工具，两者能力之间尚有代差。”

中国人工智能学会副理事长、北京大学教授刘宏补充说明了聊天软件与生产力工具的区别：聊天软件能用就行，就算出错也无伤大雅，比如此前的小i、小冰也能胜任聊天功能，但作为工具，就要确保不能出错。他认为，目前大模型学习深度还不够，缺乏与外部知识库的交互和调用，有待与工具软件更好地嵌入、融合，专业检索能力和数据安全保障有待进一步提升。

不过，这些不足丝毫不影响刘宏对大模型的热切期许。在他看来，大模型是物质、能量、信息融于一体的三元工具，是有史以来人类发明的最厉害的工具。类似从短信到微信的聊天革命，AI大模型正快速从“玩具”向“工具”演变。

邱锡鹏认为，目前最重要的一件事是让机器对齐人类价值观，这也是这四个月来团队所做的最重要的一项工作。如何对齐？邱锡鹏解释说，就是让一些人类反馈给模型输出的答案打分，对于模型产生的符合人类价值观的答案，不断给予正向鼓励。

元宇宙“失宠”？大模型将加速元宇宙到来

短短半年，ChatGPT的爆火似乎让“红极一时”的元宇宙处境有些尴尬，有人认为元宇宙只是昙花一现。中国人工智能学会名誉副理事长、日本工程院院士、电子科技大学讲席教授任福继坦言，2021年爆火的元宇宙是个“早产儿”，是“已来的未来”，大模型的出现不会导致元宇宙的衰落，反而会加速其到来。

在任福继看来，大模型的涌现能力正在催化元宇宙。比如，在已经开始应用的虚拟主播、AI带货等领域，数字人技术融入大模型的多步推理、指令执行等功能后，直接与用户对话的虚拟人将变得更像人。据清华大学发布的《元宇宙发展研究报告3.0版》，2021年，虚拟数字人核心产业规模约为336亿元，年均增长率为31%。对此，任福继表示：“近年来的虚拟数字人发展比我们预料的还要快很多。”

他还畅想了大模型和元宇宙融合后的终极形态——超世界，即虚实交融的虚拟世界。“现实世界拥有时间、空间、人间三个变量，而在超世界中，时间可以有正有负，空间可以有实有虚。”任福继举例说，在未来充满交融共生的生活场景中，当独居老人突发疾病，千里之外的医生可第一时间将药方发给大模型，大模型赋能的居家机器人接收药物后及时给老人服下，在这里，空间从虚到实。同样的，你也可以和逝去的名人面对面对话，在这里，时间由负到正。

作为情感计算领域全球典型学者，任福继认为，过去30年，人工智能在逻辑推理方面取得了长足进步。未来30年，人工智能还将在脑智、心智等方面更进一步。

作者：沈湫莎

责任编辑：任荃

*文汇独家稿件，转载请注明出处。