上海市数据科学重点实验室主任肖仰华大模型不能只会开放闲聊
自ChatGPT上线来,国际国内各大厂商纷纷跟进,投入了巨大研发资源来研发类似大模型。人工智能的发展,尤其到了通用人工智能阶段,可谓热点纷呈。
作为人工智能产业发展过程中的里程碑事件,ChatGPT代表通用人工智能技术的成熟,宣告人类社会技术进步有可能进入快速增长期,甚至一个指数发展期。在类ChatGPT大模型领域,中国尚处于起步阶段,需做进一步战略规划并统筹发展。就相关问题,《瞭望东方周刊》近日专访了上海市数据科学重点实验室主任、复旦大学教授肖仰华,探讨我国大模型产业的发展路径。
知识底座
《瞭望东方周刊》:通用大模型一定程度上刷新了我们对人工智能领域的认知,如何理解它带来的变革?或者说大模型有哪些能力?
肖仰华:大模型是人类文明所积累的海量知识容器,其所具备的通识能力,就是开放世界的理解能力。现在跟ChatGPT聊天,聊任何行业、学科的问题,它都能给出一个看起来不错的答案,虽然其仍可能犯一些事实错误、一些逻辑错误,但基本不会太偏离问题主旨——比如问出生日期却答出生地点。它还具备一定的“自知之明”能力,对于超出范围或者伦理敏感的问题,会拒绝回答。大模型这种对人类开放世界的理解力,已达到甚至超越普通人的水平。传统人工智能产品的“智障”问题已基本解决,这种开放世界的理解能力,对垂直领域(垂域)的认知非常关键,因为垂域应用是建立在通用大模型的通用认知能力基础之上的。
大模型有组合创新能力。我们在指令学习阶段让它学了A任务、B任务,它以后有可能泛化出求解A+B任务的能力。这种组合泛化,以前做不到,今天能做到,通用大模型让“举一反三”成为可能。
大模型有忠实的指令理解和执行能力,尤其是超大模型。只要给它指令、要求、约束、规范、规则,它就一定能够按照要求一步步完成任务。这本质上是一种情境化生成能力。我甚至认为,大模型智能本质就是情境化生成能力,因为大模型在提示越来越丰富时,生成的效果越来越好。
大模型有复杂任务的分解能力和规划能力。现实中很多场景都是复杂任务,需要一步一步求解,先做什么,再做什么,按照顺序进行合理编排,这就是规划能力。
大模型还有强大的符号推理能力。以前人们只是把大模型当做知识容器来看待,只期望其提供需要的知识。但今天不得不承认大模型也一定程度上具备类似知识库(知识图谱)所具备的推理能力,比如常识推理、数值推理等能力,当然这方面能力还需要进一步提升。
《瞭望东方周刊》:为什么说单有通用大模型不足以解决行业领域很多问题,需要发展垂域大模型?
肖仰华:因为具有上述能力,通用大模型好比是一个宽广的知识底座,但仍然缺乏专业知识的深度,缺乏专业领域复杂应用的长程推理能力。ChatGPT这类大模型本质上只是实现了在开放环境下的人机对话,或者叫开放闲聊,但开放闲聊并不能帮我们解决实实在在的工作场景中的复杂决策任务,比如要做设备故障排查、疾病诊断,都是严肃复杂的决策场景。在这些场景中需要丰富的专业知识、复杂的决策逻辑、宏观态势的研判能力、综合任务的拆解与规划能力、复杂约束的取舍能力、未见事物的预见能力、不确定场景的推理推断能力等。
大模型的开放闲聊过程中可能存在两个问题:一是“幻觉”问题。与ChatGPT聊天,有时它说得头头是道,但仔细分析,会发现它正在胡编乱造一些不存在的事实。同时因为其语言风格一本正经,让普通人很容易相信它,即便是领域专家要从它有板有眼的文本中识别虚构和错误也是一件不易的事。
二是缺乏领域“忠实度”的问题。解决任何专业领域的问题都要求大模型不要自己根据通识去自由发挥,而要严格遵循这个领域的规范、用符合这个领域的知识体系来回答问题。但是我们去尝试了一些通用大模型,发现如果不做一些调教优化,它总是会超出你给定的领域文档自由发挥,进而犯错。
所以,一个基本的判断是:单单利用现在的通用大模型不足以解决行业很多问题。实际应用需要的是事实正确、忠实于领域知识与文本的垂域大模型。从这个判断出发,当下我们要发展面向垂域的大模型,要发展通用大模型的外围插件,要采取大模型和知识图谱、传统知识库相结合的策略。
赶上差距
《瞭望东方周刊》:面对ChatGPT所引发的通用人工智能产业变革,国内企业应该如何抓住大模型产业机会?
肖仰华:大模型绝不是宣传文案的噱头。我们正在见证由通用人工智能所带来的前所未有的技术。通用人工智能是人类历史上第一次关于智能本身的。历次技术突破都是人类智能的产物,而唯独通用人工智能是“智能”本身的。
大模型的诞生宣告了整个人工智能进入全新的重工业时代。回顾人类历史上的历次技术,多始于相对低级的手工作坊模式,经过漫长的发展周期,最终形成了成熟的重工业发展模式。重工业化的人工智能有三个鲜明的特征:大模型、大算力和大数据。
5月23日,工作人员在贵州大学省部共建公共大数据国家重点实验室算力中心(刘续/摄)
国外大模型产业已经形成了一个生态,而且发展非常迅速。反观国内,从表象上看热闹非凡、模型林立,但是剥开外壳从内里看,仍然有不少问题,不免让人担忧。
一方面,几乎所有国内人工智能产业的重要企业与研发机构纷纷推出了自己的类ChatGPT大模型。这说明,大家都意识到大模型的战略意义,积极主动投入资源,这值得肯定。
另一方面,国内大模型产业发展已经出现一些问题:一是技术路线同质化严重,很多大模型都是用ChatGPT喂养自己的大模型,或是在国外开源通用大模型基础上进行指令微调;二是数据生态不完善,中文数据生态尤其重要,但现在较为欠缺;三是算力掣肘;四是模型创新有限,现在很多国内大模型都基于国外的开源社区模型。
总之,ChatGPT所引发的通用人工智能产业变革才刚刚开始,中国相关部门和企业要以深入的思考和扎实的实践抓住机遇,同时高度重视发展过程中出现的问题。
《瞭望东方周刊》:具体来说,中国发展大模型产业目前面临哪些短板?
肖仰华:大模型产业的发展取决于多个因素:其一是模型,模型好比内功,模型越大,潜力越强。其二是算力,这是大模型的核心竞争力,大模型竞争归根结底是算力的竞争。其三是数据,只有高质量的数据,才能喂养出高水平的大模型。不过,这几个问题都不是中国大模型产业的真正短板所在。
与国际同行相比,当前我国大模型产业发展在数据上有优势,在算力方面有基础,模型本身也不存在什么技术秘密,真正的短板在于我们对大模型“炼制”工艺的掌握,包括数据配方、数据清洗和参数设置等等,这些从根本上决定了大模型的效果,是大模型产业发展的重要因素。这方面短期之内难以跟上或者超越,需要我们付出巨大代价进行摸索。
实际上,上述的每一个具体模块,国内都知道怎么做,但是将它们整合在一起,总体效果和国外是存在差距的,不是0分和100分的差距,而是70分与100分的差距。我们要赶上最后这几十分,要不断试错、评测和改进。
从大模型问题引申来看,应用和集成创新,一直是我们的强项。但是跟美国相比,我们缺少原始创新,原始创新甚至到了极度稀缺的程度。原始创新是怎么来的?可能来自科学家的奇思妙想,可能来自偏执甚至疯狂的想法。比如Open AI的CEO山姆·奥特曼(Sam Altman),他在2015年成立Open AI,2018年投入巨资研发大模型。而在2018年这个时间点,全世界没有多少科学家认为通用大模型这条路可以走通。
将来我们要实现引领,就一定要不断优化科研文化和科研生态,鼓励思辨、鼓励质疑,激发原始创新。
7月8日,2023世界人工智能大会在上海世博展览馆举行。蜜度信息,“文稿通”基于大模型的诗歌生成
战略定力
《瞭望东方周刊》:在大模型热潮之下,中国自己的大模型发展道路究竟该怎么走?
肖仰华:国家有关部门要引导业界统一规划、合作协同、有序发展、健康发展。对此,我建议,可以从八个方面的应对措施推动我国大模型产业的发展:一是积极推动数据联盟(数据交易)的建设,促进优质数据的共享与传播;二是大力推动算力联盟建设,促进优质算力共享与协作;三是推动模型开源社区建设,完善国产大模型的开源生态;四是创新培养方式,培育大模型产业人才;五是建立大模型的诊断与应用评测体系,保障大模型产业健康发展;六是研究绿色可持续的大模型技术,降低大模型落地成本;七是积极探索大模型的应用模式,丰富大模型的应用场景;八是持续研究大模型训练与应用关键技术,完善大模型技术体系。
尤其要注意,在这波大模型的发展热潮之下,不能为了追随ChatGPT,忽略了其他热点,错失了下一个机遇。我们一定要有战略定力,对不断出现的热点要有战略重视,但不能打乱既有部署。比如,很多传统小模型,该研究还得继续研究,数字化与智能化进程中的其他技术也得往前推进。
在方向上,或者说,只有底座大模型与垂域应用相结合,才能最终创造价值。比如,医疗领域希望做能代替或部分解放医生的问诊机器人,投资领域希望有投资顾问机器人,司法领域希望有法律咨询机器人,这都属于垂域场景。在提升通用大模型能力的同时,也期待相关企业能在大模型垂域应用上有所作为,把大模型的通识能力更好地与垂域的专业知识、专家经验、行业解决问题的思维方式相结合,去解决现实中的复杂问题。我们既要重视通用大模型,更要重视垂域应用,重模型轻应用或者重应用轻模型,都是不可取的。
中国市场巨大、数据丰富、应用场景丰富,完全可以用完善的应用生态来带动底座大模型的进步,走一条“农村包围城市”的路线。也就说,先把我们擅长的外围应用和技术生态做好,不断去补齐通用大模型在数据、算力、模型和工艺等方面的短板,并在这一过程中摸索有中国特色的大模型发展道路,形成独特优势,另辟大模型竞争赛道,进而形成核心竞争力,形成百花齐放、百家争鸣的繁荣生态。
总之,国产大模型绝不能停留在类ChatGPT的开放闲聊,要尽快提升其解决千行百业实际问题的能力,切实把大模型发展成为推动我国各行业数字化转型与高质量发展的先进生产力。