“大模型是人工智能的新时代。对话式的语言大模型是整个人工智能大模型进一步突破的核心。而专业化的语言大模型,是真正的通用人工智能落地的发展的核心。”思必驰联合创始人、首席科学家、上海交通大学教授俞凯在2023全球智博会上表示。
俞凯作为一名人工智能的从业者,更是一名研究者,他对目前大模型的行业发展和趋势有着自己的见解。“在接受采访时他表示,以GPT为代表的通用大模型是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。而基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。”
通用模型助力产业迭代
(相关资料图)
以ChatGPT为代表的通用人工智能技术,通过数据和算力效能的变化,催生出海量的新商业模式。而数字人、个人助理、搜索引擎等应用基于通用人工智能基础架构的变化,更引发了产业创新迭代,俞凯认为其对产业的影响主要体现在以下四个方面。
首先,通用人工智能技术对搜索引擎产生了革命性变化。搜索引擎之前是通过筛选关键词,推荐给用户全部答案,让用户自行筛选模式。现在,更倾向于提出一个问题,搜索引擎能直接给出回答,而且这个答案可能比此前的关键词搜索更加丰富、多元。在垂直领域,变化更巨大。比如文献的搜索衍变成为直接给出更准确、丰富的资料,给用户提供了更得力的帮助。
其次,通用人工智能技术正在重塑办公模式,仅仅输入一句简短的文字,就能生成初稿;只要提供简要演示的信息、想要的风格,点击生成,一份排版精美、动画丰富的PPT就诞生了……当办公软件得到人工智能的加持,人们的工作方式或许会从根本上发生变化。办公效率将大幅提升,办公场景从此改变。
再次,用户可以应用通用人工智能技术做内容创作。无论是生成一篇文章,生成一个邮件,其高效、快速、多风格的内容为创新应用拓展、创作成本降低等提供了有力支撑,大模型正在成为内容生产的创新引擎。
最后,就是和物理世界的连接。因为通用人工智能技术可以生成代码,而代码是连接最基础的物理设备的基本协议。当只需要一句话就可以转成代码来操作系统,人工智能就变成了一个物理操作系统。
俞凯认为,在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。而思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了实际的研究成绩和应用成绩。俞凯表示,思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,并正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。
伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。俞凯表示,技术本身是中性的,关键是运用技术的人,应该向善、不作恶。生成式AI面临的两大挑战,一是数据合规,包括数据来源合规、数据处理合规、数据生成合规;二是应用边际,包括需要从人员管理上、工程化实现、场景领域上去规范应用边界,如何更好地“协助人类”而不是“替代人类”,甚至是沦为deep fake的帮凶。
涌现能力加速落地发展
基于语言大模型的通用对话系统的出现产生了巨大的转变,在深度学习时代,产生了很多的之前没有的能力,叫做涌现能力。俞凯表示:“所有涌现能力的产生,一定不是自然而然的,它的涌现能力的产生,‘大’很重要,具有产生新可能,甚至于无穷无尽的可能性,也是大模型‘涌现’的前提条件。”
涌现能力的背后,则进一步隐含着三个非常重要的技术:情景学习、思维链和指令学习。情景学习深刻改变了传统机器学习的范式,只需要通过一系列精心设计的提示语句,对任务进行详细描述,然后再辅以一些情景例子,就能够让模型参考着既定例子完成特定任务。
指令学习则使模型能够理解并执行各种自然语言指令,将任务指令化以便机器理解。人类只需要在少量的任务上进行指令化,在经历大概40多个任务指令化之后,对模型进行适度微调,就很容易泛化到上百、上千种任务,即使它从来没有见过。而思维链则使得模型具有了推理的能力,让本来模型不会解的一个个复杂问题,分解成很多简单问题,然后通过逐一解决简单问题,最终使得复杂问题迎刃而解。
AI技术更不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。采访的最后,俞凯说:“希望所有的产业伙伴和研究伙伴和我们一起共创大模型未来的生态。让深度学习的下一代大模型可以在促进数字经济发展方面发挥重要作用。”
思必驰将于7月12日在苏州举办DFM- 2 大模型及创新技术应用成果发布会,发布属于自己的东风大模型。在发布会上,思必驰也会详细解读DFM- 2 在行业落地的应用情况,而这款大模型表现如何,我们也拭目以待。
X 关闭