3月16日下午,百度正式发布文心一言,包括五大能力——“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。
百度李彦宏介绍称,内测中“文心一言”并不完美,但市场有需求必须要推出来。
《文心雕龙》是一本中国古代文学批评著作,作者刘勰在书中提出了“文心”这一概念,指的是文学创作的内心体验和情感表达。《一言》则是唐代文学家韩愈的一篇散文,其中提到“一言既出,驷马难追”,意思是说一旦说出口的话就很难收回。
因此,百度的名字“文心一言”寓意着搜索引擎能够帮助人们快速地找到自己想要的信息,同时也提醒人们在言行上要慎重,避免后悔。
文心一言五大能力
目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?
场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。
场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。
场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。
场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。
场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。
与 Bing Chat 和 ChatGPT 的对比
图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。
演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。
下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。
首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。
Bing Chat 的回答还显示其信息来源是百度百科。
而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。
在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。
而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。
虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。
而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。
技术架构 & 特性
根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。
文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。