ChatGPT的一大特点是不再像之前的人工智能产品那么高冷,而是变得平易近人,能让普通用户参与互动聊天。
那么,在专业机构和研究人员眼中,ChatGPT代表了怎样的水平?就此,新京报新京智库专访了中国信通院云大所人工智能部副主任曹峰。
作为人工智能领域的“国家队”,曹峰和其所在的中国信息通信研究院团队,在2022年12月就基于智能对话和大模型等研究工作基础,对ChatGPT的对话、生成两项能力进行多维评测并发布结果,受到产业各界的关注。
新京智库:在AIGC(利用人工智能技术来生成内容)领域,就计算能力与现有技术而言,ChatGPT属于什么级别?
曹峰:ChatGPT的计算能力、数据集尚未公布。但是从技术的领先性来说,ChatGPT在全球都属于领先位置,一般来看领先半年到一年左右。
在开放域对话方面,ChatGPT在对话集成的技术、实现的机制、达到的效果、覆盖的领域等方面均具有绝对优势。在特定域对话方面,ChatGPT优势不明显。根据中国信通院于2022年12月开展的评测结果来看,ChatGPT尚难摆脱知识整合和逻辑推理困境,在约束条件下生成能力仍有不足。
新京智库: 2022年12月,中国信通院对ChatGPT的对话、生成两项能力进行多维评测,评测有哪些发现?
曹峰:根据中国信通院对ChatGPT的测试结果来看,当前ChatGPT支持以下几大类的文案生成,包括创意写作:学术类、新闻类、文案类、散文类、诗歌类、戏剧类、小说类、心得类、其他类;命题写作:主题拟定、风格模仿、文本续写、格式拟定;摘要生成:学术类、新闻类、散文类、戏剧类、小说类;代码生成:原始生成、错误修复。bsport体育app
从结果上看,ChatGPT在开放域内容创作上表现较好,bsport体育app但在命题写作、摘要生成等约束条件下生成能力仍有不足。
可以看出,当前ChatGPT仅仅能代替一些开发类的文案协作,如果增加一些限定条件,那么其性能就会较大幅度的下降。所以短期内,它是无法代替具有高要求,高限定场景下的写作需求的。
曹峰:在产业热度上,ChatGPT发布至今已获得前所未有的关注度。ChatGPT仅用两个月就实现了上亿用户目标,成为史上用户数量增长最快的消费者应用。这种热度还在持续提升。ChatGPT引发科技浪潮,吸引Google、Microsoft、Amazon、百度、腾讯、竹间等国内外企业的积极布局。
在技术实现上,集成多种前沿技术并采用先进的训练方式。bsport体育appChatGPT作为大规模语言模型,借助预训练学习、微调学习、提示学习和强化学习等技术手段,不断借助人类反馈,实现了更强的自我学习能力。
此外,ChatGPT在更广泛复杂的数据集上采用了更为通用的预训练方式,能捕捉到人类语言不同题材的特征,从而可以面向特定领域和场景做进一步的微调。
在应用表现上,ChatGPT交互语言多样、能力丰富、机制全面。ChatGPT支持英文、中文、日语等多语言交互,除擅长的对话问答能力外,还具备代码生成、论文写作、诗词创作等内容创作能力。相比于同一家族的GPT-3模型,ChatGPT在复杂语句理解、上下文语义衔接、错误内容纠正、质疑不合理前提、拒绝恶意提问等方面取得重要突破。
新京智库:近期,OpenAI传出即将发布GPT-4的消息。据分析,升级版的GPT模型在技术上会有更大的提升,能够准确执行更接近人类能力的任务。ChatGPT未来还会有怎样的发展?
曹峰:我们注意到OpenAI已经预告即将发布GPT-4。据称,与GPT-4相比,ChatGPT就相当于是一个“玩具(toy)”。我们已经看到ChatGPT所能带来的巨大可能,GPT-4可能在功能、性能等方面远远超过现在的ChatGPT。
曹峰:当前我国并没有直接对标ChatGPT的产品,但是我们看到,2月7日,百度正式对外官宣类ChatGPT项目“文心一言”(ERNIE Bot)。该产品目前正在做上线前的冲刺,将于三月份完成内测,面向公众开放。另据报道,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。
实际上,国内智能对话相关产品很多,并已经出现了很多年。百度、腾讯、思必驰、竹间、图灵人工智能研究院均推出相关对话开发平台和产品。
目前,我们看到阿里、腾讯都在内部测试相关的产品,可以期待我国相关产品的能力和表现。
如果您对稿件和图片等有版权及其它争议,请及时与我们联系,我们将核实情况后进行相关删除。