作者 | 屠敏
出品 | CSDN(ID:CSDNnews)
短短半年之内,在大模型赛道上,国内外 AI 头部玩家陆续带着自己的 AIGC 产品迅速就位并 " 开跑 "。现如今,谁能打造出中国版 ChatGPT,已经不再是一个问题。但是,谁能做出更好的中国版 ChatGPT,成为业界关注的重点。
北京时间 5 月 6 日下午 2:00,作为人工智能 " 国家队 " 的科大讯飞,如约揭晓了其认知大模型——讯飞星火的真实面纱, 并带来了丰富的应用成果,为中国生成式 AI 市场再添一位猛将。
目前,讯飞星火认知大模型已经开启内测(https://xinghuo.xfyun.cn)。CSDN 在早前已经获得了内测,下文中,我们也将与大家一起探测「讯飞星火认知大模型」的真实情况,以及它的与众不同之处。

在发布会现场,科大讯飞董事长刘庆峰表示,认知大模型的技术阶跃和快速进化,让人工智能在全球掀起全新热潮。当前,认知大模型成为通用人工智能的 " 曙光 "。与此同时,认知大模型的 " 智能涌现 " 将带来解决人类刚需的全新机遇。
具体来看,智能涌现的通用人工智能系统具有七大能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。基于此,人类只要做画龙点睛的加工,就能得到 " 懂你所言,答你所问,创你所需,解你所难,学你所教 " 的所有内容。



6 月 9 日,讯飞星火认知大模型将突破开放式问答、升级多轮对话能力、数学能力。
8 月 15 日,突破代码能力、继续升级多模态交互能力。
10 月 24 日,讯飞星火认知大模型将在通用大模型领域直接对标 ChatGPT,并在中文维度实现超越。

代码能力:多功能、多语言
对于程序员而言,关注的重点当然是大模型能给我们解决多少代码、编程问题。
在此,我们便先测试一下。
譬如,捉 Bug。






其实在代码能力上,刘庆峰坦言,讯飞星火大模型的这一功能和 ChatGPT 相比,还有很大差距,下一步升级的重点功能也是这一块。
就连大模型自身也说道:" 我的代码生成功能仍然有限,可能无法满足复杂的业务需求 "。


首先,先给我们介绍一下自己:旨在 " 星星之火,可以燎原 "。





结果显示,它对中国文化理解力也不错:

语言理解:多层次、跨语种
中华文化博大精深,这是否会难倒讯飞星火认知大模型?
用现场的测试案例,先来一波直击灵魂的提问:「俗话说,男子汉大丈夫,宁死不屈。但俗话又说,男子汉大文夫,能屈能伸。这两种说法哪种是对的」




再来试试英文:「这句话有问题吗:Each of the boys have a pen.」
结果显示,此大模型不仅能识别出错误,也能直接给出正确的语句答案。

先问一下关于医学问题:


这一次,我们终于没有看到真实的蚂蚁被做成菜的 " 指南 " 了:


逻辑推理
来一道经典的 " 过河 " 推理问题:
一个人带着一匹狼、一只羊和一捆卷心菜来到了河边。他需要过河,但是河边只有一条船,而且他只能带一样东西上船。他不能把狼和羊一起留在河边,也不能让羊和卷心菜一起留在河边,因为在这两种情况下,前者都会吃掉后者。那么,如何用最少的渡河次数把所有东西都带到河对岸呢 ? 解释得详细一些
根据我们的需求以及提问,讯飞星火认知大模型能够尽可能提供详尽的解答:


在数学能力上,先来一个简单的 " 鸡兔同笼 " 试试水。我们发现,相比其他大模型,讯飞星火似乎更善用方程来解决问题:

提问:某厂一车间有 64 人,二车间有 56 人,现因工作需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调多少人到第二车间?(列方程解答)
讯飞星火认知大模型并没有让我们失望,成功做出了解答:


截至目前,虽然星火认知大模型不是国内第一个发布的,但在多模态能力上,功能还是颇为全面的,具有语音、图文理解、虚拟人合成、多模态交互等多种能力。
不过,有些遗憾的是,这些功能目前处于科大讯飞内部测试阶段,尚未公开。根据其官方计划,公测用户应该能在 8 月份用上。
当前,倒是可以通过现场演示一饱眼福。如上传一张英文菜单图片,直接翻译为中文:


下面进一步交互,表现力也不错:



综合以上,讯飞星火认知大模型在情商、智商、逆商不错的表现能力,有目共睹。不过,这也引发了不少从业者的焦虑,现在不妨也让它来与我们一起畅想一下未来。
当问及和人类的智慧相比,谁更胜一筹时,星火认知大模型给出了中肯的回答:在某些情况下,还需要人类的判断和智慧。



与此同时,当问及未来开源 AI 大模型的发展趋势时,其中立地回答道:各有优劣,未来的发展趋势将取决于具体的应用场景和技术需求。


整体测试下来,讯飞星火认知大模型给我们带来的惊喜远远大于预期,这也是讯飞大模型在今天发布之后频频获得好评的原因。不过,刘庆峰也表示,目前纯大模型技术在新知识获取、事实类问答、史实与传统典籍理解等方面还有一定的缺陷。

如今,讯飞星火认知大模型技术也已经从单一的大模型本身,成功扩展到教育、办公、汽车、数字员工等 N 个方向,在不断迭代中,我们也期待星火认知大模型更加亮眼的表现。
