超越ChatGPT？讯飞星火3.0上手实测，整体实力碾压！-中国新闻联播

10 月 24 日，在 1024 全球开发者节上，科大讯飞如期发布了讯飞星火大模型 V3.0，用科大讯飞董事长刘庆峰的话说，讯飞星火 3.0 七大能力持续提升，整体超越ChatGPT，医疗领域超越GPT-4。

讯飞星火可以说是一众国产大模型中的另类。它不是最早发布的那个，但却是唯一一家给出明确的升级节点的大模型产品，迭代时间甚至精确到了日期。从 5 月 6 日发布星火 V1.0，到8 月 15 日迭代2.0、10 月 24 日如期更新星火 V3.0 ，用短短 5 个月时间完成了对 ChatGPT 的超越。

国务院发展研究中心国研经济研究院用星火 V3.0 和其他大模型产品进行了对比横评，给出了“星火大模型综合能力超越 ChatGPT，国内领先、国际一流”的评价。

星火 V3.0 这么厉害？

话不多说，是骡子是马拉出来溜溜，今天我们就来上手实测下讯飞星火 V3.0 的能力如何。

科大讯飞在发布会中着重强调了讯飞星火 V3.0 在代码能力上的提升，在刘庆峰看来，在产业数字化和数字产业化的过程中，软件是定义一切的。作为数字世界的基石，讯飞星火 V3.0 的代码能力进一步提升。在“智慧课堂”产品的跨平台改造中，涉及到从 Windows 平台到 Linux 平台的迁移，代码量高达 20 万，按照传统的开发方式，需要三个月的时间，但是在星火赋能下，1 个月就完成了迁移工作。

先来个简单的小游戏，用 Python 语言生成一个贪吃蛇游戏的代码。

讯飞星火 V3.0

ChatGPT：

二者都能够在极短时间内就生成一段可用的 Python 代码，差异较小。

再来一道代码的问答题：

ChatGPT：

讯飞星火 V3.0

讯飞星火和 ChatGPT 都正确地回答了这一考验代码与自然语言转换的问题，并且都给出了逐行解释。ChatGPT 解释了代码的用途，但讯飞星火对待代码更为严谨，指出这段代码缺少了函数定义的结束括号。

发布会上，科大讯飞还发布了以讯飞星火 V3.0 为基础的智能编程助手 iFlyCode2.0，据刘庆峰介绍，iFlyCode2.0 在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%，大幅提升软件从业人员效率。

代码能力的提升只是讯飞星火 V3.0 升级的一部分能力之一。讯飞星火 3.0 在中文能力上实现了对 ChatGPT 的超越，我们来比较下二者在中文内容生产上的区别。

比如，我们让二者都分别拟定一个近期对马斯克的采访提纲。

ChatGPT：

讯飞星火 V3.0：

对比来看，讯飞星火的提纲更为充实，在一些重点问题上比如特斯拉及电动汽车产业上给出更专业、更细致的提问，比如提到充电设施的建设问题，采访提纲的深度和广度均有所保证，而不是像 ChatGPT 只是单纯地列出了一些访谈可能涉及的方向，显得有些泛泛而谈。

按照科大讯飞的理解，大模型不仅要能回答问题，还要能够提出问题，不仅是回答，还要能像人一样主动提出问题。

这就要说到讯飞星火 V3.0 在主动式交互上的进步了。刘庆峰介绍说，他们在讯飞星火的 3.0 版本上进一步提升了多轮对话能力，让大模型不再只是简单的信息咨询，而是多轮问话中能把问题问得更清楚。

这一特点运用得更为深入的是科大讯飞最新发布的讯飞星火医疗大模型。事实上，早在 2017 年，讯飞智医助理就已经通过国家执业医师资格考试，排名超过 96.3% 的人类考生，已经为基层医院及等级医院的医师提供服务。但是由于医疗场景的特殊性，科大讯飞在面向大众提供这一服务时十分谨慎。

现在，得益于讯飞星火 3.0 主动式交互的进步，讯飞星火 3.0 在医疗领域已经超越 GPT-4，磅发布了讯飞晓医生 App。在发布会中演示中，科大讯飞研究院院长刘聪专门实机演示了讯飞晓医的使用，它可以主动发问，主动丰富患者背景信息，通过多轮对话判断患者病情，科大讯飞将其称之为每个人的 AI 健康助手。

一切拿实测说话，我们用一个最简单的“肚子疼”的问题来分别提问 ChatGPT 和讯飞晓医。

ChatGPT：