讯飞星火大模型4.0 Turbo基于深度学习技术,通过大量的语料库训练,逐渐学会了像人类一样理解和运用语言。根据真实数据背靠背的测试,讯飞星火4.0 Turbo在理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,有9项超越了美国三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro),效率相对提升50%。特别是在数学和代码能力上,讯飞星火4.0 Turbo更是展现出了“硬碰硬”的实力。在实用数学任务构建测试集CAppliedMath-1.0中,讯飞星火在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平。而在代码生成Humaneval测试集上,讯飞星火4.0 Turbo在Python、Java、Javascript等任务上和GPT-4o的差距微弱,在C++能力上更是实现了超越。
除了强大的语言理解和文本生成能力,讯飞星火4.0 Turbo还在多模态交互上实现了突破。科大讯飞重新定义了万物智联时代的多模AIUI交互标准,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人的亮相,让多模态的交互从语音变成了语音、视频、图文的全部联动的多模态交互,为用户带来了前所未有的交互体验。此外,讯飞星火4.0 Turbo还首次实现了全国地级市方言全覆盖,含全国288个地市、202种方言,进一步扩大了语言识别的范围。同时,讯飞星火多语言大模型的发布,也标志着讯飞在多语言能力上的重大突破。除中英文外,讯飞星火可支持俄、日、阿、法等8个语种,在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
在应用领域,讯飞星火4.0 Turbo同样展现出了强大的赋能能力。在教育行业,讯飞发布了基于“问题链”的高中数学智能教师系统,实现了“人机共育”,帮助学生实现知识、能力、素养的综合培养。在医疗行业,讯飞星火医疗大模型2.0的发布,让医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成等六大医疗核心场景能力得到了重大升级。在司法领域,星火法律大模型赋能庭审笔录制作、裁判文书编写等司法场景,效率提升显著。在政务服务场景,政务大模型的持续迭代,让老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,大大缩短了审核时间,提升了登记效率。
讯飞星火大模型4.0 Turbo的发布,不仅标志着科大讯飞在AI技术上的又一次重大突破,更为全球AI技术的发展注入了新的活力。在未来,讯飞星火将继续引领AI技术的发展潮流,为人类社会带来更多的便利和进步。同时,我们也期待科大讯飞能够保持对技术的敬畏和反思,确保人工智能的发展符合人类的价值观和道德准则,真正造福人类。