“在过去两年中,以大模型为代表的AI开启了一个全新时代,目前AI应用已进入落地的深水区。”在今日开幕的第七届世界声博会暨2024科大讯飞全球1024开发者大会上,科大讯飞董事长刘庆峰宣布讯飞星火大模型迭代到4.0 turbo,并升级多项应用。
据介绍,星火4.0 turbo底座能力再次升级,七大能力综合评测超过GPT-4turbo,其中数学能力、代码能力超过GPT-4o。在数学能力上,星火4.0 turbo已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底实现类o1模型的高难度数学能力。
讯飞星火此次还首发多个功能,包括首发语音视觉虚拟人交互“三合一”,其中多模态视觉交互,让大模型从语音交互拓展到音视频流的实时多模交互。
首发的超拟人数字人在业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成。“一张照片就能生成数字人,口唇、表情、动作都由大模型自动生成,并能够精准匹配文本,实现跨模态的语义一致性和更加立体的个性化多维表达。”刘庆峰表示。
他还宣布,科大讯飞首次发布星火多语言大模型,首批支持中英之外的八个语种,涵盖俄语、德语、韩语、日语、法语、阿拉伯语、西班牙语、葡萄牙语,并在多行业任务场景效果超过GPT-4o。
“大模型的竞争格局决定一个国家未来安全发展转型的话语权,中国的大模型市场不能只做中文,而让所有的国际语种都由美国一统天下。”刘庆峰表示,科大讯飞作为人工智能国家队,需要承担这样的使命,希望给世界提供第二种选择。
在端侧模型越来越受关注的情况下,科大讯飞还首次发布汽车端侧星火大模型,其参数规模为13亿,相较云端主流模型,在汽车主流场景的实际效果损失≤1%。自今年第四季度起,奇瑞、广汽、长城等多款搭载端侧星火大模型的车型将上市开售。
在教育领域,刘庆峰宣布,科大讯飞联合华为、中国教育科学院共同打造教育行业大模型,首次发布基于“问题链”的高中数学智能教室助手,并邀请全国的教师共创,目前已拓展到北上广等12个区域的400多位教研员和优秀教师。
面向医疗领域,刘庆峰宣布,讯飞医疗大模型升级到2.0,医疗海量知识、复杂语言理解、诊断治疗推荐、医疗专业文书、多轮交互、多模态交互等六大核心能力升级,评测能力领先GPT-4turbo和GPT-4o。
在影像诊断领域,科大讯飞正式发布医学影像大模型,实现各类影像自动质控,支持同一影像多病种识别诊断。基于联合安徽政府打造的安徽省医学影像云平台,能实现一次检查单次可见到全省互认。刘庆峰预测,这每年可为安徽省节约20亿元以上的医保费用。
今年诺贝尔物理奖和化学奖颁给AI科学奖,也引发了AI for Science的关注。刘庆峰认为,AI可以提高科研基础效率,对科学任务进行端到端建模,并能辅助设计科研方案。
据介绍,科大讯飞星火科研助手1.0已在中国科学院下属116个院所使用,并实现在生物、科学装置等领域的科研攻关。“AI for Science决定了中国科技发展的速度,赋能科研是星火的重要使命。”刘庆峰宣布,星火科研助手将升级到2.0。
在AI大模型应用方面,刘奇峰表示,讯飞星火实现多个第一,如央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、大模型开发者生态第一等。
“我们打造了20多个行业大模型,300多个智能体应用,形成相互借鉴和复用的规模化效应。”刘庆峰还宣布,科大讯飞将牵头成立5亿元创业基金,并与地方政府联合为AI创业团队提供产业落地支撑。
此外,科大讯飞还宣布,联合华为、合肥大数据共同启动国产超大规模智算平台“飞星二号”。刘奇峰表示,科大讯飞和华为将联合探索新的训练方案,推动智算集群规模再次倍增,实现从万卡规模到万P算力,同时持续探索新模型新算法的适配,如强化学习、类o1模型、多模态大模型等,实现业界对标。
对于AI产业的发展,刘庆峰认为大模型规模产业化必须进入行业深水区,关键是顶天立地、自主可控、通专结合、端云联动、软硬一体。
“所有玩概念的,没有大未来。只有自主可控的生态,才有生生不息的未来。坚持这五个关键点,才能真正解放生产力,释放想象力,改变产业格局和竞争格局。”刘庆峰表示。