10月24日上午,第七届世界声博会暨2024科大讯飞全球1024开发者节(以下简称“全球1024开发者节”)在合肥开幕。活动现场,科大讯飞首发超拟人数字人,宣布国产大模型“讯飞星火4.0 Turbo”升级,七大能力全面超过GPT-4 Turbo,国产超大规模智算平台“飞星二号”正式启动。
“星火超拟人数字人”首次现身
从去年5月6日首发以来,“合肥造”大模型讯飞星火持续迭代,在今年全球1024开发者节上,科大讯飞董事长刘庆峰重磅宣布,讯飞星火大模型再次升级,4.0 Turbo版本正式发布,在国际14项主流测试集当中有9项实现超越,在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。
此次全面升级的讯飞星火大模型4.0 Turbo还上线了“超拟人数字人”。刘庆峰介绍,在原有的远场高噪、全双工、多语种多方言能力上,他们还升级了多模态能力,新增了超拟人和个性化能力。
超拟人数字人的首次亮相,惊艳了现场不少观众。
原先,讯飞星火大模型的多模态交互能力,其创新性在于用户可以通过拨打“语音电话”的形式和大模型问话对答,这次,讯飞星火大模型4.0 Turbo从超拟人的语音升级为超拟人的数字人,用户可以通过拨打“视频电话”的形式和大模型问话对答。
“我们实现了语音、视频、图文的全部联动的多模态交互。”科大讯飞研究院院长刘聪在现场和超拟人数字人玩起了“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,超拟人数字人的反应都惟妙惟肖。
比如刘聪现场给超拟人数字人打了个“视频电话”,他不断调整玩偶手办“孙悟空”“奥特曼”“怪兽”的摆放位置,并让超拟人数字人“看图说话”,超拟人数字人立即回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽”,还和刘聪畅聊起了不同角度的所见。
在现场,刘聪还演示了更为实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能对画面中产品的品牌、功能等信息进行“秒回”,超拟人数字人已成为“跨语言”购物的好帮手。
“目前,讯飞星火大模型支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,讯飞星火大模型可支持1300+种人设的打造。
更多汽车将搭载“合肥技术”
在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。全球1024开发者节上,科大讯飞首次发布了星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
刘庆峰介绍,在多语言能力上,科大讯飞首次实现了全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。多模态多语言能力升级,将全面赋能汽车产业。
据悉,今年四季度起,奇瑞、广汽、长城等多款搭载汽车端侧星火大模型的车型将上市开售,“合肥技术”将走向更远的地方。
此外,科大讯飞还面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。如在医疗行业,讯飞星火医疗大模型2.0升级了医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成等核心能力。基于讯飞星火医学影像大模型打造的智能医学影像助手,可以帮助影像技师快速评估图像质量、及时纠正检查问题、快速生成诊断报告、解释溯源并多期对比等。
现场,科大讯飞还联合安徽省卫生健康委员会等单位共同发布全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球最顶尖的影像AI科研团队,共同推进医学影像大模型的发展;联合中国教科院,首发“基于问题链的高中数学智能教师系统”,打造众多高中数学优秀教师集体智慧与AI大模型智能的综合体等。
“飞星二号”正式上线
一年一度的AI开发者大赛备受业内关注。记者从现场获悉,2024科大讯飞AI开发者大赛共有来自14个国家、348座城市的35268支团队参赛,其中9372支是大模型团队。
只有生态繁荣,才能孕育出更多新成果。
根据IDC研究报告和市场公开数据显示,科大讯飞在语音语义市占率中第一,大模型开发者规模第一,达78.1万。
据悉,科大讯飞将牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。
为给予AI创业团队更多技术支持,活动现场,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”宣布启动,让各类技术有充足“燃料”保持创新。
据介绍,“飞星二号”具备强大的计算能力,能够支持大规模的数据处理和复杂的人工智能模型训练。
去年10月24日,科大讯飞携手华为推出首个国产万卡算力集群“飞星一号”平台。“飞星二号”的上线,将带来新模型新算法的持续适配和智算集群规模的再次跃迁。刘庆峰表示:“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”
记者 刘小容 文/图