大模型爆发两年之后,底座模型的技术迭代并没有如人们预期中呈现飞速增长。受制于算力、数据以及更多的资金原因,去年至今,越来越多的企业放弃了底座模型的训练与开发,开始将目光转向应用领域。
此前媒体报道,“AI六小虎”中至少有两家已放弃预训练模型,业务重心转向应用层面。海外,硅谷明星AI公司Character.ai明确宣布放弃预训练,转而与第三方模型合作。甚至一些头部大厂此前也传出放弃通用基础模型开发的消息,即便后续很快辟谣否认,但市场对通用模型的信心不足已可见一斑。
国内仍有不少头部厂商对外强调底座模型的重要性。科大讯飞董事长刘庆峰连续两年在两会期间对外呼吁,要加强自主创新底座大模型的建设。2024年全国两会期间,他提出九点建议,强调要加大对通用大模型底座“主战场”的持续投入。去年科大讯飞的业绩说明会上,刘庆峰公开表态,科大讯飞当年度 50%的研发投入都将用于大模型底座建设。
过去一年,讯飞星火底座模型迭代速度飞快,几乎每两月就实现一次能力升级。1024开发者节刚过去没多久,讯飞星火4.0 Turbo 底座能力就再次实现了升级。1月15日,科大讯飞对外发布了讯飞星火4.0 Turbo的全新版本,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。发布会上,科大讯飞还同时发布了深度推理模型讯飞星火X1以及星火语音同传大模型。
在当前大模型热潮逐渐散去、行业进入技术悲观期的当下,这份对底座模型开发的坚持更显珍贵。正如刘庆峰此前对外表态,大模型的底座能力决定发展高度。只有从源头掌握技术创新,才能不断扩大大模型市场规模。
但技术的迭代始终离不开市场的需求。纵观本次科大讯飞对讯飞星火4.0Turbo的升级,特点之一就是瞄准细分行业和企业的痛点需求,尤其表现在行业知识理解、图文识别以及长文本等能力提升上。发布会上,科大讯飞还在行业内首发了混域知识搜索技术。
科大讯飞介绍,本次讯飞星火4.0 Turbo的底座能力升级,就是基于行业龙头企业的痛点需求,以及C端2亿多星火用户的真实反馈。在这些建立在真实场景的反馈基础上,讯飞星火在行业理解能力上有了显著提升,成为了更懂行业的大模型。
比如此次讯飞星火特别增强的复杂场景的图文识别能力,就是为了解决各行各业文档识别的“疑难杂症”。过去人们日常生活中常见的体检报告、法院文书、学术论文乃至企业合同中,常常有复杂的长表格、杂乱板式或者手写公式等,对图文识别能力要求颇高。
讯飞星火4.0 Turbo能力提升后,在通用文档版面分析、文字识别的准确率提升了40%,复杂表格结构、潦草手写文字等方面的准确率提升了60%。此外,还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止模型乱回答,同时发布了扫描文档解析的极速版本,文档理解速度提升10倍。
长文本能力上,讯飞星火4.0 Turbo研发了基于智能体的全新长文本框架,并对长文本注意力机制进行了优化。通过利用大规模网页数据、书籍数据等进行知识关联式的数据合成,讯飞星火长文本的知识融合准确率提升了40%以上,整体效果已超越GPT-4o。讯飞星火4.0 Turbo还在业界首发句子级别的溯源,准确率达90%,有效解决大模型的幻觉问题。
基于图文、长文本等能力的提升,科大讯飞首发混域知识搜索技术。简单来说,这一技术针对的就是当前用户与模型对话中数据要素杂乱的问题,可以实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。
正是这些对行业痛点需求的洞察,讯飞星火已经成为当下央国企合作的首选。根据此前媒体统计数据,在2024年大模型招投标市场中,科大讯飞以 91 个中标项目、披露中标金额 84780.8 万元排名第一,断层式领先其他厂商,成为 2024 年度标王。
目前,科大讯飞已经与央国企及20多个行业头部企业联合发布行业大模型,覆盖300多个应用场景。在积累百余个行业应用经验之后,讯飞星火4.0Turbo的行业能力也不断升级,在金融、油气、能源、电力、钢铁等行业能力提升11%~16%不等,成为“最懂行业”的大模型,进一步满足各行各业在真实场景下的刚需。
本文来源:财经报道网
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:http://www.mvteam.cn/6319/
共有 0 条评论