接入DeepSeek!国金证券、兴业证券等官宣,金融IT人士:确实优于其他大模型

配资导航 2025-2-8 1 2/8

本文来源:时代财经 作者:金子莘

DeepSeek应用场景已经在金融行业火速落地。一名金融IT从业人士这样评价道:“DeepSeek模型对端侧推理能力有显著提升。”

截止目前,已有多家券商、基金宣布完成DeepSeek开源模型的本地化部署,不少公募基金也正探索上述系列开源模型的业务应用场景。

2月6日晚,国金证券(600109.SH)、国元证券(000728.SZ)、华福证券等中小型券商宣布已完成DeepSeek本地化部署测试。该消息一出,券商股在2月7日反应热烈,华林证券(002945.SZ)一度涨停,国金证券涨近6%,券商板块集体拉升。

与券商一样,基金公司也在密集实行DeepSeek开源模型的私有化部署。2月7日,包括汇添富、富国、国泰、景顺长城、博时、诺安等基金公司都宣布已在探索相关应用场景。沪上某腰部基金公司IT负责人透露 ,“未来,公司将根据搭建效果运用到代码辅助生成、研报解读、信息披露文件检查、制度解答、非结构化数据核对等相关场景”。

            图片来源:图虫创意           

券商抢先落地应用

业内对DeepSeek开源模型给予相当大的肯定,上述基金公司IT负责人表示,“就目前测试数据来看,同等条件资源下,DeepSeek确实优于其他大模型”。

从目前公开宣布的机构来看,落地的应用场景已相当丰富。国金证券在微信公众号平台表示,“此次完成DeepSeek的本地化部署测试,旨在将其应用于信息检索、文档处理、行业研究及市场分析等多个场景,并计划未来进一步拓展至智能服务、风险管理、投资分析等核心业务领域,全方位推动公司业务智能化升级,为投资者创造长期价值。”

兴业证券(601377.SH)表示,目前已搭建强大数智中台,支持包括QWen等不同开源大模型接入及融合应用,日前又追加完成了DeepSeek V3和R1两款大模型产品接入中台大模型矩阵,可实现诸多业务场景的全面赋能升级。

基金行业也正在适应技术变化。据时代财经了解,诺安基金在完成DeepSeek金融大模型本地化部署的基础上,已经推出基于主流AI开源框架自主研发的“诺安AI助手”,在投研分析、客户服务、风险管控等核心业务场景启动试点应用。,

在推动AI与资管业务深度融合方面,诺安基金通过私有化部署小模型,搭建起涵盖图片内容提取、语音转文本、文本转语音及文档摘要生成等功能的AI基础能力平台;同时,基于开源框架自主研发统一AI模型网关,实现多模型协同调度与AI资源的高效管理。目前,诺安基金正在投研数据智能处理、客户标签动态分析、中后台流程自动化等领域展开多轮“小步快跑”式探索实践。

事实上,早在DeepSeek开源模型正式问世以前,金融机构已经在探索相关大模型,并落地业务场景。

国金证券表示,早在2022年ChatGPT发布以来,即对生成式大模型的研究和应用保持高度关注和投入,2023年公司率先采用大模型辅助编程和大模型员工助手辅助办公。在2024年初,公司还组建了国金证券人工智能实验室。

截至目前,国金证券已有大模型算力池建设和本地化部署相关技术积累,前期已部署60多种常见的开源大模型类型,DeepSeek发布之后,公司再度利用前期经验迅速完成多个版本的本地化部署测试工作。

DeepSeek是一条“鲶鱼”

横空出世的DeepSeek热度空前,未来空间仍十分广阔。

据广发证券(香港)研报,DeepSeek已成为全球用户增长最快的AI应用,上线20天后全网下载量超2000万,登顶中、美等地区App Store榜首,该份研报中也提及,DeepSeek作为低成本模型或将引发市场对AI巨头估值的担忧。

除金融行业密集进行本地化部署外,不少行业巨头也纷纷宣布接入DeepSeek接口。

2月8日,腾讯云发布消息,上线了DeepSeek-R1和V3原版模型的API接口,除此之外,还将它们接入了大模型知识引擎,并支持联网搜索。基于DeepSeek,在操作上,只需拖拽几步,就能搭建一个集“智能问答+知识管理+实时搜索”于一体的AI应用。

据时代财经梳理,金山云(03896.HK)、东风股份(600006.SH)、恒瑞医药(600276.SH)、每日互动(300766.SZ)、万达信息(300168.SZ)、三六零(601360.SH)等公司均已公开宣布接入DeepSeek模型。

浙商证券大模型研究报告认为,“DeepSeek是搅动全球模型市场的一条鲶鱼,带来性能、价格、开源三重冲击。自此,ToB端应用、AI端侧应用将最受益于大模型的开源趋势、成本降低、迭代加速。”

报告进一步指出,首先DeepSeek性能比肩国际顶尖模型,DeepSeek R1在数学、代码、自然语言推理等任务上的性能可比肩OpenAI1模型正式版。其次,该模型低成本或将颠覆市场格局,DeepSeek V3整个训练过程仅用了不到280万个GPU小时,相比之下,Llama 3 405B的训练时长是3080万GPU小时。

在践行开源理念方面,DeepSeek-V3和推理模型DeepSeek-R1均开源,R1同步开源了其模型权重,并允许用户利用模型输出,通过模型蒸馏等方式训练其他模型。

- THE END -

配资导航

2月08日23:34

最后修改:2025年2月8日
0

非特殊说明,本博所有文章均为博主原创。

共有 0 条评论

您必须 后可评论