DeepSeek 热潮来袭,企业如何避免盲目跟风

自年前DeepSeek走入大众视野以来,A股市场便被搅的风起云涌,众多公司被纳入DeepSeek概念而收获资金追捧。根据同花顺数据统计,截止2025年2月21日,共有347家公司被纳入DeepSeek概念,自2025年2月5日至2025年2月21日,共有331家累计涨幅为正,其中并行科技、优刻得、青云科技等领涨整个概念,涨幅均在200%左右。
图形用户界面, 文本, 应用程序

AI 生成的内容可能不正确。
不过当前DeepSeek概念内的大多数公司无非是蹭个热点,其实自身业务与DeepSeek并无实际关联,短期内基本都不会对公司的业绩产生实质影响。而且由于DeepSeek目前仅是对话模型,并不是像ChatGPT或者国内比较成熟的文心一言、Kimi等多模态模型,覆盖文件分析、图像生成等各个领域,故而对于大多数非知识问答领域内的公司也很难应用DeepSeek到实际工作场景,想要改善实际业务也很难。
图形用户界面, 应用程序, 网站

AI 生成的内容可能不正确。
结合各种资料及笔者自身知识,当前市面上有各种各样的AI应用大体可以分为两种类型:已有商业产品中集成AI功能和已AI为核心构建生态的产品。已有商业产品中集成AI功能的例子众多,包括办公软件(Office)、视频软件(抖音)、代码编辑器(PyCharm)等,此类应用产品都是AI来服务应用中某些功能,核心价值并不建立在AI上,AI只是让用户可以更有效率的工作,但是即使关闭AI也不影响用户的核心功能使用。
如目前广泛使用的Microsoft PowerPoint工具中就集成了微软的AI工具,可以帮助用户优化PPT或者根据用户描述生成PPT,但是如果用户不使用也不影响用户自行制作PPT,即产品本身的核心价值并不因为AI辅助功能的消失而消失。同理也适用于类似的集成AI的工具。另一类是以AI为核心组件的产品,主要集中在大模型聊天机器人形态,其中最为知名的便是大模型“潮流领军人物”ChatGPT,另一个知名代表便是前文提到的目前的“潮流新贵”DeepSeek。它们以强大的搜索、对话等功能为核心,脱离了AI,它们也就不复存在,其本身并未提供其余核心功能。
 
不过与OpenAI发布版本的ChatGPT不同,DeepSeek是完全开源的大模型,在github等各类开源网站上都有模型公开,相关技术文档、实现方式也有论文进行呈现,所以任何人都可以自由自行下载部署,并进行一定程度的优化或者升级,各种互联网平台上都有丰富教学教程。
 
以B站平台为例,输入“deepseek本地部署”进行搜索,相关教学视频就有近千个,从一两分钟的快速部署到十几个小时的详细教学不等,主要步骤概括起来可以分为三大步“安装Ollama-拉取DeepSeek R1模型-安装模型对话工具”(具体见互联网教程)。
图形用户界面, 网站

AI 生成的内容可能不正确。
所以大家不要把DeepSeek模型的本地部署当作什么复杂高深的事情,也不是本地部署完成了就意味着DeepSeek的背书或者以及与DeepSeek展开了合作。而且由于DeepSeek存在多种规模大小适配的模型,从蒸馏版的1.5B大小到满血版的671B(数字越大,智能程度越高)。几千元的笔记本就能支持32B或者70B,企业部署671B的模型也不需要投入过多的成本,尤其对于大多数企业来说,它们本身就已经有服务器了,直接部署“满血”版DeepSeek,几乎不会耗费什么成本。
 
 
由此也就引出了我个人认为目前企业应用大模型方式的四种方式:自行开发大模型、开源大模型本地化部署、与官方合作定制化开发模型、使用大模型官方API。自行开发大模型作为高度定制化的方式,完全能够根据自身需求定制化模型框架、训练数据与优化目标,优质的模型很容易在这个方面形成技术壁垒,但是自行开发需要巨大的硬件投入、人力时间成本,有一定的技术门槛,而且最后的开发结果也不一定会令人满意。所以对于一般的公司而言,想要自行开发一个优秀的大模型无疑是“天方夜谭”,巨大投入后的微小产出无疑会拖垮整个公司。因此,就目前而言,国内主要大模型开发厂商均是具有一定硬件、技术储备的互联网公司,其余非相关领域跨界开发的都没有什么实际有效的产出。这也是DeepSeek之所以引起国内外争相讨论的原因,其以远低于其它大模型开发成本的技术手段获得了不俗的模型表现,而且还可以复现。
 
相较于自行开发,开源大模型本地化部署无需投入大量资源便可获得优秀的已有模型,而且还可以根据个性需求,运用特定专业领域的知识数据进行微调,达到模型定制化优化升级。若仅有基础模型而不用专业领域知识微调的话,这样应用无异于拿着铁棒去绣花。以笔者比较熟悉某漫画领域知识而言(问题:“传武”漫画中“红尘仙”的设定)

因为DeepSeek并无此漫画的具体知识,互联网上已有的公开信息也只是部分网友自行创作出来的,其中不乏完全错误的信息,所以根据公开资料的回答自然存在错误(天牢由李春主导建造,非李董)。而企业应用到具体领域当中时,自然存在企业内部特有的专业问题以及特定知识,需要企业将这些知识“喂”给模型,从而应对专业的使用场景。这种方式同样需要一定的硬件支持以及具有极强专业技术能力的人才队伍来完成优化升级,而且开源大模型本身的质量也是参差不齐,如何挑选合适的模型适应公司业务场景也是一个问题,合适的模型可以让微调事半功倍。不过这种方式是笔者认为比较适用于大多数公司的应用方式。即无需耗费大量资源训练基础模型,仅需投入部分较少的资源在基准模型的基础上进一步微调,从而达到特定目的。既可以以个性化的方式开发定制模型,积累企业AI开发、应用经验,保护自身数据安全,又可以节约前期预训练的巨大投入,保持自身独立,属于衡量多个维度之后比较有价值的选择。
 
鉴于开源模型质量的参差不齐,企业在AI人才储备方面的问题,与合适的大模型官方合作、定制化开发模型也是一个不错的选择,可以在有效利用官方技术实力的基础上,针对特定需求开发、优化模型。不过这也在一定程度上对合作方的技术路线和更新节奏存在一定依赖。不过对于有志于AI发展,但是又不想要分散资源在非主业上的企业来说,合作开发其实是个不错的选择。
 
最后便是调用官方API,利用这种方式,企业无需本地部署、也无需强大的存储与计算资源,后续的模型更新与优化均无需考虑,可以比较便捷的享受到大模型带来的优势。然而对于部分存在隐私、敏感数据的公司而言,公司数据会被潜在的上传到云端,从而导致隐私数据泄露,如很早之前,三星接入使用ChatGPT时便被曝出来的芯片机密泄露事件。
文本, 电子邮件

AI 生成的内容可能不正确。
而且就以笔者自身调研数据而言,当前主流API的调用费用均不低,以下是三家公司API的简单比较,举例测试问题为:贵州茅台一样的“茅”上市公司还有哪些?(仅用示例中问题简单测试,若问题复杂度提高,则相应费用会进一步提升,具体情况可自行测试)

主流API名称 单次回答价格范围
DeepSeek 普通模式 0.003~0.008元
深度思考 0.01~0.04元
月之暗面(Kimi) 普通模式 0.01~0.06元
联网模式 0.1~0.6元
字节(豆包) 普通模式 0.002~0.01元
联网模式 0.01~0.06元
       所以若是企业大规模调用大模型API,成本不容忽视,而且也不利于公司积累AI领域数据知识。因而该方式可能适用于需求频次较低、自身无力开发维护大模型的小微企业,对于中大型公司而言可能不是一个好的选择。
 
基于上述分析,笔者认为如果市场中某公司发公告声明自己已经完成DeepSeek开源大模型的本地化部署,那么一般就只有一种情况,那就是这个公司想要蹭热点、搞噱头。因为仅仅将模型下载后在本地部署不过是DeepSeek模型的Copy,如果公司不在上面进行微调训练(利用公司特定领域知识经验数据对模型进一步升级)、开发个性化模型,那么这样的模型与幻方量化相比并没有任何差异化,公司想要借此来吸引用户无疑是天方夜谈,因为对于想要采用大模型对话的用户而言,为什么不直接使用DeepSeek官方渠道,非要找个“二道贩子”?尤其是幻方量化还会不断迭代该模型。
 
而且如果当前版本的DeepSeek的本地部署都可以对公司的经营发展产生重要影响,那么之前爆火的ChatGPT应当早已对公司经营发展进行改善而无需等到现在。如果说ChatGPT是国外产品而不便于合作,那么在DeepSeek之前国内已经有众多类似产品,上从智能程度高、价格贵的月之暗面的Kimi,下到智能程度欠佳、价格便宜字节的豆包,中间还有百度的文心一言、阿里的通义千问,除中文语料的智能化程度以外,以上各个模型在多模态方面均胜过DeepSeek,也无疑更适于企业升级,为何暂时没有看到任何一家国内企业因为大模型的应用而获得实际经营业务上的巨大改善?
 
笔者觉得很重要的一点就是多数企业并没有明白自身需要AI做什么,仅仅为了搞技术噱头而引入了AI,而忽略了“给用户带来具体价值”的核心点,笔者相信这种具体价值应该是从深思熟虑的应用中获得的,就像互联网上传播的一个搞笑图片,我想可以很好的表现这一点(key:KFC疯狂星期四V我50,不懂什么意思的朋友可以去查一下)。

当然笔者并不否认可能存在“开发着、开发着”应用场景自然出现的情况,但这样无疑是极其稀少的。对于多数企业而言,如果不关注大模型应用本身能够给用户带来的价值,那么凭借噱头炒作带来的公司估值增长能够维持多久?等到这些挣扎着谋求可持续盈利商业模式的大模型公司自身都难以为继了,表面上粉饰一层“AI膜”的企业们又当如何自处?若只是为了公司市值增长,不若踏踏实实搞好公司经营管理,运用有效的市值管理手段,少跟点风,方为长久之道。