“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”

“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”

狼秋叶 2025-02-25 财经报 15 次浏览 0个评论
“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”

2月21日-23日在上海举行的2025GDC全球开发者先锋大会上,中国公司深度求索(DeepSeek)旗下生成式AI产品DeepSeek成为当之无愧的热点话题,几乎每个参会的观众、开发者都在谈论DeepSeek。

为什么会是DeepSeek成功破圈、DeepSeek是否会成为中国的“OpenAI”?DeepSeek给现场的开发者们带来哪些思考?澎湃科技记者在大会期间和AI从业者们聊了聊。

“DeepSeek给我带来的最大的思考是它带来了技术平权。”蜜度科技股份有限公司CTO刘益东告诉澎湃科技(www.thepaper.cn),DeepSeek帮助开发者和中小型大模型创业公司完成了AI市场教育。

“以前我们主动教育客户,大模型能做什么,但DeepSeek出现后,客户会主动提需求,我买你的大模型应用,但你最好能给我部署接入DeepSeek。”刘益东称,这是现象级的变化。

DeepSeek是否能成为中国的“OpenAI”这一问题,在刘益东看来,应该换个角度讨论。

与其讨论DeepSeek能否成为中国版的“OpenAI”,不如说DeepSeek其实挑战了OpenAI的模式,“DeepSeek也没有必要成为中国版的OpenAI,成为OpenAI也并不是大模型的终局。

OpenAI和马斯克的xAI在大模型的投入上都是“大力出奇迹”,通过不停地堆算力来训练大模型推理能力,但“DeepSeek用有限的资源走了一条适合国内的路,同样呈现的效果也非常好。”刘益东说。

蓝耘科技集团股份有限公司(以下简称“蓝耘科技”)总监顾瑞泉认为,通过DeepSeek看到未来大模型发展的三个趋势:首先,在专有或推理模型领域,越来越多的模型会开始降低预训练和推理成本;其次,开源技术正在改变以前的行业思维,例如百度近期开源了一些模型,其他尚未开源的企业也在逐步开放技术。开源技术将对AI未来的发展做出重要贡献。最后,人们不再专注于大模型预训练,而是将焦点转向后训练阶段,这将推动后续AI产业链上的创新。

蓝耘科技CTO安江华认为,国内确实很难出现像OpenAI和xAI这样的公司,“大力出奇迹”的路径在国内行不通。

安江华分析认为,目前全球仅有少数几家公司如OpenAI、马斯克的xAI处于AI第一梯队,DeepSeek在全球的位置仍属于第二梯队。第二梯队的公司在财力上无法与第一梯队相比,如果直接跟随第一梯队的策略,“大力出奇迹”,可能长期看下来会被拖垮。

从技术路径来看,DeepSeek最大的优势在于,通过算法优化和资源调配,减少了大语言模型(LLM)预训练的时间,但实际上,还是利用了更多的人工时间来换取训练效率的提升。“这种方式虽然节省了资金,但整体时间成本仍然很高。”安江华说。

安江华认为,在中国,单纯依靠“大力出奇迹”的模式依然是行不通的。主要原因在于国内企业难以获得足够的资源支持大规模投入,,要实现类似规模OpenAI、xAI的发展,需要从一级和二级市场募集大量资金,但在国内面临诸多限制。

是否还有其他可行的路径?

安江华称,DeepSeek有其先天优势,它脱胎于幻方量化,这类通过量化起家的公司早期已经有相当充足的资金积累,选择通过人工优化来换取训练时间的缩短。未来可能会有越来越多的团队选择DeepSeek这类模式。当然,如果资金充足的情况下,“大力出奇迹”的模式当然是最佳选择,但这并不是所有企业都能实现。

转载请注明来自小白菜,本文标题:《“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”》

每一天,每一秒,你所做的决定都会改变你的人生!