中国AI逆袭，美国专家坐不住了

今天，国产AI大模型DeepSeek，登顶苹果App Store中国区免费榜第一位。与此同时，DeepSeek也在美区苹果App Store免费榜飚升至第一位，超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是，这也是中国应用首次同时在中国和美区苹果App Store占据第一位。DeepSeek为什么这么火？

中国AI逆袭，美国专家坐不住了

今天，国产AI大模型DeepSeek，登顶苹果App Store中国区免费榜第一位。与此同时，DeepSeek也在美区苹果App Store免费榜飚升至第一位，超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是，这也是中国应用首次同时在中国和美区苹果App Store占据第一位。

1月26日深夜，游戏科学CEO、《黑神话：悟空》制作人冯骥在微博发文称DeepSeek是顶级科技成果。他表示，如果有一个AI大模型做到了以下任何一条，都是超级了不起的突破，而DeepSeek全部同时做到了：这些突破包括强大、便宜、开源、免费、联网、本土。

冯骥在微博中推荐网友马上去用这款应用，尝试用它基本取代传统搜索，想象自己已经认识每个领域的顶尖专家，而且他们都是你随时在线的好朋友，把所有可能需要“请教别人”的问题，都拿去先问它。

DeepSeek为什么这么火？

科技财经作家醒客认为，从国内市场来看，它的推出，类似于2023年初百度或阿里推出相关产品，具有同等重要意义。此次推出实现了品质的大幅提升。以往使用大模型时，大家常抱怨其回答虽无大错，但前后重点不突出，车轱辘话较多。

然而使用这款模型后，内容的条理性清晰了很多，使用品质有了跨越式提升。打个比方，如果一个人回答问题不痛不痒，另一个人观点犀利、直指核心，大家肯定会觉得后者更好。就好比突然来了一位高水平选手。

公开资料显示，DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，由知名量化资管巨头幻方量化创立于2023年7月17日。2024年1月5日，DeepSeek发布首个大模型DeepSeek LLM，其包含670亿参数。时隔一年，历经多次迭代，今年1月20日，DeepSeek正式发布推理大模型DeepSeek-R1，并同步开源模型权重。作为开源模型，DeepSeek-R1在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o，且训练成本仅为后者的十分之一（约557.6万美元）。许多报道都提到了DeepSeek的成本很低，甚至把它称为AI界的拼多多。

打造AI界的拼多多，有怎样的意义？

醒客表示，这一意义重大。对于想做大模型的企业而言，过去做大模型，没有10亿或100亿资金很难成事，因为训练成本等整体成本极高。但现在这款模型报出的训练成本是五百多万美金，虽对普通公司仍算高昂，但相较于过去动辄几亿、几十亿美金，成本已大幅降低。成本降低带来诸多好处，比如多个公司可以合作搭建模型，使用成本也会大幅下降。过去两年，大模型领域发展迅速，但应用的最大障碍就是成本。成本高，若无法取得相应效益，从商业角度看就不值得做。国内很多大模型推出后多次降价，可若要达到可用水准且价格低廉，过去很难实现。据不同机构或团体测试，成本能降低至十分之一以下，甚至几十倍，这种成本降低对AI大模型的普及意义非凡。

醒客表示，这款模型能引发广泛关注，源于它是从国外火起来的，且是开源模型的重要代表。我们知道，国内大模型有开源和闭源之分，像百度就是典型的闭源，李彦宏认为闭源有其优势。OpenAI以前开源，后来闭源。如今其很多竞争对手采用开源方式，如Meta等公司。在开源领域，大家对这种方式十分欢迎。人工智能投入巨大，升级速度比传统软件快，过去两年，业内人士能看到大模型每月都在发展。在开源领域，优势愈发明显，因为开源意味着所有开源公司共享人才与成果，是抱团作战，而闭源靠公司内部几个人，从创新角度看，开源优势无可置疑。

但人工智能存在较大风险，比如可能影响就业、替代人类，安全风险比传统软件高几个等级，类似原子弹技术，若开发后管控不善，可能自食恶果。因此，在AI领域，开源与闭源就多了安全与否的争议。

不过从能力角度看，如果开源更有效，那么闭源不太可能比开源更快产生破坏性，反推可知开源安全性可能更强。这款模型作为开源软件，意味着很多没有AI积累的初创公司，借助其低成本与开源优势，能快速做出自己的模型，这是它最重要的贡献。

值得一提的是，伴随DeepSeek持续火爆，其服务器曾于1月26日下午出现局部服务波动。不过，这一问题在数分钟内便得到了解决。深度求索回应称，此次事件可能与新模型发布后的访问量激增有关。

有业界分析认为，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

美国消费者新闻与商业频道发文称，DeepSeek的AI模型“威胁美国在AI领域的主导地位”。另据媒体报道，Meta员工发帖提到，DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌，工程师正在疯狂地分析DeepSeek，试图从中复制任何可能的东西。

DeepSeek可否与OpenAI一较高下？

醒客分析称，目前，据专业人士测试，这款模型的优势主要体现在训练方面，在底层大模型上优势尚不明显。通俗来讲，在训练大模型后的使用过程中，存在语言逻辑性和重点突出的问题。使用这款模型时，它对概念的理解比之前的模型有明显进步，面对同样问题，能依据前面信息调整重点，得出清晰结论。而一些只注重模型训练，后期优化不足的模型，会出现对相反问题都能给出看似合理分析的情况，让人困惑。这款模型通过专家系统与大模型结合，采用反向强化训练，在人类语言语义和使用习惯上更有条理。

对于其发展前景，醒客表示，这确实是中国软件公司在近一两年的重要创新，值得国人自豪，且在国外也得到充分肯定。但从另一个角度看，它并非传统意义上的自主研发，而是全球协作的成功范例。它基于开源系统，很多算法和数据积累来自全球开源组织，是全世界优秀工程师共同努力的结果，中国人在其中完成了一个得到认可的关键步骤。过去三到五年，全球化遭遇阻力，很多人担心AI发展会加剧分裂。但从这款模型来看，它不仅有技术影响，更让我们反思，全世界应通过全球化方式加速科技发展，而非各自为政。

内容来源：BRTV新闻建外14号微信公众号

责编：郭峥

监制：刘萤萤

中国AI逆袭，美国专家坐不住了

DeepSeek为什么这么火？

打造AI界的拼多多，有怎样的意义？

DeepSeek可否与OpenAI一较高下？

内容来源：BRTV新闻建外14号微信公众号

责编：郭峥

监制：刘萤萤

中国AI逆袭，美国专家坐不住了_北京时间