中国AI逆袭,美国专家坐不住了_北京时间

中国AI逆袭,美国专家坐不住了

​今天,国产AI大模型DeepSeek,登顶苹果App Store中国区免费榜第一位。与此同时,DeepSeek也在美区苹果App Store免费榜飚升至第一位,超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是,这也是中国应用首次同时在中国和美区苹果App Store占据第一位。DeepSeek为什么这么火?

中国AI逆袭,美国专家坐不住了

今天,国产AI大模型DeepSeek,登顶苹果App Store中国区免费榜第一位。与此同时,DeepSeek也在美区苹果App Store免费榜飚升至第一位,超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是,这也是中国应用首次同时在中国和美区苹果App Store占据第一位。

1月26日深夜,游戏科学CEO、《黑神话:悟空》制作人冯骥在微博发文称DeepSeek是顶级科技成果。他表示,如果有一个AI大模型做到了以下任何一条,都是超级了不起的突破,而DeepSeek全部同时做到了:这些突破包括强大、便宜、开源、免费、联网、本土。

冯骥在微博中推荐网友马上去用这款应用,尝试用它基本取代传统搜索,想象自己已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它。

DeepSeek为什么这么火?

科技财经作家醒客认为,从国内市场来看,它的推出,类似于2023年初百度或阿里推出相关产品,具有同等重要意义。此次推出实现了品质的大幅提升。以往使用大模型时,大家常抱怨其回答虽无大错,但前后重点不突出,车轱辘话较多。

然而使用这款模型后,内容的条理性清晰了很多,使用品质有了跨越式提升。打个比方,如果一个人回答问题不痛不痒,另一个人观点犀利、直指核心,大家肯定会觉得后者更好。就好比突然来了一位高水平选手。

公开资料显示,DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由知名量化资管巨头幻方量化创立于2023年7月17日。2024年1月5日,DeepSeek发布首个大模型DeepSeek LLM,其包含670亿参数。时隔一年,历经多次迭代,今年1月20日,DeepSeek正式发布推理大模型DeepSeek-R1,并同步开源模型权重。作为开源模型,DeepSeek-R1在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o,且训练成本仅为后者的十分之一(约557.6万美元)。许多报道都提到了DeepSeek的成本很低,甚至把它称为AI界的拼多多。

打造AI界的拼多多,有怎样的意义?

醒客表示,这一意义重大。对于想做大模型的企业而言,过去做大模型,没有10亿或100亿资金很难成事,因为训练成本等整体成本极高。但现在这款模型报出的训练成本是五百多万美金,虽对普通公司仍算高昂,但相较于过去动辄几亿、几十亿美金,成本已大幅降低。成本降低带来诸多好处,比如多个公司可以合作搭建模型,使用成本也会大幅下降。过去两年,大模型领域发展迅速,但应用的最大障碍就是成本。成本高,若无法取得相应效益,从商业角度看就不值得做。国内很多大模型推出后多次降价,可若要达到可用水准且价格低廉,过去很难实现。据不同机构或团体测试,成本能降低至十分之一以下,甚至几十倍,这种成本降低对AI大模型的普及意义非凡。

醒客表示,这款模型能引发广泛关注,源于它是从国外火起来的,且是开源模型的重要代表。我们知道,国内大模型有开源和闭源之分,像百度就是典型的闭源,李彦宏认为闭源有其优势。OpenAI以前开源,后来闭源。如今其很多竞争对手采用开源方式,如Meta等公司。在开源领域,大家对这种方式十分欢迎。人工智能投入巨大,升级速度比传统软件快,过去两年,业内人士能看到大模型每月都在发展。在开源领域,优势愈发明显,因为开源意味着所有开源公司共享人才与成果,是抱团作战,而闭源靠公司内部几个人,从创新角度看,开源优势无可置疑。

但人工智能存在较大风险,比如可能影响就业、替代人类,安全风险比传统软件高几个等级,类似原子弹技术,若开发后管控不善,可能自食恶果。因此,在AI领域,开源与闭源就多了安全与否的争议。

不过从能力角度看,如果开源更有效,那么闭源不太可能比开源更快产生破坏性,反推可知开源安全性可能更强。这款模型作为开源软件,意味着很多没有AI积累的初创公司,借助其低成本与开源优势,能快速做出自己的模型,这是它最重要的贡献。

值得一提的是,伴随DeepSeek持续火爆,其服务器曾于1月26日下午出现局部服务波动。不过,这一问题在数分钟内便得到了解决。深度求索回应称,此次事件可能与新模型发布后的访问量激增有关。

有业界分析认为,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

美国消费者新闻与商业频道发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。另据媒体报道,Meta员工发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。

DeepSeek可否与OpenAI一较高下?

醒客分析称,目前,据专业人士测试,这款模型的优势主要体现在训练方面,在底层大模型上优势尚不明显。通俗来讲,在训练大模型后的使用过程中,存在语言逻辑性和重点突出的问题。使用这款模型时,它对概念的理解比之前的模型有明显进步,面对同样问题,能依据前面信息调整重点,得出清晰结论。而一些只注重模型训练,后期优化不足的模型,会出现对相反问题都能给出看似合理分析的情况,让人困惑。这款模型通过专家系统与大模型结合,采用反向强化训练,在人类语言语义和使用习惯上更有条理。

对于其发展前景,醒客表示,这确实是中国软件公司在近一两年的重要创新,值得国人自豪,且在国外也得到充分肯定。但从另一个角度看,它并非传统意义上的自主研发,而是全球协作的成功范例。它基于开源系统,很多算法和数据积累来自全球开源组织,是全世界优秀工程师共同努力的结果,中国人在其中完成了一个得到认可的关键步骤。过去三到五年,全球化遭遇阻力,很多人担心AI发展会加剧分裂。但从这款模型来看,它不仅有技术影响,更让我们反思,全世界应通过全球化方式加速科技发展,而非各自为政。

内容来源:BRTV新闻建外14号微信公众号

责编:郭峥

监制:刘萤萤

中国AI逆袭,美国专家坐不住了

​今天,国产AI大模型DeepSeek,登顶苹果App Store中国区免费榜第一位。与此同时,DeepSeek也在美区苹果App Store免费榜飚升至第一位,超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是,这也是中国应用首次同时在中国和美区苹果App Store占据第一位。DeepSeek为什么这么火?

中国AI逆袭,美国专家坐不住了

今天,国产AI大模型DeepSeek,登顶苹果App Store中国区免费榜第一位。与此同时,DeepSeek也在美区苹果App Store免费榜飚升至第一位,超越ChatGPT等美国科技公司的生成式AI产品。值得一提的是,这也是中国应用首次同时在中国和美区苹果App Store占据第一位。

1月26日深夜,游戏科学CEO、《黑神话:悟空》制作人冯骥在微博发文称DeepSeek是顶级科技成果。他表示,如果有一个AI大模型做到了以下任何一条,都是超级了不起的突破,而DeepSeek全部同时做到了:这些突破包括强大、便宜、开源、免费、联网、本土。

冯骥在微博中推荐网友马上去用这款应用,尝试用它基本取代传统搜索,想象自己已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它。

DeepSeek为什么这么火?

科技财经作家醒客认为,从国内市场来看,它的推出,类似于2023年初百度或阿里推出相关产品,具有同等重要意义。此次推出实现了品质的大幅提升。以往使用大模型时,大家常抱怨其回答虽无大错,但前后重点不突出,车轱辘话较多。

然而使用这款模型后,内容的条理性清晰了很多,使用品质有了跨越式提升。打个比方,如果一个人回答问题不痛不痒,另一个人观点犀利、直指核心,大家肯定会觉得后者更好。就好比突然来了一位高水平选手。

公开资料显示,DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由知名量化资管巨头幻方量化创立于2023年7月17日。2024年1月5日,DeepSeek发布首个大模型DeepSeek LLM,其包含670亿参数。时隔一年,历经多次迭代,今年1月20日,DeepSeek正式发布推理大模型DeepSeek-R1,并同步开源模型权重。作为开源模型,DeepSeek-R1在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o,且训练成本仅为后者的十分之一(约557.6万美元)。许多报道都提到了DeepSeek的成本很低,甚至把它称为AI界的拼多多。

打造AI界的拼多多,有怎样的意义?

醒客表示,这一意义重大。对于想做大模型的企业而言,过去做大模型,没有10亿或100亿资金很难成事,因为训练成本等整体成本极高。但现在这款模型报出的训练成本是五百多万美金,虽对普通公司仍算高昂,但相较于过去动辄几亿、几十亿美金,成本已大幅降低。成本降低带来诸多好处,比如多个公司可以合作搭建模型,使用成本也会大幅下降。过去两年,大模型领域发展迅速,但应用的最大障碍就是成本。成本高,若无法取得相应效益,从商业角度看就不值得做。国内很多大模型推出后多次降价,可若要达到可用水准且价格低廉,过去很难实现。据不同机构或团体测试,成本能降低至十分之一以下,甚至几十倍,这种成本降低对AI大模型的普及意义非凡。

醒客表示,这款模型能引发广泛关注,源于它是从国外火起来的,且是开源模型的重要代表。我们知道,国内大模型有开源和闭源之分,像百度就是典型的闭源,李彦宏认为闭源有其优势。OpenAI以前开源,后来闭源。如今其很多竞争对手采用开源方式,如Meta等公司。在开源领域,大家对这种方式十分欢迎。人工智能投入巨大,升级速度比传统软件快,过去两年,业内人士能看到大模型每月都在发展。在开源领域,优势愈发明显,因为开源意味着所有开源公司共享人才与成果,是抱团作战,而闭源靠公司内部几个人,从创新角度看,开源优势无可置疑。

但人工智能存在较大风险,比如可能影响就业、替代人类,安全风险比传统软件高几个等级,类似原子弹技术,若开发后管控不善,可能自食恶果。因此,在AI领域,开源与闭源就多了安全与否的争议。

不过从能力角度看,如果开源更有效,那么闭源不太可能比开源更快产生破坏性,反推可知开源安全性可能更强。这款模型作为开源软件,意味着很多没有AI积累的初创公司,借助其低成本与开源优势,能快速做出自己的模型,这是它最重要的贡献。

值得一提的是,伴随DeepSeek持续火爆,其服务器曾于1月26日下午出现局部服务波动。不过,这一问题在数分钟内便得到了解决。深度求索回应称,此次事件可能与新模型发布后的访问量激增有关。

有业界分析认为,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

美国消费者新闻与商业频道发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。另据媒体报道,Meta员工发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。

DeepSeek可否与OpenAI一较高下?

醒客分析称,目前,据专业人士测试,这款模型的优势主要体现在训练方面,在底层大模型上优势尚不明显。通俗来讲,在训练大模型后的使用过程中,存在语言逻辑性和重点突出的问题。使用这款模型时,它对概念的理解比之前的模型有明显进步,面对同样问题,能依据前面信息调整重点,得出清晰结论。而一些只注重模型训练,后期优化不足的模型,会出现对相反问题都能给出看似合理分析的情况,让人困惑。这款模型通过专家系统与大模型结合,采用反向强化训练,在人类语言语义和使用习惯上更有条理。

对于其发展前景,醒客表示,这确实是中国软件公司在近一两年的重要创新,值得国人自豪,且在国外也得到充分肯定。但从另一个角度看,它并非传统意义上的自主研发,而是全球协作的成功范例。它基于开源系统,很多算法和数据积累来自全球开源组织,是全世界优秀工程师共同努力的结果,中国人在其中完成了一个得到认可的关键步骤。过去三到五年,全球化遭遇阻力,很多人担心AI发展会加剧分裂。但从这款模型来看,它不仅有技术影响,更让我们反思,全世界应通过全球化方式加速科技发展,而非各自为政。

内容来源:BRTV新闻建外14号微信公众号

责编:郭峥

监制:刘萤萤

北京时间客户端