DeepSeek热潮之下回归常识

文章出处:真空用波纹管 发表时间: 2025-04-26 21:53:30

  别人实现了从0到1的突破,DeepSeek实现了从1到N的突破。它不是国家政策大力出奇迹的结果,这看似反常,恰恰是科学技术创新的常识:伟大不能来自计划。

  在2023年新年,业界为ChatGPT展示功能而激动,随后2024年文生视频大模型Sora让人惊艳不已。就在美国科技公司看似一骑绝尘的时候,在2025的春节前后,中国的深度求索(DeepSeek震)动中美科技界。

  新年DeepSeek在苹果App Store免费应用下载榜上多天保持第一,在相同时间段超过ChatGPT首次发布时下载量。用户看中了哪一点?如果用一句话来总结,那就是性价比。一方面,使用效果不错,在一些测评中评价表现领先,另一方面,成本低廉。一些研究披露DeepSeek-V3模型的训练费用仅为558万美元,不到GPT-4o的1/20,时间不过53天。使用成本而言,V3的单位输出价格在折扣后仅为0.28美元,而OpenAI的GPT-4o价格达到10美元。

  这种性价比,不仅对于用户来说意味着更好的体验,更是对于业界带来了全新冲击。这在某种程度上预示着新的商业模式将在AI行业涌现,一两年前看起来不可超越OpenAI之类行业巨头也感受到威胁。

  一些研究和迹象显示,DeepSeek表现之所以出众,很重要的因素就是使用了模型使用了数据蒸馏技术(Distillation)。DeepSeek可能利用别的大模型的原始复杂数据来进行了训练,从而得到更精炼准确的结果。换而言之,DeepSeek的成功恰恰是因为站在ChatGPT等巨人肩头,别人实现了从0到1的突破,它实现了从1到N的突破。

  目前对于DeepSeek很多争论,无非在于这个N到底是无限接近于1,还是远大于1。换而言之,DeepSeek的成功,部分也是开源模式的成功,这没有超越商业常识。

  首先,对于美国而言,各界对此关注,甚至让人想到前苏联的卫星时刻。1957年10月4日,前苏联成功发射了世界上第一颗人造地球卫星“斯普特尼克1号”(Sputnik 1)。这不仅意味着人类踏入太空时代,更极大刺激了美国,使得美国全力发展科技,直至20多年后的“星球大战”计划。

  与此同时,对于中国而言,DeepSeek的成功,完全是一次无心插柳。如果我们细究DeepSeek的起源,恰恰发现,其成功不在于政府投入,而在于市场探索。DeepSeek来自量化基金幻方的一次近乎副业的创造,其立足点甚至不是在央企国企云集的张江科技园,而是在民营经济繁茂的杭州。讽刺的是,中国金融机构过去几年在舆论场中并不讨好,不仅被讥讽为没有价值的虚拟经济,某些从业人员甚至陷入所谓的“金融羞耻”。在金融机构中,民间资本为主的量化投资公司更是动辄得咎,每每与做空以及市场波动联系在一起。

  DeepSeek的成功,不是国家政策大力出奇迹的结果,这看似反常,恰恰是科学技术创新的常识:即明确的目标往往不能导致伟大创新,伟大不能来自计划。

  经济学上关于创新来自市场的研究已经不胜枚举,而新兴的AI领域也不例外。曾经在OpenAI工作的两位AI科学家肯尼斯.斯坦利(Kenneth Stanley)、乔尔.雷曼(Joel Lehman)撰写的《伟大不能被计划》中,就反复强调一个常识,目标越“高大上”,情况就越复杂,甚至往往会成为绊脚石,“当最伟大的成就被设定为目标时,其实现的可能性就近乎渺茫了。”

  看似英明伟大计划官僚拟定的各种目标和计划,也许可以粉饰出不错的结果,但是你很难得到你预期之外的成功。管理学告诉我们,你考核什,就会得到什么,问题就在于,在前沿领域,多数人不清楚自己需要什么。

  历史证明,伟大技术创新很难来自于计划,技术只有其内在逻辑,这是一条自我迭代的路径,中间道路往往是曲折的,无法预计也难以规划。《伟大不能被计划》就列举很多类似案例,比如世界上第一台计算机是真空电子管制造的,而真空管的历史,与计算机丝毫没有关系,最开始基本被用电学领域,而非计算机的工具。

  今天DeepSeek的成功也一样,如果在十年前你决心要赶超美国科技巨头公司,去张江科技园注册或者争取国家扶持,不一定引导到今日的DeepSeek。一家量化投资公司在起步之时与AI扯不上丝毫关系,谁能预言是它而不是其他貌似更应该成功的企业,取得了今日的突破?深度求索创始人梁文锋来自广东,为人低调,不仅在中国是特例,也和一些美国硅谷大佬们看起来格格不入。

  回顾中美贸易战,误解不少,起因复杂。各位明白,其中中国制造2025计划曾经令美国侧目,担心中国产业政策扶持之下,其国家资本主义的模式将冲击美国科技竞争力。如今已经到了2025年,我们不得已承认,多数中国科技公司的涌现和成功,和DeepSeek一样,本身也是市场力量在主导。

  中美科技竞争,如果存在优胜者,很难想象是来自国家计划的产物。如果双方明白这点,也许就知道对外加关税、科技围堵,对内强化产业政策,不仅不能够达到目标,反而可能削弱自身竞争力。

  过去一个世纪以来,中产的身份往往和专业职业联系在一起,而专业职业,恰恰可能是未来最容易被人工智能取代的群体。这也是中产根基薄弱的反映,他们的资本往往体现为不可遗传的人力资本,一旦产业变迁,确实很容易面临替代,加上国内特有的35岁现象,更是让他们没办法淡然。因此我将中国城市中等收入群体称之为软阶层。DeepSeek的出现,更是带来加剧软阶层的焦虑。

  春节期间,在我微信朋友圈里,一二线城市与三四线城市的人们所关注的话题,仿佛隔着一层无形的壁垒。前者春节期间一二线城市热点是人工智能DeepSeek,充满了被抛弃的恐惧,但是在三四线城市,大众要点还是衣食住,关心是更眼下的生活。

  对于软阶层来说,放弃无谓焦虑,本身也是回归常识。我曾经问DeepSeek,普通人应该关注DeepSeek吗?它的回答倒是诚实,“若属于技术尝鲜者、特定需求用户或行业观察者,建议保持适度关注;普通用户可阶段性查看重大突破,无需实时跟进。AI技术迭代快速,选择性关注才能平衡时间成本与收益。”

  确实,对AI产品,有空先用起来是第一原则。DeepSeek之类产品的成功,确实很可能使得人工智能再下一城。但是对于普通人来说,有限关注即可,没用也不用过分焦虑,因为在这样趋势面前,过分焦虑没有用,甚至有可能沦为被收割的韭菜。毕竟产品不断在迭代,更好的产品一定还有,前期的学习成本和时间成本其实不低。

  作为碳基生物,人类在未来必然面临人工智能这样硅基生物的挑战与追赶。真实与人性,或许是我们最后的堡垒。在今天,已经有人意识到,DeepSeek之类产品一些回答,看似有理有据,其实也是虚假的幻觉。对软阶层而言,更需要警惕:互联网或者人工智能提供的信息,看起来真实,有时候也不过是玻璃笼子。作为人类,比起积累杂乱的知识,在未来更重要是培养独立的判断力,框架远远比信息重要。注:本文仅代表作者本人观点

  经中央批准,国家监委对甘肃省政府原副省长赵金云严重职务违法问题进行了立案调查。经查,赵金云无视中央八项规定精神,接受可能会影响公正行使公权力的宴请;

  潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”

  潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”

  △美国加州州长纽森(资料图)美国人口和经济规模第一大州加利福尼亚州州长纽森当地时间16日宣布就关税问题起诉特朗普政府。他批评特朗普政府滥用关税政策的行为“违法”,给美国经济导致非常严重混乱和破坏。加州成为全美第一个就关税问题起诉特朗普政府的州。

  【深圳无人机“出警”5分钟搞定车祸现场】 空中执法“黑科技”! #深圳dou知道

  男子坐地铁嫌邻座衣服脏,多次辱骂对方,“跟要饭似的”,旁边乘客看不下去:我愿意和他挨着!警方通报:已依法行政拘留。

  浙江宁波慈溪是我国三大家电生产基地之一,其中出口美国的占比约16%。慈溪一家家电企业负责人和记者说,他们跟美国客户签署协议时,对方支付了30%的定金;而同规格洗衣机、冰箱的零部件通用性很强,能达到70%。因此,即便美国客户违约,他们也可将产品重新翻包后再次销售。

  美国特朗普政府以所谓“让制造业回流美国”为名大打关税战,引发美国内外普遍批评。几次三番对关税政策的“朝令夕改”更是让美国农业界、商界、工业界、政界甚至包括电影行业在内的文艺界感到混乱和恐慌。

  上海浦东警方经过精心侦办,近日成功破获一起系列盗窃案,抓获嫌疑人7名。盗窃团伙分工协作,在迪士尼小镇商店内疯狂作案,大量盗窃玩具,涉案金额达50余万元。

  4月20日,中国教育科学研究院微信公众号发文介绍,近两年,中国教科院课题组针对义务教育阶段1-9年级教师开展“课后服务与教师负担情况调查”,以期摸清课后服务对教师造成负担的真实情况,并提出针对性的改进建议。

  近期,宁夏西吉公安机关依法查处了1起虚构事实扰乱公共场所秩序案,行政处罚4人,其中拘留2人,罚款2人。