| <- 社交登陆。【论坛使用帮助】 |
马四维:谁将引领 AI 科学研究时代
————创世纪计划与中国 AI 科学研究的未来
这几天,白宫高调宣布启动一项可以跟二战时期的曼哈顿计划媲美的“创世纪计划”(Genesis Mission),要用大模型和自动化科研系统重塑美国科学。如果我们把 2025 年底的这项AI创世纪计划拉开来看,我们会发现一个有点讽刺的画面:联邦层面对科研和高教大幅削减,成千上万的项目和职位被砍掉,科学家正在考虑“用脚投票”,往欧洲和别的地区走。同一时间,中国在“集中力量办大事”的体制下,快速堆起自己的 AI 基础设施:从“深度探索”(DeepSeek) 到千问(Qwen),从“AI科研”(AI for Science)计划到中科院的“科学第一”(ScienceOne) 平台,都想把 AI 变成一种“科学生产工具”,清华和中关村发布全球首个科研级的智能体“Omni科学家”(OmniScienist),直接嵌入实验室和国家重大科研项目。问题是:在科研造假高发、教育官僚化、信息审查越来越重的环境里,这套 AI 科学路线,真有可能在长期和美国的 创世纪计划 正面对抗吗?AI 科学的生产率到底靠什么撑着,美国这个“创世纪计划”在补什么短板,中国的体制又在放大什么风险。中美两国,谁更可能把“AI 科学研究”真正落地,而不是只停在 PPT 和新闻发布会上。
AI 开启新的科学研究时代
IBM 研究部门负责人达里奥·吉尔(Darío Gil)和斯坦福副教务长凯瑟琳·莫勒( Kathryn Moler )在《科学》杂志上发表了一篇社论《用人工智能加速科学研究》(Accelerating science with AI)。这篇文章配合白宫宣布的“创世纪计划”,在舆论上定调:下一个阶段,AI 不只是“写代码”“写文案”的工具,而是要变成科学家的“合作者”。
把这篇社论和白宫文件合起来看,大致有几层意思:第一,AI 要“进实验室”,而不是停在搜索框里。不是简单帮你查文献、写摘要,而是直接参与选题、提出假设、设计实验、分析数据——成为“AI 科学家助手”,最后甚至是“AI 科学共同作者”。第二,要想做到这一点,必须重建科研基础设施。这包括:统一和清洗庞大的科研数据,把分散在国家实验室、高校、机构里的数据、模型、软件打通;建设专门为科学训练的大模型和代理系统;改变今天“各自为战”的数据孤岛。第三,这是一次“生产率革命”,也是一次制度重构。
吉尔和莫勒的核心观点,可以概括成一句话:如果我们继续按 20 世纪的科研组织方式做事,只是在边上加几块 GPU,科学发现的速度不会发生数量级的变化。必须同时改革科研评价、合作方式、开放数据政策,让 AI 真正嵌入科学流程。换句话说,创世纪计划讲的是:“AI 科学研究时代”不是一句口号,而是一整套数据—算力—算法—科研制度的再设计。这跟1940年代的曼哈顿计划类似:那时候是把物理学、工程学、工业体系、军政资源捏在一起,做一件没人做过的事;今天则是把国家实验室、大学、云计算企业、AI公司捏在一起,试图做一套能“自动发现知识”的机器。
美国:一边是“创世纪”,一边是“断粮”
看白宫和美国能源部(DOE)的公开材料,创世纪计划的目标有几个关键点:
把美国国家实验室的海量数据“喂饱”给 AI。DOE 底下 17 个国家实验室,掌握着从高能物理、材料科学到气候模拟、核聚变的巨大数据资产。Genesis 想做的是:用统一的规范和平台,把这些数据转成可以训练 AI 科学模型的“燃料”。
打造专门面向科学的大模型和 AI 代理。不是直接复用 ChatGPT 这种通用对话模型,而是训练能理解微分方程、量纲分析、实验约束的“科学模型”;再在上面叠加连续行动的“AI 科学家代理”,让它自动生成假设、设计实验、优化方案。
把这套系统托管在“国家 AI 科学平台”上。这相当于给美国科学界提供一块“公共 GPU 基建”:研究人员不一定自己买超算,而是在平台上调用专门的 AI 科学服务。把 AI 科学嵌入国家战略领域。公开文件点名的方向包括:新能源、电池材料、气候模拟、药物发现、先进制造等——这些都是中美竞争最激烈的领域。
如果只看这些计划,你会觉得美国在“重建科研体系”上非常有雄心。问题是美国政府的另一只手在大砍科研经费。2025 年以来,第二任特朗普政府的预算方案中,对 NSF、NIH 等多个科研机构提出了大幅削减,国会虽然在部分领域顶住了,但很多项目仍被终止。媒体统计,有上千项 NSF 资助被取消,涉及上十亿美元的投入。特朗普政府对多项 DEI(多元、公平、包容)相关的研究经费进行冻结或审查,一些研究团队直接失去资助。一边是创世纪计划这类“国家级 AI 科学工程”,一边是广泛的科研经费削减和政治干预。NSF、NIH 等机构的大量项目被取消,不少高校尤其是非名校遭到重创,科研队伍面临断档。
如果用一个简单的等式来描述科学生产率:科学生产率 ≈ 人才 × 数据 × 算力 × 组织制度。创世纪计划在做的是:拉高“数据”“算力”“组织制度”这三项的上限。而美国当前的经费和政策环境,却在削弱“人才”这一关键的子项:先把精英逼走,再给剩下的人一台更大的机器。
美国“伤筋动骨”,欧洲趁势上位
在这种背景下,欧洲委员、欧洲研究委员会(ERC)等机构相继推出专门吸引美国科研人才的项目,甚至公开宣传“如果你在美国感到受限,欢迎来欧洲继续你的科研”。欧洲推出选择欧洲科研(Choose Europe for Science)等计划,明确把美国科学家当作重点挖掘对象,拿出数亿美元资金吸引他们过去。一项调查显示,美国相当比例的教授正在考虑或已经在寻找海外职位机会,欧洲和加拿大的高级职位申请量明显上升。
历史的讽刺就在这里:1930 年代,纳粹德国用种族主义和政治清洗,把大量犹太和自由派科学家赶走,造就了所谓的“脑力外流”。爱因斯坦等人被迫离开欧洲,最后参与了美国的科学体系和曼哈顿计划。今天,美国当然没有到那一步。但是,在经费长期不稳定、科研行政化、签证和政治氛围紧张的环境下,它在某种程度上在“自废武功”,给欧洲和其他地区的科研机构送上机会。所以,美国在 AI 科学上的前景,有点像是一脚油门、一脚刹车:创世纪计划 把油门踩到底;预算削减和人才流失又在持续踩刹车。未来哪一只脚更重,现在还没有定数。
在这样的形势下,美国出现科学家用脚投票的趋势。虽然这跟当年纳粹德国的情况当然不能简单类比,但有一个共通点:当一个国家把科学视为“可以随时砍掉的开支”时,科学家会用脚投票。区别在于:1930 年代的德国是用种族主义和暴力把人赶走;今天的美国则是在预算和政治压力下,让很多人觉得“不值得再赌这十年”。
从 AI 科学的视角看,这会产生两个后果:创世纪计划 的人才池可能被掏空一部分。AI 科学家本来就是稀缺资源,如果一部分流向欧洲和其他地区,美国的“AI 科学基础设施”会有硬件而缺乏足够的软件(人)。欧洲和其他地区,有机会做出“第三种模式”。一边利用美国培养的人才和技术生态,一边在更稳定的经费和相对宽松的政治环境下,建立自己的 AI 科学平台。也就是说,未来在 AI 科学上的竞争,不再只是中美对撞,而可能变成美—欧—中三角竞争。美国如果在基础科研上继续自断经脉,创世纪计划的优势会被削弱;中国如果不解决诚信和开放问题,用AI for Science 会悬在半空。
中国:集中力量办大事,还是放大系统性问题?
再看中国这一边。从政策文本上看,中国在 “AI+科学” 上的布局并不落后。中科院和多所高校提出 AI for Science、ScienceOne 等计划,目标和创世纪计划很像:要用大模型、知识图谱、自动化实验平台来改造材料科学、药物设计、气候模拟等领域。商业层面,阿里云的千问(Qwen)、百度、华为等都在做面向科学和工业的专用大模型,强调在材料、化学、生命科学方面的“多模态能力”。
从“组织能力”的角度看,中国的确有几项优势:第一,资源集中速度快。只要政治上认定某件事“关系国家竞争”,财政和行政资源可以快速向相关项目倾斜,建超算中心、组大项目组、设重点实验室,周期往往比欧美短。第二,数据整合的行政权力更集中。在一个高度集中的体制内,公共数据(医疗、交通、工业、气象)在法律和技术上更容易被集中和统一管理。这对 AI 科学来说是实打实的“燃料优势”。第三,“集中力量办大事”的组织传统。不管是载人航天、量子通信还是高铁,中国过去二十年的一些工程实践,确实证明了:在目标足够明确、技术路径足够清晰的情况下,这种体制有强大的推进力。
但是,当我们从“科学研究”这个角度看,得把另一面摊开来讲。首先,科研造假与论文工厂:AI 成了“造假放大器”。近年来,关于中国科研造假、论文工厂的报道层出不穷。几年前肿瘤生物学期刊一次性撤稿百余篇论文后,科技部公开表示要严厉打击学术不端。到 2020–2022 年,中国在全球论文撤稿中的占比一路上升,有研究指出中国的撤稿率明显高于世界平均水平。2025 年,中国官方媒体自己的调查也披露,一些“论文工厂”已经开始用生成式 AI 来批量生产假论文,一个写手一周可以在 AI 帮助下写几十篇稿子,整条灰色产业链获利巨大。这说明在一个评价体系高度依赖“论文数量”“影响因子”“帽子工程”的环境里,AI 不但不会自动带来更高质量的科学,反而很容易变成造假的加速器。当然,中国也在试图“补课”:比如出台针对生成式 AI 在科研中的使用规范,强调科研诚信,禁止用 AI 代写代投。但制度的惩罚力度、科研组织对“真问题”的重视程度,短期内还很难完全扭转。
其次,教育官僚化与“应试科研”。中国的高等教育,长期在一种“考试文化 + 官僚管理”的混合体制下运行。高考和各种标准化考试,在一定程度上保证了“选拔效率”,但也牺牲了批判性思维和独立探索的空间。在高校内部,年轻老师和博士后往往在“发够文章、拿够项目、升职称”的压力下,被推向一种“应试科研”:题目要稳,要能出结果;方向要跟风,要贴国家基金的热点关键字;风险高、周期长的基础科学问题,很难获得足够空间。在这种生态下引入 AI 科学工具,很容易出现一种结果:表面上是“AI 提高科研效率”,实际是“AI 帮你更快写出更多看上去像科研成果的东西”。从长远看,这会削弱 AI 在真正意义上的“科学发现”中的作用,把大模型变成一种“论文自动化流水线工具”,而不是“科研范式的变革者”。
第三,信息审查与“禁区”:AI 科学的隐形边界。还有一个比较敏感但不得不提的问题:信息环境的限制。中国在 2023 年推出《生成式人工智能服务管理暂行办法》,明确要求生成式 AI 必须“坚持社会主义核心价值观”,不得生成“危害国家安全”和“扰乱社会秩序”的内容。这类规定本身针对的是内容安全,但在实际运行中,很容易把“政治红线”扯进知识空间和科学空间。前不久,DeepSeek 因为在处理敏感问题时给出不当回答,触发安全漏洞,被监管点名调整,也是一个典型例子:技术上要强,政治上要“安全”,两者之间经常出现张力。当一个 AI 科学系统背后必须满足大量政治和意识形态约束时,它在处理涉及环境风险、公共健康、社会不平等等敏感议题时,很难完全按照“科学问题优先”的逻辑去探索。这是中国在 AI 科学上最大的制度性风险之一:当政治上的“正确”压过科学上的“诚实”,再强的 AI 也只能在有限的空间里折腾。
AI 科学研究的未来前景
我们可以用一个尽量朴素的公式,把中美两国的 AI 科学前景拆开看:AI 科学能力 ≈(顶尖人才 × 自由探索度)×(高质量数据 × 高端算力)×(科研制度与激励)。用这个公式,分析美国和中国AI 科学研究的未来前景。
美国:优势在“自由 + 创新生态”,风险在“政策摇摆和人才流失”。人才与自由探索度;美国仍然在全球吸引和培养顶尖科学家方面有巨大优势,尤其是在数学、物理、计算机等基础学科;大学体系和同行评议文化仍然鼓励质疑和长周期探索。即便有政治干预,这个生态短期内不会完全崩盘。数据与算力:有最强的商业云和国家超算资源,创世纪计划 进一步把 DOE 实验室的数据资源系统化,算力和数据的整合能力,在全球处于第一梯队。制度与激励:有较成熟的科研诚信体系、开放科学运动和多元化的资助渠道;但当前的预算削减和政治化趋势,如果持续十年以上,会严重削弱这一优势。
中国:优势在“算力与行政动员”,风险在“科研文化与信息环境”。人才与自由探索度:中国有庞大的理工人才储备,很多在数学和工程上非常扎实;但是,长期的应试教育和官僚化管理削弱了批判性思维和科研独立性。“不出事”“跟上指标”往往比“提出真正新的问题”更重要。数据与算力:在某些领域(医疗影像、工业物联网、城市感知)有数据集中和使用的制度优势;算力方面,即便受到美国芯片管制,也在通过国产芯片、云算力整合来填补;但整体上仍落后于美国。制度与激励:“集中力量办大事”可以在短期内推动大工程,但科研评价中的“论文数量”“帽子工程”“行政考核”仍然严重;学术不端和论文工厂问题说明,制度在奖励“看上去像科研”的东西。再加上信息审查和意识形态约束,对涉及制度反思、环境风险、公共卫生等敏感议题的研究形成隐形边界,这对 AI 科学的长期突破是不利的。
用最简单的话说,美国的问题是:方向对了,但可能缺油(经费)和司机(人才)。中国的问题是:汽油和发动机都有,但方向盘受很多看不见的手控制。谁更有可能把“AI 科学研究”做实?如果美国能在未来几年稳住科研经费和大学体系,创世纪计划有可能真的在材料、气候、生命科学等领域带来“翻倍级”的生产率提升;如果中国愿意认真整顿科研评价、打击造假、放宽科学讨论空间,那么它在 用AI做科学研究的追赶速度会非常快;如果两边都做不好,那 AI 科学研究的真正突破,可能出现在一个你今天不太关注的第三方——比如某个欧陆国家的跨国实验室联盟。
考验的不是 GPU,而是制度
回到一开始的问题:在“AI 科学家时代”,美国靠创世纪计划,能不能在与中国的竞争中守住领先?中国在造假和官僚化问题没解决的前提下,能不能用“集中力量办大事”的办法在 AI 科学上追平美国?如果只看 GPU 数量、模型参数、论文数量,很像一场“榜单战争”。但从科学史的眼光看,真正决定胜负的,从来不是这些表层指标。
曼哈顿计划的成功,不只是因为美国有钱搞大工程,更是因为它在关键时刻接纳了从欧洲逃离的科学家,允许他们在相对自由的氛围下做事。二战之后,美国能在半个世纪里维持科学领先,很大程度上依赖开放的大学体系、稳定的科研资助和对失败的容忍。今天,创世纪计划 如果想成为AI 科学研究时代的另一个曼哈顿计划,需要的不只是白宫的一纸命令和 DOE 的一套平台,而是一个不把科学家当成“可随时砍掉成本”的国家科技政策。
反过来,中国如果真的想在 AI 科学上和美国一争高下,就必须明白:AI 不会自动洗净科研体制里的“水货”;相反,在论文工厂、成果冲量的压力下,AI 很容易变成造假的快车道;“集中力量办大事”可以修高铁、造芯片,但科学发现需要的是长期稳定的自由探索和被允许的怀疑精神,这跟“统一口径”“统一表述”是冲突的;如果学术评价仍然压在“项目—职称—论文”这几根杠杆上,即便有最好的 AI 科学平台,也很难持续产出真正改变范式的工作。
所以,真正的问题也许不是“谁的 AI 模型更大”,而是谁更愿意用制度改革的成本,去换“AI 科学家时代”的红利?在这个意义上,美国的创世纪计划和中国的AI科研计划,都还只是开头。它们像两块放在实验台上的巨大试剂:一块在民主制度下,遭遇预算斗争和政治周期;一块在威权体制下,同时被动员逻辑和控制逻辑拉扯。这场对AI科学研究的实验,结果现在没人知道。能确定的只有一点:决定 AI 科学研究未来的,不是 AI 本身,而是背后那套制度和文化。
作者投稿
【声明】:禅世界论坛尊重言论自由,任何人可讨论佛学、政经、生活和科技等话题。言论发表前请根据常识和法规自审。论坛管理员和版主有权删除任何不当内容。使用本论坛即表示接受【禅世界论坛规则】。【论坛使用帮助】。 【禅世界免责声明】。
【Chanworld.org】2017.06.06-2021.04.30-2025.04.10-MG-RM
