Paper 已死,硬核科研当立
2026年4月2日(星期四)19:30 - 21:00,我听了香港中文大学计算机科学与工程系徐强教授的一场报告,题目很锋利,叫《Paper 已死,硬核科研当立:AI 时代科研人的自我修养》。
“Paper 已死”当然是一种有意为之的表达,但它真正刺中的,并不是论文有没有价值,而是另一层更深的问题:当 AI 正在系统性改写科研流程时,科研人到底该拿什么证明自己的价值?未来的科研,又该以什么作为真正的交付物?
听完之后,我一直在想一个问题:AI 到底让科研变简单了,还是变难了?
论文之外还有什么
以前做科研,写论文几乎是终点。你做完实验,写成 paper,发到会议上,citation 数字涨上去,这件事就算完成了。
但徐强教授说,未来真正有生命力的科研成果,不应该只是一篇论文。它更应该是一个能被别人调用的东西——工具、API、Benchmark、Ground Truth,这些才是能长期活在技术生态里的东西。
以前我们评价一个研究好不好,主要看它发在哪儿、被引了多少次。但如果你做的东西根本没人用,没人调用,没人继续扩展,那它真的算”成功”了吗?
报告里提了一个评价框架叫 ROSE:解决真实需求(R),具备原创性(O),具有重要性(S),保持优雅性(E)。这套标准比”发在哪儿”难多了,但它更接近科研本身该有的样子。
真正好的研究,不应该止步于论文。它应该继续变成工具、系统、方法,继续活在后续的工作里。
Agent 越强,越需要有人看着
报告的第二条线,讲的是 Agent 的治理问题。
现在很多人谈 Agent,都在说它能做什么:理解任务、拆解流程、调用工具,甚至表现出”自主行动”的样子。但很少有人认真想一个问题:如果 Agent 越来越强,谁来保证它不乱来?
徐强教授提了一个概念叫”监管内核”。简单说,就是在大模型和外部世界之间,加一层约束。大模型负责想、负责出主意,但真正执行之前,得有人检查一下:这个动作安全吗?符合规则吗?会不会出问题?
真正成熟的 Agent 系统,不能只靠”更聪明”的模型堆出来。你得有一套机制,能验证它、约束它、在它出问题的时候能拦住它。
AI 时代做系统设计,不只是能力问题,更是边界问题。
AI 替代的是手艺,不是眼光
报告里我最认同的一点,是它没有把 AI 简单当成”效率工具”。它问了一个更深的问题:当工具越来越强,人还剩下什么?
徐强教授说,AI 会抹平很多技能层面的差距。那些重复性的、靠熟练度堆起来的工作,确实容易被自动化。但有一类东西很难被替代:对问题的洞察、对方向的判断、对信息真伪的辨别,以及把一个模糊问题推进成可验证成果的能力。
这意味着,以后比”会不会用工具”更重要的,是你能不能提出一个值得研究的问题;能不能判断 AI 给出的结果是真的有效,还是只是”看起来像答案”;能不能把一项工作从想法推进到真正能用、能传播、能落地的成果。
工具在变强,但真正决定上限的能力,反而变得更底层了。
问答环节里的几个观点
问答环节有人问:AI 会不会让差距越来越大?那些本来就擅长组织、判断的人,会不会在 AI 加持下把普通人甩得更远?
徐强教授说,科研思维是可以训练的。怎么判断一个问题有没有价值,怎么辨别信息是否可靠,怎么组织自己的研究过程,这些都不是天赋,是可以靠长期训练建立起来的能力。
他还说了一个读论文的方法:读的时候,不要只看作者得出了什么结论,要去想他怎么走到这条路上的。你得看出问题是怎么被发现、定义、推进和解决的,这才是真正该学的东西。
这很重要。因为 AI 可以帮你更快地总结论文、生成思路,但如果你没有判断力,就很容易被那些”看起来很流畅、实际上很空”的内容牵着走。工具越强,判断力越稀缺。
教育该教什么
报告里关于教育的讨论,也让我想了很久。
AI 让知识获取变得更容易了。以前要花很长时间才能学会的东西,现在可能问一下 模型就知道了。但这不意味着教育会变轻松,反而可能更难。
因为当知识本身越来越容易获得时,真正稀缺的就不再是”记住多少”,而是”判断什么值得学”。未来真正重要的,可能不只是教学生知识,而是教他们怎么判断、怎么选择、怎么形成自己的问题意识。
说得直白一点:AI 可以帮你执行,但前提是你自己得知道要去哪。没有方向感的人,工具再强,也只会更快地原地打转。
写在最后
所以,”Paper 已死”想说的,不是论文没用了。而是只把论文当终点的时代,正在结束。
AI 时代真正的”硬核科研”,一方面要求你做出能真正用起来的东西,留下可复用、可调用、可进入系统的交付物;另一方面,也要求你重新修炼那些最基础的能力:问题意识、判断力、研究品味,以及和新工具配合的能力。
工具革命已经发生了。接下来真正决定一个科研人能走多远的,也许不是他会不会用 AI,而是他能不能在 AI 时代,依然看见什么问题真正值得被解决。
附:原始听会记录
以下内容保留我当时的笔记式记录,放在文末备查。
小结
本次会议围绕 AI 时代科研范式的变革展开,探讨了科研交付物的重塑、Agent 时代的监管内核,并回应了关于科研价值、AI 工具使用及教育模式等核心问题。
1. 科研范式的重塑与交付物的变革
科研的核心价值不应仅限于发表论文(citation),更应体现在能否被 AI Agent 调用和产生实际的社会影响力。
未来的科研交付物应包含可被 Agent 调用的工具、API、Benchmark 或 Ground Truth 等基础设施,以确保工作的长期生命力和生态位。
提出了“Rose 法则”作为新的科研评判标准:解决一个真实需求(R),具备原创性(O),具有重要性(S)和优雅性(E)。
2. Agent 时代的监管内核:OS 系统
针对 Agent 系统存在的不确定性、不可控性及潜在风险,提出构建一个“监管内核”(OS),作为 Agent 的“缰绳”。
该内核通过将大语言模型(LLM)的语义输出映射为确定性的指令集,结合规则进行边界检查和拦截,形成“神经符号系统”。
目标是让 LLM 负责创造可能性和制定计划,而监管内核则负责守住边界,确保系统安全、可靠地执行。
3. 关键议题与观点探讨
科研价值与“水论文”:强调硬核科研的价值在于对问题的深刻洞察和解决,而非简单的重复劳动。自动化“水论文”系统缺乏认知增益,而高质量的科研过程本身对锻炼个人能力有益。
AI 工具的使用:认为 AI 工具(如大模型)能有效抹平不同能力的研究人员在技能层面的差距,但核心的“科研思维”如如何提出有价值的问题、如何与 AI 有效沟通、如何判断信息真伪,仍是需要训练和培养的。
教育模式的演变:面对 AI 对知识获取方式的冲击,教育应转向培养学生的核心判断力、批判性思维和跨领域整合能力,而非单纯的知识灌输。课堂的角色应转变为引导学生解决问题和进行深度交流。
待办
- 开源项目发布
徐强近期将会发布其团队研发的监管内核系统(OS),并邀请社区试用和反馈。
问答摘记
刘伟峰:头一两年,和最近两年感受不一样,AI 抹平中等、高级人员的科研能力,但是最近感觉有所拉大。能用好 AI 大模型的人将差距拉开,而这波人有很好的组织管理天赋,从小就有这样的能力,这个能力可以让他们更好地利用 AI。这种差距很难再追赶,固化了,徐老师怎样看待这个事情。
徐强:有不同意见。工业革命抹平体力差距,大模型抹平人的技能差距,但不认为它抹平了科研的能力。科研这套思维 方式可以训练,怎样察觉一个问题它的价值、和 AI 有效沟通、如何判断信息真伪,有意识地训练科研的思维就不会被 AI 抹平,所以否认 AI 时代下科研能力与领导组织天赋强相关。徐强的书中也说到不会更大地拉开差距,科研是有规律的,是可以训练的。
论文是读不完的,要精挑细选地去读。在读论文的时候,主要考虑作者是怎样走到这条路上的,而不是真正的研究内容,提升自己的科研品味和判断力,然后就能提升自己使用 AI 做科研的效率和效果。
使用什么样子的模型:用最好的 AI 工具,花钱使用最强的模型来提升自己。
学校教育问题:有了 AI,知识和技能是平权了,但是判断力和选择的能力还是经验丰富的人,比如学长和老师,更加强。
小孩子教育问题:每个时代的人有每个时代的人的需求,不像“登味”很浓的我们这些。你的知识和技能本身平权了,现在的教育在这方面是要改的。小孩子一定要有自己有兴趣和热爱的东西,有热爱的东西肯定就有很多发现、需求和想法,这时候就可以使用 AI 去做,成为自己兴趣和热爱的打工人。有想法有能力的人肯定不会被替代,如果没有什么兴趣又没有什么想法,那 AI 真的会很大程度上替代这些人。

评论