arXiv新规解读：陶哲轩支持，学术署名与AI使用规范深度解析

2026-05-18阅读 0热度 0

上传一篇AI水出来的论文，一旦被查实，所有作者都会被封禁一年。

解封之后，想再投稿？得先通过正规期刊的同行评审才行。

这条新规，来自预印本平台arXiv计算机科学版块的主席托马斯·迪特里希（Thomas Dietterich）。他在社交平台X上公布时，语气干脆，没有半点商量的余地。

规则很明确：只要论文里找到作者未核查AI生成内容的“实锤”，所有署名作者一并受罚，没有例外。

消息一出，连数学家陶哲轩也亲自下场评论了。

这位数学界最活跃的AI拥抱者，在Mathstodon上发文，用自己之前提出的四条建议框架来对照这项新政，最后总结为一句话：

在生成论文比消化论文容易得多的时代，这个方向是对的。

网友们更是炸开了锅。有人鼓掌叫好，说早就该这么干了。

也有人提出反问：你会在2005年禁止用互联网进行研究的文章吗？

还有人质疑“连坐”制度的合理性：难道要求论文的每一位合著者都必须逐条检查每一条引用吗？

arXiv最严新规：签名即担责

在物理、数学、计算机科学这些领域，绝大多数论文在进入同行评审之前，都会先在arXiv上挂出预印本。作为全球学术流通最核心的基础设施之一，arXiv的影响力不言而喻。它正从康奈尔大学剥离，转型为独立非营利机构，未来很可能获得更多资源来主动治理平台。

arXiv这次出手，核心逻辑非常清晰：签名即担责，无论内容是怎么生成的。

托马斯·迪特里希的原话是这么说的：

如果生成式AI工具产生了不当语言、抄袭内容、偏见内容、错误、错误引用或误导性内容，且这些内容被纳入科学著作，责任由全体作者承担。我们最近对此类行为的惩罚标准进行了明确。

需要划清界限的是，新政并非禁止使用AI。用AI来润色文字、辅助查找文献，这些都没问题。

arXiv真正要卡的，是另一条底线：你到底有没有认真读过自己署名的论文？

那么，什么算“确凿证据”呢？迪特里希列举了几种典型情况：

比如“幻觉引用”，也就是引用了根本不存在的论文；

或者残留了LLM的元评论，比如稿件里还留着“这是一段200字摘要，是否需要修改？”之类的字样；

再比如占位符未填，表格里赫然写着“请用实验真实数据填入此处”。

如果正式提交的论文里还存在这些低级错误，那只能说明作者过于粗心，根本没有认真检查过自己的论文。

这样的证据一旦被抓到，也意味着论文中的其他内容同样不值得信任。

后果很严重：在arXiv上被封禁一年。解封后，所有新投稿都必须先通过正规期刊的同行评审，才能重新上传。

而且，封号是“连坐”的，所有署名作者一起受罚。

迪特里希表示，这是个“一击即止”的规定，但作者有权提出申诉。内部流程上，也会先由版主记录问题，再由分区主席确认后，才能实施处罚。

不得不说，arXiv这次虽然惩罚的都是些低级错误，但出手确实相当严厉。

陶哲轩附议：论文生成远比消化容易

新政讨论得太火热，陶哲轩也闻讯赶来建言献策。

他在Mastodon上发了一组帖子回应此事，用自己此前在一次演讲中提出的四条建议作为框架，逐一对照arXiv的新政。

这四条建议分别是：

第一，在传统工作流中，明确并严格执行AI辅助的许可边界；

第二，降低对“抢先发表”和“仅仅解决问题”的强调，转而重视“消化成果”；

第三，为重度使用AI的贡献者设计新的挑战，使其仍然能产生真实学术价值；

第四，无论传统还是非传统工作流，都要明确说清项目目标（包括显性和隐性目标）及其背后的原因。

他的总体判断是：新政与前两条建议高度契合。

arXiv这次划定的责任边界，正是第一条建议的落地，明确了什么叫“许可范围内的AI辅助”。而整个新政背后的逻辑，对应的正是第二条建议的核心主张。

他抛出了一个关键判断：在这个时代，生成一篇论文远比消化一篇论文容易。任何将传统科学机构的平衡重新倾向于“消化”的努力，都是值得欢迎的。

至于第三条建议，陶哲轩认为已经有了自然的出口。像viXra这样的平台，对AI辅助投稿几乎不设限，可以作为那些未经消化内容的独立存档地。

但他的定性也很清楚：这类平台专注于“生产”而非“消化”，不应被纳入正统学术引用链，也不应出现在arXiv或正规期刊的参考文献里。

换句话说，想靠AI批量产出论文的人，有地方可去，但别想挤进正统学术体系。

不过，有网友在帖子下留言指出，这个“出口”其实也快堵死了。viXra自己也已经禁止了AI生成论文，并另建了ai.viXra.org专门接收此类内容。

第四条建议则指向了一个更根本的问题：预印本平台究竟为谁服务？

陶哲轩的判断是，作者和读者的需求是共生的，必须同时照顾到。他的原话是：

一个只服务于作者的平台会被大量低质量投稿填满，而读者并不愿意阅读；一个只服务于读者的平台会劝退作者进行繁琐的投稿过程。鉴于论文生成和理解之间出现了新的阻抗失配，质量门槛现在必然要提高，但这最终对双方都是有益的变化。

这话什么意思？

意思是，生成一篇论文的成本在急速下降，但消化、理解一篇论文的成本并没有改变。两端的落差越来越大，如果平台不主动提高门槛，就只能眼睁睁看着读者被淹没在信息垃圾里。

但同时，陶哲轩也点出了新政管不住的问题。“争先为首”的文化是系统性的病根，是整个学术评价体系造成的，arXiv单方面出手，治不了根。

从各方反馈来看，物理学界面临的这个问题，可能比数学界更为严重。

AI论文泛滥，到底有多严重？

arXiv此次重拳出击，背景是用AI写论文已经成为了普遍现象。

2025年发表于《自然-人类行为》的一项研究显示，计算机科学领域约五分之一的论文摘要含有LLM修改的明显痕迹，且在ChatGPT发布后的数月内出现急剧攀升。这还只是摘要，正文里的比例只会更高。

arXiv每个月收到的AI生成的综述论文，已经达到数百篇的量级。要知道，历史上综述论文本是由领域内资深学者撰写的稀缺内容。现在，任何人用AI短时间内就能生成一篇，然后批量投稿，让志愿审稿人疲于奔命。

其实，arXiv早在2025年10月就出过一记重拳，禁止计算机科学类未经同行评审的综述和立场论文直接上传，要求先过期刊关。此次的封号政策，无疑是进一步的升级。

学术会议也没能幸免。2026年1月，AI检测机构GPTZero分析了NeurIPS 2025超过4000篇录用论文，在至少53篇中发现了数百条AI幻觉引用，而这些论文全部通过了三位以上审稿人的评审。

此外，问题也从论文蔓延到了考场。普林斯顿大学最新宣布，废除延续133年、允许学生无监考参加考试的荣誉制度，从今年夏季起恢复现场监考。

直接原因是，教务长迈克尔·戈尔丁（Michael Gordin）收到大量教授和学生的反映：“考试作弊已经普遍化”。

如今，教授们将不得不亲自监考，并报告任何违反学术诚信政策的行为。去年一项针对约500名普林斯顿高年级学生的调查数据，触目惊心：超过27%的人承认曾借助ChatGPT等AI模型作弊，约半数人知悉有同学违反了荣誉准则。

学生自己描述的作弊现场是：“如果考试在笔记本上进行，随时可以切到另一个窗口；如果是纸质试卷，就躲在桌下用手机。”133年的荣誉制度，基于信任，不设监考。结果，AI把这份信任直接击穿了。

arXiv的封号令，和普林斯顿的监考令，都有一个共同点：AI大幅压低了“生产”的门槛，但也给了越来越多人偷懒和取巧的机会。而这种偷懒和取巧，有着根本性的损害。

当AI开始水论文、开始替代学生作弊，一个更深层的忧虑浮现出来：人类科学和文明的基石，是否正在被侵蚀？

AI的能力边界，由它所消化的人类知识决定。如果大量低质量、未经消化的“水论文”涌入训练数据，AI学到的就是低质量信息，然后生成更多水论文，再进入下一轮训练。这个循环一旦锁死，论文本身就不再是知识的载体，而成了信息的噪音。

发论文完全流于形式，AI输入人类用AI“水”出来的论文，最后再输出给更多人……文明的进步，就可能被锁死在低水平重复的循环里。

科幻小说《三体》里，外星文明用“智子”锁死了地球科学进化的可能性。而现在，如果AI水论文成为普遍，何尝不是人类自己锁住了自己？这，或许是另一种形式的“智子”。

arXiv新规解读：陶哲轩支持，学术署名与AI使用规范深度解析

arXiv最严新规：签名即担责

陶哲轩附议：论文生成远比消化容易

AI论文泛滥，到底有多严重？

相关阅读

最新教程

最新资讯