
全球最大的预印本平台 arXiv 出台“一票否决”新规,对利用人工智能(AI)无差别批量生产的低质量论文实施一年的投稿禁令。
据TechCrunch等外媒报道,arXiv近日宣布了这项加强版的制裁政策。该平台自1991年成立以来,一直是计算机科学、数学和物理学等领域在同行评审前分享研究成果的交流平台,被视为快速把握全球科学动态的窗口,目前累计发表论文约300万篇。
新规指出,若发现“明确证据”表明作者未对AI生成的内容进行核实,一旦违规,将面临一年内禁止提交新论文的处罚。要恢复投稿资格,论文必须首先在经同行评审的学术期刊上发表。明确证据的典型例子包括:引用不存在的文献(虚假引用)、ChatGPT等聊天机器人留下的元评论,以及未妥善删除的示例数据或说明文字。例如,论文中残留的“此表为示例,请用实验数据填充”或“这是摘要,请问需要编辑吗?”等语句。俄勒冈州立大学杰出教授、arXiv计算机科学板块主席托马斯·迪特里希表示:“如果提交的论文中哪怕包含一条作者未核实LLM生成内容的明确证据,我们就无法信任论文的任何部分。”他强调:“无论内容是如何生成的,研究责任完全在于作者。”
近来,“AI垃圾”(指由AI批量生成的劣质数字内容)已成为学术界的一个问题。AI垃圾特指AI生成的低质量论文数量激增的现象。ChatGPT发布后,arXiv本身的投稿量便大幅增加。2023年5月,月度投稿量首次突破2.0092万件;今年3月,首次突破3.0045万件。面对志愿审稿人难以应对的稿件数量,原本由康奈尔大学运营的arXiv将于7月转型为独立的非营利组织。
各大学术出版商和研究机构纷纷引入工具来验证AI的使用情况。施普林格·自然已部署“不当引用检测器”,以防止出现AI聊天机器人捏造不存在文献的“幻觉引用”。同时,该公司还运营着自主研发的工具Geppetto,专门用于检测由论文工厂批量生产的虚假论文或毫无意义的AI生成文本。Geppetto会对文本各部分由AI生成的可能性进行评分。据悉,该工具上线后数月内,便在预出版阶段识别出数百篇虚假论文。
本文由斯特网原创发布,未经许可,不得转载!
本文链接:https://ttes.yrowe.com/jdez/22310/





