问题由谷歌大脑研究员指出
梦晨 发自 凹非寺
非常AI | 公众号 QbitAI
一篇19家机构、100位学者联名发表的AI大模型综述性论文,现被质疑涉嫌大量段落抄袭。
目前该论文已被arxiv管理员添加上“与其他作者的另一篇论文有文字重合”的备注。
论文第一单位智源研究院,刚刚对此发布了官方声明:已展开调查,对学术不端零容忍。
问题最早由谷歌大脑研究员Nicholas Carlini指出。
他在一篇博客文章中列举了10个涉嫌抄袭他们的论文《Deduplicating Training Data Makes Language Models Better》的段落。
同时通过收集数据初步核查, Carlini认为这篇论文还涉嫌抄袭十余篇来自其他作者的论文。
此事已引起AI从业者广泛关注。
Nicholas Carlini博客文章:
https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html
智源研究院官方回应:
https://www.baai.ac.cn/portal/article/index/cid/4/id/403.html