大丑闻?一篇数十位国内AI大牛参与的论文被指严重抄袭

  来自清华、北大、上海交大;腾讯、华为、京东、字节跳动,和炙手可热的AI研发机构北京智源人工智能研讨院等十多家知名机构的数十名国际AI大牛参与署名的论文,被Google Brain的一名研讨员指出严重剽窃。   被指控的论文名为《A Roadmap for Big Model》(下称《大模型》),依据论文发布时,智源社区发布的文章:论文“由悟道大模型研讨项目担任人,智源学术副院长,清华大学计算机系教授唐杰牵头,从大模型根底资源、大模型构建、大模型关键技术与大模型使用探究4个层面动身,对15个详细范畴的16个相关主题停止片面引见和讨论。”   名叫Nicholas Carlini的研讨员近日在其博客中直接罗列了少量该论文与他更早发布的“Deduplicating Training Data Makes Language Models Better”论文一摸一样的段落。   而且,他还表示,被剽窃的能够至多还有其他十余篇论文。 图源:Nicholas Carlini博客   查阅预印本效劳器arXiv可以发现,谷歌大脑研讨员的论文上传工夫为去年七月份,而《大模型》的上传工夫在往年三月。两篇文章所讨论的“大模型”,为目前世界AI研讨范畴最抢手的话题之一。   这篇篇幅宏大的论文,作者署名甚至少达百人。该论文长达数十页,并足足用了第一页的篇幅罗列参与的作者。   其中不乏国际AI业界和学界的知名大佬,供职机构更是把中国知名高校和互联网巨头简直一扫而光。   在论文作者引见局部写到,“唐杰设计了这个大模型道路图”。依据清华官方信息,唐杰2006年在清华大学计算机系取得博士学位。研讨兴味包括社会网络剖析、数据发掘、机器学习和知识图谱。2022年1月,唐杰刚因对信息和社交网络发掘的奉献而中选国际计算机学会会士。呈现在作者栏的还包括诸多与唐杰一样在中国AI业内响当当的名字。   Nicholas Carlini在其博客中表示:“很能够只要多数作者参与了这种剽窃,一小局部作者的不当行为不应该被用来责备大少数行为良好的作者。”   在Nicholas Carlini的曝光博客发酵后,arXiv已在触及剽窃的“A Roadmap for Big Model”论文页面下添加了文字重合的警示。 图源:预印本效劳器arXiv   就在明天半夜,担任“A Roadmap for Big Model”论文牵头的北京智源人工智能研讨院的官方账号已对该状况做出回应,其表示:“我们曾经留意到对《A Roadmap for Big Model》一文的质疑,正在对相关状况停止核实,智源研讨院鼓舞学术创新和学术交流,对学术不端零容忍,有关停顿将尽快通报。” 图源:知乎

发表评论