当前位置:首页 > 站长资讯 > 正文内容

AI论文“抄观点不抄字”引激辩

a811625535个月前 (09-22)站长资讯2

  图片来源:AI生成

  【今日视点】

  ◎本报记者 张梦然 实习生 周思彤

  人工智能(AI)生成的科研成果正引发学界对“思想抄袭”的激烈争论。

  《自然》杂志日前一则报道称,部分研究人员发现,一些标注为大型语言模型生成的论文,虽未直接复制文字,却存在挪用他人研究 *** 或核心观点且不标注出处的情况,即“抄观点不抄字”。

  但对这种“思想抄袭”或“思想挪用”的指控,有学者及AI研发团队予以否认。

  “思想挪用”案例频引争议

  今年1月,韩国高等科学技术研究院研究员朴炳俊收到印度班加罗尔科学研究所“揭发团队”的邮件,被告知一款名为“The AI Scientist”的工具生成的未正式发表手稿,疑似使用了他论文中的研究 *** ,却并未署名。“The AI Scientist”由东京Sakana AI公司于2024年推出,是计算机科学领域全自动科研工具的代表,能通过大型语言模型生成思路、自主编写运行代码,并撰写研究论文,且会明确标注为“AI生成”。

  朴炳俊核查后发现,该AI手稿虽提出了新架构,与他的论文主题不同,但两篇论文的核心 *** 高度相似。

  发现这一问题的印度“揭发团队”指出,类似情况并非个例。他们在今年2月发表的研究中提到,经外部专家评估,多个AI生成手稿存在未直接复制文字,却挪用他人观点且不署名的现象。这些由大型语言模型生成的研究观点表面看似新颖,实则是“巧妙地抄袭”,其原创性难以验证。

  此外,“揭发团队”还发现,Sakana AI今年3月宣布的、首篇通过国际学习表征会议研讨会同行评审的全AI生成论文,疑似挪用了2015年发表的一项研究中的核心成果,且未标引用,同时,其还借鉴了另一篇2015年的未署名手稿。专家评估认为,这篇AI论文与2015年的研究相似性达到了5级,即具有极高的相似性。

  为进一步验证,“揭发团队”选取了美国斯坦福大学团队2024年发布的4份AI生成研究方案、Sakana AI的10份AI手稿,以及与Sakana AI使用相同 *** 生成的36份新方案,邀请13位领域专家按“5级相似度量表”评估(5级为 *** 完全对应,4级为融合2—3项前人成果)。结果显示,24%的AI生成作品达到4—5级相似度。

  如何定义“抄袭”仍存分歧

  针对上述指控,“The AI Scientist”研发团队予以否认,称“抄袭指控不实,毫无根据且应被无视”。团队表示,被质疑的AI手稿与前人研究假设不同、应用领域各异,即便 *** 存在部分关联,也只是“未引用相关文献”,这在人类研究者中也属常见现象,且团队已承认工具存在引用不足问题,但强调AI生成成果并非抄袭。

  学界对“是否构成抄袭”的判断也存在分歧。美国佐治亚理工学院机器学习研究员本·胡佛认为,朴炳俊提及的AI论文与他本人的研究相似度仅为3级,“远不足以构成抄袭”。韩国高等科学技术研究院研究生白真宥则指出,新颖性本身就具有主观性,人类评审在学术会议中也常就何为原创争论不休。

  朴炳俊本人虽认为其研究与AI论文的 *** 相似度达5级,但也表示“这未必符合法律或伦理层面的抄袭定义”。

  柏林应用科学大学专家德博拉·韦伯-伍尔夫指出,争议根源在于“抄袭”定义的认知差异:部分计算机科学家认为抄袭需“主观故意欺诈”,但她主张“意图不应作为判断标准”,因为AI没有主观意识,且现有AI系统无法追溯观点来源。她引用国际学术诚信中心前主任泰迪·菲什曼的定义:“未恰当标注他人可识别的观点或成果,且存在原创性预期时,即构成抄袭”。

  现有学术体系饱受冲击

  争议背后,是AI科研对现有学术体系的深层挑战。德国锡根大学机器学习专家乔拉恩·比尔指出,计算机科学等领域每年论文数量激增,研究者本就难以验证自身观点的新颖性;而大型语言模型通过重组训练数据生成观点的特性,会加剧学术信用流失,因为AI天然倾向于借鉴前人成果。

  更关键的是,“思想抄袭”的验证尚无有效解决方案。韦伯-伍尔夫坦言,目前没有统一 *** 能证明“思想抄袭”与“文字抄袭”不同,观点挪用难以量化。新加坡南洋理工大学AI研究员刘阳也表示,现有技术可检测句子语义相似度,但“观点或概念层面的相似度检测研究极少”。

  研究测试显示,商业抄袭检测工具Turnitin未能识别出专家判定的AI论文来源文献,学术搜索大型语言模型工具OpenScholar仅识别出1篇。

  “The AI Scientist”虽会通过“大型语言模型生成关键词+语义学者搜索引擎+大型语言模型评估”的流程验证原创性,但比尔认为,该过程过于简化,因为关键词难以完整概括观点,搜索引擎可能遗漏关键文献,无法媲美领域专家的判断。

  AI使用标准亟待明晰

  面对争议,学界普遍认为需规范AI科研工具的使用。

  新加坡国立大学计算机科学家靳民彦表示,AI工具终将普及,关键是找到正确的使用方式。“The AI Scientist”研发团队则表示,其成果仅是“概念验证”,旨在证明“AI生成科研论文已具备可行性”,未来这类系统有望实现“重大原创发现”。团队同时承认AI生成论文存在质量问题,建议当前阶段仅将这一工具用于“启发思路”,研究者需自行验证其输出内容的可靠性。

  目前,关于AI生成科研成果的学术规范尚未成形,如何平衡AI的科研辅助价值与学术诚信,仍是学界亟待解决的课题。

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://2345hao.cn/blog/index.php/post/33400.html

分享给朋友:

“AI论文“抄观点不抄字”引激辩” 的相关文章

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

  以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。   2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

上声电子:四年净利仅剩30% 研发低产能又“空置” 三角股权难解丨

  历时四年发展,归母净利润反缩水近7成的上声电子,即将登陆科创板,寻求资本助力。   作为国内前装市场汽车声学产品方案供应商的上声电子,于2021年3月29日在科创板启动招股环节。公司计划募集4.47亿元资金,其中2.47亿元用于扩产扬声器项目,1.49亿元用于扩产汽车电子项目,剩余5000万元...

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

华恒生物:近半市占率的细分龙头 竟然只能“被动挨打”丨

  全球最大的丙氨酸生产商华恒生物,即将亮相科创资本市场。   2021年4月7日,以合成生物技术为核心,主要从事氨基酸及其衍生物产品研发、生产、销售的华恒生物,于科创板开启了路演询价环节,距离正式亮相科创板仅剩一步之遥。      图/Wind   目前,华恒生物拥有接近50%的市场占有率...

四个交易日大跌24%、16.6亿资金疯狂逃离 真爱美家股价过山车的背后丨

四个交易日大跌24%、16.6亿资金疯狂逃离 真爱美家股价过山车的背后丨

  四个交易日高位逆势大跌24%,共计16.6亿资金逃离,上市仅10多天的真爱美家(003041.SZ)正经历大资金高位套现离场。   资料显示,真爱美家是一家以毛毯出口为主的家用纺织企业,公司于2021年4月6日正式登陆资本市场。4月15日,公司涨停封板态势突然崩溃,股价掉头向下,当天最大跌幅触...

崧盛股份:头部玩家红利、前瞻布局两大风口 2021Q1营收、净利同步飙升1.6倍只是开端?丨

崧盛股份:头部玩家红利、前瞻布局两大风口 2021Q1营收、净利同步飙升1.6倍只是开端?丨

  LED植物照明驱动电源第一股崧盛股份,即将亮相创业板资本市场。   2021年5月17日,深圳市崧盛股份披露《首次公开发行股票并在创业板上市招股意向书》及《初步询价及推介公告》等材料,启动IPO招股,距离正式登场仅剩一步之遥。      图/Wind   崧盛股份本次IPO拟募资4.59...