自我引用,本是体现科研承接性的一种治学方法。但如果玩大了,就会出问题。西班牙萨拉曼卡大学的计算机科学家科查多(Juan Manuel Corchado)最近就因超多的自引,成为众矢之的。
2022年初,WRWU世界大学排名(Webometrics Rankings of World Universities)发布了一项关于西班牙科学研究者的排名。这是由西班牙最大的公共研究机构高等科学研究理事会(CSIC)主导的榜单,在该国颇具权威性。
科查多凭借H指数105和被引量38806的成绩,从该国10万多名研究者中脱颖而出,在榜单中排名第145位。
Juan Manuel Corchado
这本是一个傲人的成绩。不成想,随即而来的一声质疑,瞬间打破了这一切:有人指出,在科查多全部论文的近3.9万被引量中,有不少来自他自己的贡献。
自己引用自己的研究成果?看起来,这似乎不失为一种提高被引量和H指数的“蹊径”。
但是,这样的做法真的可行吗?
自引和过度引用撑场面
细数科查多的论文,“自我引用”并不在少数。
例如,一篇题为《智慧城市建设:物联网与区块链》(IoT and Blockchain forSmart Cities)的会议摘要总共有322篇参考文献,其中44篇都是科查多自己的论文。而在关于2021年第二届教育技术中的人工智能国际会议(AIET)的文章中,竟有相当一部分参考文献与前述会议摘要一模一样,而两个会议的主题显然相去甚远。
“科查多的自我引用率高达22%!”在对科查多的论文进行统计后,西班牙格拉纳达大学的信息科学家、文献计量学家马丁(Alberto Martín-Martín)揭开了科查多高被引量背后的“真相”。
根据马丁的统计,在科查多全部研究成果的近3.9万次被引中,大约有8400次来自于他自己在谷歌学术网站(Google Scholar)上的论文。考虑到并非所有论文都会被谷歌学术网站收入,这个数据可能不够准确。
马丁还发现,一些研究者在引用科查多的论文时,存在过度引用的问题。西班牙电信公司的普利多(Arturo Perez Pulido)就是其中之一。迄今为止,他引用科查多的论文近4000次,占科查多总被引量的10%。其中个别文章的参考文献甚至全部来自于科查多一人。
对于过度引用问题,由于谷歌学术等网站的门槛过低,所以至今无解。“任何人都可以很容易地上传文章,其中包括对知识库的引用,而这些引用可以指向任何论文。”马丁说,以类似的方式,任何人都可以从任何论文中复制粘贴,并将拷贝来的内容作为自己的原创,上传到ResearchGate等网站中。
ResearchGate是一个面向全球研究者的科研社交网站,科学家们可以在上面分享研究成果、学术著作,以及参加一些科研论坛或兴趣小组。
争议不断
那么,科查多为什么如此执着于追求高被引量?这让马丁百思不得其解。
“在意大利等国家,对研究者的评估会考虑其个人文章的被引量,但在西班牙,期刊影响因子才是主要的考量因素。”马丁表示。也就是说,如果文章没有发表在具有高影响因子的期刊上,那么无论科查多的文章被引量有多高,也无法为他的个人评估带来多少助益。
当撤稿观察网站(Retraction Watch)就此事询问科查多时,他声称自己手臂骨折,回复速度较慢。此后,他未再作出进一步的回应。
《英国医学杂志》科研诚信主管拉加沃洛(Simone Ragavooloo)指出,像科查多这样的“自我引用”,在学术界绝非个例,而是一种普遍现象。
但是,这种行为的合理性依然颇具争议。“虽然我不愿意称这种行为是可疑的或有害的,但这些研究者似乎还不明白科学文献中引用和归因的真正目的。”拉加沃洛说。
布拉格查尔斯大学的亨伯格(Petr Heneberg)则认为,适当的“自我引用”没有任何问题。例如,一个人的被引量中包含了1300次自我引用,这听上去很夸张,但如果他的总被引量是13656,那么他的自我引用率仍然在10%的可接受范围之内,甚至再多一点也无妨。
根据2019年的一项研究,通过对大约10万名研究人员的数据统计,显示自我引用率的中位数是12.7%。科查多22%的自引率显然大大超过平均数。再加上10%的来自单一其他学者的过度引用,可疑的被引量合计占比32%。
然而,科查多并不是最“疯狂”的自引者。同一项研究还给出另一组数据,在大约10万名研究人员中,至少有250个科学家有超过50%的引用来自自己或他们的合著者。
与这些科学家相比,科查多似乎还留有余地,但真正令人惊讶的是他的发文量。亨伯格发现,近年来科查多发文量不少,比如2021年就发表了25篇论文,但这还不算多。在2009年,科查多与人合作发表了603篇论文,平均1天就发1.6篇论文,这简直不可思议!
大量滥发学术论文,加上较高的可疑引用率,一举让科查多凸显出来。
加西亚(Nicholas Robinson Garcia)是格拉纳达大学的一位社会科学家,他撰写发表了一篇研究论文,阐明了在谷歌学术上操纵引文有多么轻而易举,并对这种趋势表达了质疑。后来,一位研究人员甚至还联系他,询问如何提高自己的论文被引量,加西亚没有回复。“但过了一段时间后,我发现他确实这么做了。”他说道。
以量取胜的滥觞
“这种行为的危害程度,实际上取决于谷歌学术等工具在学术评估上的重要性究竟有多大。”加西亚说道。
他见过不少沉迷于“自我引用”而无法自拔的研究者,至于其中有多少是出于纯粹的自大自狂,有多少是为了提高自己的被引量,或者是两者兼有?他也无从得知。
“自我引用”现象的泛滥,反映了西班牙学术界过分关注研究者个人文献计量指标的严重问题。
在欧洲各国中,西班牙的学术评估体系可以说是独树一帜。因为它有一个集中在国家层面的评估系统,用于评估个人表现。这给政府带来了沉重的负担,以至于政府不得不依靠文献计量指标来减轻学术评估的工作量。
久而久之,便损害了西班牙学术评估的质量。
参考:
https://retractionwatch.com/2022/03/25/how-critics-say-a-computer-scientist-in-spain-artificially-boosted-his-google-scholar-metrics/#more-124555
https://www.webometrics.info/en/GoogleScholar/Spain
https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3000384
声 明