ブログ「hypoxia research::blog」さんによると、この議論はNatureで既にかなり議論されていたようですが、気付きませんでした。以下はScienceの記事の抜粋。意訳しており、誤りがあるかもしれないことを予めご了承ください。
1.「Déjà vu」での分類
「Déjà vu」では、MEDLINE(医学関係の論文データベース)中の74790組の論文で、論文のタイトル、要旨が類似していると検知されている。この中の90%(68,749編)は「unverified(未確認)」に分類されている。それ以外でさらに詳細に調べられた論文は以下の4種に分類されている。
1)Distinct(明白、1487編)
2)Sanctioned(認可済み、1695編)
3)Update(更新、527編)
4)Duplicate(複写、2124編):本文の85%以上が一致
内 著者が共通(1866編)、著者が異なる(剽窃の疑いが濃厚:258編)
2.自分自身の論文の一部の繰り返し使用
「Déjà vu」で類似性が高いとしている論文の中には同じ著者の論文が含まれている。自分自身が以前に公表した論文で用いた表現を繰り返して用いているために、「Déjà vu」の剽窃論文候補リストに加えられてしまっている。その多くは「unverified(未確認)」と分類されているが、unverifiedと分類されているにしても、自分の論文が自分自身の論文を剽窃していると疑われていることを知った研究者は心穏やかではない。
3.他の論文の表現の利用
「Déjà vu」によって、論文作成で広く行われている「patchwriting(はめ込み)」の問題が明らかになった。patchwritingとは、論文の序文、scientific design(研究手法)の章、、その他で他の論文の表現を用い、詳細についてのみ自分自身の研究内容を記載することである。中国の研究者が別の著者の論文と95%以上一致する論文を投稿していることが「Déjà vu」で判明し、取り下げた例が紹介されている。記事では、学生にpublication ethicsを教えている教員の「patchwritingは他人の研究のアイデアを盗用することであり、当に剽窃の一種である」という言葉を示している。
4.レビュウ(総説)論文
総説の主旨は、そのテーマについての研究の歴史、現状、将来展望を著わすことにある。したがって、正確を期すために、他の論文の一部をそのまま引用するのが通例である。このことによって、他の論文と一致する表現が増え、結果として「Déjà vu」に剽窃論文候補としてリストアップされてしまう。また、同じテーマのレビュウ論文を2年続けて書けば、新しいレビュウ論文の大部分は古いレビュウ論文と同じ表現になってしまう。レビュウ論文の著者も、自分の論文が「Déjà vu」の剽窃論文候補リストに加えられていることに戸惑いと怒りを感じている。
5.結論
大学などで「Déjà vu」が採用人事などに使おうとする動きもあるが、「Déjà vu」に自分の名前が不正確にリストアップされた研究者は、そのようなことがあってはならないと考えている。学術論文雑誌とレビュウ論文の数が過剰であって、発行されている論文の50%-70%は無価値である現状で、論文剽窃についての見張り番(watchdog)がいるという意味で「Déjà vu」の存在価値はある。
おわりに
上で紹介した記事中に、米国の大学の授業に「publication ethics」という科目があること自体に驚きを感じた。
私が初めて英語の論文を書いたときには、特に英語表現に四苦八苦した。自分自身の言葉で書き始めたが、思うに任せず、結局、「マネより始めよ」を念頭に、他の関連論文の表現を参考した覚えがある。複数の論文の表現を種々取り交ぜ、丸写しではなかったし、指導教官と数えきれない回数の改訂を行った後で投稿したので剽窃には該当してはいなかったとは思うが、「表現を流用してはいけない」と意識していなかったので、一歩間違えば、危なかったかもしれない。
サイテーション・インデックスや被引用論文数が雑誌や論文の価値を示すという誤解が広がっている現状では、「Déjà vu」は完全なシステムではないのは明らかであるにもかかわらず、最新の科学技術で構築された「Déjà vu」を完全なシステムと誤解する人間が現われることを恐れる。