シンガポール通信-五輪エンブレム盗用問題2:盗んだかどうかではなく、似ているかどうかが問題になる時代になった!

最近は、対象とする論文における剽窃の有無をチェックするソフトが開発されたと述べた。このソフトの原理そのものは単純であって、対象の論文に含まれる各文章と同じ文章がすでに発表されている論文の中に含まれているかどうかをチェックするというものである。

しかしながらその狙いとするところは、原則として既に発表されている論文(もちろん電子化されている必要があるが)すべての中に同じ文章が存在するかどうかの照合を行うというものである。まさに最近うるさく言われる「ビッグデータ」の応用の典型例ではないだろうか。

もっとも全ての論文を対象として照合を行うというのは時間がかかりすぎて効率が悪いから、現実問題としては、照合を行う論文の分野をチェック対象の論文と同じ分野にしたり(異なる分野で同じ専門的な表現が出てくる事は極めて少ないであろうから)、また照合を行う論文の発表された期間を限定する(特に理系の論文であれば古い論文の中に同じ専門的表現が出てくる事は極めて少ないであろうから)などによって、照合される論文の数を絞っているものと思われる。

また、短い語句であれば同じ表現が他の論文に存在する事は十分あることなので、少なくとも複数の文章にまたがって同じ表現であるかどうかなどを照合の条件としているようである。ともかくもそれらのソフトは、対象となる論文が過去に発表された論文を剽窃している割合が何パーセントか、また具体的に対象論文のどの箇所が既に発表された論文のどの箇所を剽窃しているかなどの定量的な結果を出力してくれる。

これはコピー&ペーストを気楽に行ってきた研究者にとっては、大変な強敵が現れてきた事になる。もっとも前回述べたように、他人の成果を再掲するにせよ、論文の内容をそのままコピー&ペーストするのではなくて自分の表現に変えて記述するのが研究論文の記述の本来のマナーなので、このようなソフトの存在そのものは研究者のマナー向上の観点からすると歓迎すべきものである。

しかしこのようなソフトが気楽に使えるようになると、これを濫用して論文の内容そのものより他人の論文の記述と同じ記述があるかどうかだけを問題にする風潮も生じて来る。そして研究の世界では、そのような風潮が生じ始めているようである。
その良い例が前回述べたSTAP細胞事件の小保方氏の場合であって、当初はノーベル賞候補とこぞって褒め上げておきながら、その成果に疑義が発生すると、過去の成果にさかのぼってあらを見つけ出そうとする者が続出する。まあいずれの世界もそのようなものだと言えばそれまでではあるが。

特に博士論文のように、若くてまだ論文の書き方に精通していない研究者が記述した論文においては、他人の論文を部分的にコピー&ペーストすることもしばしばあるので、このようなソフトにかけると高い剽窃率が出てきやすいのは事実である。

私の知り合いのオランダの大学の先生に聞くと、最近ヨーロッパでは学位論文を提出する前には剽窃をチェックするソフトにかけて剽窃の有無をチェックするのが常識化しているとの事である。これらのソフトはもちろん意識して剽窃したかどうかをチェックできるわけではないので、単に偶然に同じ表現になったとしても剽窃と判断する。したがってたとえ意識的にコピー&ペーストをしていなくても剽窃と指摘されればその部分を書き直すことが必要となって来る。

ここまで来ると今回の五輪エンブレムの盗用問題との関わりが見えて来るではないか。2020年東京オリンピック大会のエンブレムをデザインした佐野研二郎氏は、盗用したとされるベルギーのリエージュ・シアターのロゴは見た事もなく、エンブレムは自分が零から作り上げたデザインであると主張している。

本人の主張は尊重すべきかもしれないが、情報が氾濫するグローバル時代においては何かの際にそのロゴを見てそれが無意識に記憶に残り、自分のデザイン制作の場合に無意識の記憶が働いた可能性を無視するわけにはいかない。したがって本人の主観に基づく主張ではなくて、実際に似ているかどうかという客観的な判断によって新しいデザインかどうかを判断する必要が出てくるのではないだろうか。

図形の同等性・類似性の判断は、文章の同等性・類似性の判断に比較すると困難ではあるが、不可能ではない。近い将来にデザインの類似性を判断するソフトが開発される事も考えられる。そうすると、あるデザインの新規性を判断する際には過去の(すべての)デザインとの類似性をそのソフトによって計算し、似たデザインが列挙されると共にそれぞれのデザインと何%似ているかが数値として出力される事になる。

そうすると事前にある閾値を定めておき、その閾値以下の類似性を持つデザインであれば新しいデザインとして認めるというプロセスを取り入れる事になる。つまりAIによるデザインの新規性の判定である。過去の全てのデザインをビッグデータとして記憶しておき、それと新しいデザインとの類似性の判定を行う事によってデザインの新規性をAIが判断する。これはまさにAIが人間の知的活動の一分野を人間から奪ってしまう可能性の一つではあるまいか。