ONAKASUITANE

色々適当に調べたことなど

【画像生成AI】著作権と現状の問題

著作権のおさらい

著作権著作権法第2条より「思想または感情を創作で表現した文芸、美術、音楽、学術」等の著作物に与えられる権利で、著作物は外部へ公開された時点で保護の対象として扱われます。たとえば私自身がヘタクソな落書きを適当に描いて公開しても、その創造物が第三者から「商用利用としての価値がない」と評されようが、その落書き自体は著作物として認められることになります。ただし「表現されていない思想や感情、アイデアやコンセプトについては保護されない」とされ、絵画でいえば「画風」、小説でいうところの「文体」については著作物の対象外とされます。ただし特許申請を通すことで、アイデアそのものが保護の対象とされるケースもあります。

 

では、先ほどの「公開した落書き」の中にオリジナルとして名前までつけたキャラクターがいたとして、それを第三者が模造しネット上等に自作としてアップした場合はどうなるでしょう。著作権では「抽象的な表現」については著作権保護の対象にはならないとされていますが、誰が見てもあきらかに「オリジナルと完全に一致するキャラクターである」ことが確認された際、そのキャラクター自体が著作権保護の対象として認められるケースがあります。ですので上記第三者の行為が、著作権侵害に抵触する可能性はあります。

「キャラクターそのもの」の特徴や雰囲気のみは著作物にはなりえませんが、アニメ、漫画、ゲーム等の「表現として公開されたキャラクター」は著作物として扱われます。利用の際には著作者の許諾が、原則必要となります。

 

二次創作、ファンアートの「版権」について

「元の創作物にアレンジを加え生み出された表現」については、二次的著作物として保護の対象です。その条件には著作権法第27条及び28条より「著作者の許諾」が必要ですが、多くの二次創作またはファンアートについては「黙認」の上で成り立っています。この「黙認」されている二次創作やファンアートの歴史自体が古く長く続いているもので、そこからプロとして活躍されるようになったイラストレーター、漫画家、小説家など、現在も続き多くいらっしゃいます。しかしながら「一部表現や取り扱い」について禁止されているケースもあり、版権物の取り扱いの際には十分な確認が必要です。もちろん著作者が「二次的著作物としての表現や販売を禁止する」ことを表明されている場合もあり、すべてが「黙認」として許可されているわけではありません。

 

これら版権物に対し金銭のやり取りが発生する場合、多くが「販売」とは言わず「頒布」という表現を用いている言葉の背景には、上記の事情があるためです。

 

 

生成AIの「二次利用」≠「二次創作」

生成AI技術は2024年3月現在時点にて、すでに多くの試験的な取り組みや一般ユーザーの利用、加えて商用として活用されるケースも増えてきています。しかしディープフェイクの満盈やデータセットの問題に対し、現在国内では根本的な解決、緩和防止に関しては他国より遅れをとっています。全てのAI技術が上記の問題を抱えているわけではなく、技術発展自体には賛成でありつつも、無断機械学習に利用されたデータの一部に含まれるCSAM(Child Sexual Abuse Material)や生体情報含む画像データの活用、悪質な流用について、特にソーシャルメディアでは現状の技術利用に疑問視する人、反対を唱える人も連日見かけるようになりました。

 

そんな中、画像生成AIの「データセットを利用した生成物」において、その扱いは人の手で生み出された「二次創作」と同義であるかのように発言されているのを時々目にします。

画像生成AIから生まれる「二次創作」も現状多くありますが、あくまで特に問題視されているのは生成AIの基盤となっている「無断機械学習に使われているデータセット」とその利用に関する部分で、画像生成AIで取り扱われているデータ自体に、国内外問わず多くの人々が懸念の声をあげています。現在ネット上のスクレイピング(データ抽出)に関して違法とはされていませんが、倫理的な問題が数多く存在しています。(※スクレイピングを禁止している媒体もあるため、規約の確認等必須ではあります)

また、著作者が「著作物のAI利用を禁止します」と表明されているにも関わらず、無断機械学習に利用し、許諾なしに特定の著作物に近似する画像データまたはデータセット自体を拡散、販売までを行う悪質なユーザーも中にはいらっしゃるようです。個人の対策だけでは防ぎようのない問題になってきています。

 

 

画像生成AIのデータセット

画像生成AIによって生み出される美しい色彩や繊細なデザイン、面白い表現には必ず元となった複数の画像データがあります。その技術の種類、仕組みはどうあれ、現段階では生成には「データセット───ネット上より無断取得されたデータ群なしでの確立はありえません。「結果として」出力される表現については、コラージュに近いのではないでしょうか。

 

ようやく最近になってその利用されているデータに、倫理的問題のある画像がいくつも含まれていると報道されるようになってきました。前記したCSAMに関する画像データのことです。発覚したのは一年より前ですが、自国ではあまり公に取り上げられることはありませんでした。そしてもちろんCSAM以外にも、問題として取り上げられるべき生体画像が数多く含まれていることもわかっています。

 

それに続き、スクレイピングの正当性についての疑問もあります。

「人の手によって」行われた海賊版サイト等での違法ダウンロードについては、国内では著作権法119条3項について定められた罰則があります。ですが生成AIのスクレイピング等のデータ取得においては見逃されているのが現状です。自国でもスクレイピングにおける規制等は、現時点で特に厳しく設けられてはいません。

 

 

画像生成AIと著作権侵害

意図的な過学習を行い、わざと特定の著作物に近似するよう調整する悪質な使われ方も確認されています。学習前にもう一段階過学習を挟み「〇〇(著作者名)風」と称して公開することにより、「類似性・依拠性」が認めらないようにしているようです。

とはいえ上記方法でなくても、著作物が不当に利用されたかどうかの証明ですら非常に困難です。著作権侵害等の証明には、最低限データセットのリストとプロンプトの開示が必要なのではないでしょうか。また外部から、データセットに含まれる特定の著作物を削除する手段がないということも、問題点として挙げられるでしょう。

 

この件については著作権侵害ではなく「不正競争法防止法」で訴えられるのではという意見もありますが、著作物が「一般的に、世間に周知されている」ことが前提となります。「周知」の判断、証明が厳しい場合には適用されません。

また最初の方に前記しましたが、表現や絵柄については著作権の対象外です。「類似性・依拠性」についても曖昧なところはあります。

 

※上記は2024/03/24時点での内容になります。

 

 

おわりに

人の手よる表現が損われ続けば、クリエイティブ産業に多大なる損害が発生するのではと危惧しています。上記以外にも懸念される課題は多くあり、解決処理する姿勢がほとんど見られないと判断される事態になれば、多方面から信頼を失うことにも繋がるのではないでしょうか。

技術の発展には期待していますが、人を傷つける道具にはなってほしくないと思います。

 

 

 

参考文献、URL

----------------

知的財産権管理技能検定公式テキスト」知的財産教育協会 編

「インターネット監視財団(IWF)」 https://bclawimpact.org/2023/04/20/