以前もブログで記事にしましたが、2023年12月20日にまだ素案で今後変更などはある状態ですが、文化庁からAIと著作権に関する考え方について(素案)として、最初のドラフトが示されました。
RAG等については前回取り上げています。
www.patent-topics-explorer.com
今回は全体を読んでみて、面白かった論点をメモ的に抽出しておこうと思います。
(1) 著作権侵害の基本の考え方
今までの文化庁の審議会内での議論のとおり、生成AIの生成物であっても複製等にあたるかは従来通りの①類似性と②依拠性の2点で判断するという考えで、類似性については生成AIだから特別ということはなさそうな印象。
一方で、依拠性については、利用者に認識がなくても、学習データに該当する著作物が使われていると依拠性がありとする一方で、生成AIに技術的手段等で該当する著作物を生成することを防ぐ手段が講じられている等の事情がある場合は依拠性がないという方向へ流れるなど、生成AIの内部についてもチェックしておく必要がありそうな内容になっていると思われました。
(2) AI学習を拒絶する著作権者の意思表示がある場合どうなるか
意思表示があることで、30条の4但書の「著作権者の利益を不当に害すること」に該当するかが素案では検討されています。
素案では意思表示のみでは原則あたらず、AI学習のための著作物の複製等を防止する技術的な措置が講じられ、当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合に、30条の4但書に該当しうるとしています。
ネット上の情報は通常バラバラで存在して「情報解析に活用できる形で整理したデータベースの著作物」という状態で存在していることはまれなので、データベース化されていない個々の著作物は30条の4の適用から外れることは難しいような印象も受けました。
また、資力がない一般的な著作者は、技術的な複製回避手段を講じるのは難しく、せいぜい利用規約で同意ボタンを押させるくらいが精いっぱいな気がするが、そのような場合にどうなるかも興味はあるところです。
(3) 著作権侵害の差止請求に附帯する除却請求について
学習用データセットは可能性あり、学習済みモデルまでは難しいという考えのようです。
i) 著作権侵害の対象となった当該著作物が、将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合は、当該AI学習に用いられる学習用データセットからの当該著作物の除去が、将来の侵害行為の予防措置の請求として認められ得ると考えられる。
ii) AI学習により作成された学習済モデルについての廃棄請求は、通常、認められないものと考えられる。
(4) プロンプトは著作物性が認められるか?
主な考慮要素としては、
① 指示・入力(プロンプト等)の分量・内容 を考慮して、表現と同程度の詳細な指示と認められるか、
②人間が、創作的表現といえる加筆・修正を加えた部分
考慮されずらいものとしては、
③ 生成の試行回数
④ 複数の生成物からの選択 (通常創作性があると考えられる行為であっても、その要素として選択行為があるものもあることから、そうした行為との関係についても考慮)
が挙げられていました。
著作権には、額の汗の法理という、時間やお金や労力をつぎ込んだものを著作権で保護するというものではない考えがあります。
そういった意味で、試行回数は「頑張ったんだよ!」という意味で主張しがちではありますが、あくまで何回も思考を経て表現として昇華させたという主張をした方がよいのかもしれませんね。