気になった特許の話題 -Patent Topics Explorer-

気になった特許等の知的財産の話題やニュースをピックアップしていくブログです! This blog is picking up intriguing IP topics including patents, trade secrets etc. !

 

 

米国: 「海賊版データ」での生成AI開発は著作権侵害となるのか?米国連邦地裁が下した判断

 

生成AIの急速な発展は、私たちのクリエイティブな活動を大きく変えつつあります。しかし、その裏側で、AIの学習データが著作権で保護されたコンテンツに大きく依存しているという問題が浮上しています。近年、この問題は裁判所の審理の対象となり、注目すべき2つの判決が下されました。これらはAI開発企業と著作権者の権利のバランスをどのように捉えているのでしょうか?

 

今回は、米国カリフォルニア州北部地区連邦地方裁判所で下された、生成AIの訓練が著作権侵害となるか、特にフェアユースにあたるかの判断について、Metaに対する判決とAnthropicに対する判決を比較しながら、その主要な論点と結論を分かりやすく解説します!

 

 

Anthropicの事件概要

 

Anthropicは、人間の読書や執筆を模倣するテキスト応答型AIサービス「Claude」を提供するAIソフトウェア企業です。Anthropicは、このClaudeを動かす大規模言語モデル(LLM)を訓練するために、膨大な量の書籍やテキストを使用しました。

データ収集において、Anthropicは2つの主要な方法を取ったとされています。

 

海賊版サイトからのダウンロード: 2021年初頭から、AnthropicはBooks3、LibGen、PiLiMiといった海賊版サイトから、数百万冊もの著作権で保護された書籍を無許可でダウンロードし、社内の中央「研究ライブラリ」に保管したとされています.。共同設立者は、この方法が「法律的/実務的/ビジネス的な面倒」を避けるためだと述べているそうです。

 

書籍の購入とスキャン: 何百万ドルもかけて何百万冊もの紙媒体の書籍を購入し、それらを裁断してデジタルスキャンし、元の紙媒体は破棄するという手法です。

このケースでは、原告の作家たちは、Anthropicが自分たちの著作物を無許可でコピーして利用したことで著作権を侵害したと訴えています。

 

 

Anthropicの事件での裁判所の判断

 

裁判所は、Anthropicのフェアユースの抗弁について、使用方法に分けて著作権侵害判断しました。

 

LLM訓練のためのコピー:フェアユースにあたると認定(著作権侵害でない)

 

LLMがテキストを訓練に利用し、単語間の統計的パターンを学習する目的は、「極めて変形的(highly transformative)」であると判断しました。

 

裁判所は、人間が本を読んで新しい作品を書くのと同じように、LLMが何千もの作品から文法、構成、スタイルを蒸留して新しいテキストを生成することは、著作権法が懸念する種類の競争ではないと説明しています。

 

なお、本件ではClaudeの出力が、原告の著作物の侵害的なコピーや大幅な模倣を一般利用者に提供していないことが強調されています。もし出力が侵害するものであれば、異なる結果になっていたかもしれません。

 

購入した書籍をデジタル化したライブラリコピー:フェアユースにあたると認定(著作権侵害でない)

 

購入した紙媒体の書籍をスペース節約と検索性向上のためにデジタル形式に変換する行為は、変形的であるとされました。

これは、既存のコピーを外部に共有したり販売したりする目的ではなく、あくまで社内利用のための形式変更であることが理由とされています

 

また、訓練のために作品全体をコピーすることは、LLMの性能向上のために「合理的に必要」であると判断されています。

 

海賊版サイトから取得した中央ライブラリのコピー:フェアユースではないと判断(著作権侵害に該当する)

 

これがこの事件で注目すべき点化もしれません。 裁判所は、Anthorpicが「世界のあらゆる書籍」を収集し、LLM訓練に使うかどうかにかかわらず「永遠に」保管するために海賊版コピーを取得したことは、それ自体がフェアユースではないと厳しく指摘しました。

これは、正規の購入で得られる書籍のコピーの需要を直接的に「置き換える」行為であり、著作権者が利用を管理できる権利を侵害すると判断されました。

 

さらに、裁判所はこのように海賊版の書籍を中央ライブラリに保管する行為は著作権者の市場を破壊すると述べています。

 

したがって、この部分についてはAnthropicは略式判決を得られず、損害賠償を含めた審理に進むことになりました。

 

Metaの事件

 

Metaが訴えられた事件では、MetaのLLM「Llama」も著作権で保護された書籍を訓練に利用しており、多くは海賊版サイトから入手していました。

 

この事件でも左伴署は、LLMの訓練自体は「高度に変形的」な利用でありフェアユースの第一要素に有利と判断しました。また、Llamaが原告の著作物を意味のある形で「反芻(regurgitate)」できないことや、AI訓練のためのライセンス市場は著作権者が独占する市場ではないという理由で、市場への影響に関する原告の主張(直接的な代替とライセンス市場の喪失)を退けました

 

しかし、最も重要な違いは「市場の希薄化(market dilution)」の議論です。裁判所は、AIが大量の競合作品を生成し、原告の著作物の市場を「劇的に損なう」可能性を認識し、これが著作権インセンティブを損なう「潜在的に勝利する論点」であると強調しました。この市場の希薄化は、Anthropicの事件で指摘された「著作権者を競争から保護するものではない」という見解とは対照的です

 

Metaの事件では、原告がこの「市場の希薄化」に関する十分な証拠を提出しなかったため、略式判決でMetaが勝利したとされています。裁判所は、この判決はMetaの行為が合法であるという前例になるものではなく、「原告たちが間違った主張をし、正しい主張を裏付ける記録を十分に用意しなかっただけ」だと明言しています。裁判所は、十分な証拠があれば、多くのケースで原告が勝訴する可能性が高いと示唆しています。また、AI企業は著作物を利用するために、著作権者にライセンス料を支払う必要が出てくるだろうとも述べられています。

 

2つの事件から見えてくるもの

 

LLMの「訓練」行為そのものは、どちらの裁判でも変形的と見なされ、フェアユースの可能性が高いとされました。

 

ところが、データ「取得」の方法については、Antrhopicの事件では海賊版からの取得・恒久的なライブラリ保持はフェアユースではない(著作権侵害となりうる)とされました。

 

一方で、Metaの事件では、海賊版からの取得方法が直接フェアユースを否定するものではないとしつつ、「AIによる市場の希薄化」が著作権侵害の論点となると指摘しましたが、原告側が証拠を欠いたため、この特定の訴訟では棄却されました。

 

これらの判決は、AIの学習プロセスがフェアユースとして認められる可能性を示しつつも、学習データの取得方法が著作権法に則っているか、そして著作権者の市場にどのような具体的な損害を与えるかが、今後の裁判で問われる重要なポイントとなることを示唆しているかもしれません。