cp1

企業に著作権料を支払わせればGenAIツールは「存在できない」

生成人工知能 (GenAI) 企業の Anthropic は、米国の法廷で、大規模言語モデル (LLM) のトレーニング データに著作権で保護されたコンテンツを使用することは「フェアユース」とみなされ、AI があれば「今日の汎用 AI ツールは存在し得ない」と主張しました。企業は素材のライセンス料を支払わなければならなかった。

米国法では、「フェアユース」とは、批評、ニュース報道、教育、研究などの目的で、著作権で保護された素材を許可なく限定的に使用することを認めています。

2023年10月、コンコード、ユニバーサル ミュージック グループ、ABKCOを含む多くの音楽出版社が、AmazonとGoogleが支援する生成AI企業Anthropicに対して訴訟を起こし、「著作権で保護された楽曲の組織的かつ広範な侵害」の疑いで数百万ドルの損害賠償を求める可能性があると訴えた。歌詞”。

テネシー州地方裁判所に提出されたこの訴状は、Anthropicが自社のAIモデルの構築と運用において、「出版社が所有または管理する無数の楽曲の歌詞を含む、膨大な量の著作権で保護された作品を不法にコピーし、配布している」と主張した。

AI技術は複雑で最先端であるかもしれないが、著作権で保護された素材の使用に関する法的問題は「単純かつ長期にわたる」ものであると付け加えた。

「被告は、権利者からの許可を確保しない限り、自分のビジネスを構築するために他人の著作権で保護された作品を複製、配布、展示することはできない」と述べた。 「企業がその侵害を『AI』という言葉で飾り立てたからといって、この原則が崩れるわけではない。」

訴状はさらに、アンスロピック社が著作権許可を確保できなかったことにより、「出版社とそのソングライターが著作権で保護された作品に対する管理権を奪い、創作活動で苦労して得た利益を奪っている」と主張した。

この問題を軽減するために、音楽出版社は裁判所に対し、Anthropicに損害賠償を支払うよう求めている。 そのトレーニングデータと方法の説明を提供します。 そして会社が所有する作品の「侵害コピー」をすべて破棄します。

しかし、アントロピック社は、10月30日の米国著作権局への提出書(この件とは全く別のもの)の中で、自社のAIモデルであるクロードのトレーニングは「素材の典型的な合法的な使用に該当する」と述べ、「著作権で保護された作品がトレーニング データに使用されている限り、それは作品の表現目的とは関係のない (単語と概念間の統計的関係の) 分析を目的としています。」

さらに、「クロードを訓練するために作品を使用することは、オリジナル作品の販売を妨げるものではないため公正であり、商業的な場合でも、十分に変革をもたらすものである。」と付け加えた。

LLMによる著作権で保護されたコンテンツの取り込みに対するライセンス制度の可能性について、アンスロピック氏は、常にライセンスを要求することは、大多数の作品へのアクセスをロックし、アクセスできる「最もリソースの豊富な団体」のみに利益をもたらすため、不適切であると主張した。コンプライアンスへの取り組みを強化します。

「LLMを効果的に訓練するために著作権で保護された作品の非表現的な使用にライセンスを要求することは、アイデア、事実、その他の非著作権素材の使用を妨げることを意味する」と同団体は述べた。 「データセットの各側面が他の出力よりも特定の出力に大きな「重み」を与える可能性があると仮定しても、モデルはその部分の合計以上のものです。

「したがって、そもそも生成 AI モデルの開発を不経済にせずに、個々のクリエイターにとって意味のあるロイヤルティ レートを設定することは困難でしょう。」

2024年1月16日に裁判所に提出した40ページの文書(特に11月に音楽出版社が提出した「仮差止請求」に対応したもの)の中で、アンスロピックは同じ主張をさらに展開し、「十分な量の音楽を蓄積することは不可能だろう」と主張した。独立企業間のライセンス取引において、クロードのような LLM を、いかなる代償を払ってでもトレーニングする内容です。」

さらに、「公的に利用可能なインターネットから幅広く収集された」データを使用しているのはAnthropicだけではなく、「実際には、広範なデータを使用して複雑なLLMを訓練するのに必要な規模と多様性を備えた訓練コーパスを蓄積する他の方法はない」と付け加えた。人間の言語と世界一般の理解。」

「原告の歌の歌詞、あるいはそれらのデータセットに反映された他のコンテンツが含まれることは、単にその技術的課題を解決するための唯一の実行可能なアプローチの副産物に過ぎない」と同報告書は述べた。

さらに、LLM のトレーニングに必要なデータセットの規模は、効果的なライセンス制度を運用するには大きすぎると主張しました。「数兆のトークンを生成するために必要な数十億のテキストをカバーするのに十分な権利所有者とライセンス取引を行うことはできません。」汎用 LLM が適切なトレーニングに必要とするもの。 著作権で保護されたコンテンツで LLM をトレーニングするためにライセンスが必要な場合、今日の汎用 AI ツールは存在できません。」

音楽出版社らは訴訟の中で、Anthropic が自社の著作権で保護された素材をトレーニング コーパスから簡単に除外できると主張しているが、同社は、不特定の制限を設けるなど、「その種の複製の発生を防ぐための広範な保護措置」をすでに導入していると述べた。 「他のアプローチ」の中でも特に、モデルが再現できるものと、著作権で保護された素材を認識するようにモデルをトレーニングすることです。

これらの対策は一般的に効果的ではあるが、完璧ではないと付け加えた。「特に、著作権で保護された作品の重要な部分を出力するためにクロードを意図的に悪用しようとしているユーザーの場合、一部の短いテキストがこの文書をすり抜けてしまう可能性があるのは事実です」 Anthropic は多面的な防御策を講じています。

「この訴訟の対象となっている特定の曲に関して、原告らは、原告またはその代理人以外のユーザーに出力されたことはもちろん、すべての曲がこれまでに出力されたという証拠も挙げていない。」

同様の著作権訴訟は、OpenAI や Stability AI を含む他の企業や、ハイテク大手の Microsoft、Google、Meta に対しても起こされています。 この記事の出版時点ではまだ裁判所による判決は下されていませんが、最終的な結果はテクノロジーの将来に先例を作り始めることになるでしょう。

米国作曲家・著者・出版社協会(ASCAP)は、米国著作権局へのコメントの中で(これも、Anthropic およびその他のテクノロジー企業に対して現在提起されている訴訟とは完全に別のものである)、次のように述べた。生成 AI モデルがどのようにトレーニングおよびデプロイされるかについては、生成 AI モデルをトレーニングするために著作権で保護された作品を無許可で非個人的に使用することがフェアユースに当たるという現実的なシナリオは存在しないと考えており、したがって、著作権所有者の同意が必要です。 」

Anthropic とはまったく対照的に、同社はさらに次のように主張しました。「生成 AI モデルの開発における著作権で保護された素材の使用は、変革をもたらすものではありません。 トレーニングプロセス中の著作権で保護された素材の不正使用は、商業目的を促進するために行われます。」

音楽出版社が法的訴状を提出するわずか1か月前の2023年9月、アンスロピックは、電子商取引大手アマゾンが同社に最大40億ドルを投資し、少数株を取得すると発表した。 2023年2月、Googleは同社に約3億ポンドを投資し、株式の10%を取得した。 FTX創設者のサム・バンクマン・フリード氏も、同年11月に破産を申請する前に、2022年4月にアンスロピックに5億ドルを出資した。

次の投稿
SAP は AI に重点を置いていますが、依然としてクラウドが鍵です
前の投稿
8×8 はサービス スイートとしてのエクスペリエンス コミュニケーションを強化します

ノート:

AZ: 動物の世界、ペット、ペット、野生の自然に関するカテゴリー記事…
SP:スポーツカテゴリー。
New vs Ne: ニュースコラム。
Te: テクノロジー カテゴリ。
Gt:エンターテインメントカテゴリー。
Bt: 占い、星占い、超常現象、超常現象。
Ta:人生コラム。