cn21

Gemini 上級ユーザーは Google の Imagen 3 にアクセス可能

Google は、最新のテキストから画像への AI である Imagen 3 への早期アクセスをより多くの人々に展開しています。Gemini Advanced の加入者であれば、Gemini および Google アプリのベータ版で、試用を勧めるポップアップが表示されることがあります。以前は、ほんの一握りのクリエイターだけがアクセスできましたが、Google は現在、より多くのユーザーに AI を試用させています。まだテスト段階であるため、誰もが利用できるわけではなく、一般公開までもう少し待つ必要があるかもしれません。

Imagen 3はこれまでで最高のAI画像ジェネレーターです

Imagen 3 は、Google の最高レベルのテキストから画像への AI モデルです。同社が 5 月 14 日に初めて発表したこのモデルは、テキストの説明から驚くほどリアルな画像を作成するように設計されており、実際にその目的を果たしています。発表時に AI で生成された画像のプレビューは鮮明で、AI で作成されたとは思えないほどでした。

Google は Imagen 3 の機能のサンプルを公開しており、プロンプトには「泥だらけの使い古しのハイキング ブーツ」や「3 人の女性が一緒に立って笑っている」などがある。また、「灰色の背景の前に堂々と腰掛けた、なめらかなオオカミのクローズアップ」もあり、その背後にある AI の真実を知らなければ、本物のオオカミをカメラで撮影したと勘違いしてしまうだろう。

Imagen 3 AIで生成されたオオカミの画像Imagen 3 AIで生成されたオオカミの画像
画像: Google

Google アプリと Gemini アプリの一部ベータ テスターに​​は、Imagen 3 の利用を促す「First Look」通知が表示されます。また、高度なビデオ生成モデルである Veo も開発中です。Veo は、さまざまな映画スタイルの高解像度 1080p ビデオを作成できます。また、ユーザーの指示に基づいて一貫性のある一貫した映像を生成し、映画用語を理解してリアルな動きをレンダリングすることもできます。この AI は現在、一部のクリエイターがプライベート プレビューで利用できます。

Gemini Advanced の画像 3Gemini Advanced の画像 3
画像: Android Authority

GoogleのImagen 3が倫理的な懸念を引き起こす

AI が生成したコンテンツには、深みや意味が欠けていることが多い。最初は、印象的だった。ランダムな単語の組み合わせでユニークな画像を作成するという考えは、誰もが興味をそそられた。その後、私たちは、インターネットに大量に流される虚ろな目や歪んだ指に飽きてしまった。それらの画像は、記憶に残らず、使い捨てのものになった。Google は、非常にリアルなディテールと、より説得力のあるディープフェイクを備えた Imagen 3 で、この問題を解決したいと考えている。

Imagen 3 は、当社の最高品質のテキスト画像変換モデルです。信じられないほどのレベルのディテールを生成し、写真のようにリアルで実物そっくりな画像を生成します。以前のモデルよりも視覚的なアーティファクトがはるかに少なくなっています。Google は、非常にリアルなディテールとより説得力のあるディープフェイクを備えた Imagen 3 でこの問題を解決したいと考えています。

グーグル

画像3 鳥を彫刻する手の画像画像3 鳥を彫刻する手の画像
画像: Google

興味深い話に聞こえるが、「写真のようにリアル」で「説得力のあるディープフェイク」が将来に何を意味するかを考えると、確かに懸念が湧いてくる。偽ニュースやプロパガンダを宣伝する画像や、操作のツールとして同意のない露骨なコンテンツがさらに増えるだろう。また、既存の作品に基づいて AI が生成した画像に関する所有権と帰属の議論も忘れてはならない。

もちろん、Google が危険なツールを作ったと非難する人はいません。しかし、ロバート A. ハインラインは「危険な武器はない。あるのは危険な人間だけだ」と言いました。危険なのはテクノロジー自体ではなく、それを使用する人々の意図です。


前の記事

傷跡を治す方法(注目の画像) - 嵐が丘傷跡を治す方法(注目の画像) - 嵐が丘

次の投稿
iOS 18とmacOS SequoiaでiPhoneミラーリングを体験
前の投稿
Appleの特許はVision Proの快適性を向上させる方法を説明している

ノート:

AZ: 動物の世界、ペット、ペット、野生の自然に関するカテゴリー記事…
SP:スポーツカテゴリー。
New vs Ne: ニュースコラム。
Te: テクノロジー カテゴリ。
Gt:エンターテインメントカテゴリー。
Bt: 占い、星占い、超常現象、超常現象。
Ta:人生コラム。