27 6月 7:06 pm

Gemini 上級ユーザーは Google の Imagen 3 にアクセス可能

Google は、最新のテキストから画像への AI である Imagen 3 への早期アクセスをより多くの人々に展開しています。Gemini Advanced の加入者であれば、Gemini および Google アプリのベータ版で、試用を勧めるポップアップが表示されることがあります。以前は、ほんの一握りのクリエイターだけがアクセスできましたが、Google は現在、より多くのユーザーに AI を試用させています。まだテスト段階であるため、誰もが利用できるわけではなく、一般公開までもう少し待つ必要があるかもしれません。

Imagen 3はこれまでで最高のAI画像ジェネレーターです

Imagen 3 は、Google の最高レベルのテキストから画像への AI モデルです。同社が 5 月 14 日に初めて発表したこのモデルは、テキストの説明から驚くほどリアルな画像を作成するように設計されており、実際にその目的を果たしています。発表時に AI で生成された画像のプレビューは鮮明で、AI で作成されたとは思えないほどでした。

Google は Imagen 3 の機能のサンプルを公開しており、プロンプトには「泥だらけの使い古しのハイキングブーツ」や「3 人の女性が一緒に立って笑っている」などがある。また、「灰色の背景の前に堂々と腰掛けた、なめらかなオオカミのクローズアップ」もあり、その背後にある AI の真実を知らなければ、本物のオオカミをカメラで撮影したと勘違いしてしまうだろう。

Google アプリと Gemini アプリの一部ベータテスターには、Imagen 3 の利用を促す「First Look」通知が表示されます。また、高度なビデオ生成モデルである Veo も開発中です。Veo は、さまざまな映画スタイルの高解像度 1080p ビデオを作成できます。また、ユーザーの指示に基づいて一貫性のある一貫した映像を生成し、映画用語を理解してリアルな動きをレンダリングすることもできます。この AI は現在、一部のクリエイターがプライベートプレビューで利用できます。

Gemini Advanced の画像 3 — 画像: Android Authority

GoogleのImagen 3が倫理的な懸念を引き起こす

AI が生成したコンテンツには、深みや意味が欠けていることが多い。最初は、印象的だった。ランダムな単語の組み合わせでユニークな画像を作成するという考えは、誰もが興味をそそられた。その後、私たちは、インターネットに大量に流される虚ろな目や歪んだ指に飽きてしまった。それらの画像は、記憶に残らず、使い捨てのものになった。Google は、非常にリアルなディテールと、より説得力のあるディープフェイクを備えた Imagen 3 で、この問題を解決したいと考えている。

Imagen 3 は、当社の最高品質のテキスト画像変換モデルです。信じられないほどのレベルのディテールを生成し、写真のようにリアルで実物そっくりな画像を生成します。以前のモデルよりも視覚的なアーティファクトがはるかに少なくなっています。Google は、非常にリアルなディテールとより説得力のあるディープフェイクを備えた Imagen 3 でこの問題を解決したいと考えています。

グーグル

興味深い話に聞こえるが、「写真のようにリアル」で「説得力のあるディープフェイク」が将来に何を意味するかを考えると、確かに懸念が湧いてくる。偽ニュースやプロパガンダを宣伝する画像や、操作のツールとして同意のない露骨なコンテンツがさらに増えるだろう。また、既存の作品に基づいて AI が生成した画像に関する所有権と帰属の議論も忘れてはならない。

もちろん、Google が危険なツールを作ったと非難する人はいません。しかし、ロバート A. ハインラインは「危険な武器はない。あるのは危険な人間だけだ」と言いました。危険なのはテクノロジー自体ではなく、それを使用する人々の意図です。

アイリーンは、テクノロジー、電子商取引、食品分野で 4 年間の経験を持つベテランライターです。現在は Talk Android と Android Police に記事を投稿しており、最新の革新的な実践、ソリューション、ガジェットについて熱心に語っています。執筆していないときは、アイリーンは内なるカウチポテトを堪能し、ゲーム、歌、音楽、そしてもちろん食べることに喜びを見出します。