te54

Ubuntu 22.04 に Apache Hadoop をインストールする方法 – TecAdmin

(jp) =

非構造化データを理解し、大量のデータを分析することは、今日では別の球技です。 そのため、企業は非構造化データをより効率的に管理するために、Apache Hadoop やその他の関連技術に頼ってきました。 企業だけでなく個人も、大規模なデータセットの分析やユーザー クエリを処理できる Web サイトの作成など、さまざまな目的で Apache Hadoop を使用しています。 ただし、Ubuntu に Apache Hadoop をインストールすることは、Linux サーバーの世界に慣れていないユーザーにとっては難しい作業のように思えるかもしれません。 幸いなことに、Ubuntu に Apache Hadoop をインストールするのに経験豊富なシステム管理者である必要はありません。

次の段階的なインストール ガイドでは、ソフトウェアのダウンロードからサーバーの構成までのプロセス全体を簡単に説明します。 この記事では、Ubuntu 22.04 LTS システムに Apache Hadoop をインストールする方法を説明します。 これは、他の Ubuntu バージョンにも使用できます。

ステップ 1: Java 開発キットをインストールする

Java は Apache Hadoop の必須コンポーネントであるため、Hadoop がインストールされるネットワーク内のすべてのノードに Java Development Kit をダウンロードしてインストールする必要があります。 JRE または JDK をダウンロードできます。 Hadoop のみを実行する場合は JRE で十分ですが、Hadoop で実行するアプリケーションを作成する場合は、JDK をインストールする必要があります。 Hadoop がサポートする Java の最新バージョンは、Java 8 および 11 です。Apache の Web サイトでこれを確認し、OS に応じて適切なバージョンの Java をダウンロードできます。

  1. デフォルトの Ubuntu リポジトリには、Java 8 と Java 11 の両方が含まれています。 次のコマンドを使用してインストールします。
    sudo apt update && sudo apt install openjdk-11-jdk 
    
  2. インストールが正常に完了したら、現在の Java バージョンを確認します。
    java -version
    
    Ubuntu 22.04 での Hadoop のインストール
    Java のバージョンを確認する
  3. 次のコマンドを実行すると、JAVA_HOME ディレクトリの場所を見つけることができます。 記事の後半で必要になるテキスト ファイル内の場所に注意してください。
    dirname $(dirname $(readlink -f $(which java)))
    

    Ubuntu 22.04 での Hadoop のインストール
    JAVA_HOME の場所を確認する

ステップ 2: Hadoop のユーザーを作成する

すべての Hadoop コンポーネントは、Apache Hadoop 用に作成したユーザーとして実行され、ユーザーは Hadoop の Web インターフェイスへのログインにも使用されます。 「sudo」コマンドを使用して新しいユーザー アカウントを作成するか、「root」権限を持つユーザー アカウントを作成できます。 root 権限を持つユーザー アカウントはより安全ですが、コマンド ラインに慣れていないユーザーにとっては不便かもしれません。

  1. 次のコマンドを実行して、hadoop という名前の新しいユーザーを作成します。
    sudo adduser hadoop 
    

    Ubuntu 22.04 での Hadoop のインストール
    Hadoop ユーザーの作成

  2. 新しく作成した hadoop ユーザーに切り替えます。
    su - hadoop 
    
  3. ここで、新しく作成された hadoop ユーザーのパスワードなしの SSH アクセスを構成します。 最初に SSH キー ペアを生成します。
    ssh-keygen -t rsa  
    

    Ubuntu 22.04 での Hadoop のインストール
    SSH キー ペアの生成

  4. 生成された公開鍵を承認済みの鍵ファイルにコピーし、適切な権限を設定します。
    cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys   
    chmod 640 ~/.ssh/authorized_keys    
    
  5. ここで、ローカルホストに SSH で接続してみます。
    ssh localhost 
    

    既知のホストに RSA キーを追加して、ホストを認証するよう求められます。 yes と入力して Enter キーを押し、ローカルホストを認証します。

    Ubuntu 22.04 に Hadoop をインストールする方法
    ローカルホストに ssh を接続します

ステップ 3: Ubuntu に Hadoop をインストールする

Java をインストールしたら、Apache Hadoop とそれに関連するすべてのコンポーネント (Hive、Pig、Sqoop など) をダウンロードできます。最新バージョンは、Hadoop の公式ダウンロード ページにあります。 必ずバイナリ アーカイブをダウンロードしてください (ソースではありません)。

  1. 次のコマンドを使用して、Hadoop 3.3.4 をダウンロードします。
    wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz 
    
  2. ファイルをダウンロードしたら、ハード ドライブのフォルダーに解凍できます。
    tar xzf hadoop-3.3.4.tar.gz 
    
  3. 抽出したフォルダーの名前を変更して、バージョン情報を削除します。 これはオプションの手順ですが、名前を変更したくない場合は、残りの構成パスを調整してください。
    mv hadoop-3.3.4 hadoop 
    
  4. 次に、システムで Hadoop および Java 環境変数を構成する必要があります。 ~/.bashrc ファイルを任意のテキスト エディターで開きます。
    nano ~/.bashrc 
    

    以下の行をファイルに追加します。 ターミナルで dirname $(dirname $(readlink -f $(which java))) コマンドを実行すると、JAVA_HOME の場所を見つけることができます。

    ファイルを保存して閉じます。

  5. 上記の構成を現在の環境にロードします。
    source ~/.bashrc 
    
  6. また、hadoop-env.sh ファイルで JAVA_HOME を構成する必要があります。 テキスト エディターで Hadoop 環境変数ファイルを編集します。
    nano $HADOOP_HOME/etc/hadoop/hadoop-env.sh 
    

    「export JAVA_HOME」を検索し、手順 1 で見つかった値で構成します。以下のスクリーンショットを参照してください。

    Ubuntu 22.04 に Hadoop シングルノード クラスタをインストールする
    JAVA_HOME を設定する

    ファイルを保存して閉じます。

ステップ 4: Hadoop の構成

次に、etc ディレクトリの下にある Haddop 構成ファイルを構成します。

  1. 最初に、Hadoop ホーム ディレクトリ内に namode および datanode ディレクトリを作成する必要があります。 次のコマンドを実行して、両方のディレクトリを作成します。
    mkdir -p ~/hadoopdata/hdfs/namenode,datanode 
    
  2. 次に、 core-site.xml ファイルを作成し、システムのホスト名で更新します。
    nano $HADOOP_HOME/etc/hadoop/core-site.xml 
    

    システムのホスト名に従って次の名前を変更します。

    ファイルを保存して閉じます。

  3. 次に、 hdfs-site.xml ファイル:
    nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml 
    

    以下に示すように、NameNode および DataNode ディレクトリ パスを変更します。

    ファイルを保存して閉じます。

  4. 次に、 mapred-site.xml ファイル:
    nano $HADOOP_HOME/etc/hadoop/mapred-site.xml 
    

    次の変更を行います。

    ファイルを保存して閉じます。

  5. 次に、 ヤーンサイト.xml ファイル:
    nano $HADOOP_HOME/etc/hadoop/yarn-site.xml 
    

    次の変更を行います。

    ファイルを保存して閉じます。

ステップ 5: Hadoop クラスターを起動する

Hadoop クラスターを開始する前。 Namenode を Hadoop ユーザーとしてフォーマットする必要があります。

  • 次のコマンドを実行して、Hadoop Namenode をフォーマットします。
    hdfs namenode -format  
    

    namode ディレクトリが hdfs ファイル システムで正常にフォーマットされると、「ストレージ ディレクトリ /home/hadoop/hadoopdata/hdfs/namenode が正常にフォーマットされました」。

    Ubuntu 22.04 に Hadoop をインストールする方法
    フォーマットナモード

  • 次に、次のコマンドで Hadoop クラスターを開始します。
    start-all.sh  
    

    Ubuntu 22.04 に Hadoop をインストールする方法
    Hadoop サービスを開始する

  • すべてのサービスが開始したら、http://localhost:9870 で Hadoop にアクセスできます。

    Ubuntu 22.04 に Hadoop をインストールする方法

  • また、Hadoop アプリケーション ページは http://localhost:8088 にあります。

    Ubuntu 22.04 に Hadoop をインストールする方法

結論

Ubuntu に Apache Hadoop をインストールすることは、特にドキュメントの指示に従うだけの場合、初心者にとっては難しい作業になる可能性があります。 ありがたいことに、この記事では、Apache Hadoop を Ubuntu に簡単にインストールするのに役立つステップバイステップのガイドを提供します。 この記事に記載されている手順に従うだけで、Hadoop のインストールがすぐに開始され、実行されるようになります。

次の投稿
直射日光を好む5つの植物
前の投稿
Musk が主導権を握り、インドが新しい IT 規則を導入する中、Twitter は「ただの鳥」になるのか、それとも翼を切られるのか?

ノート:

AZ: 動物の世界、ペット、ペット、野生の自然に関するカテゴリー記事…
SP:スポーツカテゴリー。
New vs Ne: ニュースコラム。
Te: テクノロジー カテゴリ。
Gt:エンターテインメントカテゴリー。
Bt: 占い、星占い、超常現象、超常現象。
Ta:人生コラム。