チュートリアル:NFS 経由で Azure Data Box Heavy にデータをコピーする

[アーティクル]
06/01/2023

このチュートリアルでは、ローカル Web UI を使用してホストコンピューターに接続し、そこからデータをご利用の Azure Data Box Heavy にコピーする方法について説明します。

このチュートリアルでは、以下の内容を学習します。

前提条件
Data Box Heavy に接続する
データを Data Box Heavy にコピーする

前提条件

開始する前に次の点を確認します。

チュートリアル:Azure Data Box Heavy の設定。
Data Box Heavy の受け取りが済んでいて、ポータル内での注文の状態が [配送済み] であること。
Data Box Heavy にコピーするデータが格納されているホストコンピューターがあること。このホストコンピューターは次の条件を満たしている必要があります。
- サポート対象のオペレーティングシステムが実行されていること。
- 高速ネットワークに接続していること。最速のコピー速度を得るため、2 つの 40 GbE 接続 (ノードごとに 1 つずつ) を並列で利用できます。 40 GbE 接続を使用できない場合は、少なくとも 2 つの 10 GbE 接続 (ノードごとに 1 つずつ) を使用することをお勧めします。

Data Box Heavy に接続する

選択したストレージアカウントに基づいて、Data Box Heavy では最大で次のものが作成されます。

GPv1 および GPv2 に対して関連付けられているストレージアカウントごとに 3 つの共有。
Premium ストレージに対して 1 つの共有。
BLOB ストレージアカウントに対して 1 つの共有。

これらの共有はデバイスの両方のノード上に作成されます。

ブロック BLOB およびページ BLOB の共有の場合:

第 1 レベルのエンティティはコンテナーです。
第 2 レベルのエンティティは BLOB です。

Azure Files の共有の場合:

第 1 レベルのエンティティは共有です。
第 2 レベルのエンティティはファイルです。

次の表は、Data Box Heavy 上の共有への UNC パスと、データのアップロード先である Azure Storage のパスの URL を示しています。 Azure Storage の最終的なパスの URL は、UNC 共有パスから導き出すことができます。

ストレージ	UNC パス
Azure ブロック BLOB	共有への UNC パス: `//<DeviceIPAddress>/<StorageAccountName_BlockBlob>/<ContainerName>/files/a.txt` Azure Storage の URL: `https://<StorageAccountName>.blob.core.windows.net/<ContainerName>/files/a.txt`
Azure ページ BLOB	共有への UNC パス: `//<DeviceIPAddres>/<StorageAccountName_PageBlob>/<ContainerName>/files/a.txt` Azure Storage の URL: `https://<StorageAccountName>.blob.core.windows.net/<ContainerName>/files/a.txt`
Azure Files	共有への UNC パス: `//<DeviceIPAddres>/<StorageAccountName_AzFile>/<ShareName>/files/a.txt` Azure Storage の URL: `https://<StorageAccountName>.file.core.windows.net/<ShareName>/files/a.txt`

Linux ホストコンピューターを使用している場合は、次の手順を行って、NFS クライアントへのアクセスを許可するように、ご利用のデバイスを構成します。

共有にアクセスできる許可するクライアントの IP アドレスを指定します。ローカル Web UI で、 [接続とコピー] ページに移動します。 [NFS の設定] で、 [NFS のクライアントアクセス] をクリックします。
NFS クライアントの IP アドレスを指定して、 [追加] をクリックします。この手順を繰り返すことにより、複数の NFS クライアントに対するアクセスを構成できます。 [OK] をクリックします。
Linux ホストコンピューターにサポートされているバージョンの NFS クライアントがインストールされていることを確認します。お使いの Linux ディストリビューションの特定のバージョンを使用します。
NFS クライアントをインストールした後、次のコマンドを使用して、Data Box デバイスに NFS 共有をマウントします。

sudo mount <Data Box Heavy device IP>:/<NFS share on Data Box Heavy device> <Path to the folder on local Linux computer>

NFS 経由で Data Box Heavy の共有に接続する方法の例を次に示します。 Data Box Heavy の IP は 10.161.23.130 で、共有 Mystoracct_Blob は ubuntuVM にマウントされており、マウントポイントは /home/databoxheavyubuntuhost/databoxheavy です。

sudo mount -t nfs 10.161.23.130:/Mystoracct_Blob /home/databoxheavyubuntuhost/databoxheavy

Mac クライアントの場合は、次のように、さらにオプションを追加する必要があります。

sudo mount -t nfs -o sec=sys,resvport 10.161.23.130:/Mystoracct_Blob /home/databoxheavyubuntuhost/databoxheavy

常にコピーしようとするファイル用のフォルダーを共有下に作成してから、ファイルをそのフォルダーにコピーします。ブロック BLOB およびページ BLOB の共有の下に作成したフォルダーは、データが BLOB としてアップロードされるコンテナーになります。ストレージアカウント内の root フォルダーに直接ファイルをコピーすることはできません。

データを Data Box Heavy にコピーする

Data Box Heavy 共有に接続したら、次の手順はデータのコピーです。データのコピーを開始する前に、次の考慮事項を確認してください。

適切なデータ形式に対応する共有にデータをコピーする必要があります。たとえば、ブロック BLOB データは、ブロック BLOB 用の共有にコピーしてください。 VHD をページ BLOB にコピーします。データ形式が適切な共有の種類と一致しない場合、後続の手順で、Azure へのデータのアップロードに失敗します。
データのコピー中は、そのサイズが Azure Storage と Data Box Heavy の制限に関するページに記載されたサイズ制限に準拠していることを確実にしてください。
Data Box Heavy によってアップロードされているデータが、Data Box Heavy の外部で別のアプリケーションによって同時にアップロードされた場合、アップロードジョブエラーやデータの破損が生じる可能性があります。
SMB と NFS の両方を同時に使用しないこと、または同じデータを Azure 上の同じ最終コピー先にコピーしないことをお勧めします。このような場合は、最終的な結果がわからなくなります。
常にコピーしようとするファイル用のフォルダーを共有下に作成してから、ファイルをそのフォルダーにコピーします。ブロック BLOB およびページ BLOB の共有の下に作成したフォルダーは、データが BLOB としてアップロードされるコンテナーになります。ストレージアカウント内の root フォルダーに直接ファイルをコピーすることはできません。
大文字と小文字を区別するディレクトリとファイル名を NFS 共有から Data Box Heavy 上の NFS に取り込む場合:
- 名前の大文字と小文字の区別は保持されます。
- ファイルの大文字と小文字は区別されません。
たとえば、SampleFile.txt と Samplefile.Txt をコピーする場合、デバイスにコピーされるときに名前の大文字と小文字の区別は保持されますが、2 番目のファイルによって最初のファイルは上書きされます。これは、これらが同じファイルと見なされるためです。

Linux ホストコンピューターを使用している場合は、Robocopy のようなコピーユーティリティを使用します。 Linux で使用できる代替手段は、rsync、FreeFileSync、Unison、Ultracopier などです。

cp コマンドは、ディレクトリをコピーするのに最適なオプションの 1 つです。使用方法について詳しくは、cp の man ページをご覧ください。

マルチスレッドのコピーに rsync オプションを使用する場合は、以下のガイドラインに従ってください。

Linux クライアントで使用されているファイルシステムに応じて、CIFS Utils または NFS Utils パッケージをインストールします。

sudo apt-get install cifs-utils

sudo apt-get install nfs-utils
Rsync および Parallel をインストールします (Linux ディストリビューションのバージョンによって異なります)。

sudo apt-get install rsync

sudo apt-get install parallel
マウントポイントを作成します。

sudo mkdir /mnt/databoxheavy
ボリュームをマウントします。

sudo mount -t NFS4 //Databox-heavy-IP-Address/share_name /mnt/databoxheavy
フォルダーのディレクトリ構造をミラー化します。

rsync -za --include='*/' --exclude='*' /local_path/ /mnt/databoxheavy
ファイルをコピーします。

cd /local_path/; find -L . -type f | parallel -j X rsync -za {} /mnt/databoxheavy/{}

j は並列化の数を指定し、X は並列コピーの数です

16 並列コピーから始めて、使用可能なリソースに応じてスレッドの数を増やすことをお勧めします。

重要

Linux ファイルの種類のうち、シンボリックリンク、文字ファイル、ブロックファイル、ソケット、パイプはサポートされていません。これらのファイルの種類を使用すると、発送準備手順でエラーが発生します。

コピー先フォルダーを開いて、コピー済みのファイルを表示し、確認します。コピー処理中にエラーが発生した場合は、トラブルシューティングのためにエラーファイルをダウンロードします。詳細については、データを Data Box Heavy にコピーしている間のエラーログの表に関するページを参照してください。データコピー中のエラーの詳細な一覧については、Data Box Heavy の問題のトラブルシューティングに関するページを参照してください。

データの整合性を保証するため、データがコピーされるときにインラインでチェックサムが計算されます。コピーが完了したら、デバイスで使用済み領域と空き領域を確認します。

ダッシュボードで空き領域と使用済み領域を確認する

次のステップ

このチュートリアルでは、Azure Data Box Heavy に関する次のようなトピックについて説明しました。

前提条件
Data Box Heavy に接続する
データを Data Box Heavy にコピーする

次のチュートリアルに進み、お客様の Data Box を Microsoft に返送する方法を学習してください。

Azure Data Box Heavy を Microsoft に発送する

次の方法で共有

チュートリアル:NFS 経由で Azure Data Box Heavy にデータをコピーする

前提条件

Data Box Heavy に接続する

データを Data Box Heavy にコピーする

次のステップ

フィードバック

その他のリソース