Azure 資料箱限制

當您部署和操作 Microsoft Azure 資料箱時,請考慮這些限制。 下表描述資料箱的這些限制。

資料箱服務限制

  • 如果搭配資料箱服務使用多個儲存體帳戶,則所有儲存體帳戶都應屬於相同的 Azure 區域。
  • 我們建議您使用三個以下的儲存體帳戶。 若使用多個儲存體帳戶,可能會影響效能。

資料箱限制

  • 資料箱最多可以儲存 5 億個檔案,且可供匯入和匯出。
  • 資料箱在雲端中最多支援 512 個容器或共用。 使用者共用內的最上層目錄,會成為雲端中的容器或 Azure 檔案共用。
  • 資料箱使用量容量可能會因為 ReFS 中繼資料空間耗用而小於 80 TiB。
  • 資料箱在 NFS 共用上一次最多支援 10 個用戶端連線。

Azure 儲存體限制

本節說明 Azure 儲存體服務的限制,以及適用於資料箱服務的 Azure 檔案、Azure 區塊 Blob 和 Azure 分頁 Blob 所需的命名慣例。 請仔細檢閱儲存體限制,並遵循所有的建議。

如需與 Azure 儲存體服務限制以及命名共用、容器和檔案的最佳作法有關的最新資訊,請移至:

重要

如果有任何檔案或目錄超出 Azure 儲存體服務的限制,或是不符合 Azure 檔案儲存體/Blob 命名慣例,系統就不會透過資料箱服務將這些檔案或目錄擷取到 Azure 儲存體中。

資料複製和上傳注意事項

針對匯入順序

資料箱的匯入順序注意事項包括:

  • 容器、共用和資料夾:
    • 請勿直接將檔案複製到任何預先建立的共用。 您需要在共用底下建立資料夾,然後再將檔案複製到該資料夾。
    • StorageAccount_BlockBlob 和 StorageAccount_PageBlob 底下的資料夾是容器。 例如,容器會建立為 StorageAccount_BlockBlob/container 和 StorageAccount_PageBlob/container
    • 只要是直接在 StorageAccount_AzFile 底下建立的每個資料夾,都會轉譯為 Azure 檔案共用。
    • Azure Blob 儲存體不支援目錄。 如果您在 StorageAccount_BlockBlob 資料夾底下建立資料夾,則會以 Blob 名稱建立虛擬資料夾。 對於 Azure 檔案服務,則會維持實際的目錄結構。
  • 合併資料夾內容:
    • 寫入 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 共用中的每個檔案,分別會以區塊 Blob 和分頁 Blob 的形式上傳。
    • 如果資料夾的名稱與現有容器相同,資料夾的內容就會與容器的內容合併。 尚未存至雲端的檔案或 Blob 會新增至容器。 如果檔案或 Blob 的名稱與容器中的檔案或 Blob 相同,則會覆寫現有的檔案或 Blob。
    • 如果容器有名稱相同的現有封存 Blob,則上傳至封存層的 Blob 將會失敗。 當 blob 位於封存層時,無法讀取或修改。 如果您需要覆寫 Blob,請確定 Blob 沒有設定為封存。 如需詳細資訊,請參閱封存存取層
    • 在 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 資料夾底下建立的所有空目錄階層 (不含任何檔案) 都不會上傳。
  • Azure 資料箱不支援將資料匯入 NFS Azure 檔案共用。 若將資料從資料箱複製到與來源資料夾名稱相同的現有 NFS Azure 檔案共用中,將會產生衝突。 為了解決衝突,資料箱會將來源共用重新命名為 databox-<GUID>,並將其上傳至目標儲存體帳戶作為 SMB Azure 檔案共用。
  • 如果您同時針對資料副本使用 SMB 和 NFS 通訊協定,建議您:
    • 針對 SMB 和 NFS 使用不同儲存體帳戶。
    • 請勿使用 SMB 和 NFS,將相同的資料複製到 Azure 中的相同最終目的地。 在這類情況下,無法判斷最後的結果。
    • 雖然同時透過 SMB 和 NFS 複製資料可以順利運作,但我們不建議這麼做,因為很容易發生人為錯誤。 等待 SMB 資料複製完成,再開始 NFS 資料複製。
  • 上傳管理:
    • 如果將資料上傳至 Azure 時發生任何錯誤,則會在目標儲存體帳戶中建立錯誤記錄。 上傳完成後,系統會提供此錯誤記錄的路徑,方便您檢閱記錄以執行矯正措施。 若未事先確認已上傳的資料,請勿從來源刪除資料。
    • 將資料上傳至 Azure 檔案儲存體時,可以參考使用 Azure 資料箱來保留檔案 ACL、屬性和時間戳記,依照其中的指引保留檔案中繼資料和 NTFS 權限。
    • 上傳至雲端時,Blob 和 Azure 檔案儲存體都會維持檔案的階層。 例如,您複製了以下路徑的檔案:<container folder>\A\B\C.txt。 則此檔案會上傳至雲端中的相同路徑。
    • 如果上傳期間檔案的 CreateTimeLastWriteTime 欄位超過允許的大小,「Fri, 31 Dec 9999 23:59:59」就會取代 Azure 檔案屬性中的原始日期。 檔案上傳成功,而且沒有引發任何錯誤。

針對匯出順序

資料箱的匯出順序注意事項包括:

  • 資料箱是 Windows 型裝置,不支援區分大小寫的檔案名稱。 例如,您在 Azure 中可能有兩個不同的檔案,兩者的名稱只有大小寫不同。 請勿使用資料箱來匯出這類檔案,因為檔案會在裝置上遭覆寫。
  • 如果您的輸入檔案中有重複的標記,或是有標記參考相同資料,資料箱匯出作業可能會略過或覆寫檔案。 Azure 入口網站顯示的檔案數和資料大小,可能與裝置上的實際資料大小不同。
  • 資料箱會透過 SMB 將資料匯出至 Windows 型系統,並受限於 SMB 的檔案和資料夾限制。 系統不會匯出名稱不受支援的檔案和資料夾。
  • 從前置詞與容器間有 1:1 對應。
  • 檔案名稱大小上限為 1024 個字元。 系統不會匯出超過此長度的檔案名稱。
  • 匯出了 xml 檔案 (建立順序期間所上傳) 中重複的前置詞。 系統不會忽略重複的前置詞。
  • 分頁 Blob 和容器名稱區分大小寫。 如果大小寫不符,就會找不到 Blob 和/或容器。

Azure 儲存體帳戶大小限制

以下是複製到儲存體帳戶中的資料大小限制。 請確定您上傳的資料符合這些限制。 如需這些限制的最新資訊,請參閱 Blob 儲存體的可擴縮性和效能目標,以及 Azure 檔案儲存體可擴縮性和效能目標

複製到 Azure 儲存體帳戶中的資料大小 預設限制
區塊 Blob 和分頁 Blob 上限與針對 Azure 訂閱定義的儲存體限制相同,包含來自資料箱等所有來源的資料。
Azure 檔案 數據箱支援 Azure 進階檔案共享,允許記憶體帳戶中所有共用總共 100 TiB。 由於複製記錄和稽核記錄所使用的空間,可用容量上限會稍微減少一些。 系統會為複製記錄和稽核記錄各保留至少 100 GiB 的容量。 如需詳細資訊,請參閱 Azure 資料箱、Azure Data Box Heavy 的稽核記錄。 StorageAccount_AzFile 下方的所有資料夾都必須遵循此限制。 如需詳細資訊,請參閱建立 Azure 檔案共用

Azure 物件大小限制

以下是可寫入的 Azure 物件大小。 請確定所有上傳的檔案均符合這些限制。

Azure 物件類型 預設限制
區塊 Blob 14 TiB
分頁 Blob 4 TiB
以分頁 Blob 格式上傳的每個檔案都必須是 512 位元組規格 (整數倍數),否則上傳會失敗。
VHD 和 VHDX 為 512 位元組規格。
Azure 檔案 4 TiB
受控磁碟 4 TiB
如需大小和限制的更多資訊,請參閱:
  • 標準 SSD 的可擴縮性目標
  • 進階 SSD 的可擴縮性目標
  • 標準 HDD 的可擴縮性目標
  • 受控磁碟的定價和計費
  • Azure 區塊 Blob、分頁 Blob 和檔案命名慣例

    實體 慣例
    區塊 Blob 和分頁 Blob 的容器名稱 必須是長度介於 3 到 63 個字元的有效 DNS 名稱。
    必須以字母或數字開頭。
    只能包含小寫字母、數字和連字號 (-)。
    每個連字號 (-) 的前後都必須緊鄰字母或數字。
    名稱中不允許使用連續的連字號。
    Azure 檔案的共用名稱 同上
    Azure 檔案的目錄和檔案名稱
  • 保留大小寫、不區分大小寫而且長度不得超過 255 個字元。
  • 不能以正斜線 (/) 結尾。
  • 如果有的話,則會自動移除。
  • 不允許使用下列字元:" \ / : | < > * ?
  • 保留的 URL 字元必須正確逸出。
  • 不允許使用不合法的 URL 路徑字元。 \uE000 之類的字碼元素不是有效的 Unicode 字元。 也不允許部分 ASCII 或 Unicode 字元,例如控制字元 (0x00 至 0x1F、\u0081 等等)。 如需在 HTTP/1.1 中控管 Unicode 字串的規則,請參閱 RFC 2616 第 2.2 節:基本規則和 RFC 3987。
  • 不允許使用下列檔案名稱:LPT1、LPT2、LPT3、LPT4、LPT5、LPT6、LPT7、LPT8、LPT9、COM1、COM2、COM3、COM4、COM5、COM6、COM7、COM8、COM9、PRN、AUX、NUL、CON、CLOCK$、點字元 (.) 和雙點字元 (..)。
  • 區塊 Blob 和分頁 Blob 的 Blob 名稱
  • Blob 名稱會區分大小寫,而且可以包含字元的任意組合。
  • Blob 名稱長度必須介於 1 到 1,024 個字元之間。
  • 保留的 URL 字元必須正確逸出。
  • 構成 Blob 名稱的路徑區段數目不可超過 254 個。 路徑線段是連續分隔符號字元 (例如,正斜線 '/') 之間的字串,會對應到虛擬目錄的名稱。