Оценка стоимости архивирования данных

Уровень архива — это автономный уровень для хранения данных, которые редко обращаются. Уровень доступа к архиву имеет наименьшую стоимость хранения. Однако этот уровень имеет более высокие затраты на получение данных с более высокой задержкой по сравнению с горячими, холодными и холодными уровнями.

В этой статье объясняется, как вычислить стоимость использования архивного хранилища, а затем представить несколько примеров сценариев.

Расчет затрат

Затраты на архивные данные являются производными от этих трех компонентов:

  • Затраты на запись данных на архивный уровень
  • Затраты на хранение данных на уровне архива
  • Затраты на восстановление данных из архивного уровня

В следующих разделах показано, как вычислить каждый компонент.

В этой статье используются вымышленные цены во всех вычислениях. Эти примеры цен можно найти в разделе " Примеры цен " в конце этой статьи. Эти цены предназначены только в качестве примеров и не должны использоваться для вычисления затрат.

Официальные цены см. в Хранилище BLOB-объектов Azure ценах или ценах на Azure Data Lake Storage. Дополнительные сведения о том, как выбрать правильную страницу ценообразования, см. в статье "Общие сведения о полной модели выставления счетов для Хранилище BLOB-объектов Azure".

Затраты на запись

Вы можете вычислить стоимость записи на архивный уровень, умножив количество операций записи на цену каждой операции. Цена операции зависит от тех, которые используются для записи данных на архивный уровень.

вставка большого двоичного объекта;

Если вы используете операцию Put BLOB-объектов , количество операций совпадает с числом больших двоичных объектов. Например, если вы планируете записывать 30 000 больших двоичных объектов на архивный уровень, то для этого требуется 30 000 операций. Каждая операция взимается за цену операции записи архива.

Совет

Счета за операции выставляются за 10 000. Таким образом, если цена за 10 000 операций составляет $ 0,10, то цена одной операции составляет $ 0,10 / 10 000 = $ 0,00001.

Поместите список блоков и поместите список блоков

Если вы отправляете большой двоичный объект с помощью операций Put Block и Put Block List , то для отправки требуется несколько операций, а каждая из этих операций взимается отдельно. Каждая операция Put Block взимается по цене операции записи для уровня доступа по умолчанию учетных записей. Количество операций put Block, необходимых для отправки данных, зависит от размера блока, указанного для отправки данных. Например, если размер большого двоичного объекта составляет 100 МиБ, и при отправке этого большого двоичного объекта вы выберете размер блока до 10 МиБ, то при отправке этого большого двоичного объекта будет использоваться 10 операций put Block . Блоки записываются на архивный уровень с помощью операции Put Block List . Эта операция взимается за цену операции записи архива. Таким образом, чтобы отправить один большой двоичный объект, ваша стоимость — это (количество блоков * для горячей операции записи) + цена операции записи архива.

Примечание.

Если вы не используете пакет SDK или REST API напрямую, вам может потребоваться изучить операции, которые средство передачи данных использует для отправки файлов. Вы можете определить это, потянувшись к поставщику инструментов или используя журналы хранения.

Установка уровня большого двоичного объекта

Если для перемещения большого двоичного объекта из холодного, холодного или горячего уровня в архивный уровень используется операция set BLOB-объектов, взимается плата за операцию записи архива.

Стоимость хранения

Вы можете вычислить затраты на хранилище, умножив размер данных в ГБ на цену архивного хранилища.

Например,если вы планируете хранить 10 ТБ на архивный уровень, стоимость емкости составляет $0,002 * 10 * 1024 = $20,48 в месяц.

Затраты на восстановление

Большие двоичные объекты на уровне архива находятся в автономном режиме и не могут быть прочитаны или изменены. Чтобы считывать или изменять данные в архивном BLOB-объекте, необходимо сначала восстановить большой двоичный объект на сетевой уровень (горячий или холодный уровень).

Вы можете вычислить затраты для повторного восстановления данных, добавив затраты для получения данных в стоимость чтения данных.

Предполагая выборку цен, стоимость получения 1 ГБ данных из архивного уровня будет составлять 1 * $0,022 = $0,022.

Операции чтения выставляются за 10 000. Таким образом, если стоимость за 10 000 операций составляет $ 5,50, то стоимость одной операции составляет $ 5,50 / 10 000 = $ 0,00055. Стоимость чтения 1000 больших двоичных объектов по стандартному приоритету составляет 1000 * $ 0,0005 = $ 0,50.

В этом примере общая стоимость восстановления (извлечение и чтение) составит $0,022 + $0,50 = $0,52.

Примечание.

Если для приоритета восстановления задано значение высокого уровня, увеличение частоты извлечения и чтения данных.

Если вы планируете восстановить данные, следует попытаться избежать платы за досрочное удаление. Чтобы просмотреть параметры, см . статью о повторном извлечении BLOB-объектов из архивного уровня.

Сценарий: однократное резервное копирование данных

В этом сценарии предполагается, что вы планируете удалить локальные ленты или файловые серверы путем переноса данных резервного копирования в облачное хранилище. Если вы не ожидаете, что пользователи будут получать доступ к этим данным часто, то может потребоваться перенести эти данные непосредственно на архивный уровень. В первом месяце вы предполагаете стоимость записи данных на архивный уровень. В оставшиеся месяцы вы будете платить только за затраты на хранение данных и затраты на восстановление данных по мере необходимости для случайной операции чтения.

Используя примеры цен, отображаемых в этой статье, в следующей таблице показаны три месяца расходов.

В этом сценарии предполагается, что первоначальный прием 2000 000 файлов составляет 102 400 ГБ в архиве. Он также предполагает однократное чтение каждый месяц около 1% архивной емкости. Операция, используемая этим сценарием , является операцией Put BLOB-объектов . В этом сценарии также предполагается, что большие двоичные объекты регидратируются путем копирования больших двоичных объектов вместо изменения уровня доступа большого двоичного объекта.

Коэффициент стоимости января февраля марта Проецируемый год
Операции записи 2 000 000 0 0 2 000 000
Цена одной операции записи $0,000011 $0,000011 $0,000011 $0,000011
Затраты на запись (операции * цена операции записи) $22,00 $0,00 $0,00 $22,00
Общий размер файла (ГБ) 102 400 102 400 102 400 1,228,800
Цены на данные (оплата по мере использования) $0,002 $0,002 $0,002 $0,002
Стоимость хранения (размер файла * цена на данные) $204.80 $204.80 $204.80 $2457,60
Размер извлечения данных (1% от размера файла) 1024 1024 1024 12,288
Цена получения данных 0,022 долл. США 0,022 долл. США 0,022 долл. США 0,022 долл. США
Затраты на получение (размер извлечения данных * цена извлечения) $22,53 $22,53 $22,53 $270,34
Количество операций чтения (число файлов * 1%) 20,000 20,000 20,000 240,000
Цена одной операции чтения $0,000555 $0,0005 5 $0,000555 $0,000555
Стоимость чтения (операции * цена операции чтения) $11,00 $11,00 $11,00 $132.00
Затраты на восстановление (затраты для получения и затрат для чтения) $33,53 $33,53 $33,53 $402.34
Общая стоимость (запись и хранение и восстановление) $260,33 $238,33 $238,33 $2,881,94

Совет

Чтобы моделировать затраты в течение 12 месяцев, откройте вкладку однократного резервного копирования этой книги. Вы можете обновить цены и значения на этом листе, чтобы оценить затраты.

Сценарий: непрерывный уровень

В этом сценарии предполагается, что вы планируете периодически перемещать данные на архивный уровень. Возможно, вы используете отчеты инвентаризации хранилища BLOB-объектов для оценки того, к каким большим двоичным объектам обращаются реже, а затем используете политики управления жизненным циклом для автоматизации процесса архивации.

Каждый месяц вы предполагаете стоимость записи на архивный уровень. Затраты на хранение и повторное восстановление данных будут увеличиваться с течением времени, так как архивировать больше больших двоичных объектов.

Используя примеры цен, отображаемых в этой статье, в следующей таблице показаны три месяца расходов.

В этом сценарии предполагается, что ежемесячный прием 200 000 файлов составляет 10 240 ГБ для архивирования. Он также предполагает однократное чтение каждый месяц около 1% архивной емкости. Операция, используемая этим сценарием , является операцией Put BLOB-объектов .

Коэффициент стоимости января февраля марта Проецируемый год
Операции записи 200 000 200 000 200 000 2,400,000
Цена одной операции записи $0,000011 $0,000011 $0,000011
Затраты на запись (операции * цена операции записи) $2,20 $2,20 $2,20 $26,40
Number of files 200 000 400 000 600,000 2,400,000
Общий размер файла (ГБ) 10 240 20,480 39,720 122,880
Цены на данные (оплата по мере использования) $0,002 $0,002 $0,002
Стоимость хранения (размер файла * цена на данные) $10,14 $20,28 $30,41 $1597,44
Размер извлечения данных (1% от размера файла) 102 205 307 7,987
Цена получения данных 0,022 долл. США 0,022 долл. США 0,022 долл. США
Затраты на получение (размер извлечения данных * цена извлечения) $2,25 $4,51 $6,76 $175,72
Количество операций чтения (число файлов * 1% чтения) 2 000 4000 6000 156,000
Цена одной операции чтения $0,000555 $0,000555 $0,000555
Стоимость чтения (операции * цена для чтения) $1,10 $2,20 $3,30 $85,80
Затраты на восстановление (затраты для получения и затрат для чтения) $3,35 $6,71 $10,06 $261,52
Общая стоимость $26,03 $49,87 $73,70 $1,885.36

Совет

Чтобы моделировать затраты в течение 12 месяцев, откройте вкладку непрерывного уровня этой книги. Вы можете обновить цены и значения на этом листе, чтобы оценить затраты.

Архив и холодный и холодный

Хранилище архивов — это самый низкий уровень затрат. Однако для восстановления 10-ГиБ-файлов может потребоваться до 15 часов. Дополнительные сведения см. в статье о повторном извлечении BLOB-объектов из архивного уровня. Уровень архива может быть не лучшим, если рабочие нагрузки должны быстро считывать данные. Холодный уровень предлагает почти задержку чтения в режиме реального времени с более низкой ценой, чем это горячий уровень. Понимание требований к доступу помогает выбрать между холодными, холодными и архивными уровнями.

В следующей таблице сравнивается стоимость архивного хранилища с стоимостью холодного и холодного хранения, используя примеры цен , отображаемых в этой статье. В этом сценарии предполагается, что ежемесячный прием 200 000 файлов составляет 10 240 ГБ для архивирования. Он также предполагает 1 чтение каждый месяц около 10% сохраненной емкости (10 024 ГБ), а также 10% общих операций (20 000).

Коэффициент стоимости Архив низкая Холодный
Операции записи 200 000 200 000 200 000
Цена одной операции записи $0,000011 $0,000018 $0,00001
Затраты на запись (операции * цена операции записи) $2,20 $3,60 $2,00
Общее число файлов 200 000 200 000 200 000
Общий размер файла (ГБ) 10 240 10 240 10 240
Цены на данные (оплата по мере использования) $0,0020 $0,0045 $0,0115
Стоимость хранения (размер файла * цена на данные) $20,48 $46,08 $117,76
Размер извлечения данных (10 % от размера файла) 1024 1024 1024
Цена получения данных на ГБ 0,022 долл. США $0,03 0,01 долл. США
Количество операций чтения (число файлов * 10 % чтения) 20,000 20,000 20,000
Цена одной операции чтения $0,000555 $0,00001 $0,000001
Стоимость чтения (операции * цена для чтения) $11,00 $.20 $.02
Затраты на восстановление (затраты для получения и затрат для чтения) $30,48 $30,92 $10,26
Ежемесячная стоимость $42,62 $71,38 $167.91

Совет

Чтобы моделировать затраты, откройте вкладку "Выбор уровней " этой книги. Вы можете обновить цены и значения на этом листе, чтобы оценить затраты.

На следующей диаграмме показано влияние на ежемесячные расходы с учетом различных процентных значений чтения. На этой диаграмме предполагается, что ежемесячный прием 1000 000 файлов составляет 10 240 ГБ. При условии, что выборка цен на эту диаграмму показывает точку останова на уровне чтения на 25 % или около 25 %. После этого стоимость архивного хранилища начинает расти относительно стоимости холодного хранилища.

Холодные и архивные ежемесячные расходы

Примеры цен

В следующей таблице приведены примеры (вымышленные) цены для каждого запроса к конечной точке службы BLOB-объектов (blob.core.windows.net).

Внимание

Эти цены предназначены только в качестве примеров и не должны использоваться для вычисления затрат. Официальные цены см. на страницах цен на Хранилище BLOB-объектов Azure или azure Data Lake Storage. Дополнительные сведения о том, как выбрать правильную страницу ценообразования, см. в статье "Общие сведения о полной модели выставления счетов для Хранилище BLOB-объектов Azure".

Прайс-фактор высокая Холодный низкая Архив
Цена операций записи (за 10 000) $0,055 0,10 долл. США 0,18 долл. США $0,11
Цена операций чтения (за 10 000) $0,0044 0,01 долл. США 0,10 долл. США $5,50
Операции списка и контейнера (на 10 000) $0,055 $0,055 $0,065 $.055
Все остальные операции (за 10 000) $0,0044 $0,0044 $0,0052 $.0044
Цена получения данных (на ГБ) Бесплатно 0,01 долл. США $0,03 $.022
Цена хранилища данных в первую очередь 50 ТБ (оплата по мере использования) $0,0208 $0,0115 $0,0045 $0,002
Цена хранилища данных на следующий 450 ТБ (оплата по мере использования) $0,020 $0,0115 $0,0045 $0,002
Цена на 100 ТБ (резервная емкость за один год) $1747 $966 Недоступно $183
Цена на 100 ТБ (трехлетний зарезервированный объем) $1406 872 долл. США Недоступно 168 долл. США
Пропускная способность сети между регионами в Северная Америка (на ГБ) $0,02 $0,02 $0,02 $0,02
Цена высокоприоритетных операций чтения (на 10 000) Неприменимо Нет данных Неприменимо $65,00
Цена получения данных с высоким приоритетом (на ГБ) Неприменимо Нет данных Неприменимо 0,13 долл. США

В следующей таблице приведены примеры цен (вымышленные) цены для каждого запроса к конечной точке Data Lake Storage (dfs.core.windows.net). Сведения о официальных ценах см. в разделе о ценах на Azure Data Lake Storage.

Прайс-фактор высокая Холодный низкая Архив
Цена операций записи (каждые 4 МиБ, за 10 000) $0,07120 0,13 долл. США $0,234 $0,143
Цена операций чтения (каждые 4 МиБ, за 10 000) $0,0057 $0,013 0,13 долл. США $7,15
Итеративные операции записи (на 100) $0,0715 $0,0715 $0,0715 $0,0715
Итеративные операции чтения (на 10 000) $0,0715 $0,0715 $0,0845 $0,0715
Цена получения данных (на ГБ) Бесплатно 0,01 долл. США $0,03 0,022 долл. США
Пропускная способность сети между регионами в Северная Америка (на ГБ) $0,02 $0,02 $0,02 $0,02
Цены на хранилище данных сначала 50 ТБ (оплата по мере использования) $0,021 $0,012 $0,0045 $0,002
Цены на хранилище данных на следующий 450 ТБ (оплата по мере использования) $0,020 $0,012 $0,0045 $0,002
Цена на 100 ТБ (резервная емкость за один год) $1747 $966 Недоступно $183
Цена на 100 ТБ (трехлетний зарезервированный объем) $1406 872 долл. США Недоступно 168 долл. США
Цена высокоприоритетных операций чтения (на 10 000) Неприменимо Нет данных Неприменимо $84,50
Цена получения данных с высоким приоритетом (на ГБ) Неприменимо Нет данных Неприменимо 0,13 долл. США
Индекс (ГБ / месяц) $0,0297 Неприменимо Нет данных Неприменимо

Следующие шаги