付録 A : SQL Server の正常性モニタリング

更新 : 2009-04-30

Microsoft SQL Server 2005 には、データベースのモニタリング ツールがあります。その 1 つは、動的管理ビューです。動的管理ビュー (DMV) と動的管理関数 (DMF) は、サーバーの状態に関する情報を返します。この情報は、サーバー インスタンスの正常性モニタリング、問題の診断、およびパフォーマンス チューニングに使用できます。

一般的なサーバーの動的管理オブジェクトには次のものがあります。

  • dm_db_* : データベースおよびデータベース オブジェクト

  • dm_exec_* : ユーザー コードおよび関連する接続の実行

  • dm_os_* : メモリ、ロック、およびスケジュール

  • dm_tran_* : トランザクションと分離

  • dm_io_* : ネットワークおよびディスク I/O

このセクションでは、SQL Server の正常性モニタリングによく使用される動的管理ビューおよび関数に対するクエリを示します。

サンプル クエリ

次のクエリを実行すると、すべての DMV および DMF の名前を取得できます。

SELECT * FROM sys.system_objects
WHERE name LIKE 'dm_%'
ORDER BY name

CPU ボトルネックのモニタリング

多くの場合、CPU ボトルネックは、最適化されていないクエリ プラン、不適切な構成、不適切な設計要素、またはハードウェア リソースの不足によって生じます。CPU ボトルネックの原因を特定するために広く使用されているクエリを次に示します。

次のクエリは、現在キャッシュされているバッチまたはプロシージャのうち、CPU を最も多く使用しているものの詳細を表示します。

SELECT TOP 50 
      SUM(qs.total_worker_time) AS total_cpu_time, 
      SUM(qs.execution_count) AS total_execution_count,
      COUNT(*) AS  number_of_statements, 
      qs.sql_handle 
FROM sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC

次のクエリは、SQL テキストを含むキャッシュされたプラン別の総 CPU 使用率を示します。

SELECT 
      total_cpu_time, 
      total_execution_count,
      number_of_statements,
      s2.text
      --(SELECT SUBSTRING(s2.text, statement_start_offset / 2, ((CASE WHEN statement_end_offset = -1 THEN (LEN(CONVERT(NVARCHAR(MAX), s2.text)) * 2) ELSE statement_end_offset END) - statement_start_offset) / 2) ) AS query_text
FROM 
      (SELECT TOP 50 
            SUM(qs.total_worker_time) AS total_cpu_time, 
            SUM(qs.execution_count) AS total_execution_count,
            COUNT(*) AS  number_of_statements, 
            qs.sql_handle --,
            --MIN(statement_start_offset) AS statement_start_offset, 
            --MAX(statement_end_offset) AS statement_end_offset
      FROM 
            sys.dm_exec_query_stats AS qs
      GROUP BY qs.sql_handle
      ORDER BY SUM(qs.total_worker_time) DESC) AS stats
      CROSS APPLY sys.dm_exec_sql_text(stats.sql_handle) AS s2 

次のクエリは、CPU 消費の平均値が最も高い 50 個の SQL ステートメントを示します。

SELECT TOP 50
total_worker_time/execution_count AS [Avg CPU Time],
(SELECT SUBSTRING(text,statement_start_offset/2,(CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, *
FROM sys.dm_exec_query_stats 
ORDER BY [Avg CPU Time] DESC

次は、過度のコンパイルと再コンパイルを検出する DMV クエリを示します。

select * from sys.dm_exec_query_optimizer_info
where 
      counter = 'optimizations'
      or counter = 'elapsed time'

次のサンプル クエリは、再コンパイルされた上位 25 個のストアド プロシージャを示します。plan_generation_num は、クエリの再コンパイルの回数を示します。

select top 25
      sql_text.text,
      sql_handle,
      plan_generation_num,
      execution_count,
      dbid,
      objectid 
from sys.dm_exec_query_stats a
      cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc

効率の悪いクエリ プランは、CPU 消費を高める原因となる場合があります。

次のクエリは、累積的な CPU の使用が最も多いクエリを示します。

SELECT 
    highest_cpu_queries.plan_handle, 
    highest_cpu_queries.total_worker_time,
    q.dbid,
    q.objectid,
    q.number,
    q.encrypted,
    q.[text]
from 
    (select top 50 
        qs.plan_handle, 
        qs.total_worker_time
    from 
        sys.dm_exec_query_stats qs
    order by qs.total_worker_time desc) as highest_cpu_queries
    cross apply sys.dm_exec_sql_text(plan_handle) as q
order by highest_cpu_queries.total_worker_time desc

次のクエリでは、CPU を集中的に使用する可能性がある %Hash Match% や %Sort% などの演算子を検出して疑わしいクエリを探すことができます。

select *
from 
      sys.dm_exec_cached_plans
      cross apply sys.dm_exec_query_plan(plan_handle)
where 
      cast(query_plan as nvarchar(max)) like '%Sort%'
      or cast(query_plan as nvarchar(max)) like '%Hash Match%'

CPU 消費を高める原因となる効率の悪いクエリ プランが検出された場合は、クエリに関連するテーブルに対して UPDATE STATISTICS を実行し、問題が解決されるかどうかを確認してください。次に、データを集めて問題を PerformancePoint Planning サポートに報告してください。

システムで過度のコンパイルと再コンパイルが行われると、CPU バインドのパフォーマンスの問題が生じる可能性があります。

次の DMV クエリを実行すると、過度のコンパイルと再コンパイルを検出できます。

select * from sys.dm_exec_query_optimizer_info
where 
counter = 'optimizations'
or counter = 'elapsed time'

次のサンプル クエリは、再コンパイルされた上位 25 個のストアド プロシージャを示します。plan_generation_num は、クエリの再コンパイルの回数を示します。

select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid 
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc

過度のコンパイルまたは再コンパイルが検出された場合は、できる限り多くのデータを集めて Planning サポートに報告してください。

メモリのボトルネック

メモリ不足の検出と調査を開始する前に、SQL Server の詳細設定オプションが有効であることを確認してください。最初に、マスタ データベースに対して次のクエリを実行して、このオプションを有効にします。

sp_configure 'show advanced options'
go
sp_configure 'show advanced options', 1
go
reconfigure
go

次のクエリを実行して、最初にメモリ関連の構成オプションを確認します。

sp_configure 'awe_enabled'
go
sp_configure 'min server memory'
go
sp_configure 'max server memory'
go
sp_configure 'min memory per query'
go
sp_configure 'query wait'
go

次の DMV クエリを実行して、CPU、スケジューラ メモリ、およびバッファ プール情報を確認します。

select 
cpu_count,
hyperthread_ratio,
scheduler_count,
physical_memory_in_bytes / 1024 / 1024 as physical_memory_mb,
virtual_memory_in_bytes / 1024 / 1024 as virtual_memory_mb,
bpool_committed * 8 / 1024 as bpool_committed_mb,
bpool_commit_target * 8 / 1024 as bpool_target_mb,
bpool_visible * 8 / 1024 as bpool_visible_mb
from sys.dm_os_sys_info

I/O ボトルネック

ラッチの待機を確認することで、I/O ボトルネックを特定できます。I/O ラッチ待機の統計を検出するには、次の DMV クエリを実行します。

select wait_type, waiting_tasks_count, wait_time_ms, signal_wait_time_ms, wait_time_ms / waiting_tasks_count
from sys.dm_os_wait_stats  
where wait_type like 'PAGEIOLATCH%'  and waiting_tasks_count > 0
order by wait_type

waiting_task_counts および wait_time_ms が、正常な値から大幅に逸脱している場合は、I/O 問題を特定してください。パフォーマンス カウンタの基準と SQL Server が円滑に実行されているときの主要 DMV クエリの出力を取得しておくことが重要です。

これらの wait_types は、I/O サブシステムでボトルネックが発生しているかどうかを示します。

次の DMV クエリを使用して、現在保留中の I/O 要求を検出します。このクエリを定期的に実行して、I/O サブシステムの正常性を確認し、I/O ボトルネックに関与している物理ディスクを分離します。

select 
    database_id, 
    file_id, 
    io_stall,
    io_pending_ms_ticks,
    scheduler_address 
from  sys.dm_io_virtual_file_stats(NULL, NULL)t1,
        sys.dm_io_pending_io_requests as t2
where t1.file_handle = t2.io_handle

正常な状態のとき、このクエリからは何も返されません。このクエリから行が返された場合は、さらに詳しく調べる必要があります。

次の DMV クエリを実行すると、I/O バインドのクエリが検出されます。

select top 5 (total_logical_reads/execution_count) as avg_logical_reads,
                   (total_logical_writes/execution_count) as avg_logical_writes,
           (total_physical_reads/execution_count) as avg_physical_reads,
           Execution_count, statement_start_offset, p.query_plan, q.text
from sys.dm_exec_query_stats
      cross apply sys.dm_exec_query_plan(plan_handle) p
      cross apply sys.dm_exec_sql_text(plan_handle) as q
order by (total_logical_reads + total_logical_writes)/execution_count Desc

次の DMV クエリを使用すると、I/O が最も多く生じているバッチまたは要求を検出できます。次のような DMV クエリを使用して、I/O が最も多く生じている上位 5 個の要求を検出できます。これらのクエリを調整すると、システム パフォーマンスが向上します。

select top 5 
    (total_logical_reads/execution_count) as avg_logical_reads,
    (total_logical_writes/execution_count) as avg_logical_writes,
    (total_physical_reads/execution_count) as avg_phys_reads,
     Execution_count, 
    statement_start_offset as stmt_start_offset, 
    sql_handle, 
    plan_handle
from sys.dm_exec_query_stats  
order by  (total_logical_reads + total_logical_writes) Desc

ブロック

次のクエリを実行して、ブロックしているセッションを調べます。

select blocking_session_id, wait_duration_ms, session_id from 
sys.dm_os_waiting_tasks
where blocking_session_id is not null

この呼び出しを使用して、blocking_session_id で返された SQL を調べます。たとえば、blocking_session_id が 87 の場合は、このクエリを実行して SQL を取得します。

dbcc INPUTBUFFER(87)

次のクエリは、SQL の待機分析と、上位 10 個の待機リソースを示します。

select top 10 *
from sys.dm_os_wait_stats
--where wait_type not in ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE','SLEEP_TASK','SLEEP_SYSTEMTASK','WAITFOR')
order by wait_time_ms desc

他の spid をブロックしている spid を調べるには、データベースに次のストアド プロシージャを作成し、そのストアド プロシージャを実行します。このストアド プロシージャは、ブロックの状態を報告します。「sp_who」と入力して、@spid を検索します。@spid はオプションのパラメータです。

create proc dbo.sp_block (@spid bigint=NULL)
as
select 
    t1.resource_type,
    'database'=db_name(resource_database_id),
    'blk object' = t1.resource_associated_entity_id,
    t1.request_mode,
    t1.request_session_id,
    t2.blocking_session_id    
from 
    sys.dm_tran_locks as t1, 
    sys.dm_os_waiting_tasks as t2
where 
    t1.lock_owner_address = t2.resource_address and
    t1.request_session_id = isnull(@spid,t1.request_session_id)

このストアド プロシージャの使用例を次に示します。

exec sp_block
exec sp_block @spid = 7

関連項目