Felsök långsamma förfrågningar i SQL-servern

Ursprunglig produktversion: SQL Server
Ursprungligt KB-nummer: 243589

Introduktion

Den här artikeln beskriver hur du hanterar ett prestandaproblem som kan uppstå för databasprogram när du använder SQL Server: långsamma prestanda för en specifik fråga eller grupp med frågor. Följande metod hjälper dig att begränsa orsaken till problemet med långsamma frågor och leda dig till lösning.

Hitta långsamma frågor

För att fastställa att du har problem med frågeprestanda på din SQL Server-instans börjar du med att undersöka frågor efter deras körningstid (förfluten tid). Kontrollera om tiden överskrider ett tröskelvärde som du har angett (i millisekunder) baserat på en etablerad prestandabaslinje. I en stresstestmiljö kan du till exempel ha fastställt ett tröskelvärde för att din arbetsbelastning inte ska vara längre än 300 ms, och du kan använda det här tröskelvärdet. Sedan kan du identifiera alla frågor som överskrider tröskelvärdet, med fokus på varje enskild fråga och dess förutbestämda varaktighet för prestandabaslinje. Slutligen bryr sig företagsanvändare om den totala varaktigheten för databasfrågor; Därför är huvudfokus på körningens varaktighet. Andra mått som CPU-tid och logiska läsningar samlas in för att begränsa undersökningen.

  • För närvarande kör du instruktioner genom att kontrollera total_elapsed_time och cpu_time kolumner i sys.dm_exec_requests. Kör följande fråga för att hämta data:

    SELECT 
        req.session_id
        , req.total_elapsed_time AS duration_ms
        , req.cpu_time AS cpu_time_ms
        , req.total_elapsed_time - req.cpu_time AS wait_time
        , req.logical_reads
        , SUBSTRING (REPLACE (REPLACE (SUBSTRING (ST.text, (req.statement_start_offset/2) + 1, 
           ((CASE statement_end_offset
               WHEN -1
               THEN DATALENGTH(ST.text)  
               ELSE req.statement_end_offset
             END - req.statement_start_offset)/2) + 1) , CHAR(10), ' '), CHAR(13), ' '), 
          1, 512)  AS statement_text  
    FROM sys.dm_exec_requests AS req
        CROSS APPLY sys.dm_exec_sql_text(req.sql_handle) AS ST
    ORDER BY total_elapsed_time DESC;
    
  • För tidigare körningar av frågan kontrollerar du last_elapsed_time och last_worker_time kolumner i sys.dm_exec_query_stats. Kör följande fråga för att hämta data:

    SELECT t.text,
         (qs.total_elapsed_time/1000) / qs.execution_count AS avg_elapsed_time,
         (qs.total_worker_time/1000) / qs.execution_count AS avg_cpu_time,
         ((qs.total_elapsed_time/1000) / qs.execution_count ) - ((qs.total_worker_time/1000) / qs.execution_count) AS avg_wait_time,
         qs.total_logical_reads / qs.execution_count AS avg_logical_reads,
         qs.total_logical_writes / qs.execution_count AS avg_writes,
         (qs.total_elapsed_time/1000) AS cumulative_elapsed_time_all_executions
    FROM sys.dm_exec_query_stats qs
         CROSS apply sys.Dm_exec_sql_text (sql_handle) t
    WHERE t.text like '<Your Query>%'
    -- Replace <Your Query> with your query or the beginning part of your query. The special chars like '[','_','%','^' in the query should be escaped.
    ORDER BY (qs.total_elapsed_time / qs.execution_count) DESC
    

    Kommentar

    Om avg_wait_time visar ett negativt värde är det en parallell fråga.

  • Om du kan köra frågan på begäran i SQL Server Management Studio (SSMS) eller Azure Data Studio kör du den med SET STATISTICS TIME ON och SET STATISTICS IO ON.

    SET STATISTICS TIME ON
    SET STATISTICS IO ON
    <YourQuery>
    SET STATISTICS IO OFF
    SET STATISTICS TIME OFF
    

    Sedan ser du cpu-tid, förfluten tid och logiska läsningar från Meddelanden så här:

      Table 'tblTest'. Scan count 1, logical reads 3, physical reads 0, page server reads 0, read-ahead reads 0, page server read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob page server reads 0, lob read-ahead reads 0, lob page server read-ahead reads 0.
    
      SQL Server Execution Times:
        CPU time = 460 ms,  elapsed time = 470 ms.
    
  • Om du kan samla in en frågeplan kontrollerar du data från egenskaperna för körningsplan.

    1. Kör frågan med Inkludera faktisk körningsplan på.

    2. Välj operatorn längst till vänster från Körningsplan.

    3. Från Egenskaper expanderar du egenskapen QueryTimeStats .

    4. Kontrollera ElapsedTime och CpuTime.

      Skärmbild av fönstret för SQL Server-körningsplanegenskaper med egenskapen QueryTimeStats expanderad.

Körs jämfört med väntar: varför är frågorna långsamma?

Om du hittar frågor som överskrider ditt fördefinierade tröskelvärde kan du undersöka varför de kan vara långsamma. Orsaken till prestandaproblem kan grupperas i två kategorier, som körs eller väntar:

  • VÄNTAR: Frågor kan vara långsamma eftersom de väntar länge på en flaskhals. Se en detaljerad lista över flaskhalsar i typer av väntetyper.

  • KÖRS: Frågor kan vara långsamma eftersom de körs (körs) under lång tid. Med andra ord använder dessa frågor aktivt CPU-resurser.

En fråga kan köras vissa perioder och vänta under vissa perioder under frågans livstid (varaktighet). Men ditt fokus är att avgöra vilken som är den dominerande kategorin som bidrar till dess långa tid. Därför är den första uppgiften att fastställa vilken kategori frågorna tillhör. Det är enkelt: om en fråga inte körs väntar den. Helst ägnar en fråga större delen av sin förflutna tid i ett körningstillstånd och mycket lite tid på att vänta på resurser. I bästa fall körs även en fråga inom eller under en fördefinierad baslinje. Jämför den förflutna tiden och CPU-tiden för frågan för att fastställa problemtypen.

Typ 1: CPU-bunden (löpare)

Om cpu-tiden är nära, lika med eller högre än den förflutna tiden, kan du behandla den som en CPU-bunden fråga. Om den förflutna tiden till exempel är 3 000 millisekunder (ms) och CPU-tiden är 2 900 ms innebär det att större delen av den förflutna tiden spenderas på processorn. Sedan kan vi säga att det är en CPU-bunden fråga.

Exempel på frågor som körs (CPU-bundna):

Förfluten tid (ms) CPU-tid (ms) Läsningar (logiska)
3200 3000 300 000
1080 1000 20

Logiska läsningar – läsning av data-/indexsidor i cacheminnet – är oftast drivrutinerna för CPU-användning i SQL Server. Det kan finnas scenarier där CPU-användning kommer från andra källor: en while-loop (i T-SQL eller annan kod som XProcs- eller SQL CRL-objekt). Det andra exemplet i tabellen illustrerar ett sådant scenario, där majoriteten av processorn inte kommer från läsningar.

Kommentar

Om CPU-tiden är större än varaktigheten anger detta att en parallell fråga körs. flera trådar använder processorn samtidigt. Mer information finns i Parallella frågor – löpare eller servitör.

Typ 2: Väntar på en flaskhals (servitör)

En fråga väntar på en flaskhals om den förflutna tiden är betydligt större än CPU-tiden. Den förflutna tiden inkluderar tiden som kör frågan på CPU -tiden (CPU-tid) och tiden som väntar på att en resurs ska släppas (väntetid). Om den förflutna tiden till exempel är 2 000 ms och cpu-tiden är 300 ms är väntetiden 1700 ms (2 000–300 = 1 700). Mer information finns i Typer av väntetider.

Exempel på väntande frågor:

Förfluten tid (ms) CPU-tid (ms) Läsningar (logiska)
2000 300 28000
10080 700 80000

Parallella frågor – löpare eller servitör

Parallella frågor kan använda mer CPU-tid än den totala varaktigheten. Målet med parallellitet är att tillåta att flera trådar kör delar av en fråga samtidigt. Under en sekund av klocktiden kan en fråga använda åtta sekunders CPU-tid genom att köra åtta parallella trådar. Därför blir det svårt att fastställa en CPU-bunden fråga eller en väntande fråga baserat på den förflutna tids- och CPU-tidsskillnaden. Men som en allmän regel följer du de principer som anges i ovanstående två avsnitt. Sammanfattningen är:

  • Om den förflutna tiden är mycket större än CPU-tiden bör du betrakta den som en servitör.
  • Om CPU-tiden är mycket större än den förflutna tiden bör du betrakta den som en löpare.

Exempel på parallella frågor:

Förfluten tid (ms) CPU-tid (ms) Läsningar (logiska)
1200 8100 850000
3080 12300 1500000

Visuell representation på hög nivå av metoden

Skärmbilden visar en visuell representation på hög nivå av metoden för felsökning av långsamma frågor.

Diagnostisera och lösa väntande frågor

Om du har fastställt att dina frågor av intresse är servitörer är nästa steg att fokusera på att lösa flaskhalsproblem. Annars går du till steg 4: Diagnostisera och lösa frågor som körs.

Om du vill optimera en fråga som väntar på flaskhalsar identifierar du hur lång väntetiden är och var flaskhalsen är (väntetypen). När väntetypen har bekräftats kan du minska väntetiden eller eliminera väntetiden helt.

Om du vill beräkna den ungefärliga väntetiden subtraherar du CPU-tiden (arbetstiden) från den förflutna tiden för en fråga. Cpu-tiden är vanligtvis den faktiska körningstiden och den återstående delen av frågans livslängd väntar.

Exempel på hur du beräknar ungefärlig väntetid:

Förfluten tid (ms) CPU-tid (ms) Väntetid (ms)
3200 3000 200
7080 1000 6080

Identifiera flaskhalsen eller vänta

  • Kör följande fråga för att identifiera historiska frågor som väntar länge (till exempel >20 % av den totala förflutna tiden är väntetiden). Den här frågan använder prestandastatistik för cachelagrade frågeplaner sedan SQL Server startades.

    SELECT t.text,
             qs.total_elapsed_time / qs.execution_count
             AS avg_elapsed_time,
             qs.total_worker_time / qs.execution_count
             AS avg_cpu_time,
             (qs.total_elapsed_time - qs.total_worker_time) / qs.execution_count
             AS avg_wait_time,
             qs.total_logical_reads / qs.execution_count
             AS avg_logical_reads,
             qs.total_logical_writes / qs.execution_count
             AS avg_writes,
             qs.total_elapsed_time
             AS cumulative_elapsed_time
    FROM sys.dm_exec_query_stats qs
             CROSS apply sys.Dm_exec_sql_text (sql_handle) t
    WHERE (qs.total_elapsed_time - qs.total_worker_time) / qs.total_elapsed_time
             > 0.2
    ORDER BY qs.total_elapsed_time / qs.execution_count DESC
    
  • Kör följande fråga för att identifiera att frågor körs med längre väntetider än 500 ms:

    SELECT r.session_id, r.wait_type, r.wait_time AS wait_time_ms
    FROM sys.dm_exec_requests r 
       JOIN sys.dm_exec_sessions s ON r.session_id = s.session_id 
    WHERE wait_time > 500
    AND is_user_process = 1
    
  • Om du kan samla in en frågeplan kontrollerar du WaitStats från körningsplanens egenskaper i SSMS:

    1. Kör frågan med Inkludera faktisk körningsplan på.
    2. Högerklicka på operatorn längst till vänster på fliken Körningsplan
    3. Välj Egenskaper och sedan egenskapen WaitStats .
    4. Kontrollera WaitTimeMs och WaitType.
  • Om du är bekant med scenarier med PSSDiag/SQLdiag eller SQL LogScout LightPerf/GeneralPerf kan du använda någon av dem för att samla in prestandastatistik och identifiera väntande frågor på din SQL Server-instans. Du kan importera de insamlade datafilerna och analysera prestandadata med SQL Nexus.

Referenser för att eliminera eller minska väntetider

Orsakerna och lösningarna för varje väntetyp varierar. Det finns ingen allmän metod för att lösa alla väntetyper. Här följer artiklar om hur du felsöker och löser vanliga problem med väntetyp:

Beskrivningar av många väntetyper och vad de anger finns i tabellen i Typer av väntetider.

Diagnostisera och lösa problem med frågor som körs

Om CPU-tiden (arbetartiden) ligger mycket nära den totala varaktigheten som förflutit ägnar frågan större delen av sin livslängd åt att köra. När SQL Server-motorn kör hög CPU-användning kommer vanligtvis den höga CPU-användningen från frågor som driver ett stort antal logiska läsningar (den vanligaste orsaken).

Kör följande instruktion för att identifiera de frågor som ansvarar för hög CPU-aktivitet för närvarande:

SELECT TOP 10 s.session_id,
           r.status,
           r.cpu_time,
           r.logical_reads,
           r.reads,
           r.writes,
           r.total_elapsed_time / (1000 * 60) 'Elaps M',
           SUBSTRING(st.TEXT, (r.statement_start_offset / 2) + 1,
           ((CASE r.statement_end_offset
                WHEN -1 THEN DATALENGTH(st.TEXT)
                ELSE r.statement_end_offset
            END - r.statement_start_offset) / 2) + 1) AS statement_text,
           COALESCE(QUOTENAME(DB_NAME(st.dbid)) + N'.' + QUOTENAME(OBJECT_SCHEMA_NAME(st.objectid, st.dbid)) 
           + N'.' + QUOTENAME(OBJECT_NAME(st.objectid, st.dbid)), '') AS command_text,
           r.command,
           s.login_name,
           s.host_name,
           s.program_name,
           s.last_request_end_time,
           s.login_time,
           r.open_transaction_count
FROM sys.dm_exec_sessions AS s
JOIN sys.dm_exec_requests AS r ON r.session_id = s.session_id CROSS APPLY sys.Dm_exec_sql_text(r.sql_handle) AS st
WHERE r.session_id != @@SPID
ORDER BY r.cpu_time DESC

Om frågor inte driver processorn just nu kan du köra följande instruktion för att leta efter historiska CPU-bundna frågor:

SELECT TOP 10  qs.last_execution_time, st.text AS batch_text,
    SUBSTRING(st.TEXT, (qs.statement_start_offset / 2) + 1, ((CASE qs.statement_end_offset WHEN - 1 THEN DATALENGTH(st.TEXT) ELSE qs.statement_end_offset END - qs.statement_start_offset) / 2) + 1) AS statement_text,
    (qs.total_worker_time / 1000) / qs.execution_count AS avg_cpu_time_ms,
    (qs.total_elapsed_time / 1000) / qs.execution_count AS avg_elapsed_time_ms,
    qs.total_logical_reads / qs.execution_count AS avg_logical_reads,
    (qs.total_worker_time / 1000) AS cumulative_cpu_time_all_executions_ms,
    (qs.total_elapsed_time / 1000) AS cumulative_elapsed_time_all_executions_ms
FROM sys.dm_exec_query_stats qs
CROSS APPLY sys.dm_exec_sql_text(sql_handle) st
ORDER BY(qs.total_worker_time / qs.execution_count) DESC

Vanliga metoder för att lösa problem med CPU-bundna frågor som körs länge