Dicas de como realizar um tuning no SQL Server
Olá pessoal tudo certo?
No post de hoje, eu quero compartilhar com vocês algumas dicas de como iniciar um tuning em alguma rotina, seja stored procedure, function ou query adhoc.
Quando vamos iniciar um trabalho de tuning, uma das primeiras informações que precisamos é visualizar o plano de execução da query e as informações de estatísticas.
Mas antes vamos entender um pouco os passos que o Otimizador de Consultas segue para executar uma query.
Primeiro o Otimizador de Consultas faz o “Parsing“ do comando para validar se a sintaxe do comando está correta. Estando o código correto, é gerado o que chamamos de parser tree, que contém os passos lógicos para a execução da consulta SQL.
O segundo passo é o que chamamos de Algebrizer, esta etapa é que faz a normalização do comando que recebe do parser tree, verifica a existência dos objetos utilizados na consulta (tabelas, colunas etc), além de outras tarefas como validar se o usuário que está executando tem permissão de acesso, valida as constraints e etc… a saída deste passo é um metadado com as informações.
O terceiro passo é o que chamamos de Optimizer, que vai fazer a leitura do metadado recebidos da fase anterior e vai começar a analisar os operadores físicos e lógicos que ele vai utilizar, também vai analisar os hints que estão na query e os operadores de JOIN. Após isso, ele vai começar a gerar vários planos de execução. Dentre os planos gerados ele vai escolher o que for classificado como bom o suficiente “good enough“. Para ele escolher esse plano ele leva em consideração o custo de cada operação além do custo de recursos como IO e CPU.
Uma vez que o otimizador de consultas gera o plano de execução, ele é então armazenado em uma área de memória denominada plan cache, que é uma área onde ficam armazenados todos os planos de execução do SQL Server.
Concluído o terceiro passo, agora que o nosso plano de execução está gerado o SQL Server sabe exatamente como chegar nos dados, então ele é colocado na fila de execução que é o passo Execution ou Exec Plan.
1) Plano de Execução
Tiago o que seria o plano de execução?
Apesar de quase 100% das pessoas que trabalham com SQL Server saber o que é o plano de execução e para que ele serve, se você está começando a trabalhar com banco de dados agora, vou dar uma resumida. O primeiro ponto é que o Plano de Execução não é exclusivo do SQL Server, todos os SGBD que eu conheço tem planos de execução (Oracle, MySQL, Postgree…), que nada mais é que uma representação gráfica, textual ou em XML que mostra quais operadores e operações que o otimizador de consultas fez para retornar os dados da sua query e também o custo de cada operação realizada.
Com esse recurso você consegue ver as etapas de execução da sua query e assim verificar o que pode ser melhorado.
Para gerar um plano de execução de uma instrução você pode simplesmente utilizar o atalho “CTRL+M” ou então clicar no ícone:
O plano de execução também pode nos dar informação de sugestão de índices do SQL Server.
Mas o que seria essas sugestões de criação de índices?
Por exemplo, quando executamos uma consulta o otimizador de consultas utiliza as estatísticas e identifica que a query que você está executando teria um desempenho melhor se a tabela X tivesse um índice na coluna Y.
Como podemos observar na imagem acima, o otimizador de consultas está nos sugerindo um índice na tabela “Sales.Customer“, que vai gerar um impacto de “97%” na execução da consulta.
Para fazer a leitura do plano de execução as literaturas recomendam que devemos começar da esquerda para a direita e de cima para baixo, uma vez que facilita a nossa interpretação. Porém, o Otimizador de Consultas constrói os planos de execução da direita para a esquerda e de cima para baixo. Também precisamos aprender o que significa cada operador ou pelo menos os principais deles.
Para consultar os operadores podemos consultar o Books Online (BOL).
Vamos entender melhor com um plano de execução um pouco mais complexo. Vamos exibir o plano de execução da query abaixo:
WITH LastDayOrderIDs AS ( SELECT SalesOrderID FROM Sales.SalesOrderHeader WHERE OrderDate = (SELECT MAX(OrderDate) FROM Sales.SalesOrderHeader) ), LastDayProductQuantities AS ( SELECT ProductID, SUM(OrderQty) AS LastDayQuantity FROM Sales.SalesOrderDetail JOIN LastDayOrderIDs ON Sales.SalesOrderDetail.SalesOrderID = LastDayOrderIDs.SalesOrderID GROUP BY ProductID ), LastDayProductDetails AS ( SELECT Product.ProductID, Product.Name, LastDayQuantity FROM Production.Product JOIN LastDayProductQuantities ON Product.ProductID = LastDayProductQuantities.ProductID ) SELECT * FROM LastDayProductDetails ORDER BY LastDayQuantity DESC;
Para entender o plano vamos utilizar a recomendação literária que fica mais fácil o entendimento.
1 – Otimizador de consulta executou uma operação de “Cluster Index Scan”
3 – Realizou outra operação de “Cluster Index Scan”
4 – Fez uma agregação dos dados utilizando o operador “Stream Aggregate“, essa primeira agregação é referente a função MAX (SELECT MAX(OrderDate) FROM Sales.SalesOrderHeader)
Dica: Quando clicamos com o botão direito -> propriedades do operador, temos as informações do que o operador está fazendo.
5 – Realizou outra operação de “Cluster Index Scan”
6 – Fez o join dos dados através do operador “Nested Loops”
7 – Agora fez uma operação de “Cluster Index Seek”
8 – Realizou o join entre os resultados dos passos (4,5,6 e 7) com o operador “Nested Loops”
9 – Realizou a ordenação dos dados utilizando o operador de “Sort”
10 – Fez uma nova agregação dos dados por causa do “Group By” – (GROUP BY ProductID)
2 – Agora com a segunda parte dos dados da query já retornados, o otimizador de consultas vai realizar o join utilizando o operador “Merge Join“.
11 – Vai realizar mais uma ordenação utilizando o operador “Sort” ordenando os dados da CTE (ORDER BY LastDayQuantity DESC;)
12 – Finalmente vai retornar os dados do Select.
Agora vamos ver como que o Otimizador de Consulta monta o plano de execução, como dito anteriormente, ele monta o plano da direita para a esquerda.
Como explicado anteriormente, quando executamos uma query ela passa por algumas fases e na fase do Optimizer que será gerado o plano de execução. Com isso, a engine sabe exatamente o caminho, ordem e quais operadores ela vai utilizar para alcançar o objetivo. Por esse motivo, ele gerar os planos sempre da direita para esquerda.
1 – Select
2 – Sort
3 – Merge Join
4 – Cluster Index Scan
5 – Stream Aggregate
6 – Sort
7 – Nested Loops
8 – Nested Loops
9 – Stream Aggregate
10 – Cluster Index Scan
11 – Cluster Index Scan
12 – Cluster Index Seek
Para você identificar qual é a ordem que o plano está sendo executado, você consegue essa informação nas propriedades de cada operador, na propriedade Node ID lembrando que a contagem começa no Node ID: 0.
Outra opção que nos ajuda a entender a ordem que o SQL Server está executando a nossa query é habilitando a opção “set statistics profile on“.
SET STATISTICS PROFILE ON WITH LastDayOrderIDs AS (SELECT SalesOrderID FROM Sales.SalesOrderHeader WHERE OrderDate = ( SELECT MAX(OrderDate) FROM Sales.SalesOrderHeader )), LastDayProductQuantities AS (SELECT ProductID, SUM(OrderQty) AS LastDayQuantity FROM Sales.SalesOrderDetail JOIN LastDayOrderIDs ON Sales.SalesOrderDetail.SalesOrderID = LastDayOrderIDs.SalesOrderID GROUP BY ProductID), LastDayProductDetails AS (SELECT Product.ProductID, Product.Name, LastDayQuantity FROM Production.Product JOIN LastDayProductQuantities ON Product.ProductID = LastDayProductQuantities.ProductID) SELECT * FROM LastDayProductDetails ORDER BY LastDayQuantity DESC
O retorno dessas informações nos ajuda a identificar a ordem dos operadores e também quais são os operadores físicos e quais são os operadores lógicos, além de outras informações.
Como falamos no começo do post, outro ponto muito importante a ser observado são as estatísticas da query, quantas operações de leituras físicas, lógicas e consumo de CPU o SQL Server efetuou para executar a sua consulta.
Para obter essas informações basta habilitar as estatísticas antes de executar o comando, “set statistics io,time on” .
SET STATISTICS IO,time ON WITH LastDayOrderIDs AS (SELECT SalesOrderID FROM Sales.SalesOrderHeader WHERE OrderDate = ( SELECT MAX(OrderDate) FROM Sales.SalesOrderHeader )), LastDayProductQuantities AS (SELECT ProductID, SUM(OrderQty) AS LastDayQuantity FROM Sales.SalesOrderDetail JOIN LastDayOrderIDs ON Sales.SalesOrderDetail.SalesOrderID = LastDayOrderIDs.SalesOrderID GROUP BY ProductID), LastDayProductDetails AS (SELECT Product.ProductID, Product.Name, LastDayQuantity FROM Production.Product JOIN LastDayProductQuantities ON Product.ProductID = LastDayProductQuantities.ProductID) SELECT * FROM LastDayProductDetails ORDER BY LastDayQuantity DESC
Como podemos ver nas informações estatísticas, a operação mais custosa para a execução da consulta foi a leitura na tabela “SalesOrderHeader” e a nossa consulta teve um custo de 9 ms.
Apenas uma observação para quem não conhece a operação de logical reads, pois não é uma leitura dos dados no disco e sim na memória. Quando existe leitura em disco o valor que será mostrado é a o physical reads em alguns casos quando os dados ainda não estão em memória o SQL pode fazer leitura física, mas na próxima execução da consulta os valores estejam zerado, isso vai depender de como estiver o seu PLE (Page Life Expectancy – Expectativa de vida em segundos de uma página na memória do SQL Server, bom para monitorar se você está mantendo dados em cache por muito tempo, evitando acessos a disco).
Existe uma ferramenta que utilizo bastante que é a SentryOne Plan Explorer. Ela é FREE e nos ajuda bastante quando vamos realizar um tuning.
Quando executamos uma query nessa ferramenta, ela retorna os planos de execução, estatísticas, qual operação foi mais custosa para o SQL Serve executar… Costumo dizer que é uma ferramenta fantástica, nos prints abaixo vamos poder ver as informações que ela nos retorna.
Quando vamos utilizar o plan explorer devemos clicar em “New Plan Explorer Session“.
Depois de escrever a sua query, você deverá clicar em “Get Actual Plan” e preencher as informações de acesso ao banco como instância, base de dados e login/senha.
Como podemos observar, a nossa primeira execução da query foi com o tempo de 24 ms, também podemos ver as informações de “Table I/O”, que são as informações de I/O que a nossa consulta executou. Essa informação é a mesma que temos quando executamos o “set statistics io”, no Management Studio.
Na aba “Query Columns” podemos ter informações sobre quais colunas e tabelas que a nossa query acessou e qual o custo de cada acesso.
Na aba “Plan Diagram”, nós temos o mesmo plano de execução que conseguimos quando executamos a consulta no Management Studio. Porém no Plan Explorer ele nos mostra quais foram as tops operações.
Na aba “Join Diagram”, nós temos um diagrama dos relacionamentos das tabelas da query.
Semelhante ao “set statistics profile” no Management Studio, a aba “Plan Tree” nos informa a ordem do steps que o SQL Server fez para executar a nossa query.
A aba “Top Operations”, retorna uma tabela com os custos de cada operação do plano de execução bem como as estimativas, se o operador utilizou paralelismo para executar entre outras.
Por fim, a aba “Index Analysis“ faz uma análise de cada índice que foi utilizado na nossa consulta, inclusive mostrando o ganho que teríamos ao utilizar o índice sugerido pelo SQL Server. Também podemos ver que algumas estatísticas estão desatualizadas.
O legal da ferramenta é que podemos atualizar as estatísticas e criar o índice direto por ela sem precisar de conectar no Management Studio.
Para atualizar as estatísticas no próprio SentryOne, basta clicar no gráfico que vai abrir uma janela para você configurar as opções de atualização de estatísticas, lembrando que se você não tiver permissão para atualizar estatísticas vai dar erro.
Dá mesma forma, podemos criar um índice sugerido pelo SQL Server. Para isso, basta clicar no “<s>” que o Plan Explorer vai mostrar o script de criação do índice e caso você ache necessário acrescentar alguma coluna ou alguma opção de criação basta editar o script.
Atenção:
“Criar índices e atualizar estatisticas em ambiente de produção durante o horário comercial pode impactar a performance do servidor e gerar locks.”
Por fim, no painel direito temos um histórico de execução da nossa query, onde podemos analisar e comparar as execuções e ver se tivemos algum ganho. Como podemos verificar, após atualizar as estatísticas e criar o índice sugerido pelo SQL Server, a nossa query baixou a quantidade de I/O de 1.562 para 169 e consequentemente o tempo de 24 ms para 02 ms, além de gerar um novo plano de execução.
Como podemos ver, temos N formas de executar um tuning, além de ferramentas como o SentryOne Plan Explorer existem outras, mas não adianta você ter as ferramentas se você não tiver uma noção dos operadores, qual está sendo o seu gargalo e etc…
Abaixo vou indicar alguns links com os vídeos dos treinamentos On-demand do Fabiano Amorim e do Luti. Os treinamentos estão disponibilizados no Youtube em seus respectivos canais.
Treinamento Fabiano – PE Parte I – QO, lookup, sort e merge join:
Treinamento Luti – Indexação:
O #TeamFabricioLima lançou uma plataforma de curso e temos alguns treinamentos do Fabiano, hoje (08/05/2019) temos o 25 Dicas de Performance no SQL Server Parte 1, + 25 Dicas de Performance no SQL Server Parte 2.
Para quem quiser adquirir alguns do cursos do Fabiano na plataforma do #TeamFabricioLima (https://cursos.fabriciolima.net/), use esse cupom de desconto “BLOGTIAGONEVES10“.
Referencias:
SQL Server 2017 Query Performance Tuning – Troubleshoot and Optimize Query Performance – Fritchey, Gran
High Performance SQL Server – Nevarez, Benjamin
Bom pessoal por hoje é isso. Espero que tenham gostado e espero ter ajudado quem está começando a trabalhar com tuning.
Abraços,
Curta a nossa página no Facebook