Markus Winand – IT-Tage 2015 – Den Suchraum des Optimizers gestalten

Den Suchraum 
des Optimizers 
gestalten
@MarkusWinand

Des Suchraum ist beschränkt
“the query optimizer determines 
the most eﬃcient execution plan*”
…den eﬃzientesten? Von welchen?
*http://docs.oracle.com/cd/E16655_01/server.121/e15857/pfgrf_perf_overview.htm#TGDBA94082

Des Suchraum ist beschränkt
Der Optimizer...
‣Berücksichtigt nur bestehende Indizes
➡ Andere Indizes könnten bessere Performance liefern
‣Versteht “verstümmelte” Abfragen nicht
➡ Einfachere Abfragen können Performance verbessern
‣Hat eingebaute Beschränkungen
➡ Theoretisch mögliche Ausführungspläne werden nicht
berücksichtigt

Den besten Plan in den Suchraum bringen
... it determines the most eﬃcient
execution plan out of the remaining ones.
Damit der Optimizer den besten Plan ﬁnden
kann, müssen wir sicherstellen, dass dieser
Plan innerhalb seiner Grenzen liegt.

Zwei Schritte zum absolut besten Ausführungsplan:
1. Daten-Lokalität maximieren
‣ Der gute alte B-Tree Index ist das #1 Tool
‣ Partitionen sind überbewertet
‣ Tabellen-Cluster sind unterbewertet
Indizes und Queries müssen zusammenpassen
2. Abfrage optimal schreiben
‣ Explizite Bereichsbedingungen nutzen
‣ Top-N Abbrüche verwenden
‣ Index-Reihenfolge ausnutzen
Denke in
sortierten
Mengen

Indizes als Pyramiden
Visualize Simplify

Reihenfolge in mehrspaltigen Indizes

Indizes nutzen:
Spaltenreihenfolge deﬁniert Daten-Lokalität
Example: WHERE A > :a AND B = :b

Indizes nutzen:
Faustregeln (in ~97% optimal):
‣ Konjunktive ist-gleich Suchen sind super
Spaltenreihenfolge beeinflusst Daten-Lokalität nicht
➡ Als erste Spalten in den Index. Reihenfolge so wählen,
dass andere Abfragen auch davon profitieren.
‣ Konjunktive ungleich Suchen sind schwierig
Spaltenreihenfolge beeinflusst Daten-Lokalität
➡ Nach den ist-gleich Bedingungen in den Index. Wenn
es mehrere ungleich Bedingungen gibt, die selektivste
zuerst in den Index.

Indizes nutzen:
Häuﬁge Fehler:
‣ Willkürliche Spaltenreihenfolge ☠ (falsch)
“Einfach die Spalten der where-klausel in den Index”
➡ Stimmt nur bei konjunktiven ist-gleich Suchen
➡ Index ist für andere Abfragen oft nutzlos
‣ Selektivste Spalte zuerst ☠ (falsch)
“Spaltenreihenfolge entsprechend der Selektivität”
➡ Stimmt nur bei mehreren ungleich Bedingungen.

Indizes nutzen:
------------------------------------
| Id | Operation |
------------------------------------
| 0 | SELECT STATEMENT |
| 1 | TABLE ACCESS BY INDEX ROWID|
|* 2 | INDEX SKIP SCAN |
------------------------------------
Predicate Information:
------------------------------------
2 - access("B"=20 AND "A">25)
filter("B"=20)
Index on (A, B)
------------------------------------
| Id | Operation |
------------------------------------
| 1 | TABLE ACCESS BY INDEX ROWID|
|* 2 | INDEX RANGE SCAN |
------------------------------------
------------------------------------
2 - access("B"=20 AND "A">25)
Index on (B, A)
Effizienteste 
LösungEffizientester 
workaround
‣ Index-Filterprälate sind ein Alarmzeichen
‣ Index Skip Scan ist ein Alarmzeichen
‣ Index Fast Full Scan ist ein Alarmzeichen

Using Indexes:
Angehängte Spalten verhindern Tabellenzugriff
Beispiel: SELECT C FROM X WHERE A > :a AND B = :b

Using Indexes:
All benötigten Spalten in den Index packen, um
Tabellenzugriff zu verhindern (Index-Only Scan).
‣ Kann Clustering-Factor ausgleichen 
Daher weniger nützlich, wenn
➡ Der Clustering-Faktor nahe am Optimum ist oder
➡ nur wenige Zeilen selektiert werden
‣ Eine nicht indiziere Spalte -> Problem
Egal, wo die Spalte genannt wird (SELECT, ORDER BY,...)
➡ Allen oder nichts: einige Spalten der SELECT-Klausel
im Index nützt nichts.

Using Indexes:
Häuﬁge Fehler:
‣ Unnötige Spalten selektieren* ☠ (schlecht)
SELECT *? ORM-Tools in Verwendung?
➡ Viele Spalten in viele Indizes geben ist ein NO-GO.
‣ Übertreiben ☠ (schlecht)
➡ Index wird großer, Clustering Faktor (CF) schlechter
➡ Kleiner Nutzen bei gutem CF oder wenigen Zeilen
➡ Systembegrenzungen (32 Spalten, 6398 bytes@8k)
* http://use-the-index-luke.com/blog/2013-08/its-not-about-the-star-stupid

Denke in
sortierten
Mengen
✓
✓

Beispiel:
Bestellungen von Gestern
CREATE TABLE orders ( 
..., 
order_dt DATE NOT NULL, 
... 
);
INSERT INTO orders 
(..., order_dt, ...) 
VALUES (..., sysdate , ...);
100k Zeilen
Gleichmäßig über 
4 Wochen verteilt

Beispiel:

Beispiel:
1. Untere Grenze: 
ORDER_DT >= TRUNC(sysdate-1)
2. Obere Grenze: 
ORDER_DT < TRUNC(sysdate)
2. Explizite Bereichs-Bedingung verwenden
----------------------------------------------
| Id | Operation |
----------------------------------------------
|* 1 | FILTER |
| 2 | TABLE ACCESS BY INDEX ROWID BATCHED |
----------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter(TRUNC(SYSDATE@!)>TRUNC(SYSDATE@!-1))
3 - access("ORDER_DT">=TRUNC(SYSDATE@!-1)
AND "ORDER_DT"<TRUNC(SYSDATE@!))

Beispiel:
Häuﬁger Fehler:
‣TRUNC(order_dt)=:gestern ☠ (schlecht)
Die Intention wird “verschleiert”
➡ Erfordert funktions-basierten Index 
CREATE INDEX … (TRUNC(order_dt));
➡ Unterstützt keine Sortierung nach order_dt 
WHERE TRUNC(order_dt) = :gestern 
ORDER BY order_dt DESC;
Index ist 
nicht entsprechend sortiert

--------------------------------------
| Id | Operation |
--------------------------------------
|* 1 | FILTER |
| 2 | TABLE ACCESS BY INDEX ROWID |
|* 3 | INDEX RANGE SCAN DESCENDING|
--------------------------------------
---------------------------------------------------
3 - access("ORDER_DT"<TRUNC(SYSDATE@!)
AND "ORDER_DT">=TRUNC(SYSDATE@!-1))
Beispiel:
Bestellungen von Gestern (rückläuﬁg)
1. Untere & obere Grenzen: 
ORDER_DT >= TRUNC(sysdate-1) 
ORDER_DT < TRUNC(sysdate)
2. Sortieren 
ORDER BY ORDER_DT DESC 
2. Abfrage schreiben — Reihenfolge nutzen

--------------------------------------
| Id | Operation |
--------------------------------------
|* 1 | FILTER |
| 2 | TABLE ACCESS BY INDEX ROWID |
|* 3 | INDEX RANGE SCAN DESCENDING|
--------------------------------------
---------------------------------------------------
3 - access("ORDER_DT"<TRUNC(SYSDATE@!)
AND "ORDER_DT">=TRUNC(SYSDATE@!-1))
Beispiel:
TRUNC(ORDER_DT)  
= TRUNC(sysdate)-1
2. Sortieren 
ORDER BY ORDER_DT DESC

Beispiel:
----------------------------------------------
| Id | Operation |
----------------------------------------------
| 1 | SORT ORDER BY |
| 2 | TABLE ACCESS BY INDEX ROWID BATCHED |
----------------------------------------------
---------------------------------------------------
3 - access("ORDERS"."SYS_NC00004$"=TRUNC(SYSDATE@!-1))
Kompromiss: 
CPU 
Memory 
IO 
TRUNC(ORDER_DT)  
= TRUNC(sysdate)-1
2. Sortieren 

Beispiel:
Bestellungen der letzten 24 Stunden
1. Daten-Lokalität mit TRUNC
* http://www.sqlfail.com/2014/05/05/oracle-can-now-use-function-based-indexes-in-queries-without-functions/

2. Abfrage mit expliziter Bereichs-Bedingung
Beispiel:
-------------------------------------------------
| Id | Operation |
-------------------------------------------------
|* 1 | TABLE ACCESS BY INDEX ROWID BATCHED |
|* 2 | INDEX RANGE SCAN on TRUNC(ORDER_DT) |
-------------------------------------------------
---------------------------------------------------
1 - filter("ORDER_DT">SYSDATE@!-1)
2 - access("ORDERS"."SYS_NC00004$">=TRUNC(SYSDATE@!-1))
2. Obere Grenze: keine (unbounded)
ORDER_DT > sysdate - 1
Um FBI zu verwenden (vor 11.2.0.2*) 
TRUNC(ORDER_DT)>=TRUNC(sysdate-1)
* http://www.sqlfail.com/2014/05/05/oracle-can-now-use-function-based-indexes-in-queries-without-functions/

Beispiel:
2. Abfrage mit expliziter Bereichs-Bedingung
ORDER_DT > sysdate - 1
2. Obere Grenze: keine (unbounded)
--------------------------------------------
| Id | Operation |
--------------------------------------------
| 1 | TABLE ACCESS BY INDEX ROWID BATCHED|
--------------------------------------------
----------------------
2 - access("ORDER_DT">SYSDATE@!-1)

Beispiel:
--------------------------------------------
| Id | Operation |
--------------------------------------------
| 1 | TABLE ACCESS BY INDEX ROWID BATCHED|
--------------------------------------------
----------------------
2 - access("ORDER_DT">SYSDATE@!-1)
--------------------------------------------
| Id | Operation |
--------------------------------------------
|* 1 | TABLE ACCESS BY INDEX ROWID BATCHED|
--------------------------------------------
----------------------
1 - filter("ORDER_DT">SYSDATE@!-1)
2 - access("ORDERS"."SYS_NC00004$">=TRUNC(SYSDATE@!-1))
Effizienteste 
Lösung
Effizienter 
workaround

Denke in
sortierten
Mengen
✓
✓
✓
✓

Beispiel:
Die letzten 10 Bestellungen

Beispiel:
2. Abfrage mit expliziten Bereichsbedingungen
1. Untere Grenze...? Nach 10 Zeilen...???
2. Obere Grenze? sysdate? Keine!

Beispiel:
1. Untere Grenze...? Nach 10 Zeilen...???
2. Obere Grenze? sysdate? Keine!
2. Abfrage mit Top-N-Abbruch
3. Beginne mit: Aktuellsten 
4. Abbruch nach: 10 Zeilen 
FETCH FIRST 10 ROWS ONLY (seit 12c)

Beispiel:
2. Abfrage mit Top-N-Abbruch
3. Beginne mit: Aktuellsten 
4. Abbruch nach: 10 Zeilen 
FETCH FIRST 10 ROWS ONLY (seit 12c)
----------------------------------------------------------
| Id | Operation | A-Rows | Buffers |
----------------------------------------------------------
| 0 | SELECT STATEMENT | 10 | 8 |
|* 1 | VIEW | 10 | 8 |
|* 2 | WINDOW NOSORT STOPKEY | 10 | 8 |
| 3 | TABLE ACCESS BY INDEX ROWID| 11 | 8 |
| 4 | INDEX FULL SCAN DESCENDING| 11 | 3 |
----------------------------------------------------------
---------------------------------------------------
1 - filter("from$_subquery$_002"."rowlimit_$$_rownumber"<=10)
2 - filter(ROW_NUMBER() OVER (ORDER BY ORDER_DT DESC)<=10) ROW_NUMBER() OVER (ORDER BY ORDER_DT DESC)<=10

SELECT orders.* 
, ROW_NUMBER() OVER ( 
ORDER BY order_dt DESC 
) rn 
FROM orders 

Window-Funktionen für Top-N Abbruch

SELECT * 
FROM ( 
SELECT orders.* 
, ROW_NUMBER() OVER ( 
ORDER BY order_dt DESC 
) rn 
FROM orders 
) 
WHERE rn <= 10 
10 Zeilen Selektieren

SELECT * 
FROM ( 
SELECT orders.* 
, DENSE_RANK() OVER ( 
ORDER BY TRUNC(order_dt) DESC 
) rn 
FROM orders 
) 
WHERE rn <= 1 
1 Gruppe Selektieren

SELECT * 
FROM ( 
SELECT orders.* 
) rn 
FROM orders 
) 
WHERE rn <= 1 
Nützlich um 
hier abzubechen

SELECT * 
FROM ( 
SELECT orders.* 
) rn 
FROM orders 
) 
WHERE rn <= 1 
---------------------------------------------------------------------------
| Id | Operation | E-Rows | A-Rows | Buffers | Reads |
---------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 2057 | 695 | 695 |
| 1 | SORT ORDER BY | 100K| 2057 | 695 | 695 |
|* 2 | VIEW | 100K| 2057 | 695 | 695 |
|* 3 | WINDOW NOSORT STOPKEY | 100K| 2057 | 695 | 695 |
| 4 | TABLE ACCESS BY INDEX ROWID| 100K| 2058 | 695 | 695 |
| 5 | INDEX FULL SCAN DESCENDING| 100K| 2058 | 8 | 8 |
---------------------------------------------------------------------------
DENSE_RANK

---------------------------------------------------------------------------------
---------------------------------------------------------------------------------
| 1 | SORT ORDER BY | 3448 | 2057 | 1038 | 694 |
| 2 | TABLE ACCESS BY INDEX ROWID BATCHED| 3448 | 2057 | 1038 | 694 |
|* 3 | INDEX RANGE SCAN | 3448 | 2057 | 10 | 8 |
| 4 | SORT AGGREGATE | 1 | 1 | 2 | 2 |
| 5 | INDEX FULL SCAN (MIN/MAX) | 1 | 1 | 2 | 2 |
---------------------------------------------------------------------------------
---------------------------------------------------------------------------
---------------------------------------------------------------------------
| 1 | SORT ORDER BY | 100K| 2057 | 695 | 695 |
|* 2 | VIEW | 100K| 2057 | 695 | 695 |
|* 3 | WINDOW NOSORT STOPKEY | 100K| 2057 | 695 | 695 |
| 4 | TABLE ACCESS BY INDEX ROWID| 100K| 2058 | 695 | 695 |
| 5 | INDEX FULL SCAN DESCENDING| 100K| 2058 | 8 | 8 |
---------------------------------------------------------------------------
DENSE_RANK
SUB-SELECT

Top-N vs. Max()-Subquery
Häuﬁge Fehler:
‣ Ex eaquo mit Sub-Queries ☠ (falsch)
WHERE (a, b)= (select max(a), max(b) ...)
➡ max() kommt von verschiedenen Zeilen!
➡ Nichts gefunden
‣ N>1 Gruppen selektieren ☠ (schlecht)
WHERE X < (SELECT MAX()... 
WHERE X < (SELECT MAX()...))
WHERE (N-1) = (SELECT COUNT(DISTINCT(DT))...

Denke in
sortierten
Mengen
✓
✓
✓
✓
✓

1. Maximize data-locality
Beispiel:
Die nächsten 10 Bestellungen

Beispiel:
2. Expliziter Bereich + Top-N Abbruch
1. Untere Grenze: keine (top-n)
2. Obere Grenze: wo wir aufgehört haben 
WHERE ORDER_DT < :prev_dt
3. ORDER BY ORDER_DT DESC
4. FETCH FIRST 10 ROWS ONLY

Beispiel:
2. Expliziter Bereich + Top-N Abbruch
1. Untere Grenze: keine (top-n)
2. Obere Grenze: wo wir aufgehört haben 
WHERE ORDER_DT < :prev_dt
3. ORDER BY ORDER_DT DESC
4. FETCH FIRST 10 ROWS ONLY
Ex aequo?

Explizite Bereichs-Bedingungen: Allgemein
Beispiel:

Beispiel:
1. Eindeutige Sortierung
2. Row-Value Filter um
bereits gesehenes zu
entfernen (SQL-92)
3. Enter

Beispiel:
(x,y) = (a,b)
(x,y) IN ((a,b),(c,d))
(x,y) < (a,b)
(x,y) > (a,b)
✓
✓
✗
✗
Oracle
limitation

Beispiel:
Oracle
limitation
Zwei semantisch 
gleichwertige Ansätze:
X <= A
AND NOT(X=A AND Y>=B)
(X < A)
OR (X = A AND Y < B)
* http://use-the-index-luke.com/sql/partial-results/fetch-next-page#sb-equivalent-logic
☠
Schlechte Index-Nutzung*

Weitere Zeilen mit OFFSET holen
‣Nach FETCH FIRST...ROWS ONLY, hat
SQL:2011 OFFSET eingeführt.
‣Mit der ROWNUM Pseudo-Spalte kann man
auch Zeilen überspringen (ROWNUM > :x)
‣ROW_NUMBER() kann das ebenfalls.
Egal, wie man es schreibt ...

Weitere Zeilen mit OFFSET holen
OFFSET = SLEEP
Je größer die Zahl, 
desto Langsamer die Abfage.
Noah schlimmer: Es belegt Ressourcen 
und liefert falsche Ergebnisse.

Über @MarkusWinand
€0,-
€10-30

Über @MarkusWinand
@ModernSQL
http://modern-sql.com

Markus Winand – IT-Tage 2015 – Den Suchraum des Optimizers gestalten

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Ähnlich wie Markus Winand – IT-Tage 2015 – Den Suchraum des Optimizers gestalten

Ähnlich wie Markus Winand – IT-Tage 2015 – Den Suchraum des Optimizers gestalten (20)

Markus Winand – IT-Tage 2015 – Den Suchraum des Optimizers gestalten