СУБД 2013 Лекция №2 "Модификация данных. Выборка данных (начало)"
СУБД осень 2012 лекция 7
1.
2. • К каким данным MySQL обращается чаще всего
• Какие типы запросов MySQL выполняет чаще всего
• В каких состояниях преимущественно находятся потоки
(threads) MySQL
• Какие подсистемы MySQL чаще всего использует для
выполнения запросов
• Какие виды обращения к данным встречаются наиболее часто
• Сколько различных видов действий, например просмотра
индексов, выполняет MySQL
4. • Таблица могла быть заблокирована, поэтому запрос был
вынужден ждать. Величина Lock_time показывает, как долго
запрос ждал освобождения блокировки.
• Данные или индексы могли к тому моменту еще отсутствовать
в кэше. Это обычный случай, когда сервер MySQL только
запущен или не настроен должным образом.
• Мог идти ночной процесс резервного копирования, из-за чего
все операции дискового ввода/вывода замедлялись.
• Сервер мог обрабатывать в тот момент другие запросы,
поэтому данный выполнялся медленнее.
5. Долго выполняющиеся запросы
Периодические выполняемые пакетные задания
действительно могут запускать долго выполняющиеся
запросы, но обычные запросы не должны занимать много
времени.
Запросы, больше всего нагружающие сервер
Ищите запросы, которые потребляют большую часть времени
сервера. Напомним, что короткие запросы, выполняемые
очень часто, тоже могут занимать много времени.
Новые запросы
Ищите запросы, которых вчера не было в первой сотне, а
сегодня они появились. Это могут быть новые запросы или
запросы, которые обычно выполнялись быстро, а теперь
замедлились из-за изменившейся схемы индексации. Либо
произошли еще какие-то изменения.
6. SHOW STATUS
Bytes_received и Bytes_sent
Количество байтов, соответственно полученных и
отправленных сервером.
Com_*
Команды, которые сервер выполняет
Created_*
Временные таблицы и файлы, созданные во время
выполнения запроса
Handler_*
Операции подсистемы хранения
Select_*
Различные типы планов выполнения операции соединения
Sort_*
Разнообразная информация о сортировке
7. SET profiling = 1;
SELECT SQL_NO_CACHE `movie`.`mID`, COUNT(*)
FROM `movie`
INNER JOIN `rating` USING(`mID`)
GROUP BY `movie`.`mID`
ORDER BY COUNT(*) DESC;
SHOW PROFILESG
******************** 1. row *********************
Query_ID: 1
Duration: 0.02596900
Query: SELECT …
8. • EXPLAIN ничего не говорит о том, как влияют на запрос триггеры,
хранимые и пользовательские (UDF) функции.
• Она не работает с хранимыми процедурами, хотя можно
разложить процедуру на отдельные запросы и вызвать EXPLAIN
для каждого из них.
• Она ничего не говорит об оптимизациях, которые MySQL
производит уже на этапе выполнения запроса.
• Часть отображаемой статистической информации – всего лишь
оценка, иногда очень неточная.
• Она не показывает все, что можно было бы сообщить о плане
выполнения запроса
• Она не делает различий между некоторыми операциями,
называя их одинаково.
9. EXPLAIN SELECT (SELECT 1 FROM sakila.actor LIMIT 1) FROM sakila.film
id select_type table
1PRIMARY film
2SUBQUERY actor
EXPLAIN SELECT film_id FROM (SELECT film_id FROM sakila.film) AS der;
id select_type table
1PRIMARY <derived2>
2DERIVED film
EXPLAIN SELECT 1 UNION ALL SELECT 1;
id select_type table
1PRIMARY NULL
2UNION NULL
NULL UNION RESULT <union1,2>
10. PRIMARY
Самый внешний запрос
SUBQUERY
Запрос SELECT, который содержится в подзапросе, находящемся во
фразе SELECT (иными словами, не во фразе FROM
DERIVED
Значение DERIVED означает, что данный запрос SELECT является
подзапросом во фразе FROM.
UNION
Второй и последующий запросы SELECT, входящие в объединение
UNION, помечаются признаком UNION.
UNION RESULT
Запрос SELECT, применяемый для выборки результатов из
временной
таблицы, созданной в ходе выполнения UNION.
11. EXPLAIN SELECT film.film_id
FROM sakila.film
INNER JOIN sakila.film_actor USING(film_id)
INNER JOIN sakila.actor USING(actor_id);
id select_type table
1SIMPLE actor
1SIMPLE film_actor
1SIMPLE film
12. EXPLAIN SELECT actor_id,
(SELECT 1 FROM sakila.film_actor WHERE film_actor.actor_id = der_1.actor_id LIMIT 1)
FROM (
SELECT actor_id
FROM sakila.actor LIMIT 5
) AS der_1
UNION ALL
SELECT film_id,
(SELECT @var1 FROM sakila.rental LIMIT 1)
FROM (
SELECT film_id,
(SELECT 1 FROM sakila.store LIMIT 1)
FROM sakila.film LIMIT 5
) AS der_2;
id select_type table
1PRIMARY <derived3>
3DERIVED actor
2DEPENDENT SUBQUERY film_actor
4UNION <derived6>
6DERIVED film
7SUBQUERY store
5UNCACHEABLE SUBQUERY rental
NULL UNION RESULT <union1,4>
13. ALL
Этот подход обычно называют сканированием таблицы.
index
То же, что сканирование таблицы, только MySQL просматривает ее в порядке, задаваемом
индексом, а не в порядке следования строк.
range
Просмотр диапазона – это ограниченная форма сканирования индекса. Просмотр начинается
в определенной точке индекса и возвращает строки в некотором диапазоне значений.
ref
Это доступ по индексу (иногда он называется поиском по индексу (index lookup)), в результате
которого возвращаются строки, соответствующие единственному заданному значению.
eq_ref
Это поиск по индексу в случае, когда MySQL точно знает, что будет возвращено не более
одного значения.
const, system
Эти типы доступа MySQL применяет, когда в процессе оптимизации какую-то часть запроса
можно преобразовать в константу.
NULL
Этот метод означает, что MySQL сумела разрешить запрос на фазе оптимизации, так что в
ходе выполнения вообще не потребуется обращаться к таблице или индексу.
14. EXPLAIN SELECT actor_id, film_id FROM sakila.film_actorG
************************* 1. row *************************
id: 1
select_type: SIMPLE
table: film_actor
type: index
possible_keys: NULL
key: idx_fk_film_id
key_len: 2
ref: NULL
rows: 5143
Extra: Using index
15. EXPLAIN SELECT actor_id, film_id FROM sakila.film_actor WHERE actor_id=4;
...| type | possible_keys | key | key_len |...
...| ref | PRIMARY | PRIMARY | 2 |...
16. EXPLAIN SELECT actor_id, film_id FROM sakila.film_actor WHERE actor_id=4;
...| type | possible_keys | key | key_len |...
...| ref | PRIMARY | PRIMARY | 2 |...
CREATE TABLE t (
a char(3) NOT NULL,
b int(11) NOT NULL,
c char(1) NOT NULL,
PRIMARY KEY (a,b,c)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 ;
EXPLAIN SELECT a FROM t WHERE a=’sak’ AND b = 112;
17. EXPLAIN SELECT actor_id, film_id FROM sakila.film_actor WHERE actor_id=4;
...| type | possible_keys | key | key_len |...
...| ref | PRIMARY | PRIMARY | 2 |...
CREATE TABLE t (
a char(3) NOT NULL,
b int(11) NOT NULL,
c char(1) NOT NULL,
PRIMARY KEY (a,b,c)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 ;
EXPLAIN SELECT a FROM t WHERE a=’sak’ AND b = 112;
... |type | possible_keys | key | key_len |...
... | ref | PRIMARY | PRIMARY | 13 |...
18. EXPLAIN SELECT STRAIGHT_JOIN f.film_id
FROM sakila.film AS f
INNER JOIN sakila.film_actor AS fa
ON f.film_id=fa.film_id AND fa.actor_id = 1
INNER JOIN sakila.actor AS a USING(actor_id);
...| table |...| key | key_len | ref |...
...| a |...| PRIMARY | 2 | const |...
...| f |...| idx_fk_language_id | 1 | NULL |...
...| fa |...| PRIMARY | 4 | const,sakila.f.film_id |...
19. EXPLAIN SELECT f.film_id
FROM sakila.film AS f
INNER JOIN sakila.film_actor AS fa USING(film_id)
INNER JOIN sakila.actor AS a USING(actor_id);
...| rows |...
...| 200 |...
...| 13 |...
...| 1 |...
20. Using index
Означает, что MySQL воспользуется покрывающим индексом, чтобы
избежать доступа к самой таблице.
Using where
Означает, что сервер произведет дополнительную фильтрацию
строк, отобранных подсистемой хранения.
Using temporary
Означает, что MySQL будет применять временную таблицу для сортировки
результатов запроса.
Using filesort
Означает, что MySQL прибегнет к обычной сортировке для упорядочения
результатов, а не станет читать строки из таблицы в порядке, задаваемом
индексом.
range checked for each record
Означает, что подходящего индекса не нашлось, поэтому сервер будет
заново искать индекс при обработке каждой строки в операции
соединения.
24. SELECT actor_id FROM sakila.actor WHERE actor_id + 1 = 5;
SELECT ... WHERE
TO_DAYS(CURRENT_DATE) - TO_DAYS(date_col) <= 10;
25. SELECT actor_id FROM sakila.actor WHERE actor_id + 1 = 5;
SELECT ... WHERE
TO_DAYS(CURRENT_DATE) - TO_DAYS(date_col) <= 10;
SELECT ... WHERE
date_col >= DATE_SUB(CURRENT_DATE, INTERVAL 10 DAY);
26. SELECT actor_id FROM sakila.actor WHERE actor_id + 1 = 5;
SELECT ... WHERE
TO_DAYS(CURRENT_DATE) - TO_DAYS(date_col) <= 10;
SELECT ... WHERE
date_col >= DATE_SUB(CURRENT_DATE, INTERVAL 10 DAY);
SELECT ... WHERE
date_col >= DATE_SUB(‘2008-01-17’, INTERVAL 10 DAY);
27.
28. • Вы можете хранить связанные данные рядом.
• Быстрый доступ к данным. Кластерный индекс
хранит и индекс, и данные вместе в одной B-Tree
структуре, поэтому извлечение строк из кластерного
индекса обычно происходит быстрее, чем
сопоставимый поиск в некластерном индексе.
• Использующие покрывающие индексы запросы
могут получить значение первичного ключа из
листового узла.
29. • Если данные помещаются в памяти, то порядок доступа к ним не имеет
значения, и тогда кластерные индексы не принесут большой пользы.
• Если вы загружаете большое количество данных в другом порядке, то по
окончании загрузки имеет смысл реорганизовать таблицу с помощью команды
OPTIMIZE TABLE.
• Обновление столбцов кластерного индекса обходится дорого, поскольку
InnoDB вынуждена перемещать каждую обновленную строку в новое место.
• Для таблиц с кластерным индексом вставка новых строк или обновление
первичного ключа, требующее перемещения строки, может приводить к
расщеплению страницы.
• Полное сканирование кластерных таблиц может оказаться более медленным,
особенно если строки упакованы менее плотно или хранятся
непоследовательно из-за расщепления страниц.
• Вторичные (некластерные) индексы могут оказаться больше, чем вы ожидаете,
поскольку в листовых узлах хранятся значения столбцов, составляющих
первичный ключ.
• Для доступа к данным по вторичному индексу требуется просмотр двух
индексов вместо одного.
30. CREATE TABLE layout_test (
col1 int NOT NULL,
col2 int NOT NULL,
PRIMARY KEY(col1),
KEY(col2)
);
31. CREATE TABLE layout_test (
col1 int NOT NULL,
col2 int NOT NULL,
PRIMARY KEY(col1),
KEY(col2)
);
32. CREATE TABLE layout_test (
col1 int NOT NULL,
col2 int NOT NULL,
PRIMARY KEY(col1),
KEY(col2)
);
33. CREATE TABLE layout_test (
col1 int NOT NULL,
col2 int NOT NULL,
PRIMARY KEY(col1),
KEY(col2)
);
34. CREATE TABLE layout_test (
col1 int NOT NULL,
col2 int NOT NULL,
PRIMARY KEY(col1),
KEY(col2)
);
35.
36. • Записи индекса обычно компактнее полной строки, поэтому, если
MySQL читает только индекс, то обращается к значительно меньшему
объему данных.
• Индексы отсортированы по индексируемым значениям (по крайней
мере, внутри страницы), поэтому для поиска по диапазону,
характеризуемому большим объемом ввода/вывода, потребуется
меньше операций обращения к диску.
• Большинство подсистем хранения кэширует индексы лучше, чем сами
данные.
• Покрывающие индексы особенно полезны в случае таблиц InnoDB из-за
кластерных индексов. Вторичные индексы InnoDB хранят значения
первичного ключа строки в листовых узлах. Таким образом, вторичный
индекс, который «покрывает» запрос, позволяет избежать еще одного
поиска по первичному индексу.
37. EXPLAIN SELECT store_id, film_id FROM sakila.inventoryG
************************** 1. row **************************
id: 1
select_type: SIMPLE
table: inventory
type: index
possible_keys: NULL
key: idx_store_id_film_id
key_len: 3
ref: NULL
rows: 4673
Extra: Using index
38. EXPLAIN SELECT actor_id, last_name
FROM sakila.actor WHERE last_name = ‘HOPPER’G
************************** 1. row **************************
id: 1
select_type: SIMPLE
table: actor
type: ref
possible_keys: idx_actor_last_name
key: idx_actor_last_name
key_len: 137
ref: const
rows: 2
Extra: Using where; Using index
39. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’
ORDER BY inventory_id, customer_idG
************************** 1. row **************************
type: ref
possible_keys: rental_date
key: rental_date
rows: 1
Extra: Using where
40. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’
ORDER BY inventory_id DESC;
41. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’
ORDER BY inventory_id DESC, customer_id ASC;
42. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’
ORDER BY inventory_id, staff_id;
43. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date > ‘2005-05-25’
ORDER BY rental_date, inventory_id;
44. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’
ORDER BY customer_id;
45. CREATE TABLE rental (
...
PRIMARY KEY (rental_id),
UNIQUE KEY rental_date (rental_date,inventory_id,customer_id),
KEY idx_fk_inventory_id (inventory_id),
KEY idx_fk_customer_id (customer_id),
KEY idx_fk_staff_id (staff_id),
...
);
EXPLAIN SELECT rental_id, staff_id FROM sakila.rental
WHERE rental_date = ‘2005-05-25’ AND inventory_id IN(1,2)
ORDER BY customer_id;
46. • Нормализованные таблицы обычно обновляются быстрее,
чем ненормализованные.
• Когда данные хорошо нормализованы, они либо редко
дублируются, либо не дублируются совсем. Так что изменять
приходится меньше данных.
• Нормализованные таблицы обычно меньше по размеру,
поэтому лучше помещаются в памяти и их
производительность выше.
• Из-за отсутствия избыточных данных реже возникает
необходимость в запросах с фразами DISTINCT или GROUP
BY для извлечения списков значений.
47. • Все данные находятся в одной и той же таблице, что
позволяет избежать соединений.
• Более эффективные стратегии индексирования
SELECT message_text, user_name
FROM message
INNER JOIN user ON message.user_id=user.id
WHERE user.account_type=’premium’
ORDER BY message.published DESC LIMIT 10;
SELECT message_text,user_name
FROM user_messages
WHERE account_type=’premium’
ORDER BY published DESC
LIMIT 10;
48. Таблицы счетчиков
CREATE TABLE hit_counter (
cnt int unsigned not null
) ENGINE=InnoDB;
UPDATE hit_counter SET cnt = cnt + 1;
49. Таблицы счетчиков
CREATE TABLE hit_counter (
slot tinyint unsigned not null primary key,
cnt int unsigned not null
) ENGINE=InnoDB;
UPDATE hit_counter SET cnt = cnt + 1 WHERE slot = RAND( ) *
100;
SELECT SUM(cnt) FROM hit_counter;
50. Таблицы счетчиков
CREATE TABLE daily_hit_counter (
day date not null,
slot tinyint unsigned not null,
cnt int unsigned not null,
primary key(day, slot)
) ENGINE=InnoDB;
INSERT INTO daily_hit_counter(day, slot, cnt) VALUES
(CURRENT_DATE, RAND( ) * 100, 1) ON DUPLICATE KEY UPDATE
cnt = cnt + 1;