Почему Запросы на объединение являются настолько медленными в MySQL?

Question

Почему Запросы на объединение являются настолько медленными в MySQL?

Эта ошибка может возникнуть при попытке установить pycurl.

В этом случае вы должны сделать

sudo apt-get install libcurl4-gnutls-dev librtmp-dev

(основанный здесь: https: // gist.github.com/lxneng/1031014)

11

python

задан geisterfurz007 Stop this chaos 27 November 2019 в 06:11

5 ответов

ОБЪЕДИНЕНИЕ ВСЕ быстрее, чем ОБЪЕДИНЕНИЕ, потому что плоскость UNION ожидает, что в двух наборах данных, к которым присоединяются, дубликаты, которые должны быть удалены. Если можно удостовериться (внутренними операторами Where), что не будет никаких дубликатов, намного лучше использовать ОБЪЕДИНЕНИЕ ВЕСЬ и позволить механизму базы данных оптимизировать внутренние выборы.

Используя оператор Where на результате сгруппированных результатов является слишком дорогим, потому что Вы воздействуете на большее количество внутренних результатов, чем Вам нужно. Кроме того, оптимизация механизма базы данных canвЂ™t быть обработанной вЂ” результаты не имеет ничего общего.

проверка эта ссылка для деталей https://dzone.com/articles/performance-tip-for-tuning-sql-with-union

0

ответ дан 3 December 2019 в 04:33
поделиться

Предположение: Поскольку вы запрашиваете одну таблицу с двумя объединениями, возможно, что mysql испытывает трудности с определением стратегии блокировки для таблицы, или он пытается выполнить кеширование, которое здесь не работает, поскольку вы запрашиваете непересекающиеся наборы, пытается многопоточно доступ (очень разумный), но сталкивается с некоторыми проблемами блокировки / параллелизма / поиска файлов.

объединения могут также обычно использовать более высокие настройки безопасности, поскольку эти два выбора должны быть согласованными. Если вы поместите их в отдельные транзакции, они этого не сделают.

Эксперимент: Сделайте копию таблицы и объедините их. Если я прав, это должно быть быстрее.

Возможное решение: Разделите один файл на несколько файлов, чтобы обеспечить лучшие стратегии параллелизма. Это не / не должно помочь с проблемами блокировки, но исключает проблемы многопоточности / поиска в базе данных.

Было бы полезно знать, какой механизм хранения вы используете.

Ну, только мои 2 цента. Не могу сейчас проверить это здесь.

4

ответ дан 3 December 2019 в 04:33
поделиться

Когда я оптимизирую свои 2 отдельных запроса для выполнения менее чем за 0,02 секунды, а затем их СОЮЗИРУЮ, результат выполнения запроса занимает более 1 секунды.

Ваши запросы включают ORDER BY … LIMIT предложения?

Если вы поместите ORDER BY… LIMIT после UNION , он будет применен ко всему UNION и индексам не может использоваться в этом случае.

Если id является первичным ключом, этот запрос будет мгновенным:

SELECT * FROM table ORDER BY id LIMIT 1

, но не будет:

SELECT * FROM table UNION ALL SELECT * FROM table ORDER BY id LIMIT 1

Кроме того, UNION ALL занимает больше времени, чем UNION DISTINCT . Я предполагаю, что разрешение дубликатов заставит запрос выполняться быстрее, а не медленнее.

Это также, похоже, связано с ORDER BY . Сортировка меньшего набора происходит быстрее, чем большего.

Неужели мне лучше запустить два запроса отдельно? Я бы предпочел использовать UNION

. Вам нужно, чтобы полученный набор был отсортирован?

Если нет, просто избавьтесь от последнего ORDER BY .

17

ответ дан 3 December 2019 в 04:33
поделиться

Может быть, вы измеряете время ответа, а не время для получения всех данных?

0

ответ дан 3 December 2019 в 04:33
поделиться

Другие вопросы по тегам:
python

Похожие вопросы:

145
Скрытые возможности Python [закрыто] - 23 May 2017 12:34

81
Лучшие способы учить новичка к программе? [закрытый] - 24 November 2011 00:03

60
Как разбить список на куски одинакового размера? - 23 May 2017 11:55

35
Почему изучают Perl, Python, Ruby, если компания использует C++, C# или Java как язык приложения? [закрытый] - 20 May 2010 08:15

34
Распространенные ошибки в Python [дубликат] - 23 May 2017 10:30

33
Важные реверсивные пары leetcode time out [duplicate] - 25 October 2014 10:12

31
перенос текста python в документ слова [duplicate] - 18 March 2014 21:47

score 3 · Answer 1

Относительно UNION

UNION DISTINCT (значение по умолчанию для UNION) обязательно медленнее, потому что оно должно собрать два результата, затем dedup. Однако с тех пор там меньше возвращается клиенту, там мог некоторая компенсация там.
, Пока последние версии, весь UNIONs не включили временную таблицу для сбора результатов, следовательно UNION было обязательно медленнее, чем два отдельных SELECTs. Недавно, (MySQL 5.7, MariaDB 10.1) некоторые случаи UNION ALL были улучшены, чтобы освободить данные из одного SELECT прямо клиенту, затем поставить другим.
SELECT .. UNION SELECT .. ORDER BY .. эквивалентно [1 120]
(SELECT .. UNION SELECT ..) ORDER BY .. - это
(SELECT ..) UNION (SELECT .. ORDER BY ..) - не это
всегда Предлагает использовать parens вокруг каждого SELECT.
Сортировка (через [1 112]) может занимать дополнительное время для любого (выбор или объединение), это присоединено. Это очень маловероятно для взятия меньше время. Проще говоря, Оптимизатор имеет целью делать то независимо от того, что является самым быстрым, который мог бы , оказываться, быть отсортирован.
Все эти операторы относятся к InnoDB; MyISAM, который не поддерживается очень, может пропускать некоторую недавнюю оптимизацию.
Иногда сингл SELECT с OR может быть ускорен, превратив его в UNION, таким образом, позволив двум индексам использоваться.

Относительно тестирования:

время А 0,001 запахов как Вы выполнило запрос прежде, и результат кэшируется в "Кэше запроса". Избегайте этого путем выключения королевского адвоката или добавления SQL_NO_CACHE.
Выбор WHERE flag = true (or false) имеет несколько случаев: flag индексируется? flag почти всегда одно из тех значений? В [1 128], что случай, индекс будет использоваться, и , вероятно быстрее, чем другой случай.

, Если Вы не соглашаетесь с каким-либо из моих операторов, обеспечьте рабочий пример об обратном.

score 0 · Answer 2

ОБЪЕДИНЕНИЕ ВСЕ быстрее, чем ОБЪЕДИНЕНИЕ, потому что плоскость UNION ожидает, что в двух наборах данных, к которым присоединяются, дубликаты, которые должны быть удалены. Если можно удостовериться (внутренними операторами Where), что не будет никаких дубликатов, намного лучше использовать ОБЪЕДИНЕНИЕ ВЕСЬ и позволить механизму базы данных оптимизировать внутренние выборы.

Используя оператор Where на результате сгруппированных результатов является слишком дорогим, потому что Вы воздействуете на большее количество внутренних результатов, чем Вам нужно. Кроме того, оптимизация механизма базы данных canвЂ™t быть обработанной вЂ” результаты не имеет ничего общего.

проверка эта ссылка для деталей https://dzone.com/articles/performance-tip-for-tuning-sql-with-union

score 4 · Answer 3

Предположение: Поскольку вы запрашиваете одну таблицу с двумя объединениями, возможно, что mysql испытывает трудности с определением стратегии блокировки для таблицы, или он пытается выполнить кеширование, которое здесь не работает, поскольку вы запрашиваете непересекающиеся наборы, пытается многопоточно доступ (очень разумный), но сталкивается с некоторыми проблемами блокировки / параллелизма / поиска файлов.

объединения могут также обычно использовать более высокие настройки безопасности, поскольку эти два выбора должны быть согласованными. Если вы поместите их в отдельные транзакции, они этого не сделают.

Эксперимент: Сделайте копию таблицы и объедините их. Если я прав, это должно быть быстрее.

Возможное решение: Разделите один файл на несколько файлов, чтобы обеспечить лучшие стратегии параллелизма. Это не / не должно помочь с проблемами блокировки, но исключает проблемы многопоточности / поиска в базе данных.

Было бы полезно знать, какой механизм хранения вы используете.

Ну, только мои 2 цента. Не могу сейчас проверить это здесь.

score 17 · Answer 4

Когда я оптимизирую свои 2 отдельных запроса для выполнения менее чем за 0,02 секунды, а затем их СОЮЗИРУЮ, результат выполнения запроса занимает более 1 секунды.

Ваши запросы включают ORDER BY … LIMIT предложения?

Если вы поместите ORDER BY… LIMIT после UNION , он будет применен ко всему UNION и индексам не может использоваться в этом случае.

Если id является первичным ключом, этот запрос будет мгновенным:

SELECT  *
FROM    table
ORDER BY id
LIMIT 1

, но не будет:

SELECT  *
FROM    table
UNION ALL
SELECT  *
FROM    table
ORDER BY id
LIMIT 1

Кроме того, UNION ALL занимает больше времени, чем UNION DISTINCT . Я предполагаю, что разрешение дубликатов заставит запрос выполняться быстрее, а не медленнее.

Это также, похоже, связано с ORDER BY . Сортировка меньшего набора происходит быстрее, чем большего.

Неужели мне лучше запустить два запроса отдельно? Я бы предпочел использовать UNION

. Вам нужно, чтобы полученный набор был отсортирован?

Если нет, просто избавьтесь от последнего ORDER BY .

score 0 · Answer 5

Может быть, вы измеряете время ответа, а не время для получения всех данных?

0

ответ дан 3 December 2019 в 04:33