Я пытаюсь сгруппироваться несколькими столбцами здесь - один на каждой таблице.
Это - сценарий, где я хочу найти главную стоимость портфеля для каждого клиента путем добавления их текущего портфеля и наличных денег вместе, но у клиента может быть больше чем один портфель, таким образом, мне нужен главный портфель для каждого клиента.
В данный момент с кодом ниже я получаю те же клиенты многократно для каждого из их главных портфелей (он не группируется клиентским идентификатором).
SELECT clients.id, clients.name, portfolios.id, SUM ( portfolios.portfolio + portfolios.cash ) AS total
FROM clients, portfolios
WHERE clients.id = portfolios.client_id
GROUP BY portfolios.id, clients.id
ORDER BY total DESC
LIMIT 30
Во-первых, давайте сделаем некоторые тестовые данные:
create table client (client_id integer not null primary key auto_increment,
name varchar(64));
create table portfolio (portfolio_id integer not null primary key auto_increment,
client_id integer references client.id,
cash decimal(10,2),
stocks decimal(10,2));
insert into client (name) values ('John Doe'), ('Jane Doe');
insert into portfolio (client_id, cash, stocks) values (1, 11.11, 22.22),
(1, 10.11, 23.22),
(2, 30.30, 40.40),
(2, 40.40, 50.50);
Если бы вам не нужен был идентификатор портфеля, это было бы просто:
select client_id, name, max(cash + stocks)
from client join portfolio using (client_id)
group by client_id
+-----------+----------+--------------------+
| client_id | name | max(cash + stocks) |
+-----------+----------+--------------------+
| 1 | John Doe | 33.33 |
| 2 | Jane Doe | 90.90 |
+-----------+----------+--------------------+
Поскольку вам нужен ID портфеля, все становится сложнее. Сделаем это поэтапно. Сначала мы напишем подзапрос, который возвращает максимальную стоимость портфеля для каждого клиента:
select client_id, max(cash + stocks) as maxtotal
from portfolio
group by client_id
+-----------+----------+
| client_id | maxtotal |
+-----------+----------+
| 1 | 33.33 |
| 2 | 90.90 |
+-----------+----------+
Затем мы запросим таблицу портфелей, но будем использовать соединение с предыдущим подзапросом, чтобы сохранить только те портфели, общая стоимость которых является максимальным для клиента:
select portfolio_id, cash + stocks from portfolio
join (select client_id, max(cash + stocks) as maxtotal
from portfolio
group by client_id) as maxima
using (client_id)
where cash + stocks = maxtotal
+--------------+---------------+
| portfolio_id | cash + stocks |
+--------------+---------------+
| 5 | 33.33 |
| 6 | 33.33 |
| 8 | 90.90 |
+--------------+---------------+
Наконец, мы можем присоединиться к клиентской таблице (как и вы), чтобы включить имя каждого клиента:
select client_id, name, portfolio_id, cash + stocks
from client
join portfolio using (client_id)
join (select client_id, max(cash + stocks) as maxtotal
from portfolio
group by client_id) as maxima
using (client_id)
where cash + stocks = maxtotal
+-----------+----------+--------------+---------------+
| client_id | name | portfolio_id | cash + stocks |
+-----------+----------+--------------+---------------+
| 1 | John Doe | 5 | 33.33 |
| 1 | John Doe | 6 | 33.33 |
| 2 | Jane Doe | 8 | 90.90 |
+-----------+----------+--------------+---------------+
Обратите внимание, что это возвращает две строки для Джона Доу, потому что у него есть две портфели с одинаковой общей стоимостью. Чтобы избежать этого и выбрать произвольный верхний портфель, отметьте предложение GROUP BY:
select client_id, name, portfolio_id, cash + stocks
from client
join portfolio using (client_id)
join (select client_id, max(cash + stocks) as maxtotal
from portfolio
group by client_id) as maxima
using (client_id)
where cash + stocks = maxtotal
group by client_id, cash + stocks
+-----------+----------+--------------+---------------+
| client_id | name | portfolio_id | cash + stocks |
+-----------+----------+--------------+---------------+
| 1 | John Doe | 5 | 33.33 |
| 2 | Jane Doe | 8 | 90.90 |
+-----------+----------+--------------+---------------+