SQL-запрос для поиска числа Кевина Бэкона 2

Используя базу данных IMDB, у меня есть таблицы актер , составы и фильм , и мне нужно выбрать актеров с Кевин Бэкон, число 2. Я думал, что это должно сработать, но я получаю 0 строк. В чем моя ошибка?

select fname, lname
from actor join casts on pid=actor.id
where actor.id in (
    select a3.id  --actors who have a kb number of 2
    from casts c3 join actor a3 on c3.pid=a3.id,
    (
     (select c1.mid --actors who have a kb number of 1
     from (casts c1 join actor a1 on c1.pid=a1.id), (casts c2 join actor a2 on c2.pid=a2.id)
     where c1.mid=c2.mid and a2.fname='Kevin' and a2.lname='Bacon')
    )Level1 where c3.mid=Level1.mid
)
and actor.id not in (select a4.id --and only a kb number of 2
     from (casts c4 join actor a4 on c4.pid=a4.id), (casts c5 join actor a5 on c5.pid=a5.id)
     where c4.mid=c5.mid and a5.fname='Kevin' and a5.lname='Bacon');

Вот схемы таблиц:

ACTOR (id, fname, lname, gender)
MOVIE (id, name, year)
CASTS (pid, mid, role)

mid - это внешний ключ для идентификатора фильма, а pid - это внешний ключ для идентификатора исполнителя.

Обратите внимание, что ограничения на вопрос запрещают мне использовать временные таблицы или рекурсию: запрос должен выполняться с подзапросами.


Я также пробовал

select count(distinct pid) from casts join actor on pid=actor.id where mid in (
    select mid from casts where pid in (
        select distinct pid from casts where mid in (
            select mid from casts join actor on pid=actor.id where fname='Kevin' and lname='Bacon')))

and pid not in  
    (select distinct pid from casts where mid in (
        select mid from casts join actor on pid=actor.id where fname='Kevin' and lname='Bacon'));

, который тоже вроде должен работать, но это еще не конец.


Наконец-то мне удалось получить рабочий код:

select count(distinct pid) from casts where mid in (
    select mid from casts where pid in (
        select distinct pid from casts where mid in (
            select mid from casts join actor on pid=actor.id where fname='Kevin' and lname='Bacon')))

and pid not in  
    (select distinct pid from casts where mid in (
        select mid from casts join actor on pid=actor.id where fname='Kevin' and lname='Bacon'));

Подзапросы, по крайней мере, возвращают разумные ответы. Но это займет вечность. Каждый подзапрос занимал менее 30 секунд, но вместе они занимают 6 минут и продолжают считаться. Почему?


Примечание: Это было мне домашним заданием. Чтобы избежать какого-либо подобия академических проступков с моей стороны, я бы предпочел, чтобы люди не публиковали полные / точные решения, а скорее указывали на общие вещи, которые я делаю неправильно / делаю общие предложения относительно того, как я должен это делать .

25
задан Gilles 'SO- stop being evil' 15 September 2012 в 22:44
поделиться