Похожие вопросы:
У меня есть очень большой набор данных (более 5 миллионов элементов) и мне нужно получить из него N самых больших элементов. Наиболее естественный способ сделать это - использовать кучу/очередь приоритетов хранящую только N лучших элементов. Существует несколько хороших реализаций очереди приоритетов для JVM (Scala/Java), а именно:
Первые две хороши, но они хранят все элементы, что в моем случае дает критический перерасход памяти. Третий (реализация Lucene) не имеет такого недостатка, но, как я вижу из документации, он также не поддерживает пользовательский компаратор, что делает его бесполезным для меня.
Итак, мой вопрос: существует ли реализация PriorityQueue
с фиксированной емкостью и пользовательским компаратором?
UPD. Наконец я создал свою собственную реализацию, основанную на ответе Питера:
public class FixedSizePriorityQueue extends TreeSet {
private int elementsLeft;
public FixedSizePriorityQueue(int maxSize) {
super(new NaturalComparator());
this.elementsLeft = maxSize;
}
public FixedSizePriorityQueue(int maxSize, Comparator comparator) {
super(comparator);
this.elementsLeft = maxSize;
}
/**
* @return true if element was added, false otherwise
* */
@Override
public boolean add(E e) {
if (elementsLeft == 0 && size() == 0) {
// max size was initiated to zero => just return false
return false;
} else if (elementsLeft > 0) {
// queue isn't full => add element and decrement elementsLeft
boolean added = super.add(e);
if (added) {
elementsLeft--;
}
return added;
} else {
// there is already 1 or more elements => compare to the least
int compared = super.comparator().compare(e, this.first());
if (compared == 1) {
// new element is larger than the least in queue => pull the least and add new one to queue
pollFirst();
super.add(e);
return true;
} else {
// new element is less than the least in queue => return false
return false;
}
}
}
}
(где NaturalComparator
взят из этого вопроса)