Java: совокупная сумма из списка объектов [дубликат]

Question

Java: совокупная сумма из списка объектов [дубликат]

У меня был случай, когда я случайно начал разворачивать каталог файлов в корне. Он добавил файл .htaccess из моей папки с файлами, который блокирует все php

# If we know how to do it safely, disable the PHP engine entirely.
<IfModule mod_php5.c>
  php_flag engine off
</IfModule>

. Нижняя строка проверяет файл .htaccess на root.

16

java java-8 java-stream

задан Adrian Leonhard 6 February 2015 в 09:24

2 ответа

Это возможно сделать с коллектором, который затем создает новый поток:

class Accumulator {
    public static void accept(List<Integer> list, Integer value) {
        list.add(value + (list.isEmpty() ? 0 : list.get(list.size() - 1)));
    }

    public static List<Integer> combine(List<Integer> list1, List<Integer> list2) {
        int total = list1.get(list1.size() - 1);
        list2.stream().map(n -> n + total).forEach(list1::add);
        return list1;
    }
}

Это используется как:

myIntStream.parallel()
    .collect(ArrayList<Integer>::new, Accumulator::accept, Accumulator::combine)
    .stream();

Надеюсь, вы увидите, что важный атрибут этого коллектора заключается в том, что даже если поток параллелен, когда экземпляры Accumulator объединены, он корректирует итоговые значения.

Это, очевидно, не так эффективно, как операция карты, потому что он собирает весь поток и затем создает новый поток. Но это не просто деталь реализации: это необходимая функция того, что потоки предназначены для потенциальной параллельной обработки.

Я протестировал ее с помощью IntStream.range(0, 10000).parallel(), и она функционирует правильно.

5

ответ дан sprinter 21 August 2018 в 07:16

1

@Jatin спасибо. Позже я понял, что это может быть немного проще, чем это - общая сумма на самом деле не требуется, потому что это всего лишь последний элемент в списке. Я обновлю, чтобы показать вам, что я имею в виду, - дайте мне знать, что вы думаете. – sprinter 6 February 2015 в 12:37
2

Почему Deque и LinkedList, правда? ArrayList даст вам превосходную производительность и объем памяти, потому что вы никогда не добавляете, только добавляете. Вы также можете дешево оптимизировать, проверив, какой операнд из combine короче и concat, который один на более длинный. – Marko Topolnik 6 February 2015 в 13:54
3

@MarkoTopolnik все отличные моменты. Я выбрал Deque для довольно ленивой причины: у него был метод peekLast! Но я согласен с тем, что ArrayList будет лучшим выбором - я обновлю ответ, если кто-то попытается использовать эту технику. Что касается производительности, я попробовал ее с потоком в 10 миллионов предметов, и это очень быстро. – sprinter 6 February 2015 в 14:05
4

@MarkoTopolnik как вопрос интереса Я зарегистрировал информацию во время комбайна на очень большом потоке и обнаружил, что списки всегда были одинаковой длины. Я думаю, это должно быть артефактом того, как реализуются потоки. – sprinter 6 February 2015 в 14:29
5

Это артефакт того, как источник потока в памяти, такой как массив или arraylist, разбивается (вниз по середине). Если вы использовали, скажем, Files.lines() или любой другой источник, основанный на IO, вы бы видели разные размеры. Несбалансированные деревья также будут приводить к неравномерным раздельным размерам. – Marko Topolnik 6 February 2015 в 14:31

Другие вопросы по тегам:

java java-8 java-stream

Похожие вопросы:

@Jatin спасибо. Позже я понял, что это может быть немного проще, чем это - общая сумма на самом деле не требуется, потому что это всего лишь последний элемент в списке. Я обновлю, чтобы показать вам, что я имею в виду, - дайте мне знать, что вы думаете. — sprinter, 6 February 2015 в 12:37
Почему Deque и LinkedList, правда? ArrayList даст вам превосходную производительность и объем памяти, потому что вы никогда не добавляете, только добавляете. Вы также можете дешево оптимизировать, проверив, какой операнд из combine короче и concat, который один на более длинный. — Marko Topolnik, 6 February 2015 в 13:54
@MarkoTopolnik все отличные моменты. Я выбрал Deque для довольно ленивой причины: у него был метод peekLast! Но я согласен с тем, что ArrayList будет лучшим выбором - я обновлю ответ, если кто-то попытается использовать эту технику. Что касается производительности, я попробовал ее с потоком в 10 миллионов предметов, и это очень быстро. — sprinter, 6 February 2015 в 14:05
@MarkoTopolnik как вопрос интереса Я зарегистрировал информацию во время комбайна на очень большом потоке и обнаружил, что списки всегда были одинаковой длины. Я думаю, это должно быть артефактом того, как реализуются потоки. — sprinter, 6 February 2015 в 14:29
Это артефакт того, как источник потока в памяти, такой как массив или arraylist, разбивается (вниз по середине). Если вы использовали, скажем, Files.lines() или любой другой источник, основанный на IO, вы бы видели разные размеры. Несбалансированные деревья также будут приводить к неравномерным раздельным размерам. — Marko Topolnik, 6 February 2015 в 14:31

score 5 · Accepted Answer

Вы можете сделать это с помощью атомного номера. Например:

import java.util.concurrent.atomic.AtomicLong;
import java.util.stream.IntStream;
import java.util.stream.LongStream;

public class Accumulator {
    public static LongStream toCumulativeSumStream(IntStream ints){
        AtomicLong sum = new AtomicLong(0);
        return ints.sequential().mapToLong(sum::addAndGet);
    }

    public static void main(String[] args){
        LongStream sums = Accumulator.toCumulativeSumStream(IntStream.range(1, 5));
        sums.forEachOrdered(System.out::println);
    }
}

Эти выходы:

Я использовал Long для хранения сумм, потому что вполне возможно, что два ints будут хорошо дополняться Integer.MAX_VALUE, а у длинного меньше вероятность переполнения.

5

ответ дан Steve K 21 August 2018 в 07:16

1

Я нашел этот ответ интересным и неожиданным. Не могли бы вы ответить на несколько вопросов об этом? Почему вы использовали AtomicReference, а не AtomicInteger - с помощью addAndGet? Но что еще более важно, почему это меняет тот факт, что, если поток был параллельным, нет гарантии того, какой порядок происходит при накоплении? Как AtomicReference каким-то образом изменяет поведение потоков? Если да, то можете ли вы указать на это учебник или документацию? Благодарю. – sprinter 6 February 2015 в 08:34
2

Просто добавление к предыдущему вопросу, я подумал, что я попробую сам с параллельным IntStream. Это не работает. Так что это не совсем хороший ответ. – sprinter 6 February 2015 в 08:42
3

@sprinter Да, это не работает в параллельных потоках, но поскольку операция не может быть распараллелирована в любом случае, ее можно просто вызвать .sequential () перед ее запуском. – Adrian Leonhard 7 February 2015 в 08:45
4

Как вы говорите, операция не может быть распараллелена, поэтому я назвал .sequential() в моем обновленном коде. Я также использую AtomicLong вместо AtomicReference. Возникает вопрос: «Как мне получить другой поток из этого потока», который никогда не должен использовать коллекционную или промежуточную конструкцию, если это можно избежать - сбор в список - это тяжелая операция, тогда как мой метод почти не требует дополнительного времени для потока теоретически бесконечной длины ... – Steve K 9 February 2015 в 02:46