в отношении списка строк python [duplicate]

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа перестает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

18
задан Leandro Papasidero 20 March 2015 в 20:46
поделиться

4 ответа

set работает так же быстро, как и получается.

Однако, если вы переписываете свой код для создания set один раз и не меняете его, вы можете использовать встроенный frozenset тип.

Если у вас все еще есть проблемы со скоростью, вам нужно ускорить вашу программу другими способами, например, используя PyPy вместо cPython.

23
ответ дан agf 19 August 2018 в 12:51
поделиться
  • 1
    как PyPy ускоряет cPython? – BrainStorm 18 August 2011 в 17:03
  • 2
    speed.pypy.org . В основном он реализует компилятор «точно в срок», как и механизм JavaScript в вашем браузере, который может значительно ускорить многие типы кода. В большинстве случаев он в 2-100 раз быстрее. – agf 18 August 2011 в 17:15
  • 3
    Я пробовал frozenset и PyPy, и улучшения нет: / – Leszek 18 August 2011 в 17:17
  • 4
  • 5
    Использование fozenset () вместо set () увеличило скорость на 15% в моем коде (несвязанный проект). – ChaimG 18 July 2016 в 21:23

Как упоминалось urschrei, вы должны «векторизовать» чек. Быстрее проверять наличие миллиона элементов один раз (как это делается на C), чем проверять один элемент на миллион раз.

-2
ответ дан Gecko 19 August 2018 в 12:51
поделиться

Вы должны попытаться разделить свои данные, чтобы ускорить поиск. Дерево strcuture позволит вам найти очень быстро, если данные присутствуют или нет.

Например, начните с простой карты, которая связывает первую букву со всеми клавишами, начинающимися с этой буквы, таким образом, вы 't нужно искать все ключи, но только их меньшую часть.

Это будет выглядеть так:

ids = {}
for id in open(idfile):
    ids.setdefault(id[0], set()).add(id)

for line in sys.stdin:
    id=line.strip()
    if id in ids.get(id[0], set()):
       #print fastq
       print id
       #update ids
       ids[id[0]].remove( id )

Создание будет немного медленнее, но поиск должен быть намного быстрее (Я ожидал бы в 20 раз быстрее, если бы символ fisrt ваших ключей был хорошо распределен, а не всегда один и тот же).

Это первый шаг, вы можете сделать то же самое со вторым символом, и так на, поиск будет просто ходить по дереву с каждой буквы ...

0
ответ дан JC Plessis 19 August 2018 в 12:51
поделиться
  • 1
    Установить доступ O (1), как бы дерево ускорилось? – agf 18 August 2011 в 18:23
  • 2
    Ну, похоже, ты прав. Моя ошибка: сегодня я действительно узнал что-то большое, я думал, что набор был простым списком, не имеющим двойной ценности. У вас есть URL-адрес, где я мог бы найти дополнительную информацию об этом? Я не могу найти ничего о скорости доступа к официальной документации. – JC Plessis 18 August 2011 в 18:53
  • 3
    Просто взгляните на secure.wikimedia.org/wikipedia/en/wiki/Hash_table , вот что такое наборы и словари. – agf 18 August 2011 в 19:02
  • 4
    @JC Plessis: посмотрите на сложную сложность операций python: wiki.python.org/moin/TimeComplexity – Cédric Julien 18 August 2011 в 22:11

Как я уже отмечал в своем комментарии, то, что, вероятно, замедляет вас, состоит в том, что вы последовательно проверяете каждую строку из sys.stdin для членства в вашем «главном» наборе. Это будет действительно, очень медленно и не позволит вам использовать скорость заданных операций. В качестве примера:

#!/usr/bin/env python

import random

# create two million-element sets of random numbers
a = set(random.sample(xrange(10000000),1000000))
b = set(random.sample(xrange(10000000),1000000))
# a intersection b
c = a & b
# a difference c
d = list(a - c) 
print "set d is all remaining elements in a not common to a intersection b"
print "length of d is %s" % len(d)

Вышеуказанное работает в ~ 6 секундах секунд на моей пятилетней машине, и оно тестирует членство в больших наборах, чем вам нужно (если только я не понял вас). Большая часть этого времени фактически занята созданием наборов, поэтому у вас даже не будет этих накладных расходов. Тот факт, что строки, на которые вы ссылаетесь, длинны, здесь не уместен; создание набора создает хэш-таблицу, как объясняет agf. Я подозреваю (хотя, опять же, непонятно из вашего вопроса), что если вы можете получить все свои входные данные в набор до , вы проводите любое тестирование членства, это будет намного быстрее, в отличие от считывая его по одному элементу за раз, , затем проверяет наличие набора

9
ответ дан urschrei 19 August 2018 в 12:51
поделиться
Другие вопросы по тегам:

Похожие вопросы: