Строковая обработка CSV

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

blockquote>

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.
blockquote>

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа перестает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

20
задан Markus Safar 7 February 2016 в 14:30
поделиться

11 ответов

Вы могли использовать LINQ для Объектов :

string [] strings = contactList.Select(c => c.Name).ToArray();
string csv = string.Join(",", strings);

, Очевидно, который мог все быть сделан в одной строке, но это немного более ясно на два.

21
ответ дан 29 November 2019 в 23:17
поделиться

Ваш код, не действительно совместимый с полный формат CSV . Если Вы просто генерируете CSV от данных, которые не имеют никаких запятых, продвижения/конечных пробелов, вкладок, новых строк или кавычек, это должно быть прекрасным. Однако в большинстве реальных сценариев обмена данными, Вам действительно нужна полная реализация.

Для поколения к надлежащему CSV, можно использовать это:

public static String EncodeCsvLine(params String[] fields)
{
    StringBuilder line = new StringBuilder();

    for (int i = 0; i < fields.Length; i++)
    {
        if (i > 0)
        {
            line.Append(DelimiterChar);
        }

        String csvField = EncodeCsvField(fields[i]);
        line.Append(csvField);
    }

    return line.ToString();
}

static String EncodeCsvField(String field)
{
    StringBuilder sb = new StringBuilder();
    sb.Append(field);

    // Some fields with special characters must be embedded in double quotes
    bool embedInQuotes = false;

    // Embed in quotes to preserve leading/tralining whitespace
    if (sb.Length > 0 && 
        (sb[0] == ' ' || 
         sb[0] == '\t' ||
         sb[sb.Length-1] == ' ' || 
         sb[sb.Length-1] == '\t' ))
    {
        embedInQuotes = true;
    }

    for (int i = 0; i < sb.Length; i++)
    {
        // Embed in quotes to preserve: commas, line-breaks etc.
        if (sb[i] == DelimiterChar || 
            sb[i]=='\r' || 
            sb[i]=='\n' || 
            sb[i] == '"') 
        { 
            embedInQuotes = true;
            break;
        }
    }

    // If the field itself has quotes, they must each be represented 
    // by a pair of consecutive quotes.
    sb.Replace("\"", "\"\"");

    String rv = sb.ToString();

    if (embedInQuotes)
    {
        rv = "\"" + rv + "\"";
    }

    return rv;
}

не Мог бы быть самый эффективный код в мире, но он был протестирован. Реальный мир сосет по сравнению с быстрым примером кода :)

9
ответ дан 29 November 2019 в 23:17
поделиться

, Почему бы не пользоваться одной из библиотек CSV с открытым исходным кодом там?

я знаю, что это походит на излишество для чего-то, что кажется настолько простым, но как можно сказать комментариями и фрагментами кода, существуют больше, чем кажется на первый взгляд. В дополнение к обработке полного соответствия CSV Вы в конечном счете захотите обработать и чтение и запись CSVs..., и можно хотеть управление файлом.

я использовал , Открывают CSV на одном из моих проектов прежде (но существует много других для выбора из). Это, конечно, сделало мою жизнь легче. ;)

5
ответ дан 29 November 2019 в 23:17
поделиться

Не забывайте нашего старого друга "для". Это не столь привлекательно как foreach, но это имеет преимущество способности запуститься во втором элементе.

public string ReturnAsCSV(ContactList contactList)
{
    if (contactList == null || contactList.Count == 0)
        return string.Empty;

    StringBuilder sb = new StringBuilder(contactList[0].Name);

    for (int i = 1; i < contactList.Count; i++)
    {
        sb.Append(",");
        sb.Append(contactList[i].Name);
    }

    return sb.ToString();
}

Вы могли также перенестись, вторые Добавляют в, "если" это тестирует, содержит ли свойство Name двойную кавычку или запятую, и если так, выйдите из них соответственно.

5
ответ дан 29 November 2019 в 23:17
поделиться

Вы могли вместо этого добавить запятую как первую вещь в Вашем foreach.

if (sb.Length > 0) sb.Append(",");

3
ответ дан 29 November 2019 в 23:17
поделиться

Вы могли также сделать массив c. Имя данные и использование Строка. Соединение метод для создания строки.

public string ReturnAsCSV(ContactList contactList)
{
    List<String> tmpList = new List<string>();

    foreach (Contact c in contactList)
    {
        tmpList.Add(c.Name);
    }

    return String.Join(",", tmpList.ToArray());
}

Это не могло бы быть столь же производительно как подход StringBuilder, но это определенно выглядит более чистым.

кроме того, Вы могли бы хотеть рассмотреть использование .CurrentCulture. TextInfo. ListSeparator вместо трудно кодированной запятой - Если Ваш вывод будет импортированным в другие приложения, у Вас могли бы быть проблемы с ним. ListSeparator может отличаться через различные культуры и MS Excel по крайней мере, соблюдает эту установку. Так:

return String.Join(
    System.Globalization.CultureInfo.CurrentCulture.TextInfo.ListSeparator,
    tmpList.ToArray());
3
ответ дан 29 November 2019 в 23:17
поделиться

мне нравится идея добавить запятую путем проверки, пуст ли контейнер, но разве который не означает больше обработки, поскольку это должно проверить длину строки на каждом возникновении?

Вы преждевременно оптимизируете, хит производительности был бы незначителен.

1
ответ дан 29 November 2019 в 23:17
поделиться

Просто мысль, но не забывают обрабатывать и кавычки запятой (") в значениях полей, иначе Ваш файл CSV может повредить потребительское средство чтения.

1
ответ дан 29 November 2019 в 23:17
поделиться

Я использовал этот метод прежде. Свойство Length StringBuilder не только для чтения настолько вычитающее это, каждый имеет в виду усеченный последний знак. Но необходимо удостовериться, что длина не является нулем для запуска с (который произошел бы, если список пуст), потому что установка длины к меньше, чем нулю является ошибкой.

public string ReturnAsCSV(ContactList contactList)
{
    StringBuilder sb = new StringBuilder();

    foreach (Contact c in contactList)       
    { 
        sb.Append(c.Name + ",");       
    }

    if (sb.Length > 0)  
        sb.Length -= 1;

    return sb.ToString();  
}
1
ответ дан 29 November 2019 в 23:17
поделиться

Как насчет некоторой обрезки?

public string ReturnAsCSV(ContactList contactList)
{
    StringBuilder sb = new StringBuilder();

    foreach (Contact c in contactList)
    {
        sb.Append(c.Name + ",");
    }

    return sb.ToString().Trim(',');
}
0
ответ дан 29 November 2019 в 23:17
поделиться

Как насчет того, чтобы отследить, являетесь ли Вы на первом объекте и только добавляете запятую прежде объект, если это не первое.

public string ReturnAsCSV(ContactList contactList)
{
    StringBuilder sb = new StringBuilder();
    bool isFirst = true;

    foreach (Contact c in contactList) {
        if (!isFirst) { 
          // Only add comma before item if it is not the first item
          sb.Append(","); 
        } else {
          isFirst = false;
        }

        sb.Append(c.Name);
    }

    return sb.ToString();
}
0
ответ дан 29 November 2019 в 23:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: