Парсинг файла форматированного текста CSV

Question

Парсинг файла форматированного текста CSV

У меня есть текстовый файл, который похож на это:

1,Smith, 249.24, 6/10/2010
2,Johnson, 1332.23, 6/11/2010
3,Woods, 2214.22, 6/11/2010
1,Smith, 219.24, 6/11/2010

Я должен смочь найти баланс для клиента в данную дату.

Я задаюсь вопросом, должен ли я:

A. Запустите с конца и считайте каждую строку в Массив по одному. Проверьте индекс фамилии, чтобы видеть, является ли это клиент, мы ищем. Затем отобразите индекс баланса первого соответствия.

или

B. Используйте RegEx, чтобы найти соответствие и отобразить его.

У меня нет большого опыта с RegEx, но я изучу это, если это не будет никакой brainer в такой ситуации.

7

c# parsing

задан SteveC 30 January 2012 в 08:41

7 ответов

Это выглядит как довольно стандартный формат типа CSV, который достаточно легко обработать. Вы действительно можете сделать это с помощью ADO.Net и поставщика Jet, но я думаю, что в конечном итоге будет проще обработать это самостоятельно.

Итак, во-первых, вы хотите обработать фактические текстовые данные. Я предполагаю, что разумно предположить, что каждая запись разделена некоторым символом новой строки, поэтому вы можете использовать метод ReadLine, чтобы легко получить каждую запись:

StreamReader reader = new StreamReader("C:\Path\To\file.txt")
while(true)
{
    var line = reader.ReadLine();
    if(string.IsNullOrEmpty(line))
        break;
    // Process Line
}

А затем для обработки каждой строки вы можете разделить строку запятыми и сохранить значения в структуру данных. Итак, если вы используете такую структуру данных:

public class MyData
{
    public int Id { get; set; }
    public string Name { get; set; }
    public decimal Balance { get; set; }
    public DateTime Date { get; set; }
}

И вы можете обрабатывать строчные данные с помощью такого метода:

public MyData GetRecord(string line)
{
    var fields = line.Split(',');
    return new MyData()
    {
        Id = int.Parse(fields[0]),
        Name = fields[1],
        Balance = decimal.Parse(fields[2]),
        Date = DateTime.Parse(fields[3])
    };
}

Это простейший пример, не учитывающий случаи, когда поля могут быть пустыми. , и в этом случае вам нужно будет либо поддерживать NULL для этих полей (с использованием обнуляемых типов int ?, decimal? и DateTime?), или определить какое-либо значение по умолчанию, которое будет присвоено этим значениям.

Итак, как только у вас есть это, вы можете сохранить коллекцию объектов MyData в списке и легко выполнять вычисления на его основе.Итак, учитывая ваш пример поиска баланса на заданную дату, вы можете сделать что-то вроде:

var data = customerDataList.First(d => d.Name == customerNameImLookingFor 
                                    && d.Date == dateImLookingFor);

Где customerDataList - это коллекция объектов MyData , прочитанных из файла, customerNameImLookingFor - это переменная, содержащая имя клиента, а customerDateImLookingFor - переменная, содержащая дату.

Я использовал эту технику для обработки данных в текстовых файлах в прошлом для файлов от пары записей до десятков тысяч записей, и она работает довольно хорошо.

2