Java конвертирует Windows-1252 в UTF-8

Почему Split, если вы можете совместить?

Воскрешая этот вопрос, потому что по какой-то причине простое решение не было упомянуто. Вот наше красиво компактное регулярное выражение:

"[^"]*"|[^,]+

Это будет соответствовать всем желаемым фрагментам ( см. Демонстрацию ).

Пояснение

  • С "[^"]*" мы сопоставляем полный "double-quoted strings"
  • или |
  • , мы сопоставляем [^,]+ любые символы, которые не являются запятой.

Возможная доработка заключается в том, чтобы улучшить строчную сторону чередования, чтобы позволить цитированным строкам включать экранированные кавычки.

-1
задан Prashant Vhasure 13 July 2018 в 06:32
поделиться