почему добавление b, прежде чем строка решает TypeError: startswith first arg должен быть байтами или кортежем байтов, а не str [duplicate]

Question

почему добавление b, прежде чем строка решает TypeError: startswith first arg должен быть байтами или кортежем байтов, а не str [duplicate]

Я бы рекомендовал проверить пакет sqldf Gabor Grothendieck , который позволяет вам выражать эти операции в SQL.

library(sqldf)

## inner join
df3 <- sqldf("SELECT CustomerId, Product, State 
              FROM df1
              JOIN df2 USING(CustomerID)")

## left join (substitute 'right' for right join)
df4 <- sqldf("SELECT CustomerId, Product, State 
              FROM df1
              LEFT JOIN df2 USING(CustomerID)")

Я нахожу синтаксис SQL более простым и более естественным, чем его эквивалент R (но это может просто отражать смещение RDBMS).

Для получения дополнительной информации о объединениях см. Gabor's sqldf GitHub .

74

python python-3.x startswith

задан Martijn Pieters 7 June 2014 в 17:01

2 ответа

Префикс b означает bytes строковый литерал .

Если вы видите, что он используется в исходном коде Python 3, выражение создает bytes object , а не обычный объект Unicode str . Если вы видите, что это отражено в вашей оболочке Python или как часть списка, dict или другого содержимого контейнера, то вы видите объект bytes, представленный с использованием этой нотации.

bytes объекты в основном содержат последовательность из целых чисел в диапазоне 0-255, но если они представлены, Python отображает эти байты как кодовые точки ASCII, чтобы облегчить чтение их содержимого. Любые байты вне диапазона для печати символов ASCII отображаются как escape-последовательности (например, \n, \x82 и т. Д.).

Поскольку объект bytes состоит из последовательность целых чисел, вы можете построить объект bytes из любой другой последовательности целых чисел со значениями в диапазоне 0-255, например, список:

bytes([72, 101, 108, 108, 111])

bytes model двоичный данных , включая закодированный текст . Если ваше значение bytes содержит текст, вам необходимо его сначала декодировать, используя правильный кодек. Например, если данные кодируются как UTF-8, вы можете получить значение Unicode str с помощью:

strvalue = bytesvalue.decode('utf-8')

И наоборот, чтобы перейти от текста в объекте str к bytes вам нужно закодировать . Вам нужно решить, какую кодировку использовать; по умолчанию используется UTF-8, но то, что вам нужно, сильно зависит от вашего прецедента:

bytesvalue = strvalue.encode('utf-8')

Вы также можете использовать конструктор bytes(strvalue, encoding), чтобы сделать то же самое.

Оба метода декодирования и кодирования принимают дополнительный аргумент в , чтобы указать, как обрабатывать ошибки .

Python 2, версии 2.6 и 2.7 также поддерживают создание строки литералов с использованием синтаксиса строки b'..' string, чтобы облегчить выполнение кода, который работает как на Python 2, так и на 3.

62

ответ дан Martijn Pieters 21 August 2018 в 13:56

Другие вопросы по тегам:

python python-3.x startswith

Похожие вопросы:

score 48 · Accepted Answer

Это Python3 bytes literal . Этот префикс отсутствует в Python 2.5 и старше (он эквивалентен простой строке 2.x, а простая строка 3.x эквивалентна литералу с префиксом u в 2.x). В Python 2.6+ он эквивалентен простой строке, для совместимости с 3.x .

48

ответ дан wRAR 21 August 2018 в 13:56

1

@WRAR: Был ли в коде python 2.6 я видел это, кажется, он был введен в python2.6 – kriss 7 April 2010 в 15:00
2

Я специально проверил его в ссылке 2.6 перед публикацией: docs.python.org/reference/lexical_analysis.html#literals – wRAR 7 April 2010 в 15:02
3

ОК, «Для будущей совместимости Python 2.6 добавляет байты в качестве синонима для типа str, а также поддерживает букву b» из «Что нового». – wRAR 7 April 2010 в 15:05
4

поскольку приведенные выше ссылки теперь указывают на ссылку 2.7 и добавлен префикс b, здесь приведена ссылка на старую фиктивную ссылку docs.python.org/release/2.6.8/reference/… – kriss 20 June 2012 в 09:38