Официальная кодировка, используемая Twitter Streaming API? Это UTF-8?

Какова официальная кодировка для потокового API Twitter? Лучшее предположение - UTF-8, исходя из того, что я видел, но я хотел бы избежать предположений.

Единственная часть сайта Twitter, где я видел хотя бы намек на то, что они используют официальную кодировку, находится здесь:

Twitter не хочет наказывать пользователя за то, что мы используем UTF-8, или за то, что клиент API использовал более длинное представление

https://dev.twitter.com/docs/counting-characters

Есть ли у кого-нибудь более "официальный" ответ? Я пишу токенизатор state-machine для потокового API, который делает определенные предположения. Последнее, чего я хочу, это столкнуться с чем-то вроде UTF-16.

Спасибо! :D

9
задан IHeartDuckies 25 November 2011 в 23:04
поделиться