Какова официальная кодировка для потокового API Twitter? Лучшее предположение - UTF-8, исходя из того, что я видел, но я хотел бы избежать предположений.
Единственная часть сайта Twitter, где я видел хотя бы намек на то, что они используют официальную кодировку, находится здесь:
Twitter не хочет наказывать пользователя за то, что мы используем UTF-8, или за то, что клиент API использовал более длинное представление
Есть ли у кого-нибудь более "официальный" ответ? Я пишу токенизатор state-machine для потокового API, который делает определенные предположения. Последнее, чего я хочу, это столкнуться с чем-то вроде UTF-16.
Спасибо! :D