Я видел очень умный код для преобразования между кодовыми точками Unicode и UTF-8, поэтому мне было интересно, есть ли у кого-нибудь (или было бы интересно разработать) это.
В частности, мне интересно, есть ли ярлыки, позволяющие узнать, когда потребуется суррогатная пара, без полного преобразования UTF -8 в кодовую точку.
Лучший код UTF-8 для кодовых точек, который я видел, использует методы векторизации, поэтому мне интересно, возможно ли это и здесь.