javascript dhe manipulimi i vargut w / utf-16 çifte zëvendësuese

Question

javascript dhe manipulimi i vargut w / utf-16 çifte zëvendësuese

Unë jam duke punuar në një aplikacion në Twitter dhe thjesht u futa në botën e utf-8 (16). Duket se shumica e funksioneve të vargjeve javascript janë po aq të verbër sa çiftet zëvendësuese si unë. Duhet të rikodifikoj disa gjëra për ta bërë atë të vetëdijshëm për karakterin e gjerë.

Unë kam këtë funksion për të analizuar vargjet në vargje duke ruajtur çiftet zëvendësuese. Pastaj do të rikodifikoj disa funksione për t'u marrë me vargjet sesa me vargjet.

function sortSurrogates(str){
  var cp = [];                 // array to hold code points
  while(str.length){           // loop till we've done the whole string
    if(/[\uD800-\uDFFF]/.test(str.substr(0,1))){ // test the first character
                               // High surrogate found low surrogate follows
      cp.push(str.substr(0,2)); // push the two onto array
      str = str.substr(2);     // clip the two off the string
    }else{                     // else BMP code point
      cp.push(str.substr(0,1)); // push one onto array
      str = str.substr(1);     // clip one from string 
    }
  }                            // loop
  return cp;                   // return the array
}

Pyetja ime është, a ka diçka më të thjeshtë që po më mungon? Shoh kaq shumë njerëz që përsërisin që javascript merret me utf-16 vendas, megjithatë testimi im më bën të besoj, se mund të jetë formati i të dhënave, por funksionet nuk e dinë akoma. A më mungon diçka e thjeshtë?

EDIT: Për të ndihmuar në ilustrimin e çështjes:

var a = "0123456789"; // U+0030 - U+0039 2 bytes each
var b = "


         
            16

         
         
            javascript string unicode twitter utf-16         
         
         
            задан tchrist            30 July 2011 в 21:51 
         
         
         поделиться


  

      
    

    
   
   
      0 ответов
      

      
         
                     
      

            
          Другие вопросы по тегам:          
         javascript string unicode twitter utf-16       
        Похожие вопросы:

        
          
                          99 
 Скрытые функции JavaScript? [закрытый] - 23 May 2017 02:10 
                            70 
 Что такое JavaScript-версия sleep ()? - 17 March 2018 18:15 
                            61 
 Как я могу отформатировать числа в виде строки валюты в JavaScript? - 26 May 2019 04:14 
                            55 
 Как проверить, является ли данная строка палиндромом? [закрытый] - 18 October 2011 09:05 
                            44 
 Какой синтаксис является предпочтительным для определения перечислений в JavaScript? [закрыто] - 26 December 2018 06:38 
                            40 
 Получить n-й символ строки в языке программирования Swift - 10 December 2018 21:00 
                            40 
 Как лучше всего обнаружить мобильное устройство? - 24 April 2019 12:27