当前位置: 移动技术网 > IT编程>开发语言>JavaScript > 利用JS如何计算字符串所占字节数示例代码

利用JS如何计算字符串所占字节数示例代码

2017年12月12日  | 移动技术网IT编程  | 我要评论

前言

在工作中是不是经常会遇到字符串,但是要求控制字节数的需求?因为很多时候数据库中对字节数有控制,所以在前端过程中就需要判断一下,今天我们来分享一下。

本文主要给大家介绍了关于js计算字符串所占字节数的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。

示例代码

/**
 * 计算字符串所占的内存字节数,默认使用utf-8的编码方式计算,也可制定为utf-16
 * utf-8 是一种可变长度的 unicode 编码格式,使用一至四个字节为每个字符编码
 * 
 * 000000 - 00007f(128个代码)  0zzzzzzz(00-7f)        一个字节
 * 000080 - 0007ff(1920个代码)  110yyyyy(c0-df) 10zzzzzz(80-bf)    两个字节
 * 000800 - 00d7ff 
 00e000 - 00ffff(61440个代码) 1110xxxx(e0-ef) 10yyyyyy 10zzzzzz   三个字节
 * 010000 - 10ffff(1048576个代码) 11110www(f0-f7) 10xxxxxx 10yyyyyy 10zzzzzz 四个字节
 * 
 * 注: unicode在范围 d800-dfff 中不存在任何字符
 * {@link http://zh.wikipedia.org/wiki/utf-8}
 * 
 * utf-16 大部分使用两个字节编码,编码超出 65535 的使用四个字节
 * 000000 - 00ffff 两个字节
 * 010000 - 10ffff 四个字节
 * 
 * {@link http://zh.wikipedia.org/wiki/utf-16}
 * @param {string} str 
 * @param {string} charset utf-8, utf-16
 * @return {number}
 */
  
 var sizeof = function(str, charset){
  var total = 0,
   charcode,
   i,
   len;
  charset = charset ? charset.tolowercase() : '';
  if(charset === 'utf-16' || charset === 'utf16'){
   for(i = 0, len = str.length; i < len; i++){
    charcode = str.charcodeat(i);
    if(charcode <= 0xffff){
     total += 2;
    }else{
     total += 4;
    }
   }
  }else{
   for(i = 0, len = str.length; i < len; i++){
    charcode = str.charcodeat(i);
    if(charcode <= 0x007f) {
     total += 1;
    }else if(charcode <= 0x07ff){
     total += 2;
    }else if(charcode <= 0xffff){
     total += 3;
    }else{
     total += 4;
    }
   }
  }
  return total;
 }

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对移动技术网的支持。

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网