当前位置：移动技术网 > IT编程>脚本编程>Lua > Lua中获取utf8字符串长度的方法和自定义函数

Lua中获取utf8字符串长度的方法和自定义函数

2017年12月08日 | 移动技术网IT编程 | 我要评论

--- 获取utf8编码字符串正确长度的方法

-- @param str

-- @return number

function utfstrlen(str)

local len = #str;

local left = len;

local cnt = 0;

local arr={0,0xc0,0xe0,0xf0,0xf8,0xfc};

while left ~= 0 do

local tmp=string.byte(str,-left);

local i=#arr;

while arr[i] do

if tmp>=arr[i] then left=left-i;break;end

i=i-1;

end

cnt=cnt+1;

end

return cnt;

end

lua 的string库不支持处理utf-8编码的汉字。用lua要处理汉字还是很费劲的。

utf8的编码规则：

1. 字符的第一个字节范围： 0x00—0x7f(0-127),或者 0xc2—0xf4(194-244); utf8 是兼容 ascii 的，所以 0~127 就和 ascii 完全一致
2. 0xc0, 0xc1,0xf5—0xff(192, 193 和 245-255)不会出现在utf8编码中
3. 0x80—0xbf(128-191)只会出现在第二个及随后的编码中(针对多字节编码，如汉字)

这样我们可以利用lua强大的模式匹配，来实现我们要的效果，关键的处理有这么两个：
1. local _, count = string.gsub(str, "[^\128-\193]", ""),用来得到str中的字符数
2. for uchar in string.gfind(str, "[%z\1-\127\194-\244][\128-\191]*") do tab[#tab+1] = uchar end,用来把str中的每个字符映射到tab中

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

phpredis执行LUA脚本示例代码

前言本文主要给大家介绍了关于phpredis执行lua脚本的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介... [阅读全文]
Lua面向对象编程之基础结构table简例

面向对象编程（object oriented programming，oop）是一种非常流行的计算机编程架构。 lua中最基本... [阅读全文]
Lua协同程序coroutine的简介及优缺点

什么是协同(coroutine)？ lua 协同程序(coroutine)与线程比较类似：拥有独立的堆栈，独立的局部变量，独立的指... [阅读全文]
lua读取redis数据的null判断示例代码

前言为什么要用lua脚本操作redis数据库? 1.减少开销–减少向redis服务器的请求次数 2.原子操作... [阅读全文]
Lua游戏开发教程之时区问题详解

前言什么是lua？ lua 是一个小巧的脚本语言，巴西里约热内卢天主教大学里的一个研究小组于1993年开发，其设计目的是为了嵌... [阅读全文]
Lua中pairs与ipairs的区别总结

前言最近在用模块写一个流量转发的东西，根据 header, body, cookie 按照流量比例转发到另一个地方。看了前人写... [阅读全文]
深入谈谈lua中神奇的table

前言最近在尝试配置 awesome wm，因此粗略地学习了一下 lua 。在学习过程中，我完全被 table 在 lua 中的... [阅读全文]
浅析C\C++和Lua的通信方式

为了实现Lua和其他语言之间的通信，Lua虚拟机为C\C++提供了两个特性：一，Lua_State状态机 &nbs... [阅读全文]
举例简介Lua中函数的基本用法

复制代码代码如下:function fib(n) if n < 2 then return 1 end &... [阅读全文]
OpenResty中正则模式匹配的2种方法详解

前言本文介绍 openresty 的两种正则模式匹配。首先需要说明的是，openresty 套件中包含了两种语法：一种是主要... [阅读全文]

网友评论


验证码：

Lua中获取utf8字符串长度的方法和自定义函数

2017年12月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论