当前位置: 移动技术网 > IT编程>开发语言>.net > asp.net中C#获取字符串中汉字的个数的具体实现方法

asp.net中C#获取字符串中汉字的个数的具体实现方法

2017年12月12日  | 移动技术网IT编程  | 我要评论

photoshop在线,御兽王者第三部,hhh138

符串可以包括数字,字母,汉字或者其他的字符。使用char类型的isdigit静态方法可以判断字符串中的字符是否为数字,使用char类型中的isletter静态方法可以判断字符串中是否为字母。我们来实现一种方法来实现判断字符串中是否为汉字,通过此方法可以计算字符串中汉字的个数,运行效果如图:

首先根据效果图设置好form的界面和内容,box1.text为输入的字符串,我们对该字符串的处理,来计算汉字的个数,双击buton控件,编辑其单击事件代码。

我们看下汉字的unicode范围,普遍给出了0x4e00到0x9fa5,只要我们接受到的字符的16进制编码在此范围,我们就认为此字符为汉字(label4.text显示汉字的个数)

复制代码 代码如下:

string a=box1.text;
int k = 0;
for (int i = 0; i < a.length;i++ )
{
char j=a[i];
ushort s = j;
if (s >= 0x4e00&&s<=0x9fa5)
{
k++;
}
label4.text = “” + k;

后再再整理了一些函数 c#中使用正则表达式来从字符串中判断出汉字

复制代码 代码如下:

//首先引用命名空间
using system.text.regularexpressions;

//定义一个函数,返回字符串中的汉字个数
public static int gethannumfromstring(string str)
{
    int count = 0;
    regex regex = new regex(@"^[u4e00-u9fa5]{0,}$");

    for (int i = 0; i < str.length; i++)
    {
        if (regex.ismatch(str[i].tostring()))
        {
            count++;
        }
    }

    return count;
}

代码说明:

1、unicode字符的u4e00到u9fa5之间为汉字编码,所以使用它来表示汉字的正则匹配范围。
2、字符串可以直接进行索引,索引得到的值的数据类型为char,所以str[i].tostring()是为了把char再度转换为字符串。
3、使用regex的ismatch方法,可以判断字符串是否与给定的正则表达式匹配,如果匹配成功则返回true,否则为false。

例,获取一个字符串中的汉字的个数 c#获取字符串全角的个数

复制代码 代码如下:

static void main(string[] args)
        {
            while (true)
            {

      console.writeline("输入一串字符");
                string str = console.readline();//定义一个变量str用来存储输入的字符串
                int num= encoding.default.getbytecount(str);//encoding.default.getbytecount(str)在系统默认下计算对字符进行编码是所产生的字节数
                int len = str.length;//获取字符串的长度
                console.writeline("有{0}汉字",num-len);//num-len就是字符串中的汉字个数         
            }
}

例,这个也是正常的

复制代码 代码如下:

arraylist itemlist = new arraylist();
charenumerator cenumerator = textbox1.text.getenumerator();
regex regex = new regex("^[/u4e00-/u9fa5]{0,}$");
while (cenumerator.movenext())
{
     if(regex.ismatch(cenumerator.current.tostring(),0))
         itemlist.add(cenumerator.current.tostring());
     textbox2.text = itemlist.count.tostring();
}

原理是:获得字符串中汉字的个数时,可以首先定义一个与汉字相匹配的正则表达式,然后使用charenumerator对象的movenext方法循环访问字符串中的每个字符,如果访问的字符与定义的正则表达式相匹配,则将其添加到一个数组中,最后获得该数组的项数即为字符串中汉字的个数。获得字符串中汉字个数

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网