当前位置：移动技术网 > IT编程>开发语言>Java > Java 判断字符为中文实例代码(超管用)

Java 判断字符为中文实例代码(超管用)

2019年07月22日 | 移动技术网IT编程 | 我要评论

在做项目中经常会遇到有项目需求是需要判断字符为中文的一些问题，所以搜集了判断中文字符的代码片段，特此分享供大家参考。

直接贴出代码了，里面有详细的注释。

package com.coder4j.main;
import java.util.regex.pattern;
/**
* java 判断中文字符
* 
* @author chinaxiang
* @date 2015-08-11
*
*/
public class checkchinese {
public static void main(string[] args) {
// 纯英文
string s1 = "hello,tom.!@#$%^&*()_+-={}|[];':\"?";
// 纯中文（不含中文标点）
string s2 = "你好中国";
// 纯中文（含中文标点）
string s3 = "你好，中国。《》：“”‘'；（）【】！￥、";
// 韩文
string s4 = "한국어난";
// 日文
string s5 = "ぎじゅつ";
// 特殊字符
string s6 = "��";
string s7 = "╃";
string s8 = "╂";
// 繁体中文
string s9 = "蒼老師";
// 1 使用字符范围判断
system.out.println("s1是否包含中文：" + haschinesebyrange(s1));// false
system.out.println("s2是否包含中文：" + haschinesebyrange(s2));// true
system.out.println("s3是否包含中文：" + haschinesebyrange(s3));// true
system.out.println("s4是否包含中文：" + haschinesebyrange(s4));// false
system.out.println("s5是否包含中文：" + haschinesebyrange(s5));// false
system.out.println("s6是否包含中文：" + haschinesebyrange(s6));// false
system.out.println("s7是否包含中文：" + haschinesebyrange(s7));// false
system.out.println("s8是否包含中文：" + haschinesebyrange(s8));// false
system.out.println("s9是否包含中文：" + haschinesebyrange(s9));// true
system.out.println("-------分割线-------");
system.out.println("s1是否全是中文：" + ischinesebyrange(s1));// false
system.out.println("s2是否全是中文：" + ischinesebyrange(s2));// true
system.out.println("s3是否全是中文：" + ischinesebyrange(s3));// false 中文标点不在范围内
system.out.println("s4是否全是中文：" + ischinesebyrange(s4));// false
system.out.println("s5是否全是中文：" + ischinesebyrange(s5));// false
system.out.println("s6是否全是中文：" + ischinesebyrange(s6));// false
system.out.println("s7是否全是中文：" + ischinesebyrange(s7));// false
system.out.println("s8是否全是中文：" + ischinesebyrange(s8));// false
system.out.println("s9是否全是中文：" + ischinesebyrange(s9));// true
system.out.println("-------分割线-------");
// 2 使用字符范围正则判断（结果同1）
system.out.println("s1是否包含中文：" + haschinesebyreg(s1));// false
system.out.println("s2是否包含中文：" + haschinesebyreg(s2));// true
system.out.println("s3是否包含中文：" + haschinesebyreg(s3));// true
system.out.println("s4是否包含中文：" + haschinesebyreg(s4));// false
system.out.println("s5是否包含中文：" + haschinesebyreg(s5));// false
system.out.println("s6是否包含中文：" + haschinesebyreg(s6));// false
system.out.println("s7是否包含中文：" + haschinesebyreg(s7));// false
system.out.println("s8是否包含中文：" + haschinesebyreg(s8));// false
system.out.println("s9是否包含中文：" + haschinesebyreg(s9));// true
system.out.println("-------分割线-------");
system.out.println("s1是否全是中文：" + ischinesebyreg(s1));// false
system.out.println("s2是否全是中文：" + ischinesebyreg(s2));// true
system.out.println("s3是否全是中文：" + ischinesebyreg(s3));// false 中文标点不在范围内
system.out.println("s4是否全是中文：" + ischinesebyreg(s4));// false
system.out.println("s5是否全是中文：" + ischinesebyreg(s5));// false
system.out.println("s6是否全是中文：" + ischinesebyreg(s6));// false
system.out.println("s7是否全是中文：" + ischinesebyreg(s7));// false
system.out.println("s8是否全是中文：" + ischinesebyreg(s8));// false
system.out.println("s9是否全是中文：" + ischinesebyreg(s9));// true
system.out.println("-------分割线-------");
// 3 使用cjk字符集判断
system.out.println("s1是否包含中文：" + haschinese(s1));// false
system.out.println("s2是否包含中文：" + haschinese(s2));// true
system.out.println("s3是否包含中文：" + haschinese(s3));// true
system.out.println("s4是否包含中文：" + haschinese(s4));// false
system.out.println("s5是否包含中文：" + haschinese(s5));// false
system.out.println("s6是否包含中文：" + haschinese(s6));// false
system.out.println("s7是否包含中文：" + haschinese(s7));// false
system.out.println("s8是否包含中文：" + haschinese(s8));// false
system.out.println("s9是否包含中文：" + haschinese(s9));// true
system.out.println("-------分割线-------");
system.out.println("s1是否全是中文：" + ischinese(s1));// false
system.out.println("s2是否全是中文：" + ischinese(s2));// true
system.out.println("s3是否全是中文：" + ischinese(s3));// true 中文标点也被包含进来
system.out.println("s4是否全是中文：" + ischinese(s4));// false
system.out.println("s5是否全是中文：" + ischinese(s5));// false
system.out.println("s6是否全是中文：" + ischinese(s6));// false
system.out.println("s7是否全是中文：" + ischinese(s7));// false
system.out.println("s8是否全是中文：" + ischinese(s8));// false
system.out.println("s9是否全是中文：" + ischinese(s9));// true
}
/**
* 是否包含中文字符<br>
* 包含中文标点符号<br>
* 
* @param str
* @return
*/
public static boolean haschinese(string str) {
if (str == null) {
return false;
}
char[] ch = str.tochararray();
for (char c : ch) {
if (ischinese(c)) {
return true;
}
}
return false;
}
/**
* 是否全是中文字符<br>
* 包含中文标点符号<br>
* 
* @param str
* @return
*/
public static boolean ischinese(string str) {
if (str == null) {
return false;
}
char[] ch = str.tochararray();
for (char c : ch) {
if (!ischinese(c)) {
return false;
}
}
return true;
}
/**
* 是否是中文字符<br>
* 包含中文标点符号<br>
* 
* @param c
* @return
*/
private static boolean ischinese(char c) {
character.unicodeblock ub = character.unicodeblock.of(c);
if (ub == character.unicodeblock.cjk_unified_ideographs) {
return true;
} else if (ub == character.unicodeblock.cjk_compatibility_ideographs) {
return true;
} else if (ub == character.unicodeblock.cjk_symbols_and_punctuation) {
return true;
} else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_a) {
return true;
} else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_b) {
return true;
} else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_c) {
return true;
} else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_d) {
return true;
} else if (ub == character.unicodeblock.general_punctuation) {
return true;
} else if (ub == character.unicodeblock.halfwidth_and_fullwidth_forms) {
return true;
}
return false;
}
/**
* 是否包含汉字<br>
* 根据汉字编码范围进行判断<br>
* cjk统一汉字（不包含中文的，。《》（）“‘'”、！￥等符号）<br>
* 
* @param str
* @return
*/
public static boolean haschinesebyreg(string str) {
if (str == null) {
return false;
}
pattern pattern = pattern.compile("[\\u4e00-\\u9fbf]+");
return pattern.matcher(str).find();
}
/**
* 是否全是汉字<br>
* 根据汉字编码范围进行判断<br>
* cjk统一汉字（不包含中文的，。《》（）“‘'”、！￥等符号）<br>
* 
* @param str
* @return
*/
public static boolean ischinesebyreg(string str) {
if (str == null) {
return false;
}
pattern pattern = pattern.compile("[\\u4e00-\\u9fbf]+");
return pattern.matcher(str).matches();
}
/**
* 是否包含汉字<br>
* 根据汉字编码范围进行判断<br>
* cjk统一汉字（不包含中文的，。《》（）“‘'”、！￥等符号）<br>
* 
* @param str
* @return
*/
public static boolean haschinesebyrange(string str) {
if (str == null) {
return false;
}
char[] ch = str.tochararray();
for (char c : ch) {
if (c >= 0x4e00 && c <= 0x9fbf) {
return true;
}
}
return false;
}
/**
* 是否全是汉字<br>
* 根据汉字编码范围进行判断<br>
* cjk统一汉字（不包含中文的，。《》（）“‘'”、！￥等符号）<br>
* 
* @param str
* @return
*/
public static boolean ischinesebyrange(string str) {
if (str == null) {
return false;
}
char[] ch = str.tochararray();
for (char c : ch) {
if (c < 0x4e00 || c > 0x9fbf) {
return false;
}
}
return true;
}
}

如果仅仅去判断是否是中文，不需判断中文标点的话，推荐使用正则去匹配，可能更高效点。

以上代码内容给大家介绍了java 判断字符为中文实例代码(超管用)，希望对大家有所帮助。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

sap cloud platform destination的配置

我这边有一个实际的项目需要通过sap ui5画面来实时调用sap cloud platform integrat... [阅读全文]
ceph部署rgw对象存储网关高可用集群

部署rgw对象网关节点参考：https://docs.ceph.com/docs/master/install/... [阅读全文]
战略升级，瞄准全场景，华为云如何打好数据库这张牌？

年初，关于华为关停GaussDB数据库产品线的传言可谓是有板有眼、甚嚣尘上。如今，随着华为云在TechWave技... [阅读全文]
springcloud中feign调用处理mybatis-plus Ipage反序列化问题。

通过feign接口返回的分页列表IPage，出现报错，具体报错内容如下：feign.codec.DecodeEx... [阅读全文]
大数据云计算——Azkaban组件

什么是 AzkabanAzkaban 是由 Linkedin 公司推出的一个批量工作流任务调度器，主要用于在一个... [阅读全文]
荐聊聊数据库表结构设计心得

本文讨论是一般表的设计，有一定的普遍性和通用性，当然对于特殊性的考量则不在本文讨论之列。自增 idJava 层的... [阅读全文]
SpringCloud各个组件最强总结

一、概念1.1 什么是Spring Cloud？Spring Cloud就是微服务系统架构的一站式解决方案，在平... [阅读全文]
微服务之SpringCloud

# 微服务介绍将一个原本独立的系统拆分成多个小型服务，这些小型服务都在各自独立的进程中运行，并使用轻量级机制通信... [阅读全文]
劝退记：如你如我，平庸且不甘 | 年中总结

关于我前端劝退师，最近也叫前端失业师。没能力没学历没背景，三无前端。工作第四年，想和优秀的一批人竞争，永远和自己... [阅读全文]
Flume 史上最全面的大数据学习第十篇（一）别再说不知道flume是什么了

昨天没有增加小粉丝，我反思了一下自己，是不是我写的东西太过枯燥了呀！挺难受的！算了还是不说了，每天都是美好的一天... [阅读全文]

网友评论


验证码：

Java 判断字符为中文实例代码(超管用)

2019年07月22日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论