当前位置：移动技术网 > IT编程>开发语言>Java > Character.UnicodeBlock中cjk的说明详解

Character.UnicodeBlock中cjk的说明详解

2019年07月19日 | 移动技术网IT编程 | 我要评论

本文为大家分享了character.unicodeblock中cjk的说明，供大家参考，具体内容如下

character.unicodeblock.cjk_unified_ideographs ： 4e00-9fbf：cjk 统一表意符号
character.unicodeblock.cjk_compatibility_ideographs ：f900-faff：cjk 兼容象形文字 character.unicodeblock.cjk_unified_ideographs_extension_a ：3400-4dbf：cjk 统一表意符号扩展 a
cjk的意思是“chinese，japanese，korea”的简写，实际上就是指中日韩三国的象形文字的unicode编码
character.unicodeblock.general_punctuation ：2000-206f：常用标点 character.unicodeblock.cjk_symbols_and_punctuation ：3000-303f：cjk 符号和标点 character.unicodeblock.halfwidth_and_fullwidth_forms ：ff00-ffef：半角及全角形式

/**
   * 校验一个字符是否是汉字
   * 
   * @param c
   *      被校验的字符
   * @return true代表是汉字
   */
  public static boolean ischinesechar(char c) {
    try {
      return string.valueof(c).getbytes("utf-8").length > 1;
    } catch (unsupportedencodingexception e) {
      e.printstacktrace();
      return false;
    }
  }

  /**
   * 验证字符串内容是否包含下列非法字符<br>
   * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
   * 
   * @param content
   *      字符串内容
   * @return 't'代表不包含非法字符，otherwise代表包含非法字符。
   */
  public static char validatelegalstring(string content) {
    string illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
    char islegalchar = 't';
    l1: for (int i = 0; i < content.length(); i++) {
      for (int j = 0; j < illegal.length(); j++) {
        if (content.charat(i) == illegal.charat(j)) {
          islegalchar = content.charat(i);
          break l1;
        }
      }
    }
    return islegalchar;
  }

  /**
   * 验证是否是汉字或者0-9、a-z、a-z
   * 
   * @param c
   *      被验证的char
   * @return true代表符合条件
   */
  public static boolean isrightchar(char c) {
    return ischinese(c) || isword(c);
  }

  /**
   * 校验某个字符是否是a-z、a-z、_、0-9
   * 
   * @param c
   *      被校验的字符
   * @return true代表符合条件
   */
  public static boolean isword(char c) {
    string regex = "[\\w]";
    pattern p = pattern.compile(regex);
    matcher m = p.matcher("" + c);
    return m.matches();
  }

  /**
   * 判定输入的是否是汉字
   * 
   * @param c
   *      被校验的字符
   * @return true代表是汉字
   */
  public static boolean ischinese(char c) {
    character.unicodeblock ub = character.unicodeblock.of(c);
    if (ub == character.unicodeblock.cjk_unified_ideographs
        || ub == character.unicodeblock.cjk_compatibility_ideographs
        || ub == character.unicodeblock.cjk_unified_ideographs_extension_a
        || ub == character.unicodeblock.general_punctuation
        || ub == character.unicodeblock.cjk_symbols_and_punctuation
        || ub == character.unicodeblock.halfwidth_and_fullwidth_forms) {
      return true;
    }
    return false;
  }

  /**
   * 校验string是否全是中文
   * 
   * @param name
   *      被校验的字符串
   * @return true代表全是汉字
   */
  public static boolean checknamechese(string name) {
    boolean res = true;
    char[] ctemp = name.tochararray();
    for (int i = 0; i < name.length(); i++) {
      if (!ischinese(ctemp[i])) {
        res = false;
        break;
      }
    }
    return res;
  }

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

使用wmic查看远程服务器磁盘空间剩余量

1、准备工作1.1、远程服务器的IP、主机账号及密码确认远程服务器IP地址、主机账号及密码。1.2、服务确认开启... [阅读全文]
算法之算法概述

目录一、算法概述1、算法和数据结构（1）什么是算法？（2）什么是数据结构？2、时间复杂度（1）执行次数（2）渐进... [阅读全文]
【大学分析】平均分384分！985厦门大学计算机专硕爆满！

【大学分析】栏目小编带你分析各个大学计算机考研真实报考数据，尝试探究考研难度和风险。厦门大学位于福建省厦门市，是... [阅读全文]
PTA 互评成绩计算（四舍五入函数出错？）

在浙大的计算机专业课中，经常有互评分组报告这个环节。一个组上台介绍自己的工作，其他组在台下为其表现评分。最后这个... [阅读全文]
量子计算机方面有新突破？silq详讲！

大约在四五个月前，我看在我所有计算机群里都在热传：“量子计算机领域有新突破！silq语言诞生！”。这个文章就让我... [阅读全文]
第九章同步

第九章同步9.1 背景到目前为止多道程序设计(multi- programming) :现代操作系统的重要特性... [阅读全文]
【深度学习笔记（五）】之卷积神经网络组成介绍

一.卷积神经网络（CNN）（一）结构组成经典的神经网络我们之间已经讲过了，现在我们要讲的是卷积神经... [阅读全文]
计算机里为什么不能精确表示浮点数

计算机的世界是一个二进制的世界。我们先来看看十进制和二进制的相互转换。十进制 --> 二进制：对... [阅读全文]
【奥鹏作业答案库网】大工20春《应用统计》在线作业1【奥鹏作业答案】

大工20春《应用统计》在线作业1试卷总分:100 得分:100一、单选题 (共 10 道试题,共 60 分)1... [阅读全文]
【操作系统学习笔记】一、操作系统概述

操作系统概述操作系统的基本特征1. 并发2. 共享3. 虚拟4. 异步操作系统的基本功能1. 进程管理2. 内存... [阅读全文]

网友评论


验证码：

Character.UnicodeBlock中cjk的说明详解

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论