当前位置：移动技术网 > IT编程>开发语言>Java > java实现中英文混合字符截取方法

java实现中英文混合字符截取方法

2019年07月19日 | 移动技术网IT编程 | 我要评论

题目：

编写一个截取字符串的函数，输入为一个字符串和字节数，输出为按字节截取的字符串。但是要保证汉字不被截半个，如“我abc”4，应该截为“我ab”，输入“我abc汉def”，6，应该输出为“我abc”而不是“我abc+汉的半个”。

如果是charset(gb2312, gbk, big5)，汉字占两个字节，问题的关键在于考虑截取长度的最后一个字节，如果是属于一个汉字的第一个字节，忽略即可，而汉字每个字节前都是1，所以都是负数，采用if(byte[i]<0)判断是否是汉字的最后一个字节。

目前看到的最好的办法：

import java.io.unsupportedencodingexception;

public class stringspliter {

 static void fun1(string str, int length)
  throws unsupportedencodingexception {

 // system.out.println(str.getbytes().length);
 byte[] bt = str.getbytes("gbk");
 for (int i = 0; i < bt.length; i++) {
  // 打印出字节数组中的值，可以看出只要是汉字[采用gbk编码时占两个字节/utf-8占3个字节]，并且为两个负整数
  // 由于字节的第一位都是1,所以它就是由负数来表示的
  system.out.println(bt[i]);
 }

 // 打印出按实际出入的字节数的所截字符串
 // system.out.println(new string(bt,0,length));

 // 判断最后一个是否为负，如果是负的则丢掉该字节
 if (bt[length] < 0) {
  system.out.println(new string(bt, 0, --length, "gbk"));
 } else {
  system.out.println(new string(bt, 0, length, "gbk"));
 }
 }

 public static void main(string[] args) {

 // stringspliter.fun1("我abc", 4);
 try {
  stringspliter.fun1("我abc汉def", 7);
 } catch (unsupportedencodingexception e) {
  // todo auto-generated catch block
  e.printstacktrace();
 }

 }

}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

关于msyql事务隔离你要知道

什么是事务？事务是数据库管理系统执行过程中的一个逻辑单位，由一个有限的数据库操作序列构成。数据库事务通常包含了一个序列的对数据库的读/写操作。包含有以下两个目的... [阅读全文]
JavaFX实现UI美观效果代码实例

相对于swing来说，javafx在ui上改善了很多，不仅可以通过fxml来排版布局界面，同时也可以通过css样式表来美化ui。其实在开发javafx应用的时候... [阅读全文]
使用java实现网络爬虫

接着上面一篇，这一篇目的就是在于网络爬虫的实现，对数据的获取，以便分析。----->爬虫实现原理网络爬虫基本技术处理网络爬虫是数据采集的一种方法，实际项目... [阅读全文]
JavaFX桌面应用未响应问题解决方案

日常使用软件的过程中，偶尔会遇到软件突然卡住，再点击几次就变成“未响应”的情况。在javafx应用中同样也会出现这种情况，在开发过程中应该尽量避免这种情况的出现... [阅读全文]
java调用回调机制详解

调用和回调机制在一个应用系统中, 无论使用何种语言开发, 必然存在模块之间的调用, 调用的方式分为几种:1.同步调用同步调用是最基本并且最简单的一种调用方式, ... [阅读全文]
Springboot项目因为kackson版本问题启动报错解决方案

问题现象org.springframework.context.applicationcontextexception: unable to start emb... [阅读全文]
idea中database不显示问题的解决

【问题】一般情况下，database会显示在idea的最右边，就像这个样子：一无所有。。。【理想界面】：【解决方法】方法一：1）点击view 2)点击tool ... [阅读全文]
Java多线程下的其他组件之CyclicBarrier、Callable、Future和FutureTask详解

cyclicbarrier 接着讲多线程下的其他组件，第一个要讲的就是cyclicbarrier。cyclicbarrier从字面理解是指循环屏障，它可以协同多... [阅读全文]
IDEA POJO开发神器之Groovy的使用详解

暂时只对 mysql进行了测试项目使用 lombok mybatis-plus一：使用步骤首先在项目右侧找到 database 如图没有请参考 2.点开之后进... [阅读全文]
idea+git合并分支解决冲突及详解步骤

git分支详解参考：分支管理组成1.1、master主干在版本管理中，代码库应该仅有一个主干。此主干是和当前生产保持一致的，是可用的、稳定的可直接发布的版本，不... [阅读全文]

网友评论


验证码：

java实现中英文混合字符截取方法

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论