基于C#开发中的那些编码问题(详谈)_c#

基于C#开发中的那些编码问题(详谈)

最近一直在搞各种编码问题，略有心得，与大家分享一番。

system.text提供了encoding的抽象类，这个类提供字符串编码的方法。常用的编码方式主要有ascii，unicode，utf8（unicode编码的一种）。

unicode有四种编码格式，utf-8, utf-16,utf-32,utf-7。

字符编码类,asciiencoding ,utf7encoding,unicodeencoding,utf32encoding。

下面对ascii和unicode编码进行对比，废话不说，先上代码：

这是ascii编码、解码。

static void main(string[] args)
  {
   string temp = "hello world!";
   console.writeline("original string:{0}", temp);
   
   byte[] tempbytes = system.text.encoding.ascii.getbytes(temp);
   console.writeline("bytes array:{0}", bitconverter.tostring(tempbytes));

   biginteger integer = new biginteger(tempbytes);
   console.writeline("biginteger:{0}", integer);

   string res = system.text.encoding.ascii.getstring(tempbytes);
   console.writeline("convert back string:{0}", res);
   console.readkey();
  }

运行结果如下：

original string:hello world!
bytes array:48-65-6c-6c-6f-20-57-6f-72-6c-64-21
biginteger:10334410032597741434076685640
convert back string:hello world!

很正常，对吧？但是，如果输入的字符串是中文（或者其他非ascii表中的字符），情况会怎么样呢？

改变上面的程序代码

string temp = "你好，世界！";

运行结果如下：

original string:你好，世界！
bytes array:3f-3f-3f-3f-3f-3f
biginteger:69540876599103
convert back string:??????

如果把编码格式换成utf8，依然重复上面的测试过程。

static void main(string[] args)
  {
   string temp = "你好，世界！";
   console.writeline("original string:{0}", temp);
   
   byte[] tempbytes = system.text.encoding.utf8.getbytes(temp);
   console.writeline("bytes array:{0}", bitconverter.tostring(tempbytes));

   biginteger integer = new biginteger(tempbytes);
   console.writeline("biginteger:{0}", integer);

   string res = system.text.encoding.utf8.getstring(tempbytes);
   console.writeline("convert back string:{0}", res);
   console.readkey();
  }

运行结果如下：

original string:你好，世界！
bytes array:e4-bd-a0-e5-a5-bd-ef-bc-8c-e4-b8-96-e7-95-8c-ef-bc-81
biginteger:-10998968812899434720462615123889939386679836
convert back string:你好，世界！

original string:hello world!
bytes array:48-65-6c-6c-6f-20-57-6f-72-6c-64-21
biginteger:10334410032597741434076685640
convert back string:hello world!

通过对比，我们发现除了兼容中文和其他语言外，似乎没有太大区别。如果把编码集换成unicode，中英文字符编码的不同就会很容易看出来了。

original string:hello world!
bytes array:48-00-65-00-6c-00-6c-00-6f-00-20-00-57-00-6f-00-72-00-6c-00-64-00-21-00
biginteger:3160918205608148134863399242437668999277801104545742920
convert back string:hello world!

original string:你好，世界！
bytes array:60-4f-7d-59-0c-ff-16-4e-4c-75-01-ff
biginteger:-307722159543719876182061216
convert back string:你好，世界！

如果不考虑其他情况。通过对比结果，我们发现：

1、ascii只能处理英文和英文符号，具体请参考ascii字符表

2、unicode可以处理全球所有语言符号

3、unicode处理英文时，会在每个字节后面加一个字节0x00，比ascii多出一倍的长度；处理中文时，编码较短。

4、utf8处理中文时比unicode编码长，处理英文时与ascii一样。

结论，由于现在存储介质越来越不值钱，在处理有非英文字符时，编码格式应该选择unicode（或其子集utf8等的任意一种编码格式），只有在确定程序只会处理英文的时候，才能选择ascii编码。

以上这篇基于c#开发中的那些编码问题(详谈)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

深入了解c# 匿名类型

一、什么叫做匿名类？　　匿名类就是没有名字的类。匿名类不能被引用，只能再创建的时候用new语句来声明。二、匿名类的优势以及应用场景；　　1、匿名类型提供了一种方... [阅读全文]

C# 对PDF文档加密、解密（基于Spire.Cloud.SDK for .NET）

spire.cloud.sdk for .net提供了接口pdfsecurityapi可用于加密、解密pdf文档。本文将通过c#代码演示具体加密及解密方法。使用... [阅读全文]

C# 实现俄罗斯方块（附源码）

概述俄罗斯方块（tetris）是一款由俄罗斯人阿列克谢·帕基特诺夫发明的休闲游戏，帕基特诺夫爱玩拼图，从拼图游戏里得到灵感，设计出了俄罗斯方块。由于上手简单、老... [阅读全文]

浅析c# 接口

接口：是指定一组函数成员而不是实现他们的引用类型。所以只能类喝啊结构来实现接口，在结成该接口的类里面必须要实现接口的所有方法接口的特点：继承于接口的类，必须要实... [阅读全文]

c# 接口使用实例

用接口实现一个简单的物件的入库，出库如定义一个物流类接口，包含物件所属快递公司名称属性，物件单号属性及信息显示方法。通过物件出库类信息和物件入库类信息继承该接口... [阅读全文]

详解C# 泛型中的数据类型判定与转换

提到类型转换，首先要明确c#中的数据类型，主要分为值类型和引用类型：1.常用的值类型有：（struct）整型家族：int，byte，char，short，lon... [阅读全文]

Unity通用泛型单例设计模式（普通型和继承自MonoBehaviour）

单例模式是设计模式中最为常见的，不多解释了。但应该尽量避免使用，一般全局管理类才使用单例。普通泛型单例：public abstract class single... [阅读全文]

WindowsForm实现警告消息框的实例代码

警告消息框主要是用来向用户户展示诸如警告、异常、完成和提示消息。一般实现的效果就是从系统窗口右下角弹出，然后加上些简单的显示和消失的动画。创建警告框窗口首先我们... [阅读全文]

WindowsForm移动一个没有标题栏的窗口的方法

在winform程序中，要移动没有标题栏的窗口，基本的实现思路是监听需要拖动窗口内的控件的鼠标事件，然后将鼠标位置发送给窗口进行相应的位移就可以了。通过借用wi... [阅读全文]

快速了解c# 常量(整数常量，字符常量，定义长量)

常量是固定值，程序执行期间不会改变。常量可以是任何基本数据类型，比如整数常量、浮点常量、字符常量或者字符串常量，还有枚举常量。常量可以被当作常规的变量，只是它们... [阅读全文]


验证码：

验证码：

基于C#开发中的那些编码问题(详谈)

2019年07月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论