当前位置：移动技术网 > IT编程>脚本编程>Python > python学习笔记：第6天小数据池和编码转换

python学习笔记：第6天小数据池和编码转换

2018年10月25日 | 移动技术网IT编程 | 我要评论

山口里子,新湘西剿匪记,一起操妹妹

1. id 和 ==
2. 小数据池
3. 编码和解码

1. id 和 ==

id：id是一个内置的函数，可以查看变量存放的内存地址（实际上不是真正的物理地址，这里暂时这样理解），用于判断是变量否属指向了同一块内存地址
==：== 可以用于判断两个变量的值是否相等，这个在之前的例子中也有用过

下面来看几个例子，以及具体的使用方法：

in [1]: a = 'abc'

in [2]: b = 'abc'

in [3]: a == b
out[3]: true

in [4]: a is b
out[4]: true

in [5]: c = 100

in [6]: d = 100

in [7]: c == d
out[7]: true

in [8]: c is d
out[8]: true

in [9]:

通过上面的例子可以总结出：字符串和数字在之前有定义过的话，后续再用到这个变量时，不会再分配内存，而是直接把新的变量直接指向之前定义过的值，因此使用is判断时结果都为true，这种机制被称作为缓存机制。但是这里也有比较坑的一点，我们再来看下面的例子：

in [9]: c = 1000

in [10]: d = 1000

in [11]: c is d
out[11]: false

in [12]:

同样是数字，但是100和1000的结果却不一样，这个要根据下面的一个知识点来看。

2. 小数据池

通过上面的例子可以看出，100和1000的值在经过相同的运算之后得到不同的结果，那么我们可以这样认为：如果内存地址一样，那么对应的值一定是相等的，但是反过来值一样的话内存地址不一定一样；我们先在来看几个例子：

in [15]: a = -5   
                  
in [16]: b = -5   
                  
in [17]: a is b   
out[17]: true     
                  
in [18]: c = -6   
                  
in [19]: d = -6   
                  
in [20]: c is d   
out[20]: false    
                  
in [21]: c = 300  
                  
in [22]: d = 300  
                  
in [23]: c is d   
out[23]: false    
                  
in [24]:

这种现象是因为小数据池的存在。小数据池（非官方解释）：是一种缓存机制，也被称为驻留机制，其他语言中也有类似的机制，他会把数据存储起来方便下次赋值时使用，以避免多个内存存放相同值的元素。

小数据池对数据的处理方法：

小数据池只针对数字、字符串和布尔值有效
数字的处理：在python中对-5到256之间的整数会被驻留在内存中. 将⼀定规则的字符串缓存；
对字符串的处理：如果字符串的⻓度是0或者1, 都会默认进⾏缓存；字符串⻓度⼤于1, 但是字符串中只包含字⺟, 数字, 下划线时才会缓存

使用小数据池的优缺点：

优点: 能够提⾼⼀些字符串, 整数的处理速度. 省略的创建对象的过程.
缺点: 在'池'中创建或者插入新的内容会花费更多的时间.

3. 编码和解码

编码回顾：

ascii：是最早的一种编码，是其他编码的基础，占用8bit，1byte
gbk：中文国标码，16bit，2byte
unicode：万国码，包含了全世界各国的语言，32bit，4byte
utf-8：可变的unicode，是unicode的一种实现
- 英文：8bit，1byte
- 欧洲文字：16bit， 2byte
- 中文：24bit，3byte

在网络传输和文件存储中，经常需要在各种编码之间转换，最常用的如utf-8和unicode等。
unicode的表现形式：即python程序存储在内存中的字符串
byte表现的形式：

英文：b'i like python'，除了前面加b之外跟普通字符串一样
中文：b'\xe4\xb8\xad'

字符编码之间的转换使用encode和decode操作：

in [24]: a = 'i like python'

in [25]: b = '我喜欢python'

in [26]: a.encode('utf-8')
out[26]: b'i like python'

in [27]: b.encode('utf-8')                               # 编码成utf-8字符
out[27]: b'\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2python'

in [28]: c = b'\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2python'

in [29]: c.decode('utf-8')                              # 以utf-8的编码来解码
out[29]: '我喜欢python'

in [30]: b
out[30]: '我喜欢python'

in [31]: b.encode('gbk')
out[31]: b'\xce\xd2\xcf\xb2\xbb\xb6python'

in [32]: e =  b'\xce\xd2\xcf\xb2\xbb\xb6python'

in [33]: e.decode('gbk').encode('utf-8')               # 把gbk编码转换成utf-8编码
out[33]: b'\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2python'

in [34]: f = e.decode('gbk').encode('utf-8')

in [35]: f.decode('utf-8')
out[35]: '我喜欢python'

in [36]:

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

python dict乱码如何解决

定义字典并直接输出，结果输出结果中文是乱码展示d={'name':'lily','age':18,'sex':'女','no':1121}print d输出结果... [阅读全文]
如何写python的配置文件

一、创建配置文件在d盘建立一个配置文件，名字为：test.ini内容如下：[baseconf]host=127.0.0.1port=3306user=rootp... [阅读全文]
使用Python FastAPI构建Web服务的实现

fastapi 是一个使用 python 编写的 web 框架，还应用了 python asyncio 库中最新的优化。本文将会介绍如何搭建基于容器的开发环境，... [阅读全文]
Python过滤掉numpy.array中非nan数据实例

代码需要先导入pandasarr的数据类型为一维的np.arrayimport pandas as pdarr[~pd.isnull(arr)]补充知识：pyt... [阅读全文]
python求numpy中array按列非零元素的平均值案例

输入：numpy的array输出：一个一维的平均值arrayimport numpy as np def non_zero_mean(np_arr): exis... [阅读全文]
Python如何向SQLServer存储二进制图片

需求是需要用python往 sqlserver中的image类型字段中插入二进制图片核心代码，研究好几个小时的代码：安装pywin32，adodbapiimag... [阅读全文]
python numpy实现rolling滚动案例

相比较pandas，numpy并没有很直接的rolling方法，但是numpy 有一个技巧可以让numpy在c代码内部执行这种循环。这是通过添加一个与窗口大小相... [阅读全文]
python opencv 实现读取、显示、写入图像的方法

opencv是一个强大的图像处理和计算机视觉库，实现了很多实用算法，值得学习和深究下。opencv包安装·　　这里直接安装opencv-python包（非官方）... [阅读全文]
python thrift 实现单端口多服务的过程

thrift 是一种接口描述语言和二进制通信协议。以前也没接触过，最近有个项目需要建立自动化测试，这个项目之间的微服务都是通过 thrift 进行通信的，然后写... [阅读全文]
Python while true实现爬虫定时任务

记得以前的windows 任务定时是可以的正常使用的，今天试了下，发现不能正常使用了，任务计划总是挂起。接下来记录下python 爬虫定时任务的几种解决方法。今... [阅读全文]

网友评论


验证码：

python学习笔记：第6天 小数据池和编码转换