当前位置：移动技术网 > IT编程>脚本编程>Python > Python之Pandas and Numpy 吐血整理（持续更新！！！）

Python之Pandas and Numpy 吐血整理（持续更新！！！）

2020年07月26日 | 移动技术网IT编程 | 我要评论

文章目录

Pandas基本用法
Numpy基本用法

介绍不多说，用法全部写在代码里了！！！欢迎收藏，持续更新！！！

Pandas基本用法

# -*- coding:utf-8 -*-
"""
Pandas使用例子
"""
import pandas as pd


# TODO Series => 一维的数组型对象（长度固定且有序的字典）
# 创建数组
pd.Series(dict(names='Evan', id=66))  # 使用字典生成一个Series（字典的键是行索引）
test = pd.Series(['aa', 'bb', 'cc', 'aa'], index=[1, 3, 5, 7])  # 使用列表生成一个Series，并指定行索引值（默认从0开始）
test.name = 'Data'  # 指定数组名称
test.index.name = 'Info'  # 指定行索引名称

# 查看数组属性
print('返回数组名称\n{}'.format(test.name))
print('返回指定行索引内的值\n{}'.format(test[3]))
print('返回数组的所有值\n{}'.format(test.values))
print('返回数组的所有索引\n{}'.format(test.index))
print('返回数组所有的唯一值（去重）\n{}'.format(test.unique()))
print('返回数组所有值的出现次数（默认降序）\n{}'.format(test.value_counts()))
print('计算数组中每个值是否包含于传入序列的值，返回一个布尔值\n{}'.format(test.isin(['aa', 'cc'])))


# TODO DataFrame => 二维的数组型对象（或多维）
# 创建数组
# 1. 使用嵌套字典格式创建DataFrame（字典的键作为列标签，内部字典的键作为行索引）
data = {
    'Name': {'Evan': 1, 'Jane': 2},
    'Id': {'Evan': 11, 'Jane': 22}
}
print('使用嵌套字典构建DataFrame\n{}'.format(pd.DataFrame(data)))
# 2. 使用字典列表格式创建DataFrame（字典的键为列标签，行索引默认从0开始，列表内的所有值是每一列的值）
data = {
    'Name': ['Evan', 'Jane', 'Spring', 'Summer', 'Autumn', 'Winter'],
    'Id': [66, 77, 88, 99, 100, 110],
    'Stature': [177, 160, 150, 167, 180, 190],
    'Weight': [65, 45, 50, 60, 65, 70]
}
frame = pd.DataFrame(data, columns=['Id', 'Name', 'Weight', 'Stature'], index=[3, 2, 1, 6, 5, 4])  # 指定列标签顺序、行索引值
print('构建指定列标签顺序和行索引的DataFrame\n{}'.format(frame))

# 查看数组属性
print('返回数组的行索引是否唯一\n{}'.format(frame.index.is_unique))
print('返回数组的头5行\n{}'.format(frame.head()))
print('返回指定行索引内的指定列标签值（使用轴标签）\n{}'.format(frame.loc[2, ['Id', 'Weight']]))  # 使用行索引和列标签的值
print('返回指定行索引内的指定列标签值（使用整数标签）\n{}'.format(frame.iloc[1, [0, 2]]))  # 使用行索引和列标签的位置
print('返回指定行索引内的所有值\n{}'.format(frame.loc[2]))
print('返回指定列标签内的所有值\n{}'.format(frame['Name']))
print('返回数组所有的列标签\n{}'.format(frame.columns))
print('返回数组所有的值\n{}'.format(frame.values))
print('返回数组中所有值在每一列的出现次数（没有的默认为0）\n{}'.format(frame.apply(pd.value_counts).fillna(0)))
print('返回数组中指定列标签内所有值的出现次数\n{}'.format(pd.value_counts(frame['Weight'])))
print('返回数组中指定列标签内所有的唯一值（去重）\n{}'.format(pd.unique(frame['Weight'])))


# TODO 数组操作（Serials和DataFrame一致）
# 对数组排序
# inplace默认False，代表是否改变原数组，为True时返回None，False返回一个新数组
print('根据行索引排序（默认升序）\n{}'.format(frame.sort_index(inplace=True)))
print('根据行索引排序（降序）\n{}'.format(frame.sort_index(ascending=False)))  # 指定降序
print('根据列标签排序\n{}'.format(frame.sort_index(axis='columns')))
data = pd.Series([3, 6, -5, 8, 3])
print('根据数组值排序\n{}'.format(data.sort_values()))
print('根据指定列标签排序\n{}'.format(frame.sort_values(by=['Weight', 'Stature'])))

# 对数组排名
print('对所有值进行排名（默认升序）\n{}'.format(data.rank()))  # 默认升序排名，平级全部取平均值
print('对所有值进行排名（降序）\n{}'.format(data.rank(ascending=False)))  # 降序排名，平级全部取平均值
print('平级关系取最小值，占用坑位\n{}'.format(data.rank(method='min')))  # 平级关系全部取最小值，每个平级关系占用一个坑位
print('平级关系取最小值，不占用坑位\n{}'.format(data.rank(method='dense')))  # 平级关系全部取最小值，平级关系不占用坑位
print('平级关系取最大值，占用坑位\n{}'.format(data.rank(method='max')))  # 平级关系全部取最大值，每个平级关系占用一个坑位
print('按观察顺序排名\n{}'.format(data.rank(method='first')))  # 按照值在数据中出现的次序分配排名

# 重新构建数组
# ffill向前填充（缺失值和其前面的值相同），bfill向后填充（缺失值和其后面的值相同）
print('重新构建数组的行索引\n{}'.format(frame.reindex([1, 3, 5, 7], method='ffill')))
# fill_value赋给缺失值
print('重新构建数组的行索引\n{}'.format(frame.reindex([2, 4, 6, 8], fill_value='world')))
print('重新构建数组的列标签\n{}'.format(frame.reindex(columns=['Id', 'Weight', 'happy'], fill_value='news')))

# 删除指定的项目
print('删除指定行\n{}'.format(frame.drop([1, 3])))
print('删除指定列\n{}'.format(frame.drop(['Id', 'Weight'], axis='columns')))  # axis控制轴的位置，默认为index

Numpy基本用法

# -*- coding:utf-8 -*-
"""
Numpy使用例子
"""
import numpy as np


# 创建数组
print('创建一维数组\n{}'.format(np.array([1, 2, 3])))
print('创建0-9范围的一维数组\n{}'.format(np.arange(10)))
print('创建二维数组\n{}'.format(np.array([[1, 2, 3], [4, 5, 6]])))
print('创建2行3列的随机数组\n{}'.format(np.random.rand(2, 3)))
print('指定二维数组\n{}'.format(np.array([1, 2, 3], ndmin=2)))
print('指定元素类型为复数\n{}'.format(np.array([1, 2, 3], dtype=complex)))

# 查看数组属性
test = np.array([[1, 2, 3], [4, 5, 6]])
print('\n当前数组\n{}'.format(test))
print('返回当前维度\n{}'.format(test.ndim))
print('返回一个包含数组纬度的元组（行，列）\n{}'.format(test.shape))
print('返回元素的类型\n{}'.format(test.dtype))
print('返回元素的个数\n{}'.format(test.size))
print('返回每个元素的大小，以字节为单位 ，每个元素占4个字节\n{}'.format(test.itemsize))

# 数组操作
test.resize((3, 2))  # 改变当前数组，依shape生成
print('改变数组维度的大小\n{}'.format(test.reshape(1, 6)))  # 不改变当前数组，依shape生成
print('转换数组的数据类型\n{}'.format(test.astype(np.float64)))
print('数组转置\n{}'.format(test.transpose()))  # 行列转置
print('数组转换为列表\n{}'.format(test.tolist()))

本文地址：https://blog.csdn.net/weixin_43750377/article/details/107555522

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

python中的django是做什么的

django是什么？django是一个基于python的web应用框架。它与python的另外一个web 框架 flask最大的区别是，它奉行 “包含一切” 的... [阅读全文]
Python过滤序列元素的方法

问题你有一个数据序列，想利用一些规则从中提取出需要的值或者是缩短序列解决方案最简单的过滤序列元素的方法就是使用列表推导。比如：>>> myli... [阅读全文]
python中selenium库的基本使用详解

什么是seleniumselenium 是一个用于web应用程序测试的工具。selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括i... [阅读全文]
Python在字符串中处理html和xml的方法

问题你想将html或者xml实体如 &entity; 或 &#code; 替换为对应的文本。再者，你需要转换文本中特定的字符(比如<, ... [阅读全文]
Python如何将字符串转换为日期

问题你的应用程序接受字符串格式的输入，但是你想将它们转换为 datetime 对象以便在上面执行非字符串操作。解决方案使用python的标准模块 datetim... [阅读全文]
Python使用shutil模块实现文件拷贝

主要作用与拷贝文件用的。1.shutil.copyfileobj(文件1，文件2)：将文件1的数据覆盖copy给文件2。import shutilf1 = op... [阅读全文]
Python如何执行精确的浮点数运算

问题你需要对浮点数执行精确的计算操作，并且不希望有任何小误差的出现。解决方案浮点数的一个普遍问题是它们并不能精确的表示十进制数。并且，即使是最简单的数学运算也... [阅读全文]
Python高并发解决方案实现过程详解

一.cdn加速简单说就是把静态资源放到别人服务器上全称:content delivery network或content ddistribute networ... [阅读全文]
Python 如何测试文件是否存在

问题你想测试一个文件或目录是否存在。解决方案使用 os.path 模块来测试一个文件或目录是否存在。比如：>>> import os>&... [阅读全文]
Django+Uwsgi+Nginx如何实现生产环境部署

如何在生产上部署django?django的部署可以有很多方式，采用nginx+uwsgi的方式是其中比较常见的一种方式。uwsgi介绍uwsgi是一个... [阅读全文]

网友评论


验证码：

Python之Pandas and Numpy 吐血整理（持续更新！！！）

2020年07月26日 | 移动技术网IT编程 | 我要评论

文章目录

Pandas基本用法

Numpy基本用法

您可能感兴趣的文章:

相关文章:

网友评论