当前位置：移动技术网 > IT编程>脚本编程>Python > python pandas教程入门与实战练习

python pandas教程入门与实战练习

2018年04月25日 | 移动技术网IT编程 | 我要评论

明星潜规则,公牛队标志,狗的生殖器图

Pandas是Python语言进行数据分析的基础库，是一个基于NumPy的基本的数据分析包。该工具是为了解决数据分析任务而创建的，Pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。而且提供了大量的能使我们快速便捷的处理数据的函数和方法。

Pandas最初是为了金融数据分析而开发出来的，所以提供了十分强大的时间序列分析支持。同时，在人工智能爆发的时代，无论是传统的机器学习还是飞速发展的深度学习，对数据的预处理无疑是在训练模型之前的重中之重，Pandas对数据的处理提供了便捷的工具和方法，是学习人工智能的先修课。Pandas也可以快速读取CSV，Excel等文件，为大数据分析提供了便利。

1.Pandas中最基本的数据类型是Series，Series是处理一位数据的数据类型，下面我们简单定义一个Series：

s = pd.Series([1, 3, 5, 6, 8])

Series会自动的为数据加入索引值，从0开始，类似于数组

2.同时我们也可以为数据自定索引index：

s = pd.Series([1, 2, 5, 6, 8], index=['a', 'b', 'c', 'd', 'e'])

得到的结果的会为数值匹配指定的索引（a, b, c, d, e）

3.我们可以用以下函数查看Series的索引index和值values

print(s.index)
print(s.values)

4.我们可以用索引来提取索引对应的值，类似于数组，同时我们也可以用列表的形式传入多个索引来提取多个值

print(s['a'])
# 提取多个值用列表的形式传入
print(s[['b', 'a']])

5.Series提供了可以通过Bool索引提取值得方法

print(s[s > 4])

上述例子可以提取所有的values值大于4的键值对

6.我们也可以在Series中使用numpy的一些方法

# 可以使用numpy的一些方法
print(s*4)
print(np.mean(s))
print(s.mean())

将s中的每一个元素都乘以4

下面两个函数算出了Series的平均值

7.判断一个元素是否在Series中，可以用in来处理

print(1 in s.values)
print('a' in s.index)

会返回一个bool类型值

8.我们也可以用另一种方法去定义Series中的index和value

# 也可以用以下方法定义Series的index和value
b = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(b)

9.如果用上述方法定义，并在index属性中定义了不同的index，后者没有的index会默认保存为NaN

# 如果按如下方式定义index和value
# 没有的索引会变成NaN
b = pd.Series({'a': 1, 'b': 2, 'c': 3}, index=['b', 'c', 'd'])

10.在判断Series的空值时，提供了isnull和实例方法pd.isnull，当然类似的也有notnull，返回一个bool类型的Series

# 用isNull判断是否为空
print(pd.isnull(b))
# 也可以用b.isnull这种实例方法
print(b.isnull())
# 类似的，也有notnull 方法

11.Series会根据索引来匹配两个Series的相加相减的等等操作，若有没匹配到的索引，会赋值为空，返回一个包含所有索引的Series

x = pd.Series({'a': 10, 'b': 20, 'c': 30})
y = pd.Series({'b': 20, 'c': 30, 'e': 40})
print(x+y)

这篇文章让大家对Pandas的基本数据类型和简单的初始化，取值，以及索引的使用做了简单介绍，Series是Pandas中最常使用的DataFrame的基本结构，学习了Series下面学习DataFrame有更好的理解。

下一篇将介绍DataFrame数据类型和简单的使用方法。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Python爬虫:Request Payload和Form Data的简单区别说明

request payload 和 form data 请求头上的参数差别在于：content-typeform datapost表单请求代码示例headers... [阅读全文]
如何基于python实现不邻接植花

有 n 个花园，按从 1 到 n 标记。在每个花园中，你打算种下四种花之一。paths[i] = [x, y] 描述了花园 x 到花园 y 的双向路径。另外，没... [阅读全文]
构建高效的python requests长连接池详解

前文：最近在搞全网的cdn刷新系统，在性能调优时遇到了requests长连接的一个问题，以前关注过长连接太多造成浪费的问题，但因为系统都是分布式扩展的，针对这种... [阅读全文]
python中threading开启关闭线程操作

在python中启动和关闭线程：首先导入threadingimport threading然后定义一个方法def serial_read():......然后定... [阅读全文]
浅谈Python中threading join和setDaemon用法及区别说明

python多线程编程时，经常会用到join()和setdaemon()方法，今天特地研究了一下两者的区别。1、join ()方法：主线程a中，创建了子线程b，... [阅读全文]
Python3-异步进程回调函数(callback())介绍

废话不多说，大家之家看代码吧！#异步'''举例：你喊你朋友吃饭，你朋友正忙，如果你一直在那等他，等你朋友忙完了，你们一块去。--同步调用你喊你朋友吃饭，你朋友正... [阅读全文]
python继承threading.Thread实现有返回值的子类实例

继承与threading.thread实现有返回值的子类mythread，废话不多说，大家直接看代码import threadingclass mythread... [阅读全文]
浅谈Python3多线程之间的执行顺序问题

一个多线程的题：定义三个线程id分别为abc，每个线程打印10遍自己的线程id，按abcabc……的顺序进行打印输出。我的解法：from threading i... [阅读全文]
Python中使用threading.Event协调线程的运行详解

threading.event机制类似于一个线程向其它多个线程发号施令的模式，其它线程都会持有一个threading.event的对象，这些线程都会等待这个事件... [阅读全文]
python 实现两个线程交替执行

我就废话不多说，直接看代码吧！import threadingimport timedef a(): while true: lockb.acquire... [阅读全文]

网友评论


验证码：

python pandas教程入门与实战练习

2018年04月25日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论