当前位置: 移动技术网 > IT编程>脚本编程>Python > pandas常用API_1

pandas常用API_1

2020年04月14日  | 移动技术网IT编程  | 我要评论

横店人才网,痛心切骨,青岛灭门案犯落网

pandas

数据分析处理库


api

说明:
import pandas as pd
df_obj: dataframe对象(表格型的数据结构,提供有序的列和不同类型的列值)
s_obj: series对象(一维数组对象,包含一组索引和一组数据)
1. pd.read_csv(filepath_or_buffer, ...)
  将csv文件读取到dataframe中。
常用参数:
   filepath_or_buffer:任何有效的字符串路径;也可以是url,有效的url方案包括:http, ftp, s3 和 file.
返回值:
  dataframe or textparser
2. df_obj.head(n:int=5)/s_obj.head(n:int=5)
  返回前n行。
参数:
  n:int, default:5; 返回前多少行。
返回值:
  same type as caller。
3. pd.value_counts(values, sort:bool=true, ascending:bool=false, normalize:bool=false, bins=none, dropna:bool=true)
  返回一个包含唯一值计数的series, 结果降序排列,不包含nan值。
参数:
  values: 要统计计数的数据
  sort: bool类型,是否按频率排序,默认为true.
  ascending: bool类型,升序排列,默认为false.
  normalize: bool类型,是否显示频率,默认为false.
  bins: int类型,不再是按值统计计数,而是将区间均分为几等分,统计每个区间中的计数。
  dropna: bool类型,不包括nan计数,默认为true.
返回值:
  series.
4. df_obj / s_obj.sort_index(axis=0, level=none, ascending=true, inplace=false, kind="quicksort", na_position="last", sort_remaining=true, ignore_index=false)
  按索引标签对序列进行排序。
参数:
  axis: 进行排序的轴(0/index:行,1/columns:列),默认为0.
  level: int / 级别名称 / 级别列表 / 级别名称列表;如果不是none, 则对索引级别中的值进行排序。
  ascending: 升序排序,默认为true。
  inplace: 如果为true, 则就地执行操作(改变原序列),默认为false(生成一个排序后的新列)。
  kind: 选择排序算法。(quicksort, mergesort, heapsort), 对于dataframe, 仅对单个列或标签排序时适用。
  na_position:last / first; nan放在开头还是结尾,默认为last.
  sort_remaining: 默认为false, 如果为true且级别或索引是多层的,则按指定级别排序后也按其他级别排序。
  ingore_index: 默认为false, 如果为true, 则结果轴将标记为0,1,2,..., n-1.

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网