当前位置：移动技术网 > IT编程>脚本编程>Python > Chipotle数据分析-知识点汇总

Chipotle数据分析-知识点汇总

2020年07月30日 | 移动技术网IT编程 | 我要评论

原文链接
一、数据集信息

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
chipo = pd.read_csv('/Users/Desktop/十套python练习/exercise_data/chipotle.tsv', sep = '\t')
chipo.head(10)#显示前十行
chipo.shape[0]#显示行数
chipp.shape[1]#显示列数
chipo.columns#打印列名称
chipo.index#打印索引

前十行数据

二、分类（groupby）

被下单数（order）最多的商品（item_name）是什么？

#提取数量和名称两行，按照itemname进行分类，再对quantity进行聚合操作sum
#as_index表示是否将item_name列的各项作为index，若为True，则下图的ChickenBowl等在最左边index列
bestSeller = chipo[['quantity','item_name']].groupby('item_name', as_index = False).agg({'quantity':sum})
bestSeller.sort_values(ascending = False, inplace = True)
bestSeller.head()

在这里插入图片描述

每一单对应的平均总价是多少？

#创建新的一行subTotal，填入每一行的总花费并保留两位小数
chipo['subTotal'] = round(chipo[item_price] * chipo[quantity], 2)
#取花费列subTotal和order列，根据order进行分组，对相同单数的价格进行相加，得到每一单的总价，最后再对总价求平均值
chipo[['subTotal','order_id']].groupby('order_id').agg({'subTotal':sum})['subTotal'].mean()

df.groupby()和df.agg()：

例：

df = pd.DataFrame({'Country':['China','China', 'India', 'India', 'America', 'Japan', 'China', 'India'], 
'Income':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000],
'Age':[5000, 4321, 1234, 4010, 250, 250, 4500, 4321]})
df

在这里插入图片描述

根据国家分组

df_gb = df.groupby('Country')
for index, data in df_gb:
    print(index)
    print(data)

output:
在这里插入图片描述

根据国家、收入分组

df_gb = df.groupby(['Country', 'Income'])
for index, data in df_gb:
    print(index)
    print(data)

output:
在这里插入图片描述

根据国家分组后对剩下的income和age分别求mean、max、min

df_gb = df.groupby('Country').agg(['mean', 'max', 'min'])
df_gb

在这里插入图片描述

根据国家分组，对剩下的age求min、mean、max，对income求min、max（用列表形式表示）

num_agg = {'Age':['min','mean','max'],'Income':['min','max']}
df_gb = df.groupby('Country').agg(num_agg)
print(df_gb)

在这里插入图片描述

本文地址：https://blog.csdn.net/MaeveShi/article/details/107636734

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

单链表反转(python)

反转一个单链表。示例:输入: 1->2->3->4->5->NULL输出: 5-&... [阅读全文]
基于selenium的UI自动化实践（博客文章标题获取）

目录1、需求说明2、实现目的3、特殊说明4、环境搭建5、实现思路6、实现效果1、需求说明实现的需求是：获取某个博... [阅读全文]
Django项目实战1-个人博客首页实现

环境：Windows 10 （64 位），Python 版本为 3.7.6（64 位），django 版本为 2... [阅读全文]
Pycharm安装django失败

报错截图### 详细报错如下：(venv) wh@WHdeMacBook-Pro:~/PycharmProjec... [阅读全文]
pycharm 2020 Error: failed to send plot to http://127.0.0.1:63342

pycharm 2020 发生的一个错误跪求大神指导下面是具体的错误Error: failed to send... [阅读全文]
Python random模块

#random 模块用来生成一个随机数import randomrandom.randint(a,b) ... [阅读全文]
可操作的python——opencv边缘提取的实战

可视化”表姐提取“过程，不同的图片色差不同，效果不一 [阅读全文]
Chipotle数据分析-知识点汇总

原文链接一、数据集信息import pandas as pdimport numpy as npimport m... [阅读全文]
Python中字符串的公共与私有功能

字符串的公共功能1、长度，len()string = "我想成为一名开发工程师！"print(len(strin... [阅读全文]
Python笔记--8 变量那些事（5）set

集合（set)基本知识Python中的set定义：set是一个无序的、没有重复元素的的集合；一个set是由 { ... [阅读全文]

网友评论


验证码：

Chipotle数据分析-知识点汇总

2020年07月30日 | 移动技术网IT编程 | 我要评论

df.groupby()和df.agg()：

您可能感兴趣的文章:

相关文章:

网友评论