当前位置: 移动技术网 > IT编程>脚本编程>Python > pyspark 读取csv文件创建DataFrame的两种方法

pyspark 读取csv文件创建DataFrame的两种方法

2018年08月19日  | 移动技术网IT编程  | 我要评论

日出美丽立取上,777小游戏,endomondo

方法一:用pandas辅助

from pyspark import sparkcontext 
from pyspark.sql import sqlcontext 
import pandas as pd 
sc = sparkcontext()
sqlcontext=sqlcontext(sc) 
df=pd.read_csv(r'game-clicks.csv') 
sdf=sqlc.createdataframe(df) 

方法二:纯spark

from pyspark import sparkcontext 
from pyspark.sql import sqlcontext
sc = sparkcontext()
sqlcontext = sqlcontext(sc)
sqlcontext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('game-clicks.csv')

以上这篇pyspark 读取csv文件创建dataframe的两种方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持移动技术网。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网