当前位置: 移动技术网 > IT编程>数据库>其他数据库 > Scala当中什么是RDD(Resilient Distributed Datasets)弹性分布式数据集

Scala当中什么是RDD(Resilient Distributed Datasets)弹性分布式数据集

2019年07月21日  | 移动技术网IT编程  | 我要评论

rdd(resilient distributed datasets)弹性分布式数据集。你不好理解的话,可以把rdd就可以看成是一个简单的"动态数组"(比如arraylist),对其操作,也只需要 调用它的方法而已,和java中的arraylist一样。但它与一般动态数组的区别在于:rdd是分布的。弹性是指的是数据自动在内存和磁盘切换, task如果失败会进行特定次数的重试。如果在某个节点发生错误,rdd会自动在不同的节点中重试。

文章转载自原文:

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网