当前位置:网站首页>spark中Repartition 和 Coalesce 区别
spark中Repartition 和 Coalesce 区别
2022-08-03 05:32:00 【贾斯汀玛尔斯】
关系: 两者都是用来改变 RDD 的 partition 数量的,repartition 底层调用的就是 coalesce 方法: coalesce(numPartitions, shuffle = true)
区别: repartition 一定会发生 shuffle,coalesce 根据传入的参数来判断是否发生 shuffle 一般情况下增大 rdd 的 partition 数量使用 repartition,减少 partition 数量时使用 coalesce
边栏推荐
- 连续型特征做embedding代码示例
- cookie和session区别
- MySQL的Replace用法详解
- ES6 - 剩余参数,Array的扩展方法,String的扩展方法
- 【Markdown 数学公式】markdown常用公式写法
- El - table column filter functions, control columns show and hide (effect and easy to implement full marks)
- UniApp scroll-view 事件不生效(@scroll、@scrolltolower、@scrolltoupper ...)
- ES6中 async 函数、await表达式 的基本用法
- 关于Attention的超详细讲解
- PHP Composer常用命令积累
猜你喜欢
随机推荐
Mysql去除重复数据
Oracle 11g silent install
MySQL的触发器
信息学奥赛一本通T1449:魔板
5G网络入门基础--5G网络的架构与基本原理
PCB制造常用的13种测试方法,你了解几种?
超全!9种PCB表面处理工艺大对比
一篇文章教你写扫雷(c语言基础版)
JUC并发编程深入浅出!
MySQL中,对结果或条件进行字符串拼接
SQLSERVER将子查询数据合并拼接成一个字段
【Markdown 数学公式】markdown常用公式写法
Nacos下载与安装
postman配置中文
pyspark @udf 循环使用变量问题
el-table获取读取数据表中某一行的数据属性
Docker-compose安装mysql
el-tree设置利用setCheckedNodessetCheckedKeys默认勾选节点,以及通过setChecked新增勾选指定节点
Postman知识汇总
Scala 基础 (三):运算符和流程控制









