帮助
数据倾斜:修订历史
查看该页面的日志
跳到导航
跳到搜索
筛选修订版本
展开
折叠
截止日:
标签
过滤器:
可视化编辑
可视化编辑:已切换
已被回退
手工回退
撤销
新建重定向
替换
清空
移除重定向
显示版本
差异选择:选中要对比的版本的单选按钮,按Enter键或下方的按钮。
说明:
(当前)
=与最后版本之间的差异,
(之前)
=与上一版本之间的差异,
小
=小编辑。
2024年12月26日 (星期四)
当前
之前
11:01
2024年12月26日 (四) 11:01
阿奔
讨论
贡献
2,292字节
+2,292
创建页面,内容为“数据倾斜:在并行进行数据处理的时候,由于单个 partition 的数据显著多余其他部分,分布不均匀,导致大量数据集中分布到少数计算节点上,使得该部分的处理速度远低于平均计算速度,成为整个数据集处理的瓶颈,从而影响整体计算性能。 === 原因 === # 对于 join 过程来说,如果出项较多的 key 值为空或异常的记录,或 key 值分布不均匀,就容易出…”
导航菜单
个人工具
登录
命名空间
页面
讨论
大陆简体
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
目录
文章分类
侧边栏
帮助
工具
链入页面
相关更改
Atom
特殊页面
页面信息