spark共74篇 第3页
Linux性能调优,看这篇就懂-卡咪卡咪哈-一个博客

Linux性能调优,看这篇就懂

做Linux性能调优,对很多人来说都蛮难的。今天小编就给大家讲讲Linux性能调优的那些事,希望能对你有帮助。 一、Linux的CPU调度 任何计算机的基本功能都十分简单,那就是计算。为了实现计算的功...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0578
Spark特点及缺点?-卡咪卡咪哈-一个博客

Spark特点及缺点?

本文目录: 一、调优概述 二、数据倾斜发生时的现象 三、数据倾斜发生的原理 四、如何定位导致数据倾斜的代码 五、某个task执行特别慢的情况 六、某个task莫名其妙内存溢出的情况 七、查看导致...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0588
王联辉:Spark在腾讯TDW的实战-卡咪卡咪哈-一个博客

王联辉:Spark在腾讯TDW的实战

原标题:王联辉:Spark在腾讯TDW的实战 2015年4月16-18日,由CSDN主办、CSDN专家顾问团支持的 OpenCloud 2015大会将在北京国家会议中心拉开帷幕。为期三天的大会,以推进行业应用中的云计算核心...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05011
内存有限的情况下 Spark 如何处理 T 级别的数据?-卡咪卡咪哈-一个博客

内存有限的情况下 Spark 如何处理 T 级别的数据?

UPDATE 1 简单起见,下述答案仅就无shuffle的单stage Spark作业做了概要解释。对于多stage任务而言,在内存的使用上还有很多其他重要问题没有覆盖。部分内容请参考评论中 @邵赛赛 给出的补充。S...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0666
手把手教你在本机配置spark-卡咪卡咪哈-一个博客

手把手教你在本机配置spark

本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是spark系列的第一篇文章。 最近由于一直work from home节省了很多上下班路上的时间,加上今天的LeetCode的文章篇幅较小,所以抽出了...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06510
Spark性能优化总结(建议收藏)-卡咪卡咪哈-一个博客

Spark性能优化总结(建议收藏)

近期优化了一个spark流量统计的程序,此程序跑5分钟小数据量日志不到5分钟,但相同的程序跑一天大数据量日志各种失败。经优化,使用160 vcores + 480G memory,一天的日志可在2.5小时内跑完,下...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05510