spark共74篇 第6页
大数据人才需求怎么样 Spark技术是怎么回事-卡咪卡咪哈-一个博客

大数据人才需求怎么样 Spark技术是怎么回事

大数据人才需求怎么样?Spark技术是怎么回事?Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
04815
spark知识点总结-卡咪卡咪哈-一个博客

spark知识点总结

说明:这篇文章是我的一位师兄写的,放上来只为了自己学习时参考,谢谢! 一、性能调优 1、分配资源 a、在我们在生产环境中,提交spark作业时,用的spark-submit shell脚本,里面调整对应的参数...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05714
window环境下安装spark-卡咪卡咪哈-一个博客

window环境下安装spark

❝ spark是大数据计算引擎,拥有Spark SQL、Spark Streaming、MLlib和GraphX四个模块。并且spark有R、python的调用接口,在R中可以用SparkR包操作spark,在python中可以使用pyspark模块操作spar...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07010
Spark性能优化指南——高级篇-卡咪卡咪哈-一个博客

Spark性能优化指南——高级篇

热死的鱼:Spark性能优化指南——基础篇2 赞同 · 1 评论文章 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0417
如何应对大数据分析工程师面试Spark考察,看这一篇就够了-卡咪卡咪哈-一个博客

如何应对大数据分析工程师面试Spark考察,看这一篇就够了

作者丨斌迪、HappyMint 来源丨大数据与人工智能(ID:ai-big-data) 【导读】本篇 为什么考察Spark? Spark作为大数据组件中的执行引擎,具备以下优势特性。 高效性。内存计算下,Spark 比 MapRe...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05211
spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记-卡咪卡咪哈-一个博客

spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记

写在前面:此书很棒,但需要一定的编程功底,此外强烈建议买书,因为很多架构图、算子列表,我也不会摘抄下来。 第一章 简介 1.Spark执行的特点 Hadoop中包含计算框架MapReduce和分布式文件系统...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0775