spark共74篇 第4页
Spark从入门到精通(07):Spark SQL和DataSet-卡咪卡咪哈-一个博客

Spark从入门到精通(07):Spark SQL和DataSet

了解更多推荐系统、大数据、机器学习、AI等硬核技术,可以关注我的知乎,或同名微信公众号在前面两篇文章中,我们讨论了Spark SQL和DataFrame API。我们研究了如何连接到内置和外部数据源,查看...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0627
代码+案例详解:使用Spark处理大数据最全指南-卡咪卡咪哈-一个博客

代码+案例详解:使用Spark处理大数据最全指南

全文共17984字,预计学习时长30分钟或更长如今,有不少关于Spark的相关介绍,但很少有人从数据科学家的角度来解释该计算机引擎。因此,本文将试着介绍并详细阐述——如何运行Spark?一切是如何...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0737
AI大模型团队Colossal-AI破局创新,火热招募中!-卡咪卡咪哈-一个博客

AI大模型团队Colossal-AI破局创新,火热招募中!

公司简介 潞晨科技致力于解放 AI 生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI ,高效促进 AI 大模型...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
01325
大数据人才需求怎么样 Spark技术是怎么回事-卡咪卡咪哈-一个博客

大数据人才需求怎么样 Spark技术是怎么回事

大数据人才需求怎么样?Spark技术是怎么回事?Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
04815
spark知识点总结-卡咪卡咪哈-一个博客

spark知识点总结

说明:这篇文章是我的一位师兄写的,放上来只为了自己学习时参考,谢谢! 一、性能调优 1、分配资源 a、在我们在生产环境中,提交spark作业时,用的spark-submit shell脚本,里面调整对应的参数...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05714
window环境下安装spark-卡咪卡咪哈-一个博客

window环境下安装spark

❝ spark是大数据计算引擎,拥有Spark SQL、Spark Streaming、MLlib和GraphX四个模块。并且spark有R、python的调用接口,在R中可以用SparkR包操作spark,在python中可以使用pyspark模块操作spar...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07010