spark共74篇 第7页
PySpark 处理数据和数据建模-卡咪卡咪哈-一个博客

PySpark 处理数据和数据建模

安装相关包 from pyspark.sql import SparkSession from pyspark.sql.functions import udf, when, count, countDistinct from pyspark.sql.types import IntegerType,StringType from pyspark....
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06913
YARN资源分配,没有比这说的更清楚的了-卡咪卡咪哈-一个博客

YARN资源分配,没有比这说的更清楚的了

让你彻底搞明白YARN资源分配 - 知乎 (zhihu.com)本篇要解决的问题是:Container是以什么形式运行的?是单独的JVM进程吗?YARN的vcore和本机的CPU核数关系?每个Container能够使用的物理内存和虚...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
01107
spark性能调优-卡咪卡咪哈-一个博客

spark性能调优

Spark是大数据分析的利器,在工作中用到spark的地方也比较多,这篇总结是希望能将自己使用spark的一些调优经验分享出来。 一、常用参数说明 --driver-memory 4g : driver内存大小,一般没有广播...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06712
破题大数据应用难点,TalkingData发布城市大数据场景创新平台-卡咪卡咪哈-一个博客

破题大数据应用难点,TalkingData发布城市大数据场景创新平台

11月25日,T11 2019暨TalkingData数据智能峰会在北京中国大饭店举办。会议期间,TalkingData正式发布“城市大数据场景创新平台”,并与武汉市东湖高新区签订“TalkingData华中研发总部、全国交...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0648
代号spark国际服调中文方法,非常简单-卡咪卡咪哈-一个博客

代号spark国际服调中文方法,非常简单

原标题:代号spark国际服调中文方法,非常简单 有很多喜欢玩游戏的朋友最近应该都听说过代号spark国际服这款游戏,因为这款游戏的地图非常大,可以让玩家在游戏中自由探索。4月23日代号spark国...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07915
与 Hadoop 对比,如何看待 Spark 技术?-卡咪卡咪哈-一个博客

与 Hadoop 对比,如何看待 Spark 技术?

Hadoop 首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010013