大数据共370篇 第7页
大数据,离线计算,实时计算,流处理引擎,数仓技术
Java-Spark系列10-Spark性能调优概述-卡咪卡咪哈-一个博客

Java-Spark系列10-Spark性能调优概述

一.Spark 性能优化概述 首先笔者能力优先,使用Spark有一段时间,如下是笔者的工作经验的总结。 Spark任务运行图: Spark的优化思路: 一般是从3个层面进行Spark程序的优化: 1) 运行环境优化 2) R...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0488
Spark性能优化实战手册-卡咪卡咪哈-一个博客

Spark性能优化实战手册

三万字长文 | Spark性能优化实战手册 本文分为四个部分,基本涵盖了所有Spark优化的点,面试和实际工作中必备。 《Spark性能优化:开发调优篇》《Spark性能优化:资源调优篇》《Spark性能优化:...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06114
Spark性能优化指南——高级篇-卡咪卡咪哈-一个博客

Spark性能优化指南——高级篇

热死的鱼:Spark性能优化指南——基础篇2 赞同 · 1 评论文章 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0417
大数据开发-Spark调优常用手段-卡咪卡咪哈-一个博客

大数据开发-Spark调优常用手段

Spark调优 spark调优常见手段,在生产中常常会遇到各种各样的问题,有事前原因,有事中原因,也有不规范原因,spark调优总结下来可以从下面几个点来调优。 1. 分配更多的资源 分配更多的资源: ...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05115
大数据开发:Hadoop、Spark、Flink三大框架对比-卡咪卡咪哈-一个博客

大数据开发:Hadoop、Spark、Flink三大框架对比

目前来说,大数据领域最为活跃的三个计算框架,当属Hadoop、Spark以及Flink这三者。三个框架在不同的大数据处理场景当中,表现各有优势,因此也常常被拿来做比较。今天我们也来做个对比,看看Ha...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010110
大数据开发之Spark 基础入门学习-卡咪卡咪哈-一个博客

大数据开发之Spark 基础入门学习

集群相关 Cluster Manager指的是在集群上获取资源的外部服务,为每个spark application在集群中调度和分配资源的组件,目前有三种类型: Standalone:Spark 原生的资源管理,由 Master 负责资源...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05512