大数据共370篇 第49页
大数据,离线计算,实时计算,流处理引擎,数仓技术
大数据分析技术与实战之 Spark Streaming-卡咪卡咪哈-一个博客

大数据分析技术与实战之 Spark Streaming

Spark是基于内存的大数据综合处理引擎,具有优秀的作业调度机制和快速的分布式计算能力,使其能够更加高效地进行迭代计算,因此Spark能够在一定程度上实现大数据的流式处理。 随着信息技术的迅...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
0477
ApacheFlink开发及应用指南,流式处理速度超快-卡咪卡咪哈-一个博客

ApacheFlink开发及应用指南,流式处理速度超快

ApacheFlink背景ApacheFlink行业价值如何搭建一个flink项目编写一个flink程序配置一个maven项目添加了flink的相关依赖基于flink的java案例把flink应用程序打包部署至flink平台Flink总结ApacheFl...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
0747
大数据开发 | SPARK ON YARN运行模式-卡咪卡咪哈-一个博客

大数据开发 | SPARK ON YARN运行模式

原标题:大数据开发 | SPARK ON YARN运行模式 面试过程中经常被问到spark on yarn的运行模式及区别,接下来我们从多方面展开阐述。 一、YARN介绍 Yarn 的全称是 Yet Anther Resource Negotiator...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
0487
安装 Hadoop:设置单节点 Hadoop 集群-卡咪卡咪哈-一个博客

安装 Hadoop:设置单节点 Hadoop 集群

安装 Hadoop:设置单节点 Hadoop 集群 你一定对Hadoop,HDFS及其架构有一个理论概念。 但是要获得Hadoop认证,您需要良好的实践知识。我希望你会喜欢我们之前关于HDFS架构的博客,现在我将...
kmhmha的头像-卡咪卡咪哈-一个博客kmhmha2年前
01947
ByConity 如何在 Kubernetes 上无感扩缩容强吻、摸胸、掀裙底,这些男星究竟是真敬业,还是借戏揩油?-卡咪卡咪哈-一个博客

ByConity 如何在 Kubernetes 上无感扩缩容强吻、摸胸、掀裙底,这些男星究竟是真敬业,还是借戏揩油?

ByConity 是一个由字节跳动开源的云原生数据仓库引擎,采用存储计算分离的架构,实现了读写分离和弹性扩缩容。这款引擎支持多个关键功能特性,如资源隔离、无感扩缩容、高性能和数据的强一致性...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
0627
YARN资源分配,没有比这说的更清楚的了-卡咪卡咪哈-一个博客

YARN资源分配,没有比这说的更清楚的了

让你彻底搞明白YARN资源分配 - 知乎 (zhihu.com)本篇要解决的问题是:Container是以什么形式运行的?是单独的JVM进程吗?YARN的vcore和本机的CPU核数关系?每个Container能够使用的物理内存和虚...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
01107