排序
大数据分析技术与实战之 Spark Streaming
Spark是基于内存的大数据综合处理引擎,具有优秀的作业调度机制和快速的分布式计算能力,使其能够更加高效地进行迭代计算,因此Spark能够在一定程度上实现大数据的流式处理。 随着信息技术的迅...
ApacheFlink开发及应用指南,流式处理速度超快
ApacheFlink背景ApacheFlink行业价值如何搭建一个flink项目编写一个flink程序配置一个maven项目添加了flink的相关依赖基于flink的java案例把flink应用程序打包部署至flink平台Flink总结ApacheFl...
大数据开发 | SPARK ON YARN运行模式
原标题:大数据开发 | SPARK ON YARN运行模式 面试过程中经常被问到spark on yarn的运行模式及区别,接下来我们从多方面展开阐述。 一、YARN介绍 Yarn 的全称是 Yet Anther Resource Negotiator...
安装 Hadoop:设置单节点 Hadoop 集群
安装 Hadoop:设置单节点 Hadoop 集群 你一定对Hadoop,HDFS及其架构有一个理论概念。 但是要获得Hadoop认证,您需要良好的实践知识。我希望你会喜欢我们之前关于HDFS架构的博客,现在我将...
ByConity 如何在 Kubernetes 上无感扩缩容强吻、摸胸、掀裙底,这些男星究竟是真敬业,还是借戏揩油?
ByConity 是一个由字节跳动开源的云原生数据仓库引擎,采用存储计算分离的架构,实现了读写分离和弹性扩缩容。这款引擎支持多个关键功能特性,如资源隔离、无感扩缩容、高性能和数据的强一致性...
YARN资源分配,没有比这说的更清楚的了
让你彻底搞明白YARN资源分配 - 知乎 (zhihu.com)本篇要解决的问题是:Container是以什么形式运行的?是单独的JVM进程吗?YARN的vcore和本机的CPU核数关系?每个Container能够使用的物理内存和虚...