大数据共370篇 第8页
大数据,离线计算,实时计算,流处理引擎,数仓技术
常用大数据引擎介绍,快速直达工具集-卡咪卡咪哈-一个博客

常用大数据引擎介绍,快速直达工具集

大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无...
kmkmha的头像-卡咪卡咪哈-一个博客kmkmha1年前
0889
什么是瞬态集群?解读火山引擎EMR Stateless 的创新理念以及应用-卡咪卡咪哈-一个博客

什么是瞬态集群?解读火山引擎EMR Stateless 的创新理念以及应用

作者 | 火山引擎EMR团队 众所周知,基于 Hadoop 的 EMR 体系发展到现在,经历了很多个阶段。从基于 IDC 机房通过 CDH 去部署的 1. 0 阶段,演进到在公有云上面按照存算分离的办法去进行的 2. 0 ...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
08711
Spark环境部署-卡咪卡咪哈-一个博客

Spark环境部署

部署预备Hadoop安装spark运行一般依赖Hadoop(也可以不需要)。关于Hadoop的安装,可以参考 使用虚拟机搭建Hadoop集群在安装Hadoop的过程中,需要同时安装jdk8。2. Scala安装解压Scala二进制包到...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0865
使用 Kubespray 安装 Kubernetes-卡咪卡咪哈-一个博客

使用 Kubespray 安装 Kubernetes

此快速入门有助于使用 Kubespray 安装在 GCE、Azure、OpenStack、AWS、vSphere、Equinix Metal(曾用名 Packet)、Oracle Cloud Infrastructure(实验性)或 Baremetal 上托管的 Kubernetes ...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
08511
NVIDIA 大讲堂 | 什么是 KUBERNETES?-卡咪卡咪哈-一个博客

NVIDIA 大讲堂 | 什么是 KUBERNETES?

Kubernetes 是一个开源平台,用于自动进行容器编排,即容器化应用程序的部署、扩展和管理。什么是 KUBERNETES?Kubernetes 提供了一个框架,用于部署、管理、扩展和切换分布式容器,这些容器是...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0825
通俗易懂的快速排序算法-go语言实现-卡咪卡咪哈-一个博客

通俗易懂的快速排序算法-go语言实现

基本原理 核心思想 每次排序都会选一个基准数,小于基准数的放在左子序列,大于等于基准数的放在右子序列。 原始序列:{13, 15, 8, 54, 23} step1:随机选一个基准数15,则其左子序列{13, 8},...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0825