虾画怪谈的头像-卡咪卡咪哈-一个博客
管理员
这家伙很懒,什么都没有写...
Hadoop中单词统计案例-卡咪卡咪哈-一个博客

Hadoop中单词统计案例

一、搭建本地环境1、下载准备两个工具Hadoop-2.7.3.tar.gzHadoop-2.7.3-winutils.exe.rar2、将Hadoop-2.7.3-winutils.exe.rar解压后,其中的两个文件进行拷贝Hadoop.dllWintuils.exe3、将Hadoop...
1年前
0619
B站基于缓存优化 PRESTO 集群查询性能-卡咪卡咪哈-一个博客

B站基于缓存优化 PRESTO 集群查询性能

导读本次分享主题为 B 站 Presto 集群查询性能的优化,首先会简单介绍 Presto以及 B 站内部 Presto 集群的架构。接下来讲解针对 Presto 做的改造,主要是 Presto 搭配 Alluxio 和 Presto 搭配 A...
什么是瞬态集群?解读火山引擎EMR Stateless 的创新理念以及应用-卡咪卡咪哈-一个博客

什么是瞬态集群?解读火山引擎EMR Stateless 的创新理念以及应用

作者 | 火山引擎EMR团队 众所周知,基于 Hadoop 的 EMR 体系发展到现在,经历了很多个阶段。从基于 IDC 机房通过 CDH 去部署的 1. 0 阶段,演进到在公有云上面按照存算分离的办法去进行的 2. 0 ...
1年前
08311
史上最详细、最全面的Hadoop环境搭建-卡咪卡咪哈-一个博客

史上最详细、最全面的Hadoop环境搭建

前言 这是一篇入门文章,Hadoop的学习方法很多,网上也有很多学习路线图。本文的思路是:以安装部署Apache Hadoop2.x版本为主线,来介绍Hadoop2.x的架构组成、各模块协同工作原理、技术细节。安...
SPARK+HADOOP大数据实验环境配置-卡咪卡咪哈-一个博客

SPARK+HADOOP大数据实验环境配置

最近在上大数据实验的,整理一下配置环境的过程。本文主要包括所需安装包,通用配置、hadoop配置和spark配置。一.实验环境:使用虚拟机软件:VMware Workstation Pro操作系统:Ubuntu 18.04 (mas...
linux下Hadoop安装与环境配置-卡咪卡咪哈-一个博客

linux下Hadoop安装与环境配置

注:本文采用的Linux环境为deepin 15.11系统(是由武汉深之度科技有限公司开发的颜值极高的Linux发行版),以下命令经测试Ubuntu18.04版本同样适用。linux安装可采用虚拟机安装、单系统安装、双...