2023年02月的文章 第9页

Hadoop入门教程之HDFS架构-卡咪卡咪哈-一个博客

Hadoop入门教程之HDFS架构

为什么要用Hadoop? 1.源码开源 2.社区活跃,参与者很多 3.涉及到分布式存储和计算的方方面面: Flume进行数据采集 Spark/MR/Hive等进行数据处理 HDFS/HBase进行数据存储 4.已经得到企业界的验...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0775
菜鸟的Hadoop快速入门-卡咪卡咪哈-一个博客

菜鸟的Hadoop快速入门

一、相关概念 1、大数据 大数据是一门概念,也是一门技术,是以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。 大数据包括了以Hadoop和Spark为代表的基础大数据框架,还包括实时数据...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0546
Hadoop环境配置(一):Pseudo-Distributed模式-卡咪卡咪哈-一个博客

Hadoop环境配置(一):Pseudo-Distributed模式

前言寒假花了很多时间在基于Giraph的PageRank这个实验上面,最终实现的效果是在服务器上的分布式环境中使用Giraph这个框架运行PageRank算法。这个系列的文章主要是把在配置Hadoop的过程中所有踩...
零基础入门hadoop大数据三—linux基础环境配置-卡咪卡咪哈-一个博客

零基础入门hadoop大数据三—linux基础环境配置

~~~~~~~~~~~~~~~~~~~~~~~~~更新~~~~~~~~~~~~~~~~~~~~~~~~~~~本专题教程最终会以搭建4台机器(节点)的集群为教学目的,但会经历单机版(只有一台机器)、伪分布式(还是只有一台机器)、完全分...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0897
linux下Hadoop安装与环境配置-卡咪卡咪哈-一个博客

linux下Hadoop安装与环境配置

注:本文采用的Linux环境为deepin 15.11系统(是由武汉深之度科技有限公司开发的颜值极高的Linux发行版),以下命令经测试Ubuntu18.04版本同样适用。linux安装可采用虚拟机安装、单系统安装、双...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06310
SPARK+HADOOP大数据实验环境配置-卡咪卡咪哈-一个博客

SPARK+HADOOP大数据实验环境配置

最近在上大数据实验的,整理一下配置环境的过程。本文主要包括所需安装包,通用配置、hadoop配置和spark配置。一.实验环境:使用虚拟机软件:VMware Workstation Pro操作系统:Ubuntu 18.04 (mas...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
01235