大数据共370篇 第5页
大数据,离线计算,实时计算,流处理引擎,数仓技术
大数据开发:Hadoop、Spark、Flink三大框架对比-卡咪卡咪哈-一个博客

大数据开发:Hadoop、Spark、Flink三大框架对比

目前来说,大数据领域最为活跃的三个计算框架,当属Hadoop、Spark以及Flink这三者。三个框架在不同的大数据处理场景当中,表现各有优势,因此也常常被拿来做比较。今天我们也来做个对比,看看Ha...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010110
看腾讯如何提升 Kubernetes 集群利用率?-卡咪卡咪哈-一个博客

看腾讯如何提升 Kubernetes 集群利用率?

嘉宾 | 宋翔出品 | CSDN云原生 提到近两年的技术热词,“云原生”觉得是位居前列。从云计算大数据再到如今的云原生时代,一大批新技术涌现,例如当下最火热的系统部署和容器服务平台Kubernetes...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
01005
与 Hadoop 对比,如何看待 Spark 技术?-卡咪卡咪哈-一个博客

与 Hadoop 对比,如何看待 Spark 技术?

Hadoop 首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010013
Spark: 基本架构及原理-卡咪卡咪哈-一个博客

Spark: 基本架构及原理

Spark(一): 基本架构及原理 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hado...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09911
Flink(一)-基本概念-卡咪卡咪哈-一个博客

Flink(一)-基本概念

前言:前段时间因为项目需求,需要开发一个实时采集分析日志的任务,最后选择的计算框架是Flink。项目完成后,基本上就没再接触。但总觉得既然用过了,不了解,不清楚,日后又需要还得重新看,...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09913
Hadoop系列4--HDFS集群搭建实战之HDFS系统部署-卡咪卡咪哈-一个博客

Hadoop系列4–HDFS集群搭建实战之HDFS系统部署

2.2 HDFS系统部署2.2.1 HDFS集群简介一个典型的HDFS集群通常由一个NameNode节点,一个Secondary NameNode节点,和若干个DataNode节点组成。本集群搭建案例,以5个节点为例进行搭建,节点部署规...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09913