大数据共370篇 第7页
大数据,离线计算,实时计算,流处理引擎,数仓技术
Kubernetes使用技巧|Kubectl命令手册-卡咪卡咪哈-一个博客

Kubernetes使用技巧|Kubectl命令手册

 Kubernetes简介Kubectl是Kubernetes的命令行工具,用于与Kubernetes API进行交互,管理Kubernetes集群中的应用程序和资源。它可以管理Kubernetes集群中的各种资源,包括Pod、Deployment、Serv...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09215
Spark:安装及环境配置指南!-卡咪卡咪哈-一个博客

Spark:安装及环境配置指南!

前篇文章介绍了scala的安装与配置、接下来介绍一下spark的安装及环境配置。1、Apache spark下载在浏览器输入网址https://spark.apache.org/downloads.html进入spark的下载页面,如下图所示:下...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
09014
一. Spark在Windows下的环境搭建-卡咪卡咪哈-一个博客

一. Spark在Windows下的环境搭建

由于Spark是用Scala来写的,所以Spark对Scala肯定是原生态支持的,因此这里以Scala为主来介绍Spark环境的搭建,主要包括四个步骤,分别是:JDK的安装,Scala的安装,Spark的安装,Hadoop的下载...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0905
Hadoop整合分布式文件系统上数据,保证分析和处理数据高效?-卡咪卡咪哈-一个博客

Hadoop整合分布式文件系统上数据,保证分析和处理数据高效?

 谈到对Hadoop分布式文件系统(HDFS)数据整合与分析处理,首先要说到的就是存储模式了:(一)HDFS的存储模式不同于关系型或文档型数据库,它没有索引,由于索引的目的是方便随机读写,每次读...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
08915
零基础入门hadoop大数据三—linux基础环境配置-卡咪卡咪哈-一个博客

零基础入门hadoop大数据三—linux基础环境配置

~~~~~~~~~~~~~~~~~~~~~~~~~更新~~~~~~~~~~~~~~~~~~~~~~~~~~~本专题教程最终会以搭建4台机器(节点)的集群为教学目的,但会经历单机版(只有一台机器)、伪分布式(还是只有一台机器)、完全分...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0897
想清楚这 10 点再部署 Kubernetes 也不迟-卡咪卡咪哈-一个博客

想清楚这 10 点再部署 Kubernetes 也不迟

 最近,很多 IT 话题都围绕容器和 kubernetes 展开,但容器的市场采用仍然处于初期阶段。根据研究公司 IHS Markit 的数据显示,当今企业只在大约 5%的多租户服务器上运行容器软件。到 2022 年...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0888