大数据共370篇 第11页
大数据,离线计算,实时计算,流处理引擎,数仓技术
spark—实践之DataSet实战企业人员管理系统应用案例-卡咪卡咪哈-一个博客

spark—实践之DataSet实战企业人员管理系统应用案例

此案例参考书籍《Spark大数据商业实战三部曲》,特做学习笔记,巩固学习过程。案例预览:给每位员工的年龄增加100给特定的员工年龄增加70,其他增加30对人员信息中的重复数据进行去重按年龄进行...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0588
spark处理大数据有什么优势(大数据 spark架构)大数据入门:Spark Streaming实际应用-卡咪卡咪哈-一个博客

spark处理大数据有什么优势(大数据 spark架构)大数据入门:Spark Streaming实际应用

作为Spark负责流计算的核心组件,Spark Streaming是整个Spark学习流程当中非常重要的一块。对于Spark Streaming,作为Spark流计算的实际承载组件,我们也需要更全面的掌握。今天的大数据入门分...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05012
代码+案例详解:使用Spark处理大数据最全指南-卡咪卡咪哈-一个博客

代码+案例详解:使用Spark处理大数据最全指南

全文共17984字,预计学习时长30分钟或更长如今,有不少关于Spark的相关介绍,但很少有人从数据科学家的角度来解释该计算机引擎。因此,本文将试着介绍并详细阐述——如何运行Spark?一切是如何...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0737
spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记-卡咪卡咪哈-一个博客

spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记

写在前面:此书很棒,但需要一定的编程功底,此外强烈建议买书,因为很多架构图、算子列表,我也不会摘抄下来。 第一章 简介 1.Spark执行的特点 Hadoop中包含计算框架MapReduce和分布式文件系统...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0775
不使用 Kubernetes 发行版的5个理由-卡咪卡咪哈-一个博客

不使用 Kubernetes 发行版的5个理由

导读:Kubernetes不是 Linux,请给原生Kubernetes一个机会。 目前有不少公司基于 Kubernetes 封装了自己的商用 Kubernetes 发行版,丰富了开发生态,也提供给开发者更多选择。 最近有人提出,选...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
05613
如何在 Kubernetes Pod 和您的机器之间复制文件-卡咪卡咪哈-一个博客

如何在 Kubernetes Pod 和您的机器之间复制文件

在 Kubernetes Pod 中运行的容器是不需要手动交互的独立计算单元。有时您可能需要将文件复制到 Pod 的文件系统或从 Pod 的文件系统复制文件,这可能是因为您正在调试问题并希望存档存储在容器中...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0789