大数据共370篇 第4页
大数据,离线计算,实时计算,流处理引擎,数仓技术
高效扩展Hadoop与Spark的数据处理工具:DataFu-卡咪卡咪哈-一个博客

高效扩展Hadoop与Spark的数据处理工具:DataFu

Apache DataFu 是一个开源的 Apache 项目,它是一个用于大数据处理和数据分析的库。它提供了一组功能丰富的工具和函数,用于在 Apache Hadoop 和 Apache Spark 等分布式计算框架上进行数据转换...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010415
Flink理论实战-卡咪卡咪哈-一个博客

Flink理论实战

一、Flink核心概念 1、Flink核心概念 (1)Flink是什么 ?Apache Flink是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。 可部署在各种集群环境,对各种大小的数据规模...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06715
Kubernetes是什么,为什么要用它-卡咪卡咪哈-一个博客

Kubernetes是什么,为什么要用它

Kubernetes是什么 Kubernetes,简称k8s,2015年7月诞生于Google,是市面上基于容器技术最先进的分布式架构方案。它是一个开放平台,不局限于任何语言,没有任何编程接口,任何语言编写的服务都...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07415
KubeSphere Cloud云原生备份容灾服务,为企业应用上份“保险”-卡咪卡咪哈-一个博客

KubeSphere Cloud云原生备份容灾服务,为企业应用上份“保险”

原标题:KubeSphere Cloud云原生备份容灾服务,为企业应用上份“保险” 在今天,Kubernetes 已经成为云计算领域的既定标准,企业和开发者们都在基于 Kubernetes 来进行软件的开发、部署和运维。...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
06115
Flink window 用法介绍-卡咪卡咪哈-一个博客

Flink window 用法介绍

Sink Flink没有类似spark中foreach方法 让用户进行迭代操作 虽有对外的输出操作 都要利用Sink完成 最后通过类似如下方式完成整个任务最终输出操作 stream.addSink(new MySink(xxxx)) 官方提供了...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
04915
Rust让科学计算速度提升200倍-卡咪卡咪哈-一个博客

Rust让科学计算速度提升200倍

因果推算需要庞大的计算量 在因果推断中,有2个关键步骤:因果发现因果效用评估1. 因果发现 因果发现问题可以简单理解为,首先我们有一组变量,然后在这些变量能组成的 所有 图中,找到一个最能...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
04515