大数据共370篇 第28页
大数据,离线计算,实时计算,流处理引擎,数仓技术
详解 Flink Catalog 在 ChunJun 中的实践之路-卡咪卡咪哈-一个博客

详解 Flink Catalog 在 ChunJun 中的实践之路

原标题:详解 Flink Catalog 在 ChunJun 中的实践之路 我们知道 Flink 有Table(表)、View(视图)、Function(函数/算子)、Database(数据库)的概念,相对于这些耳熟能详的概念,Flink 里还...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
06510
11个简单的Java性能调优技巧,傻瓜都能学会!-卡咪卡咪哈-一个博客

11个简单的Java性能调优技巧,傻瓜都能学会!

大多数开发人员理所当然地以为性能优化很复杂,需要大量的经验和知识。好吧,不能说这是完全错误的。优化应用程序以获得最佳性能不是一件容易的事情。但是,这并不意味着如果你不具备这些知识,...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
05210
三分钟快速了解Kubernetes-卡咪卡咪哈-一个博客

三分钟快速了解Kubernetes

Kubernetes(k8s)是自动化容器操作的开源平台,这些操作包括部署,调度和节点集群间扩展。此外,Kubernetes还支持Docker和Rocket。 Kubernetes的功能有:自动化容器的部署和复制;随时扩展或收...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
06610
Python推荐算法学习1-卡咪卡咪哈-一个博客

Python推荐算法学习1

1.闵可夫斯基距离:计算用户相似度 闵可夫斯基距离可以概括曼哈顿距离与欧几里得距离。 其中r越大,单个维度差值大小会对整体产生更大的影响。这个很好理解,假设当r=2时一个正方形对角线长度,...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
05710
Kubernetes 是什么?-卡咪卡咪哈-一个博客

Kubernetes 是什么?

Kubernetes,简称 k8s(k,8 个字符,s——明白了?)或者 “kube”,是一个开源的 Linux 容器自动化运维平台,它消除了容器化应用程序在部署、伸缩时涉及到的许多手动操作。换句话说,你可以将...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
09610
从本地到云端:豆瓣如何使用 JuiceFS 实现统一的数据存储-卡咪卡咪哈-一个博客

从本地到云端:豆瓣如何使用 JuiceFS 实现统一的数据存储

原标题:从本地到云端:豆瓣如何使用 JuiceFS 实现统一的数据存储 作者 | 曹丰宇 策划 | Tina 豆瓣成立于 2005 年,是中国最早的社交网站之一。在 2009 到 2019 的十年间,豆瓣数据平台经历了几...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈2年前
07010