大数据共370篇 第2页
大数据,离线计算,实时计算,流处理引擎,数仓技术
与 Hadoop 对比,如何看待 Spark 技术?-卡咪卡咪哈-一个博客

与 Hadoop 对比,如何看待 Spark 技术?

Hadoop 首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
010013
Spark 凭什么成为最火的大数据计算引擎?| 极客时间-卡咪卡咪哈-一个博客

Spark 凭什么成为最火的大数据计算引擎?| 极客时间

原标题:Spark 凭什么成为最火的大数据计算引擎?| 极客时间 现在,几乎所有公司都离不开推荐、广告、搜索这 3 类业务场景,因此 Spark 也相应成了大多数互联网公司的标配: 美团在 2014 年就引...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
016112
Spark计算引擎:Spark数据处理模式详解-卡咪卡咪哈-一个博客

Spark计算引擎:Spark数据处理模式详解

Spark作为大数据领域受到广泛青睐的一代框架,一方面是相比前代框架Hadoop在计算性能上有了明显的提升,另一方面则是来自于Spark在数据处理上,同时支持批处理与流处理,能够满足更多场景下的需...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07215
最详细的雪花算法,附上详细go语言实现-卡咪卡咪哈-一个博客

最详细的雪花算法,附上详细go语言实现

前言“ 嗨,everybody,我是asong,这是我的第十二篇文章,今天给大家介绍一下雪花算法。介绍雪花算法是次要的,因为大家都太熟悉了,主要目的是推荐一下我的新系列。今天,我突发奇想,想创建...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07714
基于python实现的电影推荐系统-卡咪卡咪哈-一个博客

基于python实现的电影推荐系统

摘 要 本文设计了一个个性化电影推荐系统。众所周知,现在电影资源是网络资源的重要组成部分,随着网络上电影资源的数量越来越庞大,设计电影个性化推荐系统迫在眉睫。所以本文旨在为每一个用户...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0697
Hadoop 2.x 中的多节点集群部署-卡咪卡咪哈-一个博客

Hadoop 2.x 中的多节点集群部署

Hadoop 2.x 中的多节点群集 从我们之前的Hadoop教程系列博客中,我们学习了如何设置 Hadoop单节点集群。现在,我将展示如何设置Hadoop多节点集群。Hadoop 中的多节点集群在分布式 Hadoop ...
kmhmha的头像-卡咪卡咪哈-一个博客kmhmha1年前
03813