大数据共370篇 第11页
大数据,离线计算,实时计算,流处理引擎,数仓技术
提升效率、降低成本,作业帮数据采集体系架构升级实践-卡咪卡咪哈-一个博客

提升效率、降低成本,作业帮数据采集体系架构升级实践

原标题:提升效率、降低成本,作业帮数据采集体系架构升级实践 作者 | 伍思磊 编辑 | 李忠良 在 ArchSummit 全球架构师峰会上海站上,InfoQ 非常荣幸邀请到作业帮大数据中台负责人伍思磊,他为...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07713
spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记-卡咪卡咪哈-一个博客

spark大数据教程(spark大数据分析源码解析)《Spark大数据分析实战》笔记

写在前面:此书很棒,但需要一定的编程功底,此外强烈建议买书,因为很多架构图、算子列表,我也不会摘抄下来。 第一章 简介 1.Spark执行的特点 Hadoop中包含计算框架MapReduce和分布式文件系统...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0775
什么是Flink?Flink入门教程-卡咪卡咪哈-一个博客

什么是Flink?Flink入门教程

1 Flink概述1.1 数据流与流计算数据流是一串连续不断的数据的集合,就象水管里的水流,在水管的一端一点一点地供水,而在水管的另一端看到的是一股连续不断的水流。类似于人们对河流的理解本质...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07613
提高SEO性能需求的10大优化方案-卡咪卡咪哈-一个博客

提高SEO性能需求的10大优化方案

原标题:提高SEO性能需求的10大优化方案 SEO搜索引擎优化作为一种获取自然流量的重要方式,已经成为了网站推广的必备技能。而要想在搜索引擎中获得更好的排名,就需要关注SEO性能需求。本文将从...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0766
Python手写机器学习最简单的KNN算法-卡咪卡咪哈-一个博客

Python手写机器学习最简单的KNN算法

作者|苏克1900 来源|高级农民工(ID:Mocun6) 摘要:从零开始学习机器学习最简单的 KN 打开凤凰新闻,查看更多高清图片 作者|苏克1900 来源|高级农民工(ID:Mocun6) 摘要:从零开始学习...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
0766
推荐算法原理及实现python-0316-2020-卡咪卡咪哈-一个博客

推荐算法原理及实现python-0316-2020

1、推荐算法原理(协同过滤)2、推荐算法建模1、推荐算法原理(协同过滤)? 协同过滤推荐算法分为两类:基于用户的协同过滤算法、基于物品的协同过滤算,简单的说就是:人以类聚,物以群分。分...
虾画怪谈的头像-卡咪卡咪哈-一个博客虾画怪谈1年前
07510