yukang
2023-05-29 17:36:41
.css-1yuhvjn{margin-top:16px;}.css-376mun{position:relative;display:inline;}.css-1hhle02.FileLinkCard{-webkit-align-items:center;-webkit-box-align:cen...
yukang
2023-03-07 15:54:51
分库分表实战内容基本上很少有人去分享,在网上能够搜出来的也大多属于一些方法论,但大部分技术开发真正缺少的恰恰是这些实操经验,所以后续的内容多以实践为主,携手诸位真正彻底悟透分库分表相...
yukang
2023-03-07 15:20:58
大数据量操作的场景大致如下:数据迁移数据导出批量处理数据在实际工作中当指定查询数据过大时,我们一般使用分页查询的方式一页一页的将数据放到内存处理。但有些情...
yukang
2022-12-09 17:22:20
点击上方卡片进入五分钟学大数据主页然后点击右上角“设为星标”比别人更快接收好文章文档大纲:本文上半部分之前已经发过了,传送门:50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战)上此篇文章是整个文档的下半部分,将接着上半部分从第五章开始。此文档完整版现已开放,无门槛领取此文档完整版,只...
yukang
2022-10-24 17:22:17
导读:大数据正在成为经济社会发展的新的驱动力。随着云计算、移动互联网等网络新技术的应用和发展,社会信息化进程进入大数据时代,海量数据的产生与流转成为常态。而大数据技术也如雨后春笋般正在蓬勃发展中。Hadoop分布式架构无疑是当前应用广泛、具代表性的大数据技术之一。本文将首先介绍Hadoop技术概...
yukang
2022-10-24 17:13:03
近被大数据相关的小词儿,整的有点懵。索性我们就来个专题,聊透数据库、数据仓库、数据湖以及风头正劲的“Lakehouse”——湖仓一体化。数据仓库是个啥?和数据库有什么不同?数据库的基本概念,大家应该都不陌生。如今但凡是个业务系统,都或多或少需要用到数据库。即便我们不直接跟数据库打交道,它们也在背后...
yukang
2022-10-12 15:56:29
点击关注"爱笑的架构师"右上角"设为星标"好文章不错过Zookeeper是一个分布式服务框架,主要是用来解决分布式应用中遇到的一些数据管理问题如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。我们可以简单把Zookeeper理解为分布式家庭的大管家,那么管家团队是如何选出Leade...
yukang
2022-10-12 15:56:01
不合理的需求,如何能轻松搞定?文章较长,建议提前收藏。可能99%的同学不做搜索引擎,但99%的同学一定实现过检索功能。搜索,检索,这里面到底包含哪些技术,希望本文能够给大家一些启示。需求一:我想做一个全网搜索引擎,不复杂,和百度类似就行,两个月能上线吗?全网搜索引擎架构与流程如何?全网搜索引擎的宏观...
点击加载更多
分享好友
分享这个小栈给你的朋友们,一起进步吧。
大数据之我观
创建时间:2020-05-20 11:12:12
分享
关注 Hadoop, Hive, HBase, YARN, Shark, Spark, 大规模数据处理相关的开源项目,数据挖掘,个性化推荐,反作弊诚信...
展开
订阅须知
• 所有用户可根据关注领域订阅专区或所有专区
• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询
• 专区发布评论属默认订阅所评论专区(除付费小栈外)
- 热门小栈
- 新小栈
- 更多