已经更新300+篇~ 关注公众号~
Java基础 | NIO | 并发 | JVM | 分布式 | Zookeeper | RPC | Netty | Linux |
---|---|---|---|---|---|---|---|---|
Java基础 | NIO | 并发容器 | JVM | 分布式 | zookeeper | RPC | Netty | Linux |
Hadoop | Hive | Spark | Flink | HBase | Kafka | Zookeeper | Flume | Sqoop | Azkaban |
这里的文章主要是我平时发表在公众号,博客等的文章,精心挑选,以飨读者。
Flink实战进阶 | Spark实战进阶 | Kafka实战进阶 | OLAP实战进阶 |
面试系列合集 | 大数据算法 |
本部分引用作者heibaiying,大佬写的文章非常好,欢迎大家关注他的博客。我个人会持续补充更有深度和实战性的文章~
Spark Core :
Spark SQL :
Spark Streaming :
Kafka基本原理 :
分布式消息队列Kafka原理及与流式计算的集成 :
1.Hadoop面试题总结(一)
2.Hadoop面试题总结(二)——HDFS
3.Hadoop面试题总结(三)——MapReduce
4.Hadoop面试题总结(四)——YARN
5.Hadoop面试题总结(五)——优化问题
1.Kafka面试题总结(一)
2.Kafka面试题总结(二)
1.Spark面试题总结(一)
2.Spark面试题总结(二)
3.Spark面试题总结(三)
4.Spark面试题总结(四)
Spark性能优化:
5.Spark面试题总结(五)——几种常见的数据倾斜情况及调优方式
6.Spark面试题总结(六)——Shuffle配置调优
7.Spark面试题总结(七)——程序开发调优
8.Spark面试题总结(八)——运行资源调优
本系列的大纲会根据实际情况进行调整,欢迎大家关注~
文档中参考引用了大量网络上的博客和文章,大部分给出了出处,有些没写,如果造成了侵权行为,请您联系我,立即删除~
关注公众号:每天定时推送Hadoop/Spark/Flink等最新的大数据干货技术文章,学习资料下载等
备注Github,感谢您~
备注来自GitHub加群,小助手会拉你进大数据讨论组,一起学习交流,期待你的到来~
大数据成神之路 该系列文章将为希望从事大数据开发或者由后端转型为大数据开发的工程师们指出需要学习的知识点和路径,本系列文章同时致敬我曾经在网络上看到无数个Java和大数据系列文章,深受启发同时也收货很多。
欢迎关注公众号‘大数据技术与架构’或者搜索import_bigdata关注~
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。