欢迎关注大数据技术架构与案例微信公众号:过往记忆大数据
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
过往记忆大数据

过往记忆大数据,2019年原创精选69篇

这是一份迟来的年终报告,本来昨天就要发出来的,实在是没忙开,今天我就把它当作新年礼物送给各位看官,以下文章都是我结合日常工作、学习,每当“夜深人静"的时候写出来的一些小总结,希望能给大家一些技术上的帮助。

关注我的朋友都知道,我在今年八月份发了一篇文章,里面整理了我五年来写在这个公众号上面的原创文章。这篇文章几乎可以当作一份资料集,这里再把它放出来,需要的可以收藏一下五年总结:过往记忆大数据原创精选(点击进入)

废话不多说,上干货。69篇2019年原创文章请收好~

(点击标题可直达对应文章,这只是我分享的一部分,完整版欢迎访问我的博客:https://www.iteblog.com/)

  1. 盘点2019年晋升为Apache TLP以及进去Apache孵化器的大数据相关项目
  2. Apache Kafka 2.4 正式发布,重要功能详细介绍
  3. Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比
  4. 60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践
  5. Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎
  6. Apache Spark 中编写可伸缩代码的4个技巧
  7. Apache Hudi: Uber 开源的大数据增量处理框架
  8. 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)的使用
  9. Apache Spark 3.0 预览版正式发布,多项重大功能发布
  10. 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)
  11. 使用 Spark 和 Delta Lake 构建近实时数据仓库
  12. Spark+AI Summit Europe 2019 超清视频&PPT下载
  13. Apache Cassandra 在 Facebook 的应用
  14. 重磅|Spark Delta Lake 现在由Linux基金会托管,将成为数据湖的开放标准
  15. Spark Delta Lake 0.4.0 发布,支持 Python API 和部分 SQL
  16. 一文了解 Apache Cassandra 是什么
  17. 云栖大会 | Apache Spark 3.0 和 Koalas 最新进展
  18. 原创干货 | 史上最全的大数据学习资源(Awesome Big Data)
  19. Apache Spark Delta Lake 写数据使用及实现原理代码解析
  20. 如何为Kafka集群选择合适的Topics/Partitions数量
  21. 你还在使用 JDK 7?JDK 13 都已经来了!五大新特性你最喜欢哪个 ?
  22. 32 道常见的 Kafka 面试题你都会吗?附答案
  23. 这可能是学习 Spark Delta Lake 最全的资料
  24. 深入理解 Apache Spark Delta Lake 的事务日志
  25. MongoDB 4.2 发布,支持分布式事务
  26. 一文理解 Apache Spark DataSource V2 诞生背景及入门实战
  27. 图文了解 Kafka 的副本复制机制
  28. 深入理解 Spark SQL 查询引擎
  29. Spark & Alluxio在网易严选架构演进中的实践和探索
  30. 重磅 | HPE 宣布收购 MapR!
  31. Uber 大数据平台的演进(2014~2019)
  32. Apache Hadoop 的 HDFS federation 前世今生
  33. Apache Hive JdbcStorageHandler 编程入门指南
  34. 深入理解 Spark Delta Lake 的诞生及其工作原理
  35. Spark-SQL 在字节跳动的应用实践
  36. Apache Kafka 2.3 发布,新特性讲解
  37. 砖厂 CEO Ali 对 Hadoop 的最新评价
  38. Apache Hive 联邦查询(Query Federation)
  39. Hadoop 气数已尽?
  40. 一条 SQL 在 Apache Spark 之旅(下)
  41. 一条 SQL 在 Apache Spark 之旅(中)
  42. 一条 SQL 在 Apache Spark 之旅(上)
  43. Kafka 是如何保证数据可靠性和一致性
  44. 深入理解 Spark SQL 查询引擎
  45. 通过 Spark Streaming Listener 监控程序
  46. 图文了解 Kafka 的副本复制机制
  47. 分布式原理:一致性哈希算法简介
  48. Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的
  49. Koalas: 让 pandas 开发者轻松过渡到 Apache Spark
  50. .NET for Apache Spark 预览版正式发布
  51. 重磅 | Apache Spark 社区期待的 Delta Lake 开源了
  52. Flink Forward 201904 PPT资料下载
  53. Apache Spark 2.4 回顾以及 3.0 展望
  54. SHC:使用 Spark SQL 高效地读写 HBase
  55. Apache Spark 未来:Spark 3.0 预览
  56. Open Distro for Elasticsearch:AWS 自家版本的开源 ElasticSearch
  57. Apache Spark 3.0 将内置支持 GPU 调度
  58. HBase 中加盐之后的表如何读取:Spark 篇
  59. HBase 中加盐之后的表如何读取:协处理器篇
  60. HBase 协处理器入门及实战
  61. 分布式原理:一致性哈希算法简介
  62. 分布式原理:一文了解 Gossip 协议
  63. Kafka创建Topic时如何将分区放置到不同的Broker中
  64. HBase 入门之数据刷写(Memstore Flush)详细说明
  65. Apache Arrow:一个跨平台的内存数据交换格式
  66. 为什么不建议在 HBase 中使用过多的列族
  67. 为了让你更全面的了解Apache HBase,我们做了这本专刊
  68. {Submarine} 在 Apache Hadoop 中运行深度学习框架
  69. 盘点2018年晋升为Apache TLP的大数据相关项目
(点击标题可直达对应文章,这只是我分享的一部分,完整版欢迎访问我的博客:https://www.iteblog.com/)

2020年,希望继续得到大家的支持,同时祝大家2020年幸福快乐,升职加薪,出任CEO,迎娶白富美,走上人生巅峰!!

本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据过往记忆)所有,未经许可不得转载。
本文链接: 【过往记忆大数据,2019年原创精选69篇】(https://www.iteblog.com/archives/9748.html)
喜欢 (1)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!