欢迎关注大数据技术架构与案例微信公众号:过往记忆大数据
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
过往记忆大数据

Apache 董事会宣布终止 Apache Sqoop 项目

2021年05月06日,Apache Sqoop 的 PMC venkatrangan 给 Sqoop 项目的 dev 邮件列表发送了一篇名为《Seeking inputs on the Apache Sqoop project》的邮件:

Seeking inputs on the Apache Sqoop project
如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:过往记忆大数据

从邮件内容可以看出,Apache Sqoop 最后一次 release 的时间是三年前,最近30个月没有任何新的 PMC 和 committer 加入到这个项目;Apache Sqoop 项目的活跃程度越来越低。所以 venkatrangan 发邮件给社区是想看下社区是否对 Sqoop 有新的 roadmap,否则把 Apache Sqoop 移到 Apache Attic 是比较合适的。

不过几天过去了,看起来好像没有人有新的 roadmap。紧接着,5月14日,venkatrangan 又给社区发了一个投票《VOTE: Move Apache Sqoop to attic》

Seeking inputs on the Apache Sqoop project
如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:过往记忆大数据

最后有三个 PMC 投票同意这个决定。

在6月16日举办的 Apache Board Meeting,董事会一致决定:Terminate the Apache Sqoop project(终止 Apache Sqoop 项目)!

Apache Sqoop 发展历程

Apache Sqoop 是一种用于 Apache Hadoop 和结构化数据存储(如关系数据库)之间高效传输批量数据的工具。 我们可以使用 Sqoop 将数据从外部结构化数据存储导入到 Hadoop 分布式文件系统或相关系统,如 Hive 和 HBase。 相反,Sqoop 可用于从 Hadoop 中提取数据并将其导出到外部结构化数据存储,例如关系数据库和企业数据仓库。

Sqoop 于 2009 年 5 月作为 Apache Hadoop 的贡献模块开始,最开始由 Aaron Kimball 开始贡献代码,参见 HADOOP-5815。随着项目的发展,Aaron 决定将 Sqoop 从 Hadoop 代码中分离并将其托管在其他地方,以加快开发和发布周期。 因此,在 2010 年 4 月,Sqoop 从 Hadoop 中删除,具体参见 MAPREDUCE-1644,并由 Cloudera 公司以 Apache Licensed 开源协议在 GitHub 上维护。

在接下来的一年中,Sqoop 获得了广泛采用,并发布了 4 个版本和 191 个补丁。 Sqoop 早期引入了一个扩展 API,允许开发高速第三方连接器,以便从专用系统(如企业数据仓库)快速传输数据。 结果,很多供应商使用它开发了相关的连接器。 为了支持这个由用户和第三方连接器供应商组成的新兴社区,Cloudera 决定把它贡献给 Apache。Sqoop 在 2011 年 6 月被 Apache 孵化器接受。一年后,2012年3月,Apache Sqoop 顺利毕业,称为顶级项目。

从2012年顺利毕业后,Apache Sqoop 一共发布了十三个版本,最后一个版本发布是2019年01月18日。截止到当前,已经两年多没有版本发布了。

董事会宣布停止 Apache Sqoop 项目

由于 Apache Sqoop 项目已经超过两年没有活跃,按照 Apache 的项目生命周期,其应该是 reached its end of life;所以需要将其从 Apache 项目移到 Apache Attic 项目中。一个项目可以通过两种方法进入 Attic:

  • 项目管理委员会(Project Management Committee,PMC)决定将项目移到 Attic 项目;
  • Apache 软件基金会的董事会解散 PMC 并选择将项目移到 Attic 。

而 Apache Sqoop 是通过第一种方式进行的。在这个月的 Apache 董事会会议中,一致决定停止 Apache Sqoop 项目。

对我们有啥影响

一个 Apache 项目被宣布从 Apache 中移到 Attic 项目并不是意味着这个项目不行了;也可能是这个项目太成熟了,以至于没有其他任何新的特性、Bug 修复,Apache Sqoop 应该就是这个。而且 Apache Sqoop 项目在国内外有很多用于在使用,是把关系型数据库的数据导到 Hadoop 上一个重要的工具。虽然 Sqoop 已经被宣布移到 Apache Attic,但是其实并不影响用户的使用,只不过以后就不会有官方来发布新的版本或者 bugfix,所以大家还是可以放心使用的。后面如果真的遇到 bug,可以自己维护个分支进行修复。

本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【Apache 董事会宣布终止 Apache Sqoop 项目】(https://www.iteblog.com/archives/9979.html)
喜欢 (2)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!