欢迎关注Hadoop、Spark、Flink、Hive、Hbase、Flume等大数据资料分享微信公共账号:iteblog_hadoop
  1. 文章总数:965
  2. 浏览总数:11,691,441
  3. 评论:3897
  4. 分类目录:103 个
  5. 注册用户数:5960
  6. 最后更新:2018年11月10日
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
iteblog_hadoop
大数据技术博客公众号bigdata_ai
大数据猿:
bigdata_ai

Spark 1.1.1发布

  Spark 1.1.1于美国时间的2014年11月26日正式发布。基于branch-1.1分支,主要修复了一些bug。推荐所有的1.1.0用户更新到这个稳定版本。本次更新共有55位开发者参与。
  spark.shuffle.manager仍然使用Hash作为默认值,说明了SORT的Shuffle还不怎么成熟。等待1.2版本吧。

Fixes

  Spark 1.1.1修复了几个组件的bug。在下面将会列出一些代表性的bug。同时,你也可以到这里查看所有修复的bug。

Spark Core

这是Spark core模块修复的重要bug。
Avoid many small spills in external data structures (SPARK-4480)
Memory leak in connection manager timeout thread (SPARK-4393)
Incorrect of channel read return value may lead to data truncation (SPARK-4107)
Stream corruption exceptions observed in sort-based shuffle (SPARK-3948)
Integer overflow in sort-based shuffle key comparison (SPARK-3032)
Lack of thread safety in Hadoop configuration usage in Spark (SPARK-2546)

SQL

这是SQL模块修复的重要bug。
Wrong Parquet filters are created for all inequality predicates with literals on the left hand side (SPARK-4468)
Support backticks in aliases (SPARK-3708 and SPARK-3834)
ColumnValue types do not match in Spark rows vs Hive rows (SPARK-3704)

PySpark

这是PySpark模块修复的重要bug。
Fix sortByKey on empty RDD (SPARK-4304)
Avoid using the same random seed for all partitions (SPARK-4148)
Avoid OOMs when take() is run on empty partitions (SPARK-3211)

MLlib

这是MLlib模块修复的重要bug。
KryoException caused by ALS.trainImplicit in PySpark (SPARK-3990)

Streaming

Block replication continuously fails if target is down (SPARK-3495)
Block replication may choose driver as target (SPARK-3496)

GraphX

Ensure VertexRDD.apply uses mergeFunc (SPARK-2062)

本博客文章除特别声明,全部都是原创!
转载本文请加上:转载自过往记忆(https://www.iteblog.com/)
本文链接: 【Spark 1.1.1发布】(https://www.iteblog.com/archives/1210.html)
喜欢 (5)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!