2016年04月的内容

Flink快速上手之Java API使用

　　本文将介绍如何通过简单地几步来开始编写你的 Flink Java 程序。要求　　编写你的Flink Java程序唯一的要求是需要安装Maven 3.0.4(或者更高)和Java 7.x(或者更高) 创建Flink Java工程使用下面其中一个命令来创建Flink Java工程1、使用Maven archetypes：[code lang="bash"]$ mvn archetype:generate \ -DarchetypeGrou

w397090770 9年前 (2016-04-06) 13983℃ 0评论8喜欢

Flink

Flink快速上手(QuickStart)

安装：下载并启动　　Flink可以在Linux、Mac OS X以及Windows上运行。为了能够运行Flink，唯一的要求是必须安装Java 7.x或者更高版本。对于Windows用户来说，请参考 Flink on Windows 文档，里面介绍了如何在Window本地运行Flink。下载　　从下载页面（http://flink.apache.org/downloads.html）下载所需的二进制包。你可以选择任何与 Hadoop/Scala 结

w397090770 9年前 (2016-04-05) 17788℃ 0评论23喜欢

Flink

Flink是如何与YARN进行交互的

在前面（《Flink on YARN部署快速入门指南》的文章中我们简单地介绍了如何在YARN上提交和运行Flink作业，本文将简要地介绍Flink是如何与YARN进行交互的。　　YRAN客户端需要访问Hadoop的相关配置文件，从而可以连接YARN资源管理器和HDFS。它使用下面的规则来决定Hadoop配置：　　1、判断YARN_CONF_DIR,HADOOP_CONF_DIR或HADOOP_CONF_PATH等环境

w397090770 9年前 (2016-04-04) 6074℃ 0评论8喜欢

Flink

Apache Flink vs Apache Spark

　　我们是否还需要另外一个新的数据处理引擎？当我第一次听到Flink的时候这是我是非常怀疑的。在大数据领域，现在已经不缺少数据处理框架了，但是没有一个框架能够完全满足不同的处理需求。自从Apache Spark出现后，貌似已经成为当今把大部分的问题解决得最好的框架了，所以我对另外一款解决类似问题的框架持有很强烈的怀

w397090770 9年前 (2016-04-04) 18198℃ 0评论42喜欢

Flink

如何选择Apache Spark和Apache Flink

　　Spark Streaming和Flink都能提供恰好一次的保证，即每条记录都仅处理一次。与其他处理系统（比如Storm）相比，它们都能提供一个非常高的吞吐量。它们的容错开销也都非常低。之前，Spark提供了可配置的内存管理，而Flink提供了自动内存管理，但从1.6版本开始，Spark也提供了自动内存管理。这两个流处理引擎确实有许多相似之处，

w397090770 9年前 (2016-04-02) 4867℃ 0评论5喜欢

Kafka

如何移动Kafka部分分区的数据

　　在《Kafka集群扩展以及重新分布分区》文章中我们介绍了如何重新分布分区，在那里面我们基本上把所有的分区全部移动了，其实我们完全没必要移动所有的分区，而移动其中部分的分区。比如我们想把Broker 1与Broker 7上面的分区数据互换，如下图所示：可以看出，只有Broker 1与Broker 7上面的分区做了移动。来看看移动分区之

w397090770 9年前 (2016-03-31) 3392℃ 0评论4喜欢

上一页
1
2
3
共 3 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

2016年04月的内容

Flink快速上手之Java API使用

Flink快速上手(QuickStart)

Flink是如何与YARN进行交互的

Apache Flink vs Apache Spark

如何选择Apache Spark和Apache Flink

如何移动Kafka部分分区的数据