标签：Hadoop

Hadoop面试题系列(11/11)

1、Hive内部表和外部表的区别？　　1、在导入数据到外部表，数据并没有移动到自己的数据仓库目录下，也就是说外部表中的数据并不是由它自己来管理的！而表则不一样；　　2、在删除表的时候，Hive将会把属于表的元数据和数据全部删掉；而删除外部表的时候，Hive仅仅删除外部表的元数据，数据是不会删除的！　　那么，

w397090770 8年前 (2016-08-26) 5647℃ 2评论20喜欢

Hadoop

Hadoop面试题系列(10/11)

一. 问答题1) datanode在什么情况下不会备份？2) hdfs的体系结构？3) sqoop在导入数据到mysql时，如何让数据不重复导入？如果存在数据问题sqoop如何处理？4) 请列举曾经修改过的/etc下的配置文件，并说明修改要解决的问题？5) 描述一下hadoop中，有哪些地方使用了缓存机制，作用分别是什么？二. 计算题1、使用Hive或

w397090770 8年前 (2016-08-26) 4248℃ 1评论4喜欢

Hadoop

一. 问答题1. 用mapreduce实现sql语句select count(x) from a group by b？2. 简述MapReduce大致流程，map -> shuffle -> reduce3. HDFS如何定位replica4. Hadoop参数调优: cluster level: JVM, map/reduce slots, job level: reducer, memory, use combiner? use compression?5. hadoop运行的原理？6. mapreduce的原理？7. HDFS存储的机制？8. 如何确认Hadoop集群的健康状况？

w397090770 8年前 (2016-08-26) 3359℃ 0评论3喜欢

Hadoop

Hadoop面试题系列(8/11)

一. 问答题1.hive如何调优？2.hive如何权限控制？3.hbase写数据的原理是什么？4.hive能像关系数据库那样，建多个库吗？5.hbase宕机如何处理？6.hive实现统计的查询语句是什么？7.生产环境中为什么建议使用外部表？8.hadoop mapreduce创建类DataWritable的作用是什么？9.为什么创建类DataWritable？二. 思考题1.假

w397090770 8年前 (2016-08-26) 3490℃ 0评论5喜欢

Hadoop

Hadoop面试题系列(7/11)

一. 单选题1. 下面哪个程序负责 HDFS 数据存储a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker答案：C datanode2. HDfS 中的 block 默认保存几份？a)3 份 b)2 份 c)1 份d)不确定答案:A 默认3份 3. 下列哪个程序通常与 NameNode在一个节点启动？a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker答案：D分析：hadoop的集群是基于ma

w397090770 8年前 (2016-08-26) 3675℃ 0评论2喜欢

Hadoop

Hadoop面试题系列(6/11)

一. 问答题1. 简单说说map端和reduce端溢写的细节2. hive的物理模型跟传统数据库有什么不同3. 描述一下hadoop机架感知4. 对于mahout，如何进行推荐、分类、聚类的代码二次开发分别实现那些接口5. 直接将时间戳作为行健，在写入单个region 时候会发生热点问题，为什么呢？二. 计算题1. 比方:如今有10个文件夹, 每个

w397090770 8年前 (2016-08-26) 3127℃ 0评论1喜欢

Hadoop

Hadoop面试题系列(5/11)

一.问答题1、map方法是如何调用reduce方法的？2、fsimage和edit的区别？3、hadoop1和hadoop2的区别？4、列举几个配置文件优化？5、写出你对zookeeper的理解6、datanode首次加入cluster的时候，如果log报告不兼容文件版本，那需要namenode执行格式化操作，这样处理的原因是？7、hbase 集群安装注意事项二. 思考题1. linux

w397090770 8年前 (2016-08-26) 3155℃ 0评论1喜欢

Hadoop

Hadoop面试题系列(4/11)

1.文件大小默认为64M，改为128M有啥影响？2.RPC的原理？3.NameNode与SecondaryNameNode的区别与联系？4.介绍MadpReduce整个过程，比如把WordCount的例子的细节将清楚（重点讲解Shuffle）？5.MapReduce出现单点负载多大，怎么负载平衡？6.MapReduce怎么实现Top10？7.hadoop底层存储设计8.zookeeper有什么优点，用在什么场合9.Hbase中的meta

w397090770 8年前 (2016-08-26) 3546℃ 0评论2喜欢

Hadoop

Hadoop面试题系列(3/11)

1. 集群多少台, 数据量多大, 吞吐量是多大, 每天处理多少G的数据？2. 我们的日志是不是除了apache的访问日志是不是还有其他的日志？3. 假设我们有其他的日志是不是可以对这个日志有其他的业务分析？这些业务分析都有什么？4. 你们的服务器有多少台？服务器的内存多大？5. 你们的服务器怎么分布的？（这里说地理位置

w397090770 8年前 (2016-08-26) 3410℃ 0评论4喜欢

Hadoop

Hadoop面试题系列(2/11)

1.hbase怎么预分区？2.hbase怎么给web前台提供接口来访问？3.htable API有没有线程安全问题，在程序中是单例还是多例？4.hbase有没有并发问题？5.metaq消息队列，zookeeper集群，storm集群，就可以完成对商城推荐系统功能吗？还有没有其他的中间件？6.storm 怎么完成对单词的计数？7.hdfs的client端，复制到第三个副本时宕机，

w397090770 8年前 (2016-08-26) 4130℃ 0评论2喜欢

上一页
1
2
3
4
5
6
7
8
9
10
11
12
...
17
下一页
共 17 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

标签：Hadoop

Hadoop面试题系列(11/11)

Hadoop面试题系列(10/11)

Hadoop面试题系列(9/11)

Hadoop面试题系列(8/11)

Hadoop面试题系列(7/11)

Hadoop面试题系列(6/11)

Hadoop面试题系列(5/11)

Hadoop面试题系列(4/11)

Hadoop面试题系列(3/11)

Hadoop面试题系列(2/11)