欢迎关注Hadoop、Spark、Flink、Hive、Hbase、Flume等大数据资料分享微信公共账号:iteblog_hadoop
  1. 文章总数:978
  2. 浏览总数:11,958,230
  3. 评论:3937
  4. 分类目录:106 个
  5. 注册用户数:6120
  6. 最后更新:2018年12月15日
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
iteblog_hadoop
大数据技术博客公众号bigdata_ai
大数据猿:
bigdata_ai

Hadoop面试题系列(8/11)

一. 问答题

1.hive如何调优?

2.hive如何权限控制?

3.hbase写数据的原理是什么?

4.hive能像关系数据库那样,建多个库吗?

5.hbase宕机如何处理?

6.hive实现统计的查询语句是什么?

7.生产环境中为什么建议使用外部表?

8.hadoop mapreduce创建类DataWritable的作用是什么?

9.为什么创建类DataWritable?

二. 思考题

1.假设公司要建一个数据中心,你会如何规划?

2.用Hadoop分析海量日志文件,每行日志记录了如下数据:
TableName(表名),Time(时间),User(用户),TimeSpan(时间开销)。

要求:
编写MapReduce程序算出高峰时间段(如上午10 点)哪张表被访问的最频繁,以及这段时间访问这张表最多的用户,以及这个用户的总时间开销。

本博客文章除特别声明,全部都是原创!
转载本文请加上:转载自过往记忆(https://www.iteblog.com/)
本文链接: 【Hadoop面试题系列(8/11)】(https://www.iteblog.com/archives/1763.html)
喜欢 (3)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!