焦作师范高等专科学校H
什么样的计算不能用mr来提速,举5个例子。
答案是:1)数据量很小。 2)繁杂的小文件。 3)索引是更好的存取机制的时候。 4)事务处理。 5)只有一台机器的时候。

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
有可能使 Hadoop 任务输出到多个目录中么?如果可以,怎么做?
答案是:1)可以输出到多个目录中,采用自定义OutputFormat。 2)实现步骤: (1)自定义outputformat,

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
如果没有定义partitioner,那数据在被送达reducer前是如何被分区的?
答案是:如果没有自定义的 partitioning,则默认的 partition 算法,即根据每一条数据的 key 的 hash

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
如何决定一个job的map和reduce的数量?
答案是:1)map数量 splitSize=max{minSize,min{maxSize,blockSize}} map数量由

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?
答案是:1)序列化和反序列化 序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储(持久化)和网络传输。 反

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
HDFS Federation方案的优势?
答案是:第一点,命名空间的扩展。因为随着集群使用时间的加长,HDFS上存放的数据也将会越来越多。这个时候如果还是将所有的数据都往

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
HAnamenode 是如何工作的?
答案是:ZKFailoverController主要职责 1)健康监测:周期性的向它监控的NN发送健康探测命令,从而来确定某个N

更新时间:2023/9/25 13:43:00
出自:焦作师范高等专科学校Hadoop应用基础
NameNode与SecondaryNameNode 的区别与联系?
答案是:1)机制流程同上; 2)区别 (1)NameNode负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
简要描述如何安装配置apache的一个开源Hadoop,只描述即可,无需列出具体步骤,列出具体步骤更好?
答案是:(1)使用root账户登录 (2)修改IP (3)修改host主机名 (4)配置SSH免密码登录 (5)关闭防火墙 (6

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
列举几个hadoop生态圈的组件并做简要描述?
答案是:(1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
hadoop dfsadmin - report命合用于检测HDFS损坏块。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读学取或则会写人metadata 信息并反馈client端。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop是 Java开发的,所以 MapReduce 只支持Java语言编写。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:42:00
出自:焦作师范高等专科学校Hadoop应用基础
如果 NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
Nagios不可以监控Hadoop 集群,因为它不提供 Hadoop支持。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
Block Size 是不可以修改的。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
Ganglia不仅可以进行监控,也可以进行告警。() A.正确 B.错误
答案是:A

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop环境变量中的 HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200 GB。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
NameNode 的 Web UI端口是50030,它通过jetty 启动的 web 服务。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
DataNode 首次加入 cluster 的时候,如果log中报告不兼容文件版本,那需要NameNode执行“Hadoop namenode -format”操作格式化磁盘。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
Mapreduce 的 input split 就是一个block。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:41:00
出自:焦作师范高等专科学校Hadoop应用基础
每个map槽就是一个线程。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
因为HDFS有多个副本,所以NameNode 是不存在单点问题的。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop 默认调度器策略为FIFO() A.正确 B.错误
答案是:A

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
hadoop dfsadmin - report命令用于检测HDFS 损坏块。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
slave节点要存储数据,所以它的磁盘越大越好。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或则会写入metadata信息并反馈client端。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop支持数据的随机读写。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop 是 Java开发的,所以 MapReduce 只支持Java 语言编写。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
Cloudera CDH是需要付费使用的。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:40:00
出自:焦作师范高等专科学校Hadoop应用基础
如果NameNode意外终止, SecondaryNameNode 会接替它使集群继续工作。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
Nagios不可以监控Hadoop 集群,因为它不提供Hadoop支持。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
Block Size是不可以修改的。() A.正确 B.错误
答案是:B

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
Ganglia 不仅可以进行监控,也可以进行告警。() A.正确 B.错误
答案是:A

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
hdfs-site.xml的3个主要属性?
答案是:1:dfs.name.dir决定的是元数据存储的路径以及dfs的存储⽅式(磁盘或是远端)。 2:dfs.d

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
简单描述⼀下hive中的分区表?
答案是:Hive的分区表分为动态分区和静态分区两种模式,分区表实际上就是对应⼀个HDFS⽂件系统上的

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
Mapreduce执⾏过程中,在执⾏Reduce Task之前主要做哪些⼯作?
答案是:reduce task在执⾏之前的⼯作是不断的拉取当前job⾥每个map ta

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
简单描述Shuffle过程环形缓冲区的作⽤?
答案是:数据从map()输出,经过Partitioner分区操作,在进⼊环形缓冲区。默认情况下,环形缓冲区

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
如果需要在NameNode节点群起集群,你需要如何配置?
答案是:先确保你的集群配置是正确的,单点启动能够成功,如果要群起我们需要在etc/hadoop/slaves⽂件中

更新时间:2023/9/25 13:39:00
出自:焦作师范高等专科学校Hadoop应用基础
yarn有哪⼏部分组成,作⽤分别是什么?调度器主要有哪三种?hadoop默认的是哪⼀种?
答案是:yarn由ResourceManager、NodeManager、ApplicationMaster和Container

更新时间:2023/9/25 13:37:00
出自:焦作师范高等专科学校Hadoop应用基础
Hive内部表和外部表的区别?
答案是:我们在创建外部表的时候要加个关键字 external 内部表:当我们在hive中使⽤命令删除hive表时,

更新时间:2023/9/25 13:37:00
出自:焦作师范高等专科学校Hadoop应用基础
MapReduce的基本数据类型包括哪些?
答案是:BooleanWritable ByteWritable IntWritable FloatWritable LongW

更新时间:2023/9/25 13:37:00
出自:焦作师范高等专科学校Hadoop应用基础
简单描述MapReduce不适合对哪些场景的使⽤?其实问的就是它的缺点。
答案是:(1)MapReduce不适合做低延迟数据访问场景的使⽤ (2)MapReduce不适合处理⼤

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
如何实现服务器之间的免密登录(便捷版)?SSH采⽤的是什么加密?
答案是:实现免密登录步骤: 1.在服务器⽣成密钥对 ssh-keygen -t rsa 三次回车 2.发送公钥到本

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
假如NameNode中没有数据会怎么样?
答案是:先说明NameNode节点肯定不正常,集群肯定不正常的,没有数据的NameNode就不能称之为NameNode,通常情况

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
简单描述⼀下TextInputFormat怎么进⾏⽂件切分?
答案是:TextInputFormat根据⽂件⼤⼩将⽂件拆分成split

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
是否可以在Windows上运⾏Hadoop?
答案是:你最好不要这么做,Red Hat Linux或者是Ubuntu才是Hadoop的最佳操作系统。在Hadoop安装中,Wi

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
什么是hive,谈谈你的理解?
答案是:hive是基于Hadoop的⼀个数据仓库⼯具,可以将结构化的数据⽂件映射为&#

更新时间:2023/9/25 13:36:00
出自:焦作师范高等专科学校Hadoop应用基础
简单描述你对Hadoop集群SafeMode模式的理解?
答案是:集群处于安全模式,不能执⾏重要操作(写操作),集群属于只读状态。但是严格来说,知识保证HDFS元数据信息的

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop伪分布集群包含哪些守护进程?
答案是:DataNode、NodeManager、ResourceManager,SecondaryNameNode,NameN

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop有几种运行模式?
答案是:单机模式、伪分布模式、完全分布式模式

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop有哪些应用领域?
答案是:运营商、电子商务、在线旅游、欺诈检测、医疗保健、能源开采、金融、直播、在线教育等

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop包含哪些优势?
答案是:方便、弹性、健壮、简单

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
Hadoop2.0包含哪些核心组件?
答案是:MapReduce、HDFS、YARN

更新时间:2023/9/25 13:35:00
出自:焦作师范高等专科学校Hadoop应用基础
HBase官方版本可以安装在什么操作系统上? A.CentOS B.Ubuntu C.RedHat D.Windows
答案是:ABC

更新时间:2023/9/25 13:34:00
出自:焦作师范高等专科学校Hadoop应用基础
下列关于Bloom Filter的描述正确的是? A.是一个很长的二进制向量和一系列随机映射函数 B. C.有一定的误算率 D.可以在Bloom Filter中删除元素
答案是:AC

更新时间:2023/9/25 13:34:00
出自:焦作师范高等专科学校Hadoop应用基础
关于HBase二级索引的描述,哪些是正确的? A.核心是倒排表 B.二级索引概念是对应Rowkey这个“一级”索引 C.二级索引使用平衡二叉树 D.二级索引使用LSM结构
答案是:AB

更新时间:2023/9/25 13:34:00
出自:焦作师范高等专科学校Hadoop应用基础
目前为: 1/2 页  首页   上页  下页 尾页