编辑: 5天午托 2018-09-17

10 到100 倍D. Tableau 不能查询 Hadoop 29. HDFS 的NameNode 负责管理文件系统的命名空间,将所有的文件和文件夹 的元数据保存在一个文件系统树中, 这些信息也会在硬盘上保存成以下文件: (C) A. 日志 B. 命名空间镜像 C. 两者都是 D. 两者都不是 30. 客户端在 HDFS 上进行文件写入时,namenode 根据文件大小和配置情况, 返回部分 datanode 信息,然后( D )负责将文件划分为多个 Block,根据 DataNode 的地址信息,按顺序写入到每一个 DataNode 块. A. Namenode B. Datanode C. Secondary namenode D. 客户端 31. HDFS 的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最 基本的存储单位是 128M,具有高容错、高可靠性、高可扩展性、高吞吐率等特 征,适合的读写任务是(C) A. 一次写入,少次读写 B. 多次写入,少次读写 C. 一次写入,多次读写 D. 多次写入,多次读写 32. 组合多条 SQL 查询语句形成组合查询的操作符是( D ) A. SELECT B. ALL C. LINK D. UNION CDA LEVEL II 大数据分析师模拟题 第7页,共29 页 版权所有,侵权必究 33. HBase 是面向( B )的数据库. A. 行B. 列C. 网络 D. 内存 34. linux 中,哪个目录存放用户密码信息( B ) A. /boot B. /etc C. /var D. /dev 35. 考虑如下场景:在M/R 系统中, - HDFS 块的大小是 128MB - 输入数据格式是 FileInputFormat - 我们有

2 个文件,大小分别为 64Mb 和200Mb 问:Hadoop 框架将启动几个 mapper 进程进行处理?( B ) A.

2 个B.

3 个C.

4 个D.

5 个36. 在大数据的单位中,PB 称为 拍字节 ,其中 1PB 指的是: ( D ) A. 1024KB B. 1024MB C. 1024GB D. 1024TB 37. hdfs-site.xml 中哪个主要属性决定数据存储的路径?( B ) A. dfs.name.dir B. dfs.data.dir C. fs.checkpoint.dir D. dfs.url CDA LEVEL II 大数据分析师模拟题 第8页,共29 页 版权所有,侵权必究 38. 以下哪项用于左连接( C ) A. JOIN B. RIGHT JOIN C. LEFT JOIN D. INNER JOIN 39. SQL 是一种( C )语言. A. 函数型 B. 高级算法 C. 关系数据库 D. 人工智能 40. 一张表的主键个数为( C ) A. 至多

3 个B. 没有限制 C. 至多

1 个D. 至多

2 个41. 在Hadoop v2 YARN 中,负责管理一个单独节点内资源的服务是( A ) A. NodeManager B. ResourceManager C. NameNode D. DataNode 42. 向数据表中插入一条记录用以下哪一项( B ) A. CREATE B. INSERT C. SAVE D. UPDATE 43. Hadoop fs 中的-get 和-put 命令操作对象是: ( C ) A. 文件 B. 目录 C. 两者都是 CDA LEVEL II 大数据分析师模拟题 第9页,共29 页 版权所有,侵权必究 D. 两者都不是 44. 创建一个数据库表用以下哪一项( B ) A. UPDATE B. CREATE C. UPDATED D. ALTER 45. HDFS 是一个分布式文件系统,它允许用户使用 shell 命令操作文件系统.其 中读取/user/hduser/file1.txt 文件并打印到屏幕上的命令是: ( C ) A. hdfs dfs -ls /user/hduser/file1.txt B. hdfs dfs -mkdir /user/hduser/file1.txt C. hdfs dfs -cat /user/hduser/ file1.txt D. hdfs dfs -put /user/hduser/ file1.txt 46. LSM 更能保证哪种操作的性能?( B ) A. 读B. 写C. 随机读 D. 合并 47. HDFS 文件系统有一个/作为根目录.运行如下哪个命令来列出在 HDFS 中新 创建的目录的内容: ( A ) A. hdfs dfs -ls test B. hdfs dfs -mkdir test C. hdfs dfs -cat test D. hdfs dfs -put test 48. 运行如下的命令,将本地 readme.txt 文件拷贝到 test 目录中: ( D ) A. hdfs dfs -cat test/readme.txt B. hdfs dfs -put test/readme.txt C. hdfs dfs -rm -R test/readme.txt D. hdfs dfs -copyFromLocal readme.txt test 49. 关于 MapReduce 计算框架,以下说法正确的是: ( A ) CDA LEVEL II 大数据分析师模拟题 第10 页,共29 页 版权所有,侵权必究 A. MapReduce 是一个离线的批处理计算框架 B. MapReduce 是一个实时的流处理计算框架 C. MapReduce 是一个内存计算框架 D. 以上说法都正确 50. 在MapReduce 的Shuffle 阶段, 每个 Reducer 使用 HTTP 协议来从 Mapper 节 点获取自己的 partition. 默认每个 Reducer 使用几个线程来获取 Maper 节点数据? ( C ) A.

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题