Cloudera大数据分析师认证
考试编号:CCA159

考试形式:

120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具。

 

考试大纲:

一、准备数据

> 使用ETL准备数据便于查询

> 使用Sqoop将数据从MySQL数据库导入至HDFS中。

> 使用Sqoop将数据从HDFS中导出至MySQL数据库中

>  Metstore各表间移动数据

> 在数据分析前,转换数据的值、列及文件形式

 

二、为数据提供结构

> 使用DDL来创建或改变metastore中的数据结构,便于Hive和Impala使用

> 使用多种数据类型、分隔符、文件类型创建表格

> 使用现有的表格来创建新表,定义模式

> 在metastore中创建分区表以改善查询性能

> 修改表以改变现有模式

> 创建视图以简化查询

 

三、数据分析

> 在Hive和Impala中使用查询语言分析集群中的数据

> 使用SELECT代码包括unions、subqueries准备数据

> 在查询期间计算汇总统计量,包括sums、averages

> 使用join代码在不同数据源间创建查询

> 使用内置功能转换查询输出格式

> 使用窗口功能在行间执行查询