Cloudera大数据分析师认证
考试编号:CCA159
查看更多
考试形式:
120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具。
考试大纲:
一、准备数据
> 使用ETL准备数据便于查询
> 使用Sqoop将数据从MySQL数据库导入至HDFS中。
> 使用Sqoop将数据从HDFS中导出至MySQL数据库中
> Metstore各表间移动数据
> 在数据分析前,转换数据的值、列及文件形式
二、为数据提供结构
> 使用DDL来创建或改变metastore中的数据结构,便于Hive和Impala使用
> 使用多种数据类型、分隔符、文件类型创建表格
> 使用现有的表格来创建新表,定义模式
> 在metastore中创建分区表以改善查询性能
> 修改表以改变现有模式
> 创建视图以简化查询
三、数据分析
> 在Hive和Impala中使用查询语言分析集群中的数据
> 使用SELECT代码包括unions、subqueries准备数据
> 在查询期间计算汇总统计量,包括sums、averages
> 使用join代码在不同数据源间创建查询
> 使用内置功能转换查询输出格式
> 使用窗口功能在行间执行查询