Cloudera数据科学家培训
课程概述:
数据科学家创建了信息平台来提出和回答以前所不敢想像的问题,帮助公司降低成本、提高收益、改进产品、留住客户、发现新的商业机会。
Cloudera大学规模化数据科学课程帮助学员理解什么是数据科学家和他们解决什么问题。通过课堂模拟, 学员运用数据科学的方法处理现实中来自不同行业的挑战,直至准备好数据科学家的角色。 
 
课时安排:
3天/18课时。

培训内容:
通过讲师引导的讨论及交互式的练习,学员将获得Hadoop生态系统全方位的体验,包括:
> 数据科学家的角色、行业使用案例、数据客户的业务应用。
> 从哪里、如何采集数据、评估源数据的方法、数据转形和准备。
> 统计和分析方法的类型和相互关系。
> 机器学习基础和突破。认识算法的重要性,理解数据是一个平台。
> 如何用Spark的MLlib实现并管理推荐系统,如何建立和评估数据实践。
> 部署生产级分析项目的步骤和维护工作范围的窍门。 

培训对象和学员基础:
该课程适合有Apache Hadoop基本知识,如HDFS、MapReduce、Hadoop Streaming和Apache Hive的开发人员,数据分析师和统计师。学员应熟练脚本语言;建议熟练Python ,而Perl或Ruby只需熟悉即可。

客户评价:
“讲师所展示的专业和广博的技术知识令人不敢相信。Cloudera培训的质量可以匹敌大学。”
—— General Dynamics