Cloudera检索培训
课程概述:
Cloudera大学提供的检索培训课程是专门针对希望在Hadoop中索引数据以实现更强大的实时查询功能的开发人员和工程师而设计的。培训学员将学习如何通过将Cloudera检索系统与外部应用程序进行整合,以挖掘他们的数据更多的价值。
Cloudera检索系统具备全文本、交互式搜索功能,并且具备针对Hadoop和企业数据中心的可扩展、灵活索引功能。由Apache Solr提供技术支持,可以针对新一代集成式、多工作负载查询提供规模性和可靠性。
 
课时安排:
3天/18课时。
 
培训内容:
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
> 对存储在HDFS和HBase中的数据进行批量索引。
> 通过Flume以近实时的方式执行流数据的索引。
> 以多语言和多文件格式对内容进行索引。
> 通过Morphlines处理和转换输入数据。
> 使用Hue创建索引的用户界面。
> 将Cloudera检索系统与外部应用程序进行整合。
> 使用层面搜索(faceting)、高亮(highlighting)、拼写纠错等功能
> 改善搜索体验。

培训对象及学员基础:
本课程是专门针对至少基本了解Hadoop和具备通用语言(例如Java、C、C 、Perl或Python)编程经验的开发人员和工程师设计的。培训学员应非常熟悉Linux命令行,并且应该能够执行基本任务(例如,创建和删除目录、查看和更改文件权限、执行脚本、并检查文件输出)。不要求培训学员必需具备Apache Solr或Cloudera检索系统使用经验,同时也不要求具备HBase或SQL使用经验。

客户评价:
“我立即开始应用我在Cloudera大学课堂上学到的知识来解决和重新审视多个现实问题,解决过去存在疑问的案例。同时,我能够快速创建一些能够取得预期效果的运行代码。”
—— 英特尔公司(Intel)