Big Data on AWS課程將向您介紹基于云的大數據解決方案,例如Amazon Elastic MapReduce(EMR)、Amazon Redshift、Amazon Kinesis和其余AWS大數據平臺。在本課程中,我們將向您介紹如何使用Amazon EMR來利用諸如Hive和Hue等廣泛Hadoop工具體系處理數據。講授內容還包括如何創建大數據環境、使用Amazon DynamoDB、Amazon Redshift和Amazon Kinesis,利用較佳實踐來設計大數據環境,從而實現安全性和經濟性。
我們建議參加學習本課程的人員符合以下先決條件:
基本熟悉大數據技術,包括Apache Hadoop、MapReduce、HDFS和SQL/NoSQL查詢
學員應完成Big Data Technology Fundamentals網絡培訓或具備同等經驗
具有核心AWS服務和公有云實施經驗
學員應完成AWS Technical Essentials課程或具備同等經驗
了解數據倉庫、關系數據庫系統和數據庫設計基礎
本課程中您將學習:
適用大數據體系內的AWS解決方案
在Amazon EMR環境中使用Apache Hadoop
確定Amazon EMR集群的組件
啟動并配置Amazon EMR集群
利用Amazon EMR的常用編程框架,包括Hive、Pig和Streaming
利用Hue提高Amazon EMR的易用性
在Amazon EMR上搭配使用內存分析及Spark和Spark SQL
選擇適當的AWS數據存儲選項
確定使用Amazon Kinesis以近乎實時的速度處理大數據的優勢
定義數據倉庫和列式數據庫的概念
利用Amazon Redshift有效地存儲和分析數據
了解和管理Amazon EMR及Amazon Redshift部署的成本和安全性
確定用于獲取、傳輸和壓縮數據的選項
使用可視化軟件描述數據和查詢
利用AWS Data Pipeline編排大數據流目標人群