Программа курса ориентирована на специалистов, желающих получить базовые знания о технологиях обработки больших данных, а также практический опыт использования решения компании Huawei. Знания и навыки, полученные в рамках данного курса, помогут успешно сдать сертификационный экзамен H13-711 для получения сертификации HCIA- Big Data.
Помимо теоретического материала существенная доля учебного времени отводится на выполнение лабораторных работ под руководством инструктора.
Требования к уровню подготовки слушателя:
- Наличие базовых навыков работы в ОС linux
- Наличие базовых знаний о Hadoop
- Опыт работы в IT-проектах
Курс позволит слушателям:
- Получить знания основных концепций "больших данных" и технологий их обработки
- Освоить использование компонентов «больших данных»
В ходе тренинга рассматриваются следующие темы:
- Индустрия "больших данных" и технологические тенденции
- Эра "больших данных"
- Области применения "больших данных"
- Возможности и проблемы "больших данных"
- Решение "больших данных" от компании Huawei
- HDFS - Распределённая файловая система Hadoop
- Обзор HDFS и области применения
- Место HDFS в FusionInsight HD
- Системная архитектура HDFS
- Ключевые возможности HDFS
- MapReduce - платформа распределенной пакетной обработки и YARN - Менеджер Ресурсов
- Введение в MapReduce и YARN
- Функции и архитектуры MapReduce и YARN
- Управление ресурсами и планирование задач в YARN
- Расширенные возможности
- Spark2x - Распределенный вычислительный движок в памяти
- Обзор Spark
- Принципы и архитектура Spark
- Интеграция Spark в FusionInsight HD
- HBase - Распределённая NoSQL база данных
- Введение в HBase
- Функции и архитектура HBase
- Ключевые процессы HBase
- Расширенные возможности HBase в Huawei
- Hive - Распределённое хранилище данных
- Введение в Hive
- Функции и архитектура Hive
- Базовые операции Hive
- Streaming - Движок распределённых потоковых вычислений
- Введение в Streaming
- Системная архитектура
- Ключевые возможности
- Введение в StreamCQL
- Flink – Платформа потоковой и пакетной обработки
- Обзор Flink
- Технические принципы и архитектура Flink
- Интеграция Flink в FusionInsight HD
- Loader - Преобразование данных
- Введение в Loader
- Управления задачами Loader
- Flume - Агрегатор журналов
- Обзор и архитектура Flume
- Основные характеристики Flume
- Применение Flume
- Kafka - Распределённая система подписки на сообщения
- Введение в Kafka
- Функции и архитектура Kafka
- Ключевые процессы Kafka
- Zookeeper - Распределенная координационная служба кластера
- Введение в ZooKeeper
- Место ZooKeeper в FusionInsight
- Системная архитектура
- Ключевые возможности
- Взаимодействие с другими компонентами
- FusionInsight HD - Решение Big Data от Huawei
- Обзор решения FusionInsight HD
- Возможности FusionInsight
- Истории успеха FusionInsight