Форма обучения: очная с применением дистанционных технологий
Объем программы: 4 дня
Содержание программы:
1. Введение в ADB:
- Базовые сведения об ADB и Greenplum. Архитектура MPP и её реализация в ADB.
- Отличия ADB от ADQM (Clickhouse) и ADH (Hadoop).
- Окружение. ADCM, мониторинг.
- Базовые схемы и объекты. Структура БД. Шаблоны.
2. Пользователи и группы:
- Ролевая модель. Пользователи и группы. Организация иерархии. Предоставление и отзыв полномочий. Доступ к СУБД.
- Распределение ресурсов. Ресурсные группы. Расширение Diskquota.
3. Хранение данных:- Виды таблиц. Семейства Heap и Append-Optimized. Форматы хранения данных. Сжатие данных. Базовые сведения о распределении данных. Материализованные представления. Тейблспейсы.
- Партиционированные таблицы. Отличие от обычных таблиц. Манипуляции с партициями. Варианты использования.
4. Типы данных:- Типы данных. Рекомендации по выбору. Сопоставление с типами Oracle.
- Типы JSON и JSONB. Индексы. Операторы.
- Тип XML. Функции.
5. Получение данных:- Внешние таблицы. Устройство, назначение и типы. Протоколы.
- Загрузка и выгрузка данных при помощи GPFDIST и GPLOAD.
- Использование PXF для доступа к внешним системам. Доступ к данным на кластере Hadoop. Работа с JDBC.
6. Функции:- Пользовательские функции. Классы функций. Место выполнения функции.
- Языки. PL/SQL. PL/python. C-функции. PLContainer.
- Пользовательские агрегатные функции.
- Оконные функции.
- Расширения MadLib и PostGIS.
7. Оптимальное выполнение запросов:- Схема выполнения запроса в ADB. Оптимизаторы.
- Планы запросов. Получение плана. Разбор структуры плана и показателей. Операции.
- Распределение данных. Выбор политики распределения. Правильный ключ распределения. Нюансы записи и чтения данных для таблиц с разным типом распределения.
- Статистика. Сбор статистики. Проблемы, возникающие из-за неверной статистики. Автоматизация анализа объектов в ADB.
- Особенности оптимизаторов. Разница в работе с партиционированными таблицами. Подзапросы. CTE.
- Индексы. Виды индексов. Применимость в ADB.
- Транзакции. Уровни изоляции. Обеспечение изоляции при помощи механизма VCC. Очистка объектов от неактуальных версий данных. Автоматизация очистки в ADB.
- Блокировки. Уровни блокировки для разных операций. Ручная блокировка объекта. Детектор взаимных блокировок для Heap-таблиц.
8. Организация хранилища:- Подход к модели данных.
- Подходы ETL и ELT.
- Загрузка и обновление данных в справочниках разных типов.