Arenadata Database для разработчиков
Форма обучения: очная с применением дистанционных технологий
Объем программы: 4 дня

Содержание программы:
1. Введение в ADB:
  1. Базовые сведения об ADB и Greenplum. Архитектура MPP и её реализация в ADB.
  2. Отличия ADB от ADQM (Clickhouse) и ADH (Hadoop).
  3. Окружение. ADCM, мониторинг.
  4. Базовые схемы и объекты. Структура БД. Шаблоны.
2. Пользователи и группы:
  1. Ролевая модель. Пользователи и группы. Организация иерархии. Предоставление и отзыв полномочий. Доступ к СУБД.
  2. Распределение ресурсов. Ресурсные группы. Расширение Diskquota.
3. Хранение данных:
  1. Виды таблиц. Семейства Heap и Append-Optimized. Форматы хранения данных. Сжатие данных. Базовые сведения о распределении данных. Материализованные представления. Тейблспейсы.
  2. Партиционированные таблицы. Отличие от обычных таблиц. Манипуляции с партициями. Варианты использования.
4. Типы данных:
  1. Типы данных. Рекомендации по выбору. Сопоставление с типами Oracle.
  2. Типы JSON и JSONB. Индексы. Операторы.
  3. Тип XML. Функции.
5. Получение данных:
  1. Внешние таблицы. Устройство, назначение и типы. Протоколы.
  2. Загрузка и выгрузка данных при помощи GPFDIST и GPLOAD.
  3. Использование PXF для доступа к внешним системам. Доступ к данным на кластере Hadoop. Работа с JDBC.
6. Функции:
  1. Пользовательские функции. Классы функций. Место выполнения функции.
  2. Языки. PL/SQL. PL/python. C-функции. PLContainer.
  3. Пользовательские агрегатные функции.
  4. Оконные функции.
  5. Расширения MadLib и PostGIS.
7. Оптимальное выполнение запросов:
  1. Схема выполнения запроса в ADB. Оптимизаторы.
  2. Планы запросов. Получение плана. Разбор структуры плана и показателей. Операции.
  3. Распределение данных. Выбор политики распределения. Правильный ключ распределения. Нюансы записи и чтения данных для таблиц с разным типом распределения.
  4. Статистика. Сбор статистики. Проблемы, возникающие из-за неверной статистики. Автоматизация анализа объектов в ADB.
  5. Особенности оптимизаторов. Разница в работе с партиционированными таблицами. Подзапросы. CTE.
  6. Индексы. Виды индексов. Применимость в ADB.
  7. Транзакции. Уровни изоляции. Обеспечение изоляции при помощи механизма VCC. Очистка объектов от неактуальных версий данных. Автоматизация очистки в ADB.
  8. Блокировки. Уровни блокировки для разных операций. Ручная блокировка объекта. Детектор взаимных блокировок для Heap-таблиц.
8. Организация хранилища:
  1. Подход к модели данных.
  2. Подходы ETL и ELT.
  3. Загрузка и обновление данных в справочниках разных типов.