Анализ изображений
Форма обучения: очная, с применением электронного обучения и дистанционных образовательных технологий
Объем программы: 135 ак.ч.
Продолжительность обучения: 15 занятий по 4 ак.ч.
Выдаваемый документ: Удостоверение о повышении квалификации МФТИ
Старт обучения: февраль 2023

Краткое описание программы:
Цель программы - знакомство студентов с ключевыми задачами и методами анализа изображений.

Содержание программы:
1. Вводная часть
  1. Правило хорошего кода
  2. Красивый код на Python
  3. Пробелы и табуляция
  4. Комментирование
  5. Аннотирование
2. Введение в анализ изображений. Основы обработки изображений
2.1. Введение в анализ изображений
  • Изображение - что из себя представляет
  • Св-ва изображения: Насыщенность, Яркость
  • Модели цвета: RGB, HSB, CMYK
  • Примеры современных систем и алгоритмов компьютерного зрения
  • Устройство камеры и оптической системы человека
2.2 Классические методы обработки изображений
Здесь упор делается на алгоритмы неглубокого обучения, реализованных в библиотеке OpenCV.
  • Основные задачи обработки изображений
  • Цветокоррекция изображений. Гистограммы, линейная и нелинейная коррекции яркости. Модели камеры и цветокоррекции.
  • Конволюции
  • Edge Detection
  • Contour Detection
  • SURF и SIRF
  • Гомография
  • Selective search
3. Нейросетевые подходы к анализу изображений. Основные задачи и алгоритмы
3.1. Введение в глубокое обучение
  • Нейронная сеть
  • Функции активации
  • Функции ошибок
  • Градиентный спуск
  • Оптимизаторы
  • Регуляризация
  • BatchNormalization
3.2 Предобработка данных. Аугментация изображений. Датасеты
  • Предобработка данных для нейронной сети
  • Методы аугментации данных
  • MixUp
  • Популярные датасеты изображений
  • Kaggle
3.3. Конволюционные нейронные сети
  • CNN
  • MaxPooling
  • Модификации CNN
  • Архитектуры CNN
3.4. Классификация изображений
  • Задача классификации изображений
  • Метрики качества классификации
  • Функции ошибки классификации
  • Трюки для улучшения классификации
3.5. Сегментация изображений
  • Задача сегментации изображений: Семантическая сегментация, Instance segmentation
  • Метрики качества классификации
  • Архитектуры сегментации: SegNet, Unet и т. д.
  • Функции ошибки сегментации
3.6. Детектирование объектов на изображении
  • Задача детектирования объектов на изображении
  • Метрики качества детекции
  • Архитектуры детекции
3.7. Идентификация объектов на изображени. Поиск схожих объектов
  • Задача идентификации
  • Идентификация лиц
  • Функции ошибки
  • Metic Learning
  • Модель CLIP
3.8. Распознавание текста на изображении
  • Детектирование строк
  • Распознавание текста
  • CTC loss
  • Архитектуры
3.9. Оптический поток. Карта глубин
  • Оптический поток: FlowNet, SpyNet, PWC-Net
  • Карта глубин
3.10. Обучение без учителя
  • Автоэнкодер
  • Вариационный автоэнкодер
  • Conditional Variational Autoencoder
  • Кластеризация полученных векторов
  • Few-shot обучение на полученных векторах
3.11 GAN
  • Задача генерации изображений
  • Генеративно-состязательная сеть
  • Функция ошибки
3.12. Explainable Computer Vision
  • CAM
  • GradCAM
4. Заключительная часть
  • Другие задачи обработки и анализа изображений: 3D
  • Дальнейшие пути развития

Как проходит обучение:
  1. Лекции и семинары с преподавателем МФТИ в Zoom
  2. Все занятия записываются и доступны всегда
  3. Постоянная поддержка от преподавателей в чате курса
  4. Домашние задания в течение семестра
  5. Контрольные работы в качестве промежуточного контроля знаний
  6. Обратная связь на домашние задания
  7. Итоговая аттестация в формате прикладного проекта для портфолио