Форма обучения: очная, с применением электронного обучения и дистанционных образовательных технологий
Объем программы: 135 ак.ч.
Продолжительность обучения: 15 занятий по 4 ак.ч.
Выдаваемый документ: Удостоверение о повышении квалификации МФТИ
Старт обучения: февраль 2023
Краткое описание программы: Цель программы - знакомство студентов с ключевыми задачами и методами анализа изображений.
Содержание программы:
1. Вводная часть- Правило хорошего кода
- Красивый код на Python
- Пробелы и табуляция
- Комментирование
- Аннотирование
2. Введение в анализ изображений. Основы обработки изображений2.1. Введение в анализ изображений- Изображение - что из себя представляет
- Св-ва изображения: Насыщенность, Яркость
- Модели цвета: RGB, HSB, CMYK
- Примеры современных систем и алгоритмов компьютерного зрения
- Устройство камеры и оптической системы человека
2.2 Классические методы обработки изображенийЗдесь упор делается на алгоритмы неглубокого обучения, реализованных в библиотеке OpenCV.
- Основные задачи обработки изображений
- Цветокоррекция изображений. Гистограммы, линейная и нелинейная коррекции яркости. Модели камеры и цветокоррекции.
- Конволюции
- Edge Detection
- Contour Detection
- SURF и SIRF
- Гомография
- Selective search
3. Нейросетевые подходы к анализу изображений. Основные задачи и алгоритмы3.1. Введение в глубокое обучение- Нейронная сеть
- Функции активации
- Функции ошибок
- Градиентный спуск
- Оптимизаторы
- Регуляризация
- BatchNormalization
3.2 Предобработка данных. Аугментация изображений. Датасеты- Предобработка данных для нейронной сети
- Методы аугментации данных
- MixUp
- Популярные датасеты изображений
- Kaggle
3.3. Конволюционные нейронные сети- CNN
- MaxPooling
- Модификации CNN
- Архитектуры CNN
3.4. Классификация изображений- Задача классификации изображений
- Метрики качества классификации
- Функции ошибки классификации
- Трюки для улучшения классификации
3.5. Сегментация изображений- Задача сегментации изображений: Семантическая сегментация, Instance segmentation
- Метрики качества классификации
- Архитектуры сегментации: SegNet, Unet и т. д.
- Функции ошибки сегментации
3.6. Детектирование объектов на изображении- Задача детектирования объектов на изображении
- Метрики качества детекции
- Архитектуры детекции
3.7. Идентификация объектов на изображени. Поиск схожих объектов- Задача идентификации
- Идентификация лиц
- Функции ошибки
- Metic Learning
- Модель CLIP
3.8. Распознавание текста на изображении- Детектирование строк
- Распознавание текста
- CTC loss
- Архитектуры
3.9. Оптический поток. Карта глубин- Оптический поток: FlowNet, SpyNet, PWC-Net
- Карта глубин
3.10. Обучение без учителя- Автоэнкодер
- Вариационный автоэнкодер
- Conditional Variational Autoencoder
- Кластеризация полученных векторов
- Few-shot обучение на полученных векторах
3.11 GAN- Задача генерации изображений
- Генеративно-состязательная сеть
- Функция ошибки
3.12. Explainable Computer Vision4. Заключительная часть- Другие задачи обработки и анализа изображений: 3D
- Дальнейшие пути развития
Как проходит обучение: - Лекции и семинары с преподавателем МФТИ в Zoom
- Все занятия записываются и доступны всегда
- Постоянная поддержка от преподавателей в чате курса
- Домашние задания в течение семестра
- Контрольные работы в качестве промежуточного контроля знаний
- Обратная связь на домашние задания
- Итоговая аттестация в формате прикладного проекта для портфолио