×

Вы используете устаревший браузер Internet Explorer. Некоторые функции сайта им не поддерживаются.

Рекомендуем установить один из следующих браузеров: Firefox, Opera или Chrome.

Контактная информация

+7-863-218-40-00 доб.200-80
ivdon3@bk.ru

  • Обзор метрик с целью оценки качества работы генеративных моделей для создания изображений

    • Аннотация
    • pdf

    Статья представляет обзор метрик, используемых для оценки качества изображений, полученных с помощью генеративных моделей. Для них требуются специализированные метрики, позволяющие объективно оценивать качество изображений. Сравнительный анализ показал, что для комплексной оценки качества генерации необходимо сочетание различных метрик. Перцептивные метрики эффективны для оценки качества изображений с точки зрения машинных систем, в то время как метрики, оценивающие структуру и детали, полезны для анализа восприятия человеком. Метрики, основанные на текстовом описании, позволяют оценить соответствие изображений заданным текстам, однако они не могут заменить метрики, направленные на визуальную или структурную оценку. Результаты исследования будут полезны специалистам в области машинного обучения и компьютерного зрения, а также способствуют улучшению алгоритмов генерации и расширению областей применения диффузионных моделей.

    Ключевые слова: глубокое обучение, метрика, генеративная модель, качество изображений, изображение

    1.2.1 - Искусственный интеллект и машинное обучение , 1.2.2 - Математическое моделирование, численные методы и комплексы программ

  • Сравнительный анализ современных методов генерации изображений: VAE, GAN и диффузионные модели

    • Аннотация
    • pdf

    Статья представляет собой анализ современных методов генерации изображений: вариационных автоэнкодеров (Variational Autoencoder - VAE), генеративных состязательных сетей (Generative Adversarial Networks - GAN) и диффузионных моделей. Основное внимание уделено сравнительному анализу их производительности, качеству генерации и вычислительным требованиям. Для оценки качества изображений используется метрика расстояние Фреше между распределениями признаков (Fréchet Inception Distance - FID). Диффузионные модели показали наилучшие результаты (FID 20.8), превосходя VAE (FID 59.75) и GAN (FID 38.9), но требуют значительных ресурсов. VAE стабильны, но генерируют размытые изображения. GAN обеспечивают высокое качество, но страдают от нестабильности обучения и коллапса моды. Диффузионные модели, благодаря пошаговому декодированию шума, сочетают детализацию и структурированность, что делает их наиболее перспективными. Также рассмотрены методы генерации из изображения в изображение, применяемые для модификации изображений. Результаты исследования полезны для специалистов в области машинного обучения и компьютерного зрения, способствуя улучшению алгоритмов и расширению областей применения генеративных моделей.

    Ключевые слова: дипфейк, глубокое обучение, искусственный интеллект, GAN, VAE, диффузионная модель

    1.2.1 - Искусственный интеллект и машинное обучение , 1.2.2 - Математическое моделирование, численные методы и комплексы программ