Как научить нейросеть генерировать фото на основе текстовой информации

Статьи

Искусственная нейронная сеть (ИНС) — это математическая или кибернетическая модель биологической нейронной сети. Она представляет собой один из видов искусственного интеллекта (ИИ). Нейросетевые системы могут самообучаться по базе экспериментальных данных и исправлять ошибки. Они способны разрешать проблемы прогнозирования, управления, распознавания образов. Разработчики Microsoft научили нейросеть генерировать фото на основе текстовой информации.

Нейросеть научили генерировать фото на основе текстовой информации

Структура нейросети

Нейросеть — это система соединённых и взаимодействующих между собой искусственных нейронов. Формирование выходного сигнала или нескольких выходных из множества входных определяется внутренним алгоритмом нейрона.

Нейросети способны разрешить следующие виды проблем:

  • определить класс объекта и отыскать его изображение;
  • сгруппировать полученные данные с похожими признаками;
  • выявить зависимость и обобщить данные.

Способность к самообучению — одно из главных достоинств нейронных сетей. ИНС получают знания об окружающей среде на каждой итерации обучающего процесса.

Генерация фотографий по описанию

Генерация фото на основе текстовой информации

В основу алгоритма Microsoft положена генеративно-состязательная сеть (GAN), которая позволяет создавать реалистичные фотографии. Сеть составлена из генератора и дискриминатора. Генератор образовывает новые объекты, сходные с объектами из базы экспериментальных данных, которая ему недоступна, а дискриминатор определяет принадлежность генерированного объекта к семейству объектов из обучающей базы и формирует сигнал генератору.

Главное отличие этой нейросети от предшествующих в том, что изображение генерируется не из всего описания сразу, а посредством подробного изучения деталей текста. Обучение происходит на наборах изображений с текстовыми описаниями каждого из них, что позволяет роботу понять, как совмещать тест с рисунками.

Например, нейросеть училась генерировать изображение птицы, когда это слово было указано в описании, а также узнавала, как выглядит рисунок птицы.

Применение нейронных сетей

ИНС часто применяют при анализе данных или для автоматизированного принятия решений. Нейросети распознают голосовые команды и переводят текстовые сообщения в речь. Область применения нейронных сетей:

Сфера применения нейросети

  1. Машинное обучение, которое внедряют поисковые системы. На основе множества поисковых запросов алгоритмы учатся показывать наиболее релевантную выдачу.
  2. Использование в робототехнике.
  3. Решение проблемы параллельных вычислений.

Нейронные сети интересны тем, что они основаны на биологической модели нервных систем. В перспективе роботы будут всё чаще заменять человека и займут большинство рабочих мест. Сделан первый шаг по созданию полноценного искусственного интеллекта.

Оцените статью
IT-Time24
Добавить комментарий

Этот сайт защищен reCAPTCHA и применяются Политика конфиденциальности и Условия обслуживания применять.