Набор для маскировки: создание искусственных воспоминаний

В мире машин одной фотографии никогда не бывает достаточно. Чтобы по-настоящему «узнать» цель, машина должна увидеть её тысячей разных способов.

Сценарий

Представьте, что вы оперативник в секретной фотолаборатории. У вас есть всего одна четкая фотография особо важной цели.

Если вы покажете своим стажерам только это одно фото, они узнают цель только при идеальном освещении, с расстояния ровно три метра и при взгляде прямо в камеру. В полевых условиях это бесполезно.

Тогда вы достаете свой Набор для маскировки. Вы берете это единственное фото и начинаете им манипулировать. Вы зеркально отражаете его. Увеличиваете глаза. Приглушаете свет. Добавляете искусственную зернистость, имитируя дождливую ночь. Поворачиваете голову цели на пять градусов.

К тому времени, когда вы закончите, у вас будет сотня «новых» фотографий. Ни одна из них не является настоящей, но все они правдоподобны. Вы искусственно расширили свою базу улик. Это и есть АУГМЕНТАЦИЯ ДАННЫХ (Data Augmentation).

Реальность

Нейронные сети на редкость привередливы. Если вы будете показывать им только фотографии кошек, которые сидят прямо, они могут не узнать кошку, которая лежит или частично скрыта за препятствием.

Аугментация данных — это процесс создания «синтетических» данных на основе уже имеющихся. Для изображений мы используем повороты, отражения, обрезку и изменение цветов. Для текста мы можем заменять слова синонимами или слегка менять порядок предложений. Мы не добавляем новую «истину», но мы учим ИИ быть гибким и устойчивым к изменениям в реальном мире.

Почему это важно

Данные — это топливо для ИИ, и их часто трудно найти. Аугментация — это способ «обмануть» систему на законных основаниях. Она предотвращает Переобучение (Overfitting) — ситуацию, когда модель зазубривает конкретные примеры вместо того, чтобы уловить общую идею. Показывая ИИ тысячи вариаций одного и того же объекта, вы заставляете его искать ключевые признаки — «сущность» кошки — вместо того, чтобы просто запоминать конкретное расположение пикселей.

Главное

Аугментация данных — это «Набор для маскировки», который учит ИИ узнавать истину, даже если она скрыта за шумом, тенями или под другим углом.

Специалисты называют это: Data Augmentation / Synthetic Data Generation (Аугментация данных / Генерация синтетических данных) Аугментация данных — это метод увеличения объема данных путем добавления слегка измененных копий уже существующих данных или создания новых синтетических данных на основе имеющихся. Это помогает модели лучше обобщать и снижает риск переобучения.

💬 Если бы вам пришлось скрываться от ИИ, что бы вы изменили в своей внешности в первую очередь?

Часть 17 (Аугментация данных) из 25 | #DeepLearningДляЛюдей

Сценарий

Реальность

Почему это важно

Главное

Есть проект на прицеле?