Панель управления: переключатели личности
В мире машин личность — это не имя, а последовательность переключателей. Чтобы определить, кто перед нами, нужно знать, какие лампочки зажечь.
Сценарий
Представьте, что вы стоите перед огромной панелью управления из матовой стали в бункере времен Холодной войны. Эта панель определяет каждого агента в вашем распоряжении.
Чтобы описать текущее местоположение агента (One-Hot Encoding), у вас есть ряд из десяти переключателей. Каждый из них отвечает за свой город: Лондон, Париж, Берлин, Москва…
Правило машины простое: одновременно может гореть только одна лампочка. Если агент в Лондоне, первая лампа светится красным, а все остальные остаются темными. У вас получился «One-Hot» вектор. Это точный, единичный выбор.
Но что, если вам нужно описать специализацию агента (Multi-Hot Encoding)? Перед вами другой ряд переключателей: Криптография, Рукопашный бой, Языки, Эвакуация…
Здесь правила меняются. Элитный агент может быть экспертом и в Криптографии, и в Языках. Теперь две лампочки горят одновременно. Этот «Multi-Hot» вектор не просто указывает на место; он формирует профиль — комбинацию черт, определяющих сложную личность.
Реальность
В глубоком обучении нам часто нужно сообщать модели о «категориях». Если мы классифицируем фрукты, объект обычно может быть чем-то одним (Яблоко ИЛИ Апельсин) — мы используем One-Hot Encoding (вектор с одной единицей и множеством нулей).
Но если мы помечаем фильм тегами жанров, он может быть и «Экшн», и «Фантастика». В этом случае мы используем Multi-Hot Encoding (вектор с несколькими единицами). Эти векторы — способ превратить информацию формата «галочки в списке» в формат, который нейронная сеть сможет обработать.
Почему это важно
Нейронные сети — это математические движки. Они не могут обработать слово «Лондон». Им нужно видеть [1, 0, 0, 0, ...]. Превращая категории в ряды переключателей (векторы), мы позволяем машине вычислять вероятности. Она может сказать: «Я на 90% уверен, что переключатель “Лондон” должен быть включен».
Главное
One-hot — это «Выбери один». Multi-hot — это «Отметь всё подходящее».
Специалисты называют это: One-Hot Encoding / Multi-Hot Encoding (Унитарное кодирование / Мульти-хот кодирование) One-hot encoding — это процесс преобразования категориальных переменных в двоичный вектор, где только один элемент имеет значение 1. Multi-hot encoding позволяет нескольким элементам принимать значение 1, представляя несколько категории одновременно.
💬 Если бы у вас была панель управления вашей личностью, какие три переключателя были бы включены постоянно?
Часть 15 (One-hot vs Multi-hot) из 25 | #DeepLearningДляЛюдей