Виновен по ассоциации: скажи мне, кто твой друг
В агентстве есть поговорка: «Ты — это те, с кем ты сидишь». Если мы не видим твой паспорт, мы просто посмотрим на твоих соседей.
Сценарий
Представьте, что вы офицер контрразведки в переполненном зале ожидания аэропорта. Вы видите мужчину, который сидит в одиночестве и читает газету. У него нет багажа, нет документов и нет явной принадлежности к какой-либо группе. Кто он: турист или курьер?
Чтобы выяснить это, вы смотрите не на него, а на людей вокруг. В радиусе трех метров от него находятся пять человек.
Вы прогоняете их лица по базе данных:
- Человек 1: Известный связной вражеской разведки.
- Человек 2: Курьер под прикрытием из Восточного блока.
- Человек 3: Обычный турист.
- Человек 4: Торговец оружием с черного рынка.
- Человек 5: Еще один агент конкурирующей службы.
Четверо из пяти его «соседей» — цели с высоким уровнем риска. Логика проста: если вы окружены акулами, вы вряд ли золотая рыбка. Это и есть KNN (K-Nearest Neighbours). Вы классифицируете неизвестное, глядя на большинство его ближайших соседей «в поле».
Реальность
KNN — один из самых простых и интуитивно понятных алгоритмов в ИИ. Он не строит сложный «свод правил». Вместо этого он наносит каждую единицу данных на огромную ментальную карту. Когда поступает новый, неизвестный фрагмент данных, алгоритм просто ищет «K» ближайших к нему существующих точек.
Если вы установите K=5 и четыре из пяти этих точек будут помечены как «Мошенническая транзакция», алгоритм пометит новые данные как мошенничество. Он исходит из предположения, что похожие вещи обитают в одном районе.
Почему это важно
KNN силен тем, что не требует «обучения» в традиционном смысле — он просто помнит всё. Он идеально подходит для ситуаций, где правила постоянно меняются, но «соседства» остаются стабильными. Это правило «Виновен по ассоциации», превращенное в математическую формулу.
Главное
KNN идентифицирует неизвестное, глядя на то, кто его окружает. Скажи мне, кто твой сосед, и я скажу, кто ты.
Специалисты называют это: K-Nearest Neighbours (KNN) (Метод k-ближайших соседей) K-ближайших соседей — это непараметрический классификатор обучения с учителем, который использует близость для классификации или прогнозирования группировки отдельной точки данных.
💬 Если бы ИИ сегодня посмотрел на пятерых ваших ближайших друзей, какой «Тег» он бы присвоил вам?
Часть 21 (KNN) из 25 | #DeepLearningДляЛюдей