Непредсказуемая туманность: почему вы не можете контролировать будущее
Мы потратили месяцы на обучение нашего ИИ-навигатора. Мы скормили ему каждый астероид, каждую солнечную вспышку и каждое гравитационное искажение в этом секторе. Ученый доволен. Двигатель мурлычет. Мы стартовали со 100% уверенностью.
А потом мы влетели в Пурпурную Туманность.
Сценарий
Внезапно законы физики изменились. Туманность заполнена «Пылью Темной Материи», которую наш ИИ никогда не видел. Наш корабль, который был гением в обходе астероидов, теперь пытается пристыковаться к гигантскому космическому кальмару, потому что думает, что кальмар — это дозаправочная станция.
В классическом софте это был бы баг, который можно исправить строчкой кода. В ИИ это называется «Сдвиг распределения данных» (Data Distribution Shift). Вы можете контролировать данные для обучения, но у вас нулевой контроль над данными, которые вселенная (пользователь) подкинет вам завтра.
Реальность
Это самая сложная часть для фаундеров: ваш ИИ рано или поздно столкнется с ситуацией, которую он не понимает.
Вы можете обучить бота поддержки по текущему руководству к продукту. Он идеален. Но в следующем месяце вы запускаете новую фичу или меняете цены. Внезапно «будущие данные» (вопросы пользователей) перестают соответствовать «прошлым данным» (руководству). Ваш бот начинает галлюцинировать, потому что пытается применить старые правила к новой туманности.
Почему это важно
В жизненном цикле ИИ развертывание — это не конец, а начало бесконечной миссии по наблюдению.
- Вы не можете заставить вселенную оставаться прежней.
- Вы не можете предсказать каждого «космического кальмара», которого придумают ваши пользователи.
- Вы должны строить системы, которые вовремя заметят, что корабль входит в «неизвестную туманность», чтобы успеть вернуть его в безопасную зону.
Главное
Ваша модель — это моментальный снимок прошлого. Будущее — это хаотичная туманность, которой плевать на ваши обучающие выборки.
Специалисты называют это: Data Distribution Shift (Сдвиг распределения данных) Это происходит, когда статистические свойства входных данных меняются со временем. Модель становится менее точной, потому что данные, на которых она обучалась (прошлое), больше не соответствуют данным, которые она видит в реальности (будущее).
💬 Какого последнего «космического кальмара» подкинул вашему приложению пользователь, которого ваша изначальная логика никак не ожидала?
Часть 3 (Непредсказуемая туманность) из 20 | #DLLifecycleДляЛюдей #ai_edu Based on CS230 Stanford lectures