Межгалактическая доставка: корабль — это только половина миссии
Добро пожаловать в будущее разработки. Если вы всю жизнь создавали «классический» софт, вы привыкли к миру, где Код — это Закон. Вы пишете скрипт, компьютер ему следует, и пока вы не забыли поставить точку с запятой, корабль благополучно долетает до соседней звездной системы.
Но Глубокое обучение (Deep Learning) устроено иначе. В мире ИИ код — это всего лишь пустой корпус вашего грузового корабля. Он бесполезен без ГРУЗА.
Сценарий
Представьте, что я собрал суперсовременного робота-курьера. Я написал самый элегантный код в галактике, чтобы он ходил, говорил и уворачивался от капитана корабля. В классическом программировании на этом всё. Можно запускать.
Но в ИИ этот робот — чистый лист. Чтобы сделать его «Роботом-Доставщиком», я должен скормить ему Данные.
- Если я дам ему данные об успешных доставках пиццы, он станет Пицца-ботом.
- Если я дам ему данные о набегах межзвездных пиратов, он станет Пират-ботом.
- Если я дам ему данные о том, как бухгалтерия подшивает чеки… что ж, он станет очень занудным ботом.
Реальность
В ИИ-проекте ваш продукт — это Код + Данные.
В обычном софте вы тратите 90% времени на доработку логики «Если-То». В ИИ вы тратите 90% времени, переживая о том, что лежит в коробках, которыми вы кормите машину. Если данные — это «мусор», ваш «идеальный» код просто научится производить «идеальный мусор».
Почему это важно
Вот почему нельзя просто «нанять разработчика», чтобы он прикрутил ИИ-фичу, и забыть об этом. Теперь вы — Менеджер Данных. Ваша работа — не просто построить корабль, а отобрать груз. Поведение вашего приложения не зафиксировано в исходном коде — оно рождается из паттернов в ваших данных.
Главное
ИИ-проект — это живой организм, состоящий из Кода и Данных. Изменение данных так же важно (а часто и эффективнее), как и изменение кода.
Специалисты называют это: Data-Centric AI (Дата-центричный подход к ИИ) Data-Centric AI — это подход, при котором вы систематически улучшаете данные, используемые для построения ИИ-системы, вместо того чтобы фокусироваться только на архитектуре модели или коде.
💬 Представьте, что ваш текущий проект — это межзвездная доставка. Каким «мусором» вы случайно кормите своего робота-пилота?
Часть 1 (Код + Данные) из 20 | #DLLifecycleДляЛюдей #ai_edu Based on CS230 Stanford lectures