Данные решают. Как управлять данными, чтобы создавать ценность для бизнеса - Светлана Бова
За простотой этого опыта кроется огромная работа: стандарты, API, защита, документация, разграничение ответственности. Но результат того стоит. Когда линейный сотрудник — менеджер по продажам, логист, технолог — получает доступ к данным без посредников, он начинает принимать более качественные решения. Причем быстрее.
В этом мире управление данными перестает быть просто контролем качества и становится системой обеспечения доверия. Ведь если вы доверяете данным, вы их используете. А если нет — они бесполезны, сколько бы ни стоили.
ЧТО ДЕЛАТЬ CDO УЖЕ СЕГОДНЯ
Если вы отвечаете за данные в своей компании, вот несколько вопросов, над которыми стоит задуматься прямо сейчас.
1. Оцените, в каком статусе находится ваша инфраструктура для ИИ. Есть ли у вас платформа для создания и управления ИИ-агентами? Или вы только думаете над тем, чтобы купить готовые рыночные решения? Если у вас нет платформы, вы рискуете оказаться в роли догоняющего, когда волна накроет рынок.
2. Посмотрите на свои данные глазами ИИ-агента. Готовы ли они к тому, чтобы на них полагались? Описаны ли поля? Определены ли приоритетные источники для каждой задачи? Если агент придет за информацией, найдет ли он то, что нужно, или утонет в противоречиях?
3. Подумайте, может ли ваш бизнес стать частью третьей волны — ИИ восприятия. Умные офисы, распознавание эмоций, анализ видео с производственных линий. Может быть, вам стоит уже сейчас готовить метаданные под такие устройства? Возможно, не своими силами, а через стартапы или подрядчиков. Но держать руку на пульсе.
4. И наконец, спросите себя: а готовы ли ваши люди к демократизации данных? Есть ли у них навыки, чтобы работать с информацией напрямую? Понимают ли они, какие данные за что отвечают? Или они так и будут звонить друг другу и спрашивать: «А что в этом поле лежит?»
Вторая волна ИИ уже на подходе. Электричество подведено к дому, осталось включить свет. Или не включать — и остаться в темноте, пока конкуренты давно уже работают при полном освещении.
Невидимое управление данными: как ИИ изменит управление данными
Есть вещи, которыми мы пользуемся каждый день, и мы даже не задумываемся, как они устроены. Возьмем, например, антиблокировочную систему тормозов в автомобиле. Вы просто жмете на педаль, а ABS делает свое дело незаметно, вмешиваясь только в критический момент. Вы не думаете о работе десятков датчиков и алгоритмов — вы просто едете и чувствуете себя в безопасности.
Примерно так же в будущем станет работать управление данными. Невидимое Data Governance — это когда правила настолько глубоко встроены в бизнес-процессы и ИТ-системы, что никто их не замечает. Они просто работают. Сами собой.
Как это возможно? С помощью искусственного интеллекта. Традиционные процессы управления данными, с его глоссариями в Excel, таблицами назначенных владельцев и ручными согласованиями на еженедельных комитетах, перестают справляться, и это будущее наступает прямо сейчас. Данные перестали ждать. Они движутся в реальном времени. ИИ-агенты потребляют их тысячами запросов в минуту. А управлять качеством по старинке — batch-проверками раз в сутки, когда бизнес-день уже закончился, — это все равно что пытаться управлять автомобилем, глядя в зеркало заднего вида с задержкой в 24 часа на оживленной магистрали.
Вот что уже изменилось, пока мы были заняты «расстановкой ответственных».
ПЯТЬ ПРИНЦИПОВ НОВОГО МИРА
1. Контракты на данные в виде кода. В новом мире передача данных от одного владельца к другому оформляется не на словах и даже не на бумаге, а формальным контрактом на данные (Data Contract), который существует в виде кода. Если поставщик данных вдруг меняет тип поля, система автоматически проверяет совместимость на этапе разработки, и пайплайн ломается до того, как сломались отчеты у бизнеса. Экономия часов ручного разбирательства — не в будущем, а уже сегодня.
2. Управление ИИ — прямое продолжение управления данными. Мониторинг ИИ-моделей становится новой зоной ответственности CDO. Качество параметров модели на входе напрямую определяет качество предсказаний на выходе. Дрифт модели (когда мир вокруг изменился, а модель осталась прежней) выявляется теми же инструментами, что контролируют качество данных.
3. Управление данными как код. Политики качества, правила доступа, Lineage — все это должно жить в Git, как обычный программный код. Проверки качества данных становятся частью CI/CD[111]: вы не можете выпустить новую модель или новую витрину, если она не прошла автоматические тесты качества. Компании-лидеры насчитывают десятки тысяч таких автоматических проверок, встроенных прямо в процесс разработки. Будущее управления данными — это не бюрократия и заседательства, а код и автоматизация.
4. Управление данными в реальном времени, а не по расписанию. Данные реплицируются потоками, задержка измеряется миллисекундами. Тысячи таблиц обновляются мгновенно. Операционные модели требуют свежей информации здесь и сейчас. В этом мире проверять качество данных следующим утром в batch-окне — значит быть слепым. Качество должно проверяться там, где данные живут, в момент их возникновения или передачи. Данные в движении важнее данных в покое.
5. Безопасность для ИИ-агентов. ИИ-агент не имеет логина и пароля. У него нет «сотрудника», который отвечает за его действия. Но он получает доступ к клиентским данным, финансовой отчетности, персональной информации. Кто отвечает, если агент «придумал» запрос, нарушающий политику конфиденциальности? Практика ведущих компаний сегодня — централизованная разметка каждого поля по уровню чувствительности. Политика доступа применяется автоматически, независимо от того, кто или что запрашивает данные — человек или алгоритм. Это не фантастика, а производственный процесс в ИИ сегодняшнего дня.
ТРИ ЗАДАЧИ ДЛЯ CDO, КОТОРЫЕ НЕЛЬЗЯ ОТЛОЖИТЬ НА ЗАВТРА
Эти пять принципов — архитектура будущего. Но перейти к ней можно только через конкретные действия. Вот что требуется от CDO уже сейчас.
Первое. Лидировать внедрение AI-грамотности[112], но не для всех одинаково.
Массовое обучение сотрудников работе с ИИ — это не про «все сдали тест и получили сертификат». Это как минимум про три разных уровня.
Уровень базовый: сотрудники должны научиться использовать готовые ИИ-сервисы в повседневной работе. Не бояться, не саботировать, а именно применять. Здесь задача CDO — организовать обучение промпт-инжинирингу и low-code-инструментам с вызовом ИИ. Без этого любые инвестиции в технологии останутся мертвым грузом.
Уровень продвинутый: когда люди освоились с чужими моделями, пора учить их добавлять в ИИ-сервисы собственные данные. Это RAG (Retrieval Augmented Generation)[113]. Но для этого данные должны быть подготовлены. Значит, CDO должен задать стандарты: как оформлять документы, презентации, внутренние базы знаний, чтобы они