Управление данными
Конспект DAMA DMBOK2 на русском языке
Глава 1
Вебинар-обсуждение и страница проекта
Цели организации по управлению данными
Выявление и обслуживание информационных потребностей организации и заинтересованных сторон
Сбор, хранение, защита и обеспечение целостности данных
Обеспечение качества данных и информации
Обеспечение конфиденциальности и неразглашения данных
Предотвращение несанкционированного доступа к данным, их искажения и подтасовки
Обеспечение эффективного использования данных
Данные — это факты и статистика, собранные вместе для анализа
New Oxford American Dictionary
В отрыве от контекста данные становятся бессмысленными, для понимания их смысла нужно знать контекст. Данных в природе не существует, данные создаются. Данные – это стратегически значимый актив организации. Для извлечения максимальной пользы из данных необходимо осваивать новые способы их использования.
Данные – это многократно интерпретируемое представление информации, пригодное для передачи, интерпретации или обработки формализованным образом
ГОСТ Р ИСО/МЭК 11179-1-2010
Принципы управления данными
Необходимы лидеры и приверженность руководства для эффективного управления данными
Данные имеют ценность
→ Данные имеют уникальные свойства.
→ Ценность данных может и должна оцениваться в экономических терминах.
Управление данными включает комплекс навыков
→ Одной команде не по силам управлять всеми данными организации.
→ Управление данными – кросс-функциональный процесс, требующий широкого спектра знаний и навыков.
→ Необходим целостный взгляд на функционирование организации.
Управление данными должно непрерывно эволюционировать.
Управление данными требует бизнеса
→ Необходимо управлять качеством данных.
→ Для управления данными нужны метаданные
→ Необходимо планировать управление данными.
→ ИТ должны обслуживать, а не определять стратегические потребности организации в данных
Управление данными — это управление жизненным циклом
→ Управление данными должно непрерывно эволюционировать
→ Необходимо понимать жизненный цикл данных и уметь управлять им.
→ Управление рисками на протяжении всего жизненного цикла данных.
Проблемы управления данными — простыми словами
→ Данные легко скопировать и отправить куда угодно.
→ Одними и теми же данными могут одновременно пользоваться множество людей.
→ Многие способы использования данных порождают еще больше данных.
→ В случае утери организацией своих уникальных данных заменить их будет нечем, а восстановить невозможно или непомерно дорого.
→ Большинство информационных транзакций предусматривают обмен данными.
→ Компания накапливает огромный объём данных, о которых сама даже не догадывается.
→ Данные необходимо надежно хранить, а это стоит денег.
→ Данные должны быть качественными.
Ценность данных
Ценность – это разница между затратами на создание или приобретение вещи и полученной от нее выгоды. Стандартных методик по расчету ценности данных не существует.
Данные организации уникальны и присущи только ей, оценку их стоимости нужно начинать с определения общих категорий затрат и экономических выгод.
  • Затраты на получение и хранение данных
  • Затраты на восстановление данных в случае утери
  • Затраты на повышение качества данных
  • Потери компании из-за отсутствия нужных данных
  • Затраты на минимизацию риска и потенциальные убытки, обусловленные рисками, связанными с данными
  • Выгоды от обладания данными более высокого качества
  • Цена, которую конкуренты готовы заплатить за данные
  • Стоимость данных в случае их продажи
  • Дополнительные доходы от инновационного использования данных
Качество данных
Необходимо гарантировать высокое качество данных. Без этого все затраты на сбор, хранение и защиту данных, будут потрачены напрасно.

Необходимо тесно работать с конечными потребителями данных, чтобы определить их потребности и совместно установить ключевые характеристики качества их данных.

Некачественные данные приведут к неверным решениям и негативным последствиям (издержки из-за низкого качества данных в 2016 году только в США составили около 3 трлн долларов).
Основные источники и статьи издержек, которые являются следствием низкого качества данных
  • Брак и переделки
  • Временные решения и скрытые доработки
  • Неэффективная организация и/или низкая производительность труда
  • Внутриорганизационные конфликты
  • Низкая удовлетворенность работников
  • Неудовлетворенность клиентов
  • Упущенные возможности, в том числе из-за утраты способности к инновациям
  • Непредвиденные расходы на устранение несоответствий или штрафы
  • Репутационные издержки
Выгоды от высококачественных данных

  • Рост удовлетворенности клиентов
  • Повышение производительности
  • Снижение рисков
  • Повышение прибыли
  • Новые конкурентные преимущества за счет глубокого понимания клиентов, продуктов, процессов и возможностей
Жизненный цикл данных
Жизненный цикл данных включает процессы,
  • которые создают или получают данные
  • процессы, которые осуществляют их перемещение, преобразование, хранение, а также обеспечивают обслуживание данных и предоставление совместного доступа к ним
  • процессы использования или применения данных,
  • а также процессы, обеспечивающие их ликвидацию.

На протяжении всего жизненного цикла данные могут очищаться, преобразовываться, подвергаться слиянию, улучшаться или агрегироваться.

Кроме жизненного цикла данные имеют определенную последовательность, цепочку – путь, по которому движутся данные от мест возникновения до места использования (data chain). У цепочки данных и жизненного цикла есть пересечения.
Важнейшие аспекты жизненного цикла данных
Управлять данными нужно с четким пониманием, как они созданы и получены. Создание данных стоит денег. Затраты окупаются только в том случае, если полученные данные и имеют реальную ценность.
Необходимо управлять качеством данным на протяжении всего жизненного цикла. Поскольку качество данных может пострадать на любом этапе ЖЦ необходимо планировать меры по обеспечению качества данных в расчете на весь ЖЦ данных.
Также необходимо управлять качеством метаданных на протяжении всего жизненного цикла.
Необходимо обеспечить информационную безопасность данных.
Основные усилия необходимо фокусировать на критически важных данных и необходимо минимизировать «излишние, устаревшие и тривиальные данные».
Стратегия управления данными
Стратегия работы с данными должна предусматривать бизнес-планы использования информации для получения конкурентных преимуществ и реализации целей организации.

Необходимо понимать: какие данные нужны организации, как она будет получать эти данные, управлять ими, обеспечивать их надежность и достоверность на протяжении всего ЖЦ, каким образом будет использовать данные. Здесь важную роль играет CDO – директор по данным.
Результаты стратегического планирования
Положение об управлении данными
Описание содержания программы управления данными
Дорожная карта внедрения управления данными
Чеклист: что должна включать стратегия управления данными
Убедительно изложенное видение управления данными
Краткое экономическое обоснование стратегии с примерами
Руководящие принципы, ценности и перспективы с позиции управления
Миссию и долгосрочные цели по основным направлениям управления данными
Показатели успешности управления данными
Краткосрочные задачи на 1-2 года программы управления данными по принципу SMART
Описание ролей и организационных систем, включая распределение обязанностей и прав принятия решений
Описание компонентов и инициатив программы управления данными
Приоритетную программу работ с объёмами и сроками выполнения
Вариант дорожной карты реализации с разбивкой по проектам и мероприятиям
DAMA-DMBOK2 — фреймворк управления данными
«Колесо DAMA» отражает области знаний по управлению данными. По центру располагается Data Governance (руководство данными), поскольку оно требует консистентности и баланса функций управления данными. Остальные области знаний (архитектура, моделирование, хранение данных и т. д.) находятся вокруг и являются важными составляющими зрелого управления данными в организации, хотя могут внедряться в разные периоды, в зависимости от требований бизнеса.

Пирамида DMBOK2
Пирамида DMBOK2 разработана Peter Aiken и включает все области знаний об управлении данными из DAMA DMBOK2, а также учитывает то, как в компаниях обычно начинают работать с данными (без стратегии управления данными).
Пирамида помогает понять, на каком этапе компания находится, и как двигаться дальше, чтобы выстроить надежные процессы управления данными.
Начиная с третьей главы, мы будем подробно разбирать каждый из элементов пирамиды.
Подписывайтесь на новые выпуски проекта
Получайте обновления конспекта DMBOK2 себе на почту по мере их публикации