По последним оценкам, не менее 80% от общего объема накопленных в мире данных хранятся вне реляционных баз данных. Строго говоря, все эти данные относятся к неструктурированным: они не подчиняются строгой модели, которая дала бы пользователям возможность однозначно понимать происхождение содержания, порядок организации и систематизации этих данных… Но этими данными тоже нужно управлять.
Введение в тему
Управление документами и контентом — планирование, реализация и контроль деятельности по управлению жизненным циклом неструктурированных (или полуструкутрированных) данных и информации.
Главная задача — обеспечение сохранности и целостности документов и других неструктурированных и полуструктурированных данных, а также регулирование доступа к ним.
Во многих компаниях неструктурированные данные имеют прямое отношение к структурированным. Неструктурированные данные не нужно упускать из виду — как и другие типы данных, документы и неструктурированный контент требуют надежной защиты и контроля качества. А обеспечение информационной безопасности и качества таких данных невозможно без стратегии, надежной архитектуры и целостного управления метаданными.
Цели управления документами и контентом
Эффективное хранение
Обеспечение эффективного хранения, извлечения и использования документов и контента
Интеграция контента
Интеграция структурированного и неструктурированного контента
... и соответствие ожиданиям клиентов в отношении управления записями.
Ключевые принципы управления
Кроме того, в этой области управления данными есть два основных руководящих принципа.
→ Принцип 1. Все сотрудники отвечают за безопасность своей организации во избежание потенциальных неприятностей. Следовательно, каждый должен строго соблюдать правила и процедуры создания, получения, использования и ликвидации записей, имеющихся в распоряжении.
→ Принцип 2. Эксперты по обработке записей и контента должны привлекаться к выработке политики и планированию в качестве полноправных участников. Нормативно-правовое поле и лучшие практики в этой области сильно зависят от отрасли и страны юрисдикции организации.
В 2009 году ARMA International – некоммерческая международная ассоциация специалистов по управлению записями и информацией, опубликовала Общепринятые принципы ведения записей (Generally Acceptable Recordkeeping Principles, GARP), описывающие, как именно следует вести деловую документацию.
Принцип подотчетности
В компании должен быть выбран глава программы руководства информацией из числа руководителей высшего звена
Принцип целостности
Программа руководства информацией должна быть выстроена так, чтобы информация организации имела разумные гарантии аутентичности и достоверности
Принцип защиты
Программа руководства информацией должна быть выстроена так, чтобы обеспечивать надлежащий уровень защиты
Принцип соблюдения закона
Программа руководства информацией должна быть выстроена так, чтобы обеспечивалось соблюдение всех применимых законов и подзаконных актов, а также корпоративной политики и правил
Принцип доступности
Организация должна обеспечивать удобство, и оперативность и доступа к нужной информации и точность ее предоставления для всех, кто заинтересован в ее получении и имеет право доступа к ней
Принцип соблюдения сроков хранения
Организация обязана хранить информацию на протяжении сроков, установленных действующими законами, не допуская ни преждевременного уничтожения, ни сверхнормативного удержания чувствительных данных. Конкретные требования зависят от страны.
Принцип ответственного распоряжения
Организация обязана обеспечивать безопасное и надлежащее использование имеющейся в ее распоряжении информации
Входные материалы для процесса
цели и стратегии бизнеса
ИТ-стратегия
нормативно-правовые требования сохранения: текстовых файлов, медиа, печатных материалов, потоков информации соц.медиа
Результаты процесса
стратегия управления контентом и записями
политики и процедуры
хранилища контента
управление записями в разных форматах на разных носителях
контрольно-регистрационные журналы
Основные термины
Контент
Это содержимое документа, его информационное наполнение. Под контентом понимают данные и информацию, размещенную внутри файла, документа или на веб-сайте. Контентом часто управляют исходя из степени концептуальной важности документов, в которых он содержится, а также в зависимости от типа или статуса документов.
У контента также имеется свой жизненный цикл. В своей завершенной форме часть контента становится содержимым записей организации. Официальные записи требуют особого обращения по сравнению с прочим контентом.
Жизненный цикл контента может быть активным, с ежедневными изменениями: создание, добавление или изменение информации. Существует также статичный контент, вовсе не меняющийся или изменяемый крайне редко. В свою очередь, управление контентом может варьироваться от строго формализованного до полностью неформального добавления и изменения контента пользователями.
Метаданные контента
Метаданные помогают управлять неструктурированным контентом и могут отражать следующее:
Формат контента.
Возможности поиска. Существуют ли программные инструменты поиска, разработанные для работы с неструктурированными данными соответствующего вида.
Самодокументирование. Являются ли метаданные самодокументируемыми.
Существующие шаблоны. Можно ли применить или адаптировать к контенту существующие методы и шаблоны (например, каталоги библиотек).
Предметный указатель. Очерчивает тематику контента, помогая пользователям ориентироваться в неструктурированных данных.
Требования. Насколько осторожно следует относиться к открытию доступа к контенту (например, как в фармацевтической промышленности или ядерной энергетике).
Моделирование контента
Процесс преобразования логических представлений о контенте в четко описанные структуры типов и атрибутов контента и типов данных со связями.
Моделирование контента — процесс двухуровневый. На первом уровне (уровне информационного продукта) создается осязаемый результат — например, веб-сайт. На втором уровне (компонентном) осуществляется дальнейшая детализация и прорабатываются составные элементы, образующие модель информационного продукта.
Контролируемый словарь (controlled vocabulary)
Определенный перечень слов, которые допустимо использовать в индексах, названиях категорий, документов, файлов и иных объектов, а также тегах метаданных с целью обеспечения возможности поиска, извлечения и просмотра контента.
В идеале контролируемые словари должны логически и семантически согласовываться с именами и определениями сущностей корпоративной концептуальной модели данных.
Представление словаря (vocabulary view)
Подмножество терминов из контролируемого словаря предметной области, ограниченное выбранной тематикой.
Представления словарей делают их более удобными в использовании, ограничивая содержание представлений лишь терминами, относящимися к сфере интересов пользователей.
Таксономия (taxonomy)
Обобщенное наименование любой классификации или контролируемого словаря. Общеизвестным примером таксономии является система классификации растительного и животного мира, разработанная шведским биологом Карлом Линнеем.
С учетом колоссальных объемов генерируемых в наши дни данных никакие, даже самым тщательным и детальным образом определенные таксономии не избавляют от необходимости дополнять их и корректировать
Электронное раскрытие информации (e-discovery)
Модель электронного раскрытия (Electronic Discovery Reference Model), разработана неформальной организацией специалистов, заинтересованных в выработке единых стандартов и методологий в этой области — EDRM.
Модель предлагает удобный и универсальный подход к поиску и раскрытию требуемых электронных документов (ЭД), позволяя оперативно отыскивать места их хранения внутри организации, определять применимые правила сроков хранения, выявлять недостающие или затерявшиеся ЭД и средства для их скорейшего розыска или восстановления.
Модель исходит из того, что в организации реализована функция руководства данными или информацией. Далее следуют восемь шагов или фаз процесса e-discovery, которые могут носить итерационный характер. По мере продвижения к цели раскрытия всей требуемой электронной информации объем обрабатываемых данных снижается, а степень их актуальности повышается.
Идентификация
Предварительная экспертиза данных позволяет определить типы и потенциальные местонахождения данных
Обеспечение сохранности имеющихся и сбор недостающих ЭД
Размещение потенциально относящихся к делу данных в надежное хранилище документов во избежание их уничтожения. Сбор недостающих данных выполняется по запросу юридического отдела или адвокатов компании
Обработка, ревизия и анализ ЭД
На фазе обработки ЭД уничтожаются не имеющие юридической силы дубликаты и копии оригиналов, а также производится предварительный отсев не относящихся к делу записей и документов из числа передаваемых на ревизию ЭД
Производство материалов
На фазе производства материалов данные и информация выборочно передаются юристам противоположной стороны после их приведения в соответствие с согласованными спецификациями. Первоисточниками информации могут служить файлы, электронные таблицы, e-mail, базы данных, чертежи, схемы...
Представление материалов
Представление материалов, произведенных на основе ESI, в ходе предварительного следствия и судебных слушаний или процессов — завершающая фаза электронного раскрытия. Вещественные доказательства категории ESI могут представляться в любом формате — от бумажного до исходного электронного — в качестве подтверждающих или опровергающих аргументов по существу рассматриваемого дела
Информационная архитектура
Проектированием информационной архитектуры (ИА) называют процесс создания структуры для размещения корпуса знаний, информации или контента.
Включает в себя следующие компоненты: → контролируемые словари и тезаурусы → таксономии и онтологии → навигационные карты → карты метаданных → спецификации поискового функционала → сценарии использования → модель потоков обработки пользовательских запросов.
В комплексе со стратегическим планированием контента ИА описывает объекты управления в рамках информационной системы: «чем», собственно, предполагается управлять. А «как» этими предметами управлять — определяется уже на фазе проектирования.
Проводимые работы
1
Планирование жизненного цикла → Планирование управления записями → Разработка стратегии управления контентом
2
Определение политик обращения с контентом, включая подход к e-discovery
3
Определение информационной архитектуры
4
Управление жизненным циклом → Сбор и управление записями и контентом → Сохранение, архивирование и ликвидация записей
5
Публикация и доставка контента → Предоставление доступа для поиска и получения → Доставка и выдача по всем возможным каналам
Инструменты для обеспечения интеграции и интероперабельности
Системы управления корпоративным контентом
Система управления корпоративным контентом (ECM) может представлять собой как единое платформенное решение, включающее все основные компоненты, так и набор приложений с различной степенью интеграции в единую систему (от полностью интегрированных до полностью самостоятельных)
Система управления документами
Это прикладное программное обеспечение, используемое для отслеживания и хранения электронных документов и электронных образов бумажных документов. Примерами специализированных систем управления документами являются библиотеки документов, электронные почтовые программы и системы управления изображениями.
Обработка изображений
Системы обработки изображений позволяют фиксировать и редактировать образы бумажных и электронных документов, а также управлять полученным контентом. При этом используются такие технологии, как сканирование, оптическое/интеллектуальное распознавание символов и обработка форм.
Система управления контентом
Система управления контентом (CMS) используется для сбора, упорядочения, индексирования, добавления и выдачи контента. При этом могут поддерживаться как сохранение и извлечение документов целиком, так и управление отдельными компонентами контента документов без нарушения целостности документов и внутренних связей между компонентами.
Инструменты поддержки совместной работы
Средства поддержки совместной работы позволяют членам команды собирать, сохранять, обрабатывать и организовывать документы и контент, необходимый для реализации текущих проектов. Взаимодействуя через социальные сети, отдельные участники и команды делятся документами и контентом внутри своих групп и доносят его до сведения внешних (целевых) групп через блоги, вики-ресурсы, RSS и теги.
Инструменты управления контролируемыми словарями и метаданными
Средства, помогающие разрабатывать контролируемые словари и метаданные или управлять ими, варьируются в широком спектре и могут включаться в состав самых разнообразных пакетов программных продуктов, в том числе офисное ПО, системы управления репозиториями мета- данных, средства бизнес-аналитики и системы управления документами и контентом.
Рекомендации
→
Реализация управления корпоративным контентом (ECM) требует долгосрочных усилий и может показаться слишком дорогостоящим начинанием. Как и всякое направление деятельности в масштабах всей организации, ECM требует заинтересованности и усилий от широкого круга лиц, а также адекватного финансирования из средств, выделяемых высшим руководством.
→
Для минимизации рисков следите за тем, чтобы решения по реализации ECM фокусировались прежде всего на содержательной, а не технологической стороне управления данными и контентом. И выстраивайте рабочий процесс вокруг организационных нужд, чтобы всегда была видна его ценность.