Азбука данных
и здравый смысл
→ о компетенциях и навыках
→ о пирамиде от данных к мудрости
→ о процессе работы с данными
день 01
Сегодня на волнах нашего дата-эфира
Сегодня мы знакомимся с компетенциями, которые входят в понятие грамотной работы с данными. Узнаем, как и зачем превращать данные в информацию, знания и мудрость и какой путь проходят сырые данные от момента их сбора до принятия решения.
Приветственное слово

Paul Barth, директор по грамотной работе с данными в Qlik, приветствует вас на Марафоне! Про инвестиции в проекты по данным и аналитике, про преимущества грамотной работы с данными, про развитие программ Data Literacy в мире.


Видео пока еще на английском, но есть возможность включить автоматические субтитры на русском!

Пришло время поговорить о том, о чем мы давно хотели. Грамотная работа с данными. Как начать хотя бы немножко разбираться в анализе данных так, чтобы было не страшно от огромного объема информации? Просто понять, что это такое. Мы попробуем пройти вместе с вами ваши первые шаги, держа за руку и показывая что же все-таки существует в мире данных.
Что такое грамотная работа с данными
На практике, это набор навыков, который помогает работать с данными грамотно. При этом, это не только технические навыки работы в инструменте — компетенции включают в себя понимание концепций управления данными, знание базовой статистики, а также умение выдвигать гипотезы и принимать обоснованные решения на основе данных.

Последние несколько лет, компании по всему миру включают программу развития навыков Data Literacy в свои внутренние стандарты обучения сотрудников. Менеджмент верит, что эти навыки нужны не только аналитикам, но и вообще всем. При этом, грамотная работа с данными востребована не только в бизнесе. Мы посмотрим на ее примеры и в общественных вопросах, и в персональных.

Грамотность работы с данными – это умение понимать данные, работать с ними и анализировать их, а также правильно интерпретировать и использовать. Необходимо также уметь обосновывать свое мнение и выводы, основываясь на данных.

Почему важна грамотность при работе с данными
Представьте, что вы – владелец проекта по изучению вашего любимого иностранного языка. У вас есть сайт. Вы хотите обновить дизайн сайта. Допустим, дизайнер сделал новый макет всех страниц. Вам нравится, как это выглядит и вы можете внедрить новый дизайн уже сегодня.

Но что если новый дизайн не понравится вашим посетителям? Что если ваш бренд потеряет узнаваемость, или обучающие материалы станет неудобно читать? Вы не узнаете этого, если не проведете базового тестирования и анализ его результатов. Данные подтвердят или опровергнут вашу изначальную гипотезу и вы сможете принять обоснованное решение об эффективности предложенного дизайна.

Еще раз: грамотная работа с данными помогает превращать данные в ценность

За последние несколько лет, и коммерческие и общественные организации сделали огромные инвестиции в инфраструктуру работы с данными — настраивая и закупая сервера, оборудование, информационные системы и программы. И все это, в надежде извлечь максимальную пользу из имеющихся в компании данных. Но это все не будет иметь никакого смысла, если человек не будет пользоваться своими навыками и опытом по работе с данными.

Данные обещают нам понимание паттернов и тенденций, которые окружают нас в нашей жизни. Мы можем использовать эти знания для принятия решений и для достижения целей наших организаций.

Несмотря на понятные цели и фокус на работе с данными, немногие люди в организациях могут сказать, что они делают все правильно и уверенно. Данные могут стать основой для нашего роста, привести нас к лучшим результатам в нашей жизни, или… утаить весь наш прогресс и скрыть наши возможности. Данные это инструмент и нам придется выбирать, насколько осознанно мы будем их использовать.
Компетенции Data Literacy
На верхнем уровне компетенции Data Literacy можно разделить на 4 блока:
→ навык читать и понимать данные
→ навык работать с данными
→ навыки анализа данных
→ навык вести аргументацию и коммуникацию с помощью данных

Нажмите на каждое наименование группы навыков ниже, чтобы прочитать их описание.

Навык чтения и понимания данных
Навык чтения и понимания данных снимает “языковой” барьер в понимании всего процесса работы с данными. Что такое гистограмма? Из чего состоят базы данных? Когда нужно использовать медиану? Мы учимся разбираться в терминологии и без проблем считывать данные.
Навык работать с данными
Навык работать с данными – это ваша способность взаимодействовать с полученными и (уже успешно) прочитанными данными. Понимание инструментов для их обработки, использование методов визуализации, подготовка данных для презентации.
Навык анализа данных
Навыки анализа данных означают возможность приходить к выводам. Вы можете владеть статистическими методами и алгоритмами для проведения самостоятельного анализа и поиска инсайтов (озарений) в данных. Или же читать уже подготовленные кем-то аналитические отчеты и делать выводы на основе полученной информации. Статистические навыки не равны аналитическим, а скорее являются их частью.
Навык спорить с помощью данных
Навык вести аргументацию и коммуникацию с помощью данных говорит сам за себя. Это умение отстаивать свою точку зрения (гипотезу, предположение, действие) с помощью данных. Это новая альтернатива традиционной интуиции, которой часто руководствовались при принятии решений.
Список компетенций грамотной работы с данными
Полный список компетенций, которые включаются большинством исследований как навыки Data Literacy
Эти компетенции — не конечны и не являются строго обязательными. Уровень развития каждой группы навыков зависит от вида, частоты, уровня, профиля деятельности. Но они могут служить хорошим ориентиром к чему стремиться.
От данных к мудрости
Пирамида Data-Information-Knowledge-Wisdom
Навыки грамотной работы с данными нужны и для того, чтобы понимать, какие данные могут быть полезны вообще и уметь преобразовывать их от простого набора цифр в решение, имеющее ценность.
Максимальную пользу данные приносят в тот момент, когда на их основе принимается какое-то ценное решение (пусть совсем маленькое, но оно будет обоснованным).

Кроме того, нам зачастую не нужны все данные, которые собираются. Не все из них можно трактовать с пользой, некоторые просто создают шум, который невозможно преобразовать в мудрость.
1

Сырые данные

Пока еще только потенциально полезная информация. Не все данные имеют ценность. Но тут важно уметь их понять. И если они могут быть полезны — собрать и проверить их качество

2

Информация

Данные, которые имеют цель и значение. Изучаем взаимосвязи между элементами сырых данных, например с помощью визуализации

3

Знание

Информация, которая была собрана и обработана. С одной стороны, это синтез всей имеющейся информации с целью получения результата. С другой — знание индивидуально. Знание можно передать кому-то только в виде информации

4
Мудрость
Знание, которое трансформируется в принятие обоснованного решения. Здесь задаются вопросы «что происходит» и «почему это происходит»
Представьте, что вы — пилот самолета. Вдруг на приборной панели загорается надпись: «10 000». О чем вы подумаете? Сейчас для вас эта цифра — просто данные. Вы пока не знаете как их применить к своему опыту управления самолетом. Затем, появляется надпись «м. над уровнем моря». Окей, теперь у этих данных есть значение и цель. Это стало для нас информацией: мы летим на высоте 10 000 метров над уровнем моря. Из своего прошлого опыта мы знаем, что впереди на нашем пути есть большая-большая вершина Олимп, высотой в 12 000 метров. И как успешный, мудрый пилот мы понимаем, что нужно подняться еще выше, чтобы долететь до конечного пункта маршрута в целости.
Какой путь проходят данные от сбора до принятия решений
До того, как превратиться в мудрость, данные проходят 7 крупных этапов: от непосредственного создания данных и источников, в которых они хранятся, до конечного потребления и принятия решений.

Путь цикличен — начинается с цели и вопросов, которые у вас есть, а заканчивается оценкой данных и принятием решений.

Наверняка, вы сталкивались с каждым из этих шагов, даже если не работаете с данными напрямую. Если у вас есть мобильный телефон и компьютер с выходом в интернет (предполагаем, что так оно и есть) — вы уже участвуете в этапе создания данных. Открывая выписку своего счета в мобильном приложении банка, вы уже проводите анализ расходов и доходов по имеющимся статьям. Изучая прогноз погоды, вы уже принимаете обоснованные решения о выборе одежды и брать ли с собой сегодня термос с горячим чаем.
Всегда полезно помнить, как данные попадают к вам и куда они попадут после вас. Это повысит качество вашей работы.
На каждом этапе работы с данными важны инструменты. Инструменты — это информационные системы, программы, алгоритмы, скрипты… все то, что помогает в транспортировке данных на каждый последующий шаг.
1
Цель и вопросы
Умения и личные компетенции человека, на основании имеющегося опыта. Хотя, можно использовать современные технологии для генерации вопросов к данным, но все они будут очень банальны.
2
Сбор и подготовка данных
От Excel и Google Sheets до корпоративных хранилищ данных. На физических серверах в дата-офисе компании до аренды места в облачных хранилищах. В базах данных, платных и бесплатных. Инструменты для очистки и преобразования данных. ETL-инструменты. Самостоятельные скрипты и алгоритмы. Макросы в Excel. Ручная обработка.
3
Анализ данных
Снова Excel (поэтому, пользуется популярностью). Языки программирования. Статистика. Программы для статистического анализа. BI-платформы для проведения визуальной аналитики.
4
Представление данных
Инструменты визуализации данных и BI-платформы. Онлайн-сервисы для создания диаграмм и графиков.
5
Потребление и интерпретация
Интерактивные дашборды и приложения в инструментах визуализации, отчеты, презентации, встречи. Порталы для распространения информация. Инфографика.
6
Оценка и принятие решений
Только личные качества.
Как видно, больше всего информационных систем и инструментов используется на этапах сбора и подготовки данных. Все остальное взаимодействие с данными для превращения их в ценность зависит от навыков и умений человека, который с ними работает.
Навыки DataLiteracy в Газпромнефть
Мы узнали о том, как работают с навыками грамотной работы с данными внутри большой корпорации
Татьяна Хорошева
Руководитель Направления развития компетенций по анализу данных, Газпромнефть – Региональные продажи
Модель аналитических компетенций — это единая система, включающая в себя перечень общих и профессиональных компетенций, их индикаторов, позволяющих оценить уровень развития каждой компетенции.
Для чего нужна модель компетенций
Мы применяем модель для оценки уровня развития аналитических компетенций и для принятия решений о развитии сотрудника или всего отдела.

По итогам проведенной оценки формируется пул сотрудников, которым необходимо порекомендовать пройти дополнительное обучение по направлениям, для которых отклонение от целевого уровня было наибольшим и таким образом устранить пробелы в знаниях сотрудников. Обучение может проводиться как на внутренних курсах, так и с привлечением внешних подрядчиков.

Использование модели компетенций также применяется при оценке эффективности проведенного обучения, корректировке планов развития сотрудников, оценке соответствия кандидата планируемому повышению, что в свою очередь позволяет сформировать прозрачную систему мотивации персонала.

Модель аналитических компетенций состоит из Общих и Профессиональных компетенций.
Общие и профессиональные компетенции
Общими компетенциями должны владеть все сотрудники. Эти пять компетенций описывают культуру работы с данными, грамотность данных.

Профессиональные компетенции подразумевают владение профессиональными инструментами обработки и продвинутого анализа данных для разработки новых аналитических продуктов и построения моделей.
Подробнее про модель аналитических компетенций читайте в кратком документе
а теперь... Практика
Если вы никогда не работали с данными… то давайте попробуем начать?

В нашем Марафоне практические задания будут общими, без привязки к какому-либо инструменту для анализа данных. Но попробуйте подумать над теми вопросами, которые мы будем приводить. Возможно, вам понадобится поиск какой-то дополнительной информации, помощь коллег или друзей, в том числе участников в чате Марафона. Но если у вас есть интерес к теме работы с данными, то все обязательно получится.
Задание 01.
→ 01.1. Подумайте и напишите список из трех источников с данными, с которыми вам приходилось сталкиваться за последнюю неделю. Они могут быть любыми – возможно, вы с ними работали или встречали в интернете, или они касались ваших личных данных о повседневной жизни. Источниками может быть все, что в каком-то виде хранит данные.

→ 01.2. Выберите один из источников, который вы записали выше. Напишите хотя бы одну единицу информации, которую вы получили на основе тех данных – и какой путь прошли данные к тому, чтобы стать информацией.

→ 01.3. Возьмите информацию из пункта выше и спросите себя, какое знание вы получили исходя из нее. Выпишите любые ассоциации с другой информацией или другим опытом, который нужен вам для превращения этой информации в знание.

→ 01.4. Подумайте, о том, как бы вы могли использовать полученное знание. Мудрая последовательность действий и неразумный курс действий, который нужно избежать.
Высказывайте свои мнения и мысли в телеграм-чате Марафона
Эксперты Марафона, специалисты по визуализации и анализу данных, неравнодушные энтузиасты — мы все там
Задание 02.
→ 02.1. Внимательно изучите таблицу ниже. В ней содержатся какие-то данные. Что это могут быть за данные? Можете ли вы сопоставить значения в столбцах с вашими знаниями из реальной жизни? Не все столбцы можно определить однозначно, но включите воображение.
Пример 1
Примеры таблицы представлены от курса Кризис Данных / Алексей Шинкаренко
Пример 2
а теперь... Материалы
Иван Земсков, Росгосстрах, делится опытом, как в Росгосстрах перестраивают мышление сотрудников для использования аналитики в ежедневном принятии решений с помощью вовлечения, повышения грамотности работы с данными и обучения аналитическому инструментарию.

Внутри 14:27 минутного видео о том, как вовлекать сотрудниках с помощью приложения, проводить корпоративные марафоны, использовать песочницы и тестировать знания.
Вакцина от дата-неграмотности: как перестроить мышление в пользу BI
Спасибо за эфир!
Мы постарались кратко осветить наиболее общие и важные темы относительно грамотности работы с данными. Материалов — бесчисленное множество, поэтому сложно уместить все в одну страницу. Надеемся, что представленные термины, ссылки и кейсы смогут дать вам стартовую точку в изучении Data Literacy. Ну, а мы продолжим завтра! До встречи в дне 02.