8 способов улучшить визуализацию данных с помощью контекста

Автор статьи — Мария Мазюк

После потраченных времени и усилий на анализ и визуализацию данных, необходимо, чтобы представленные вами выводы были верно интерпретированы. Контекст призван гарантировать верную интерпретацию и наладить коммуникацию между автором и пользователем. Дополнение визуализаций контекстом помогает конечным пользователям вникнуть в суть анализа и облегчает понимание объекта и результатов анализа, которые пытается донести до аудитории автор визуализации.

Предоставление контекстной информации в визуализации особенно важно, если аудитория неоднородна и может быть неподготовленной. Пояснение визуализации помогает заинтересовать аудиторию и вдохновить на детальное изучение. В данной статье мы рассмотрим частые приемы использования контекста с примерами визуализаций. За основу статьи я взяла свой собственный опыт и книгу “#MakeoverMonday” (Andy Kriebel, Eva Murray).

Для выявления проблематичных мест в готовой визуализации следует спросить себя, какие метрики / графики / выводы не являются очевидными, а также попросить неподготовленного друга / папу / брата прокомментировать то, как они понимают вашу визуализацию.

Рассмотрим некоторые способы использования контекста при визуализации данных с примерами. Кликните по изображению дашборда-примера, для перехода к интерактивной версии в Tableau Public.

Описание контекста в подзаголовке дашборда. Использование подзаголовков в 1-3 предложения помогает сообщить пользователю общую информацию об источнике данных, направить внимание пользователя на определенные элементы визуализации, сообщить об основных открытиях в результате анализа, объяснить, как использовать интерактивную визуализацию и т.д.. Также с помощью кодирования цветом слов в подзаголовке удобно задавать легенду для графиков, экономя место на дашборде.

В качестве первого примера рассмотрим мой дашборд The End of Physical Music Format?. В данной визуализации я добавила описание источника данных (датасета) и исторического контекста в подзаголовок, а также использовала кодирование цветом слов physical и digitally, соответствующее цветам в визуализации.


Пояснения данных с обобщенными показателями. Пояснения в самой визуализации так же, как и описание контекста в подзаголовке, помогают автору сообщить об основных открытиях в результате анализа.

Пример: Gender Disparity in Australia (Adam Crahen). Здесь автор с помощью пояснения в центре визуализации с обобщенными метриками (81 профессия среди 1092) сообщает об основном открытии в результате анализа.

Дополнение данных историческими сводками. Данный прием полезен для графиков, отображающих изменения показателей во времени, и помогает автору указать причину резкого изменения тренда на графике, а также отметить точки максимума и минимума.

Пример 1: Did Mad Cow and Cancer Scares Harm US Beef Consumption? (Matt Francis). Здесь автор с помощью опорных диапазонов (reference band) указывает на на промежутки времени 1987 — 1993 гг. и 2004 — 2014 гг. с объяснением причин изменения тренда с помощью исторических сводок. Также автор использует точечную аннотацию для 1993 г. для описания причины изменения тренда именно в данном году.

Пример 2: Black Participation in MLB (Jamie Smyth). Здесь автор с помощью аннотации отмечает 1981 год в качестве пика принятия участия в матчах MLB игроками-афроамериканцами.

Дополнительный контекст в тултипах (всплывающих подсказках). Размещение вспомогательных данных в тултипах помогает предоставить дополнительную информацию об объектах, которые заинтересовали пользователя, при этом экономя место на дашборде и предотвращая перегруженность визуализации. Это отличный способ пояснить расчет показателей, изменение показателя относительно прошлого периода, расшифровать аббревиатуры.

Хотела бы отметить, что тултипы, при всей их эргономичности, — это не очевидный источник информации, особенно для аудитории, не часто использующей интерактивные графики. При использовании тултипов следует указать в описании к графику, что тултипы содержат дополнительную информацию и какую. Также важно отметить, что основной смысл визуализации должен полностью передаваться и без помощи тултипов. В качестве золотого правила для своих визуализаций я спрашиваю себя, понятен ли смысл, который я хочу донести до аудитории с помощью моей визуализации, на ее скриншоте (т.е. в статичном виде без тултипов). Если да, то можно использовать тултипы для дополнительного контекста.

Главное требование к тултипам такое же, как и к визуализации: они должны быть просты для понимания, т.е. понятно отредактированы и не перегружены. Если в визуализации использована маркировка цветом, соответствующие цвета желательно указать и в тултипе.

Тултипы в виде самостоятельных предложений более понятны: они помогают рассказать историю вашей визуализации.

В качестве примера дополняющих тултипов рассмотрим визуализацию Population. (Kevin Flerlage): кликните по изображению для перехода к интерактивной версии в Tableau Public. Смысл данной визуализации — отобразить разницу в численности населения по странам и континентам, а также указать на неоднородность численности населения в разных частях света. В тултипах указана информация о точной численности населения страны в миллионах, а также процент от общей численности населения планеты.

Выделение (хайлайт) значения дискретного поля контрастным цветом с кодировкой остальных значений серым цветом. Данный прием позволяет оценить выделенное значение поля в общем контексте, оставляя другие значения дискретного поля для сравнения на заднем плане.

В качестве примера хайлайта с контекстом на заднем плане рассмотрим две визуализации.

Пример 1: The Rising Cost of Tuition in the United States (Andy Kriebel). Здесь автор выделяет красным цветом линию выбранного штата. Черный цветом отмечено среднее значение по стране. Остальные штаты отображены серым цветом для контеста. Автор также использует маркировку размером: линия выбранного штата и линия среднего значения шире, чем линии остальных штатов. Пользователю легко понять не только, насколько лучше или хуже показатель по выбранному штату в сравнении со средним по стране, но и распределение значений показателя по другим штатам: насколько часто встречаются значения показателя выше или ниже, чем у выбранного штата Пенсильвания. Также пользователь может оценить, является ли тренд линии выбранного штата каким-то отличительным, либо же он похож на линии тренда других штатов.

Пример 2: The Secret of Success (Michael Mixon). В качестве способа визуализации выбран ранжированный дотплот (ranked dot plot). На графике каждого из трех социальных классов значение соответствующего класса окрашено цветом, а значения остальных классов присутствуют на графике на заднем плане без окрашивания (в качестве контекста). Пользователю дана возможность сравнить значения каждого соц. класса со значениями остальных классов. Пользователь может легко оценить разброс мнений между классами, а также понять, насколько сильно отличаются значения одного класса от остальных. Такое использование контекста позволяет пользователю сфокусировать внимание на графике определенного класса без необходимости постоянно перебегать глазами на графики других классов для сравнения.

Добавление опорных линий (reference line). Данный прием позволяет пользователям сравнить значение показателя со значением, для которого задана опорная линия. Значениями для опорных линий могут быть среднее / медианное значение, максимальное / минимальное значение, целевое значение показателя, значение показателя в прошлом периоде, историческое значение и т.д. Значение опорной линии будет выступать в качестве контекста, обозначая то, с чем нужно сравнивать. Необходимо четко указать, что означает линия референс, чтобы у пользователей не осталось вопросов.

Пример: UK’s bittersweet relationship with sugar (Data Rocks). Здесь автор использует две линии референс для обозначения того, во сколько раз потребление сахара превышает норму. Данный виз является отличным примером использования упрощенных метрик для визуализации данных. Неподготовленные пользователи могут не знать, какой процент потребления сахара в ежедневном приеме пищи является нормой (5%). Цель визуализации — это не ознакомление с нормой потребления сахара, а указание на проблему излишнего потребления сахара. Намного проще понять, что подростки в возрасте 11-18 лет потребляют почти в 3 раза больше сахара, чем положено. Здесь две линии реферанс, обозначающие двух- (2x) и трехкратное (3x) превышение нормы, позволяют быстро оценить объем превышения нормы с помощью упрощения: в 2 раза или почти в 3 раза больше нормы.

Крупный шрифт для выделения числового значения главной метрики. Данный прием помогает дать пользователю быстрый ответ на главный вопрос визуализации. С помощью таких “огромных” чисел автор виза может направить фокус на числовое значение главной метрики, помогая пользователю понять, на чем следует сосредоточить внимание. Также “огромные” числа могут стать ключевым элементом в дизайне дашборда.

В качестве примера использования крупного шрифта для выделения числовых значений рассмотрим визуализацию U.S. Winter Olympic Medal Count 1924 — 2014 (Paul Morgan): кликните по изображению для перехода к интерактивной версии в Tableau Public. Здесь с помощью крупного шрифта главных метрик автор позволяет пользователям быстро ответить на вопрос: какие медали и в каком количестве завоевала американская олимпийская сборная на зимних играх в период с 1924 г. по 2014 г. Автор также использует легко понятное пользователю кодирование цветом, соответствующее цветам металлов медалей. Использование разных цветов для “огромных” чисел со значениями количества медалей помогает пользователю легко отличить одно числовое значение от другого, а также позволяет автору избежать перегруженности дашборда крупным шрифтом.

Персонализация визуализации для пользователей. Данный прием призван подать информацию в уникальном для каждого пользователя контексте, относительно заданных пользователем значений параметров и фильтров. К такой персонализации может относится выбор страны пользователя, возраст, пол. При этом расчет показателей осуществляется относительно заданных параметров персонализации. Это отличный способ подать сложную информацию в упрощенном виде, так как она будет более понятна пользователям в их собственном контексте.

Пример 1: How Many Total Solar Eclipses Will You See in Your Lifetime? (Curtis Harris). Автор предоставляет пользователю возможность выбрать свою дату рождения и прогнозируемую продолжительность жизни, на основании чего визуализируются прошедшие и будущие полные солнечные затмения.

Пример 2: Are you over the hill? (Steve Wexler). Здесь пользователю дается возможность выбрать свой возраст и пол и сравнить свой возраст с возрастом остальных американцев.

https://maryiamaziuk.com/data-viz-blog/

Учебный центр по технологиям анализа данных и BI: расписание/запись на учебные курсы, тестирование разработчиков — https://education.biconsult.ru/

Присоединяйтесь к QUBIC – сообщество профессионалов в области BI! Наши страницы в соц.сетях – расписание учебных курсов, бесплатные учебные материалы, анонсы мероприятий: https://vk.com/club165575964 и https://www.facebook.com/qubicspb

Неофициальный форум разработчиков Tableau

Канал на Youtube – много обучающих видео и записи вебинаров

Готовые решения “Конструктор финансовой отчетности” и “Анализ продаж

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.

63 queries in 0,195 seconds