Вопросы на собеседовании по Tableau

Вот 27 вопросов о Tableau. Они подготовлены экспертом из Intellipaat, который обучает использованию Tableau. Эти примеры дадут вам представление о типе вопросов, которые могут задавать на собеседовании. Мы взяли на себя ответственность дать правильные ответы на все вопросы.

Ответы на вопросы на собеседовании по Tableau

1.Что такое визуализация данных?

Более продвинутый, прямой, точный и упорядоченный способ просмотра больших объемов данных называется визуализацией данных. Это визуальное представление данных в виде графиков и диаграмм, особенно актуальный, если вы не можете определить информацию текстуально. Вы можете отобразить тенденции, условные обозначения/язык и взаимосвязь с помощью программного обеспечения для визуализации различных данных и инструментов; Tableau является одной из таких программ для визуализации данных, используемой предприятиями и корпорациями.

2.Каковы различия между Tableau Desktop и Tableau Server?

В то время как Desktop Tableau выполняет визуализацию данных и создает рабочие журналы, Tableau Server используется для распространения этих интерактивных журналов и/или отчетов среди целевой аудитории. Пользователи могут редактировать и обновлять учебные пособия и информационные панели в Интернете или на сервере, но не могут создавать новые. Тем не менее, в Tableau Server существуют ограниченные возможности редактирования по сравнению с рабочим столом.
Tableau Public – бесплатный инструмент, состоящий из настольных компьютеров и общедоступных компонентов сервера.

3.Определение параметров в Tableau и работа с ними.

Параметры таблицы являются динамическими переменными значениями, которые заменяют постоянные значения в расчетах данных и фильтрах. Например, вы можете создать расчетное поле, возвращающее истину, пока отметка больше «80», а в противном случае – вывести ошибку. Используя параметры, можно заменить постоянное значение 80 и динамически управлять им в формуле.

4.Как различать параметры и фильтры в Tableau?

На самом деле разница заключается в применении. Параметры позволяют пользователям вставлять значения, которые могут быть целыми числами, числами с плавающей точкой, датой, строкой и могут использоваться в расчетах. Тем не менее, фильтры получают только те значения, которые пользователи выбирают из списка «фильтр» и не могут использоваться для выполнения вычислений.
Пользователи могут динамически изменять меры и измерения в параметре, но фильтры не поддерживают данную функцию.

5.Какие есть таблицы фактов и таблицы измерений в Tableau?

Факты – это числовые показатели или измеряемые количества, которые могут быть проанализированы с помощью размерности таблицы. Факты являются блоком памяти в таблице фактов, которые содержат внешние ключи, относящиеся к однозначно соответствующим таблицам измерений. Таблица фактов поддерживает хранение данных на атомном уровне и таким образом позволяет обеспечить большее количество записей, которые будут вставлены одновременно. Например, таблица факта продаж может иметь ключ продукта, ключ клиента, ключ, продвижения товаров, проданных единиц, ссылаясь на конкретное событие.
Параметры – это описательные значения атрибутов для нескольких размеров каждого атрибута, определяющих несколько характеристик. Параметр таблицы, имеющей указатель ключа формы продукта таблицы фактов, может состоять из названия продукта, типа продукта, размера, цвета, описания и т.д.

6. Какие экспресс-фильтры есть в Tableau?

Глобальные экспресс-фильтры являются способом фильтрации каждого рабочего журнала на панели управления, пока каждому из них не будет присвоен параметр. Они очень полезны для рабочих журналов, используют тот же источник данных, который иногда оказывается в невыгодном положении и медленно генерирует результаты. Таким образом, параметры являются более эффективными.

7.Структура/положение ограничений параметров в Tableau.

Параметры облегчают только четыре способа представления данных на панели управления (которые являются семью экспресс-фильтрами). Кроме того, параметры не позволяют делать множественный отбор в качестве фильтра.

8.Что такое группировка и детализация данных в Tableau?

Группировка и детализация в Tableau – это способы разработать диаграмму рассеивания для сравнения и измерения значений данных. Как следует из названия, группировка – это расчетная форма набора значений, которые возвращают одно числовое значение. Например, мера со значениями «1», «3», «5», «7» возвращает «1». Вы можете также установить группировку по умолчанию для любой меры, которая не является заданной пользователем. Tableau поддерживает различные группировки по умолчанию для измерения суммы, среднего значения, медианы, итога и т.д.
Детализация данных относится к просмотру каждой строки источника данных при анализе данных как самостоятельно, так и в зависимости от чего-либо.

9.Что такое стыковка данных?

В отличие от объединения данных стыковка данных таблицы позволяет объединять данные из различных источников и платформ. Например, вы можете состыковать данные в файле Excel и данные из БД Oracle для создания нового набора данных.

10.Что такое контент-фильтр?

Концепция контент-фильтра Tableau делает процесс фильтрации легким и быстрым. Она устанавливает иерархию фильтрации, при которой все другие фильтры ссылаются на контент-фильтр для последующих операций. Другие фильтры обрабатывают данные, переданные с помощью контент-фильтра.
Создание одного или нескольких контент-фильтров повышает производительность, поскольку пользователи не должны создавать дополнительные фильтры для больших источников данных, и сокращает время выполнения запроса.
Вы можете создать их путем перетаскивания поля на вкладку «Фильтры», а затем, щелкнув правой кнопкой мыши по этому полю, выбрать «Добавить в контекст».

11. Каковы ограничения на использование контент-фильтров?

Tableau требует много времени для помещения фильтра в контекст. Когда фильтр установлен в качестве контекста, программа создает временную таблицу для этого конкретного контент-фильтра. Эта таблица будет перезагружаться каждый раз и состоять из всех значений, которые не фильтруются контекстом, или пользовательских SQL фильтров.

12. Названия расширений файлов в Tableau.

Существует несколько типов файлов и расширений в Tableau:
• Рабочий журнал Tableau (.twb)
• Заархивированный рабочий журнал Tableau (.twbx)
• Источник данных Tableau (.tds)
• Заархивированный источник данных Tableau (.tdsx)
• Выборка данных Tableau (.tde)
• Закладки Tableau (.tdm)
• Источник карт Tableau (.tms)
• Личные настройки Tableau (.tps)

13.Объяснение разницы между .twb и .twbx

.twb является наиболее распространенным расширением файла, используемого в Tableau, который представляет собой файл в формате XML и включает всю информацию, присутствующую в каждой панели управления и листе – такую как поля, используемые в визуализациях, стили и форматирование, применяемые к листу и панели управления.
Но этот рабочий журнал не содержит каких-либо данных. Заархивированные рабочие журналы объединяют информацию в рабочий журнал Tableau с доступом к локальным данным (не на сервере). .twbx служит zip-файлом, который будет включать в себя пользовательские изображения, если таковые имеются. Заархивированный рабочий журнал позволяет пользователям делиться информацией из журналов с другими пользователями Tableau Desktop и открывать их в Tableau Reader.

14.Какие выборки и расписания доступны на сервере Tableau?

Выборка данных – это первые копии или подразделения фактических данных из исходных источников данных. Рабочие журналы используют выборки данных вместо использования прямого соединений БД – это быстрее, поскольку выборка данных импортируется в Tableau Engine.
После такой выборки данных пользователи могут публиковать журнал, который также публикует выдержки в Tableau Server. Тем не менее, рабочий журнал и выборки не будут обновляться, если пользователи не применяют плановое обновление выписок. Расписания – это задачи планирования, установленные для извлечения обновления данных так, чтобы они автоматически обновлялись при публикации рабочего журнала с выборкой данных. Это также снимает нагрузку от переиздания рабочего журнала каждый раз, когда необходимые данные обновляются.

15. Имена компонентов панели управления

Горизонтальные – горизонтальные контейнеры макетов позволяют проектировщику группы рабочих журналов и компонентов панели управления редактировать высоту всех элементов слева направо через вашу страницу и сразу.
Вертикальные – вертикальные контейнеры позволяют пользователю сгруппировать рабочие журналы и компоненты панели управления сверху вниз на вашей странице и отредактировать ширину всех элементов одновременно.
Текст
Извлечение изображения: — рабочий журнал Tableau в формате XML. Для того чтобы извлечь изображения, Tableau применяет некоторые коды для извлечения изображений, которые могут быть записаны в формате XML.
Веб [URL ДЕЙСТВИЯ]: — URL представляет собой гиперссылку, которая указывает на веб-страницу, файл или другой веб-ресурс за пределами Tableau. Вы можете использовать действия URL для связи с дополнительной информацией о ваших данных, которые могут быть размещаться за пределами вашего источника данных. Для того чтобы сделать ссылку на ваши данные, вы можете заменить значения поля выбора URL в качестве параметра.

16. Как просматривать основные запросы SQL в Tableau?

Просмотр запросов SQL в Tableau предоставляет два варианта:
Создание записи производительности для записи информации о производительности основных событий, с которыми взаимодействуют рабочие журналы. Пользователи могут просматривать показатели производительности в рабочем журнале, созданном Tableau.
Помощь> Параметры и характеристики >Начать запись Производительности
Справка> Настройка и производительность> Остановить запись Производительности
Пересмотр протоколов рабочего стола Tableau, расположен в папке C:\Users\My Documents\My Tableau Repository. Для живого подключения к источнику данных вы можете проверить файлы Log.Txt и tabprotosrv.txt. Для получения выборки проверьте файл tdeserver.txt.

17.Что такое поле страницы?

Tableau имеет четкий и мощный инструмент для управления выводящим дисплеем, известным как поле страницы. Как следует из названия, поле страницы делит окно на ряд страниц, представляя на каждой странице другую точку зрения, что делает его более удобным для пользователей и сводит к минимуму прокрутку для анализа и просмотра данных и информации. Вы можете пролистывать страницы, используя указанные средства управления и сравнить их на общей оси.

18.Как произвести тестирование производительности в Tableau?

Тестирование производительности – неотъемлемая часть реализации Tableau. Это может выполняться путем загрузки Testing Tableau Server с сервера TabJolt, который является генератором загрузки, созданным для выполнения QA, «точка и запуск». В то время как TabJolt не поддерживает таблицы напрямую, он должен быть установлен с помощью других продуктов с открытым исходным кодом.

19. Пояснение двухосевой концепции.

Двойная ось является отличным явлением Tableau, которое позволяет пользователям просматривать две шкалы двух мер в одном и том же графике. Многие веб-сайты, такие как Indeed.com и другие, позволяют использование двойной оси для отображения сравнения между двумя показателями и скоростью их роста в септическом наборе лет. Двойные оси позволяют сравнить несколько мер одновременно, имея две независимые оси, расположенные друг поверх друга.

20. Какое максимальное количество таблиц можно объединить в Tableau?

Максимум 32 таблицы. Размер таблицы также должен быть ограничен 255 столбцами (полями).

21. Как удалить опцию «Все» из автофильтра Tableau?

Автофильтр обеспечивает функцию удаления опции «все», просто нажав на стрелку в нижней части заголовка автофильтра. Вы можете прокрутить вниз до «Настроить» в раскрывающемся списке, а затем снять флажок «Показывать атрибут «Все» Значение». Он может быть активирован снова при проверке поля.

22. Как добавить собственные/пользовательские цвета в Tableau?

Добавление собственного цвета относится к механическим инструментам Tableau. Необходимо перезапустить рабочий стол Tableau, как только вы сохраните файл .tps. На панели мер перетащите необходимый для добавления цвет в Цвет. Из меню стрелки цветового обозначения выберите «Редактировать цвета». Когда откроется диалоговое окно, выберите палитру в раскрывающемся списке и настройте ее в соответствии с требованием.

23. Что обеспечивают разные продукты Tableau?

Tableau Server: организация программного обеспечения локально или облачно для доступа к созданным рабочим журналам.
Tableau desktop: среда рабочего стола разработана для создания и публикации стандартных и заархивированных рабочих журналов.
Tableau public: рабочие журналы, доступные в режиме онлайн для пользователей, для загрузки и получения доступа к введенным данным.
Tableau Reader: разработан для получения локального доступа, для загрузки заархивированных рабочих журналов Tableau.

24. Как можно отобразить пять основных и пять последних продаж в одной визуализации?

Создайте два набора, один для 5 основных и второй для 5 последних, а затем соедините эти два набора, отображающих уникальный набор из 10 строк.

25. Что такое файл TDE?

TDE представляет собой файл Tableau с расширением .tde. Он относится к файлу, который содержит данные, извлеченные из внешних источников, таких как MS Excel, MS Access или файлы CSV.
Есть два аспекта дизайна TDE, которые делают его идеальным для поддержки аналитики и обнаружения данных.
• Во-первых, TDE является столбчатым хранилищем
• Во-вторых, он структурирован так, что влияет на то, как данные будут загружаться в память и использоваться в Tableau. Это важный аспект, так как TDE является «совместной архитектурой». Это означает, что TDE используют все сегменты памяти вашего ПК – от оперативной памяти до жесткого диска – и размещают каждую часть работы в том месте, которое лучше всего подходит для этой цели.

26. Как использовать группу в расчетном поле?

Можно добавить один и тот же расчет «Группировать по» в описание SQL-запроса или создать расчетное поле в окне данных и использовать это поле всякий раз, когда вы хотите сгруппировать поля.
Использование групп в расчете. Вы не можете ссылаться на группы Ad-Hoc(специальные) в расчете.
Смешивание данных с помощью группы, созданной во вторичном источнике данных: только расчетные группы могут использоваться для смешивания данных при условии, что группа была создана во вторичном источнике данных.
Используйте группу в другом рабочем журнале. Вы можете легко скопировать группу в другой рабочий журнал с помощью копирования и вставки расчета.

27. Могут ли параметры иметь выпадающий список?

Да, параметры имеют свой независимый выпадающий список, позволяющий пользователям просматривать записи данных, доступные в параметре при его создании.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Выбор правильного типа расчета…

Сегодня в Tableau есть несколько форм расчета:

Основные расчеты

Данные расчеты записываются как часть запроса, созданного Tableau и, следовательно, выполняются в источнике данных. Они могут быть выполнены либо в детализации источника данных (расчет на уровне строк) либо на уровне детализации визуализации (совокупность расчета).

Уровень детализации выражений

Как и основные расчеты, уровень детализации выражений также записывается как часть запроса, созданного с помощью Tableau и, следовательно, выполняется в источнике данных. Разница заключается в том, что LOD (уровень детализации) выражения могут работать при детализации, отличной от источника данных или визуализации. Они могут выполняться на более детальном уровне (с помощью INCLUDE), менее детальном уровне (через EXCLUDE) или на полностью независимом уровне (через FIXED).

Табличные расчеты

Табличные расчеты выполняются по возвращению запроса и, следовательно, могут работать только над значениями, которые находятся в наборе результатов запроса.
Одна из проблем, с которыми сталкиваются новички в Tableau, это понимание того, какой тип расчета использовать для данной задачи. Этот пост посвящен внесению некоторой ясности в то, как определить этот тип. Мы делаем это путем сравнения типов различных расчетов друг с другом.

№1 – Основной расчёт против табличного расчета

При попытке выбрать между основными и табличными расчетами, встает важный вопрос: «Есть ли все значения данных, необходимые для визуализации?» Если ответ «да», то вы можете рассчитать результат без дальнейшего взаимодействия с источником данных – чаще всего это значительно быстрее, так как меньше данных следует обрабатывать (т.е. мы просто производим расчет с использованием совокупных значений из набора результатов). Если вы не сделаете этого, то у вас не останется выбора, кроме как перейти к основному источнику данных для расчета ответа.

Рассмотрим пример, когда мы спрашиваем: «Что такое 90-й перцентиль вашего порядка детализации, показанный по стране»:

Обе стороны этой панели управления отвечают на вопрос, если бы вы были просто заинтересованы в значении 90-го перцентиля и не было необходимости в определении дальнейших выводов – в этом случае диаграмма слева будет оптимальной. Она обеспечивает минимальный набор результатов (один номер на каждую страну) с помощью базовой совокупности PCT90 ([Продажи]), которая рассчитывается в базовом источнике данных.
Тем не менее, если вы хотите получить дальнейшее результаты (например, определить детали распространения и выявлять посторонние значения) или добавить другие совокупности (например, вы также хотели бы определить медианные значения), то с помощью диаграммы можно сделать это без последующих запросов. Первоначальный запрос возвращает все записи деталей заказа (зеленые точки), предоставляет все данные, необходимые для вычисления локально 90-й перцентили, а также для изучения других результатов.
Одним из ключевых моментов этого поста является то, что именно расположение визуализации имеет значение. Как уже обсуждалось выше, именно визуализация будет влиять на то, сколько данных изначально вернется из источника данных, и это является важным фактором при определении вашего подхода. Тем не менее, бывают ситуации, когда даже при наличии всех необходимых данных в наборе результатов невозможно получить нужную визуализацию с помощью расчетной таблицы. Таким образом, вы также должны спросить, позволяет ли именно визуализация использовать расчетную таблицу.


Рассмотрим следующий пример, в котором мы запрашивает разницу продаж за год в двух форматах — один в виде диаграммы, а другой в виде таблицы:

Верхняя половина данной панели управления легко получается с помощью расчетной таблицы — просто продублируйте поле [Продажи] и примените быстрый расчет разницы таблицы, перейдите к параметру [Дата Заказа]. В то же время, если вы попытаетесь преобразовать эту структуру вычисления в таблицу, все сведется к следующему:

Вы поймете, что невозможно достигнуть определенного вида с расчетной таблицей, так как вам необходимы параметры Года с параметром Имена измерений, вложенного в него. Tableau не может блокировать строку «разница в продажах» относительно 2013 года, поэтому в этом примере единственный возможный вариант заключается в использовании основных расчетов:
[Продажи 2013]
IF YEAR([Order Date]) = 2013 THEN [Sales] END
[Продажи 2014]
IF YEAR([Order Date]) = 2014 THEN [Sales] END
[Разница]
SUM([2014 Sales]) – SUM([2013 Sales])
Такой подход позволяет получить только параметры Имена измерений, которые вы можете сортировать для их соответствия требованиям вида.

#2 – Основные расчеты против уровня детализации выражения

Если у нас не будет всех данных, необходимых для визуализации, нужно пропустить расчет через источник данных. Это означает, что необходимо использовать базовые расчеты или выражение LOD. Но как выбрать? Здесь важно понимать, соответствует ли детализация запроса именно детализации визуализации или детализации источника данных.

Основные расчеты могут быть выполнены либо в виде расчетов на уровне строк, либо в виде совокупности расчетов – таким образом они могут только ответить на вопросы о детализации источника данных или на уровне детализации визуализации. Уровень детализации выражений с другой стороны может ответить на вопросы в любой детализации.
Рассмотрим следующий пример, где мы спрашиваем, что такое 90-й перцентиль продаж на уровне детализации заказа по сравнению с уровнем общего заказа.

Если вы знакомы с набором данных Tableau Superstore, вы знаете, что он представляет собой один ряд данных для каждой позиции каждого заказа. Так что, если мы рассматриваем вопрос, приведенный выше, мы определяем:
 Детализацию источника данных: Детали заказа
 Детализацию визуализации: Страна
 Детализацию левой диаграммы: Детали заказа
 Детализацию правой диаграммы: Заказ

Таким образом, для левой диаграммы мы можем решить эту проблему методом базового расчета — PCT90 ([Продажи]) — однако для правой диаграммы мы должны сначала подсчитать детали заказа до уровня заказа, а затем выполнить совокупность перцентиля. Таким образом, мы должны использовать уровень детального выражения:
[Сумма продаж, включая заказы]
{INCLUDE [Order ID] : SUM([Sales])}
Затем мы можем использовать ту же совокупность, как указано выше — PCT90 ([Сумма продаж, включая заказы]) – для определения ответа. На следующей диаграмме приведены пояснения, как работает выражение LOG:

Обратите внимание, что мы используем выражение INCLUDE так, чтобы заказы, которые распределены между странами, были распределены правильно и не учитывались дважды. Некоторые читатели могут предпочесть решить эту проблему с помощью выражения FIXED – в этом случае мы должны были бы написать:
[Сумма продаж, включая заказы]
{INCLUDE [Country], [Order ID] : SUM([Sales])}
Это было бы рациональным для требуемой диаграммы, но будет ограничивать вашу адаптивность изменений группировки под какой-либо параметр – например, по регионам или по типу доставки.

#3 – Расчетные таблицы против уровня детализации выражения

Данное решение многих сбивает с толку, однако процесс выбора между расчетной таблицей и выражением LOD такой же, как и для расчётной таблицы относительно основного расчета. Стоит спросить:

Рассмотрим следующий пример, когда мы спрашиваем, что такое 90-й перцентиль продаж на уровне общего порядка, показанного по стране:

Вы заметите, что это почти идентично вопросу, заданному в пункте 1 выше. Единственное отличие в том, что расчет перцентиля производится на основе общего заказа, а не деталей заказа. Фактически можно реализовать диаграмму с левой стороны, на самом деле это та же диаграмма, что и с правой стороны в №2. Мы уже знаем, что детализация этой проблемы отличается от источника данных и визуализации – таким образом, мы должны использовать выражение LOD.
Диаграмма с правой стороны такая же, как и с правой стороны в №1, однако точки представляют собой заказы, а не детали заказа. Это осуществляется просто путем изменения детализации визуализации (поменять местами ID строки с ID заказа в поле Детали). Поскольку расчетные таблицы сохраняют логику расчетов отдельно от объема и направления расчетов, даже не нужно менять расчет – просто вычислите с помощью ID заказа.
Это может оказаться слишком сложно, что приведет к неуверенности в ответе на наши вопросы о процессе решения, поэтому иногда вы можете решить проблему в одностороннем порядке, пока позже не введете осложнение. Рассмотрим следующий пример, когда мы спрашиваем, для каждой возрастной группы, какой процент от болезней создает каждую учетную запись для болезни:

Очевидно, что это процент от общей задачи, и можно очень быстро устранить эту проблему с помощью расчета быстрой таблицы поверх вкладки «Болезни». Тем не менее, когда мы затем добавим сложность, позволяя пользователю осуществлять фильтрацию по конкретной болезни, мы увидим следующее:

Это происходит вследствие того, что набор результатов больше не содержит все необходимые нам данные – фильтр удалил расчетные данные пациента для других заболеваний. Вы могли бы решить эту проблему, создав фильтр расчетной таблицы:
[Фильтр болезни]
LOOKUP(MIN([Disease]), 0) расчет с использованием болезни
Или вы можете использовать выражения LOD, зная, что ФИКСИРОВАННЫЕ вычисления выполняются перед параметром фильтрации. Во-первых, необходимо обработать общее количество людей в возрастной группе:
[Общее количество пациентов относительно болезни]
{FIXED [Age]:SUM([Patient Count])}
После этого вы можете вычислить общий %:
[Общий процент]
SUM([Patient Count])/SUM([Total Patients per Disease])

#4 – В расчете будет учитываться только таблица

Наконец, нам нужно добавить одну окончательную концепцию для нашего процесса принятия решений. Есть несколько категорий проблем, которые можно решить только с помощью расчетной таблицы:
 Иерархия
 Рекурсия (например, сумма нарастающим итогом)
 Скользящие расчеты (например, скользящее среднее)
 Междурядные расчеты (например, период относительно расчетного периода)
Итак, вопрос, который нужно поставить в этом случае: «Требует ли моя проблема использования иерархии, рекурсии, скользящих расчетов или же междурядных расчетов?»


Это происходит вследствие того, что расчетная таблица может выводить несколько значений относительно каждого раздела данных, в то время как LOD и основные выражения выводят одно значение для каждого раздела/группы данных. Рассмотрим следующую задачу, где мы спрашиваем, как часто акции били рекорды относительно данных за прошлый год:

Здесь требуется рекурсивное вычисление: мне нужно рассмотреть все предыдущие значения, прежде чем сказать, что это новый максимум. Мы можем сделать это с помощью функции RUNNING_MAX. Таким образом, мы сначала рассчитаем максимальное значение на сегодняшний день:
[Запись по дню]
RUNNING_MAX(AVG([Close])) расчет с использованием дня
Затем на уровне дня мы должны отметить те дни, когда рекорд был побит:
[Расчет дня, когда был побит рекорд]
IF AVG([Close]) = [Record to Date] THEN 1 ELSE 0 END
И, наконец, нам нужно подсчитать эти дни:
[Общее время, на протяжении которого рекорд был побит]
RUNNING_SUM([Count Days Record Broken]) расчет с использованием дня.

Выводы

Ключевые моменты, вынесенные из всего этого:
 Нет верного решения проблемы. Ответ всегда «зависит от …», но процесс принятия решений поможет вам начать выбор правильного подхода.
 Расположение вопросов в визуализации имеет значение – так как его изменение предполагает необходимость изменения типа расчетов.
 Существуют ситуации, когда различные решения работают по-разному в зависимости от объема и сложности данных, от сложности вопроса и требуемого расположения.
 Всегда есть место компромиссам, которые стоит рассмотреть (производительность по отношению к гибкости и простоте). Хорошее правило – это когда вы можете выбрать любые два.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Рекомендации по поддержке базы Qlik под контролем версий

Создание хранилища на основе контейнера

Контейнер представляет собой отдельную сущность. Вы можете скопировать его, продублировать или переместить, и он продолжит работать, не требуя модификаций. Создание хранилища на основе контейнера – хорошая идея.
Используя GIT (технологии графических изображений), вы ограничиваете себя в проверке на входе/выходе целых хранилищ, не можете выбрать в нем определенные части. Если вам необходимо единое хранилище для всей программной среды, то вы будете вынуждены проверять всю программную среду Qlik при каждой проверке проекта. Я всегда рекомендую разделять программную среду на несколько хранилищ – по одному на каждый контейнер.
Если вы используете систему управления версиями, вам не понадобится полное хранилище, ведь довольно легко установить, какие части хранилища нужно проверять. Также вы можете использовать единое хранилище для каждого контейнера с использованием системы управления версиями. Примером является ситуация, когда различные разработчики ответственны за отдельные части и должны иметь доступ к разным приложениям. В соответствии с правами разработчика при настройке доступа к хранилищу, вы можете предотвратить несанкционированные или непредумышленные действия, выполненные посторонними разработчиками.
QDF открывает доступ разработчику или администратору для внесения изменений в порядок структуры контейнеров, не нарушая функциональность сценария. Может быть несколько причин для перемещения контейнера, но часто это связано с бизнес-изменениями. Расположение или выравнивание контейнеров не изменяет функциональности Qlik и не должно влиять на единое хранилище на основе контейнера. Разделение установки сохраняется, но в единой программной среде хранилища изменение структур контейнеров будет генерировать множество изменений в системе управления версиями.

Исключение файлов в формате qvw и файлов данных

Необходимо всегда исключать бинарные файлы и файлы данных. Я рассматриваю управление версиями как систему отслеживания изменений в исходном коде – это не является резервной системой.
Файл QlikView (qvw) содержит и макет, и сценарий, и сами данные. Он хранится в двоичном коде, что является неприемлемым для системы контроля версий – для определения изменений, которые были сделаны, в основном будет выполняться подтверждение всего приложения в хранилище базы данных при каждой фиксации. Приложение большого размера быстро увеличит размер вашей базы данных отслеживания версий, поэтому при каждом запуске файл qvw будет отличаться от предыдущего.

Всегда необходимо ставить файлы qvw и qvd в список игнорируемых файлов системы управления версиями.

Достаточно отследить папку PRJ вместо qvw. Папка PRJ содержит все макеты и информацию моделирования данных файла QlikView. В PRJ-папке файлы хранятся в виде считываемых XML-файлов. По мере исключения PRJ можно создать новую копию файла qvw, представляющего собой пустой файл для передачи данных.
Данные, загруженные в приложение, скорее всего, будут меняться с течением времени, в следствии этого, файлы данных никогда не должны включаться в системе управления версиями. Этот принцип справедлив как для файлов данных, которые импортированы (Excel, CSV и т.д.), так и для файлов данных, создаваемых приложением (QVD).

Держите основу структуры данных вне системы версий контроля.

Я считаю, что файлы структуры данных не должны быть частью разработанного исходного кода. Я рассматриваю их как файлы блока данных, куда я помещаю разработанный исходный код. Блок данных не находится под ответственностью разработчиков, и они не должен вносить никаких изменений в него. Если необходимо внести изменения, они должны быть глобальными для всех контейнеров, поэтому я считаю, что ответственность за это несет разработчик Qlik или администратор. Если каждый разработчик в организации, где это разрешено, внесет небольшие корректировки и изменения в файлы структуры данных, а затем руководство примет решение модернизировать структуру данных, для более позднего релиза потребуется перевыпустить файлы структуры данных.
Исключение из системы управления версиями qdf-файлы контейнера по умолчанию позволит разработчику точно понять, что является файлами конкретного исходного кода проекта, а что нет.

Отслеживайте развитие, но закрепите остальное

Только разработка программной среды должна быть подключена к системе управления версиями. По завершению процесса разработки разработчик должен разместить измененные файлы так, чтобы они могли быть скопированы по всему потоку DTAP.

Сохраняйте разработки в среде разработки, сокращая все связи с системой управления версиями в тестовом режиме, среде приемки и производства

Есть конкретная причина того, почему с сервером QlikView вы должны избегать подключения тестового режима, среды приемки и производства при выборе системы управления версиями. Ранее я объяснял, почему qvw-файлы должны быть исключены из контроля версий. Настольный клиент QlikView сначала будет рассматривать информацию о PRJ-папке при открытии qvw-файла QlikView. С другой стороны, сервер не будет рассматривать PRJ-папку в целом – только то, что было предварительно сохранено в qvw-файле. Если все изменения занесены в XML-файлы в PRJ-папке в потоке DTAP, сервер не распознает любых изменений, пока вы вручную не откроете и не сохраните qvw-файл настольного клиента. Чтобы избежать повторения этой задачи во всей программной среде, необходимо всегда подготавливать свои разработанные qvw-файлы и поддерживать их в потоке DTAP.
Также существует принцип, по которому все изменения должны находиться в среде разработки, никакие изменения не должны вноситься после того, как они будут введены в любую из других программных сред. Разделение связей с контролем версий в тестовом режиме, приемка и производство, помогут предотвратить случайные разработки, выполненные в данной среде.

Ограничения

Существуют ограничения в версии обработки лишь файлов PRJ-папки приложения в QlikView. Одно выбранное значение всегда является одним из примеров – это свойство теряется, когда файл QlikView разделяют на данные. Триггеры определенных действий являются еще одной особенностью, которая плохо обрабатывается Qlik вручную, когда дело доходит до контроля версий. В случае, если присутствуют важные характеристики, не забудьте размещать qvw-файл в одном и том же месте – я убедился, что размещенный qvw-файл не опустошается.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Руководство для мастера Tableau по перемещению рабочих журналов и источников данных

Внедрение Tableau на каждом предприятии происходит в своем темпе. Есть случаи, когда это случается молниеносно, а в некоторых случаях процесс затягивается, но все равно со временем набирает обороты с неизбежностью схода ледника.
Если вы – мастер по Tableau, внедрение данной программы в вашу организацию станет прекрасной возможностью увидеть детскую радость новых пользователей, открывающих новые перспективы работы с данными, и скрытые ранее в них секреты. Но, как и в других случаях, развитие сталкивается с проблемами, и внедрение Tableau в организациях – не исключение.

Обеспечение качества данных

Один из примеров трудностей, с которыми сталкиваются организации, это обеспечения качества данных. Почти наверняка будут столь важные данные, что их качество и точность не должны вызывать сомнений. Финансовые данные, данные по продажам или же другие пользовательские данные, используемые для принятия важных бизнес-решений, попадают в эту категорию.
Чтобы обеспечить качество данных, необходимо соблюдать QA-процессы (обеспечение качества). Они будут многоступенчатыми и, скорее всего, потребуют наличия нескольких сред (для работы). Тем не менее, одна из трудностей на пути к получению нескольких сред Tableau – необходимость перемещать рабочие журналы Tableau и публиковать источники данных из одной среды в другую.

Среда разработки?

Прежде чем продолжить, следует поинтересоваться: «Что такое среда?» Средой в контексте программного обеспечения или аппаратной составляющей является разделенная зона или работающая копия программы, изолированная от всех остальных сред. Данные среды являются мостом между процессами, перемещающими данные или артефакты (в случае Tableau – это рабочие журналы и источники данных) через среду.
Стандартными названиями для такой среды являются разработка, тестирование/QA, постановка/подготовка производства и производство. Существует 3 или 4 такие среды (постановка/подготовка чаще всего упускается). Такие среды могут существовать как отдельные проекты или же как сайты при использовании того же Tableau Server. Или каждая из них может быть отдельной используемой программой Tableau Server.

Процесс контроля качества (QA)

Процесс контроля качества является многоступенчатым, когда мы рассматриваем его с позиции высоко уровня. Ниже приведена сводка потока операций. В реальности возникнет дискуссия между аналитиком QA и разработчиком в процессе поиска решений.
• Разработчики создают рабочие журналы или источники данных;
• Разработчики тестируют рабочие журналы или источники данных для определения их точности;
• Разработчики публикуют рабочие журналы или источники данных для разработки среды Tableau Server;
• Разработчики тестируют рабочие журналы или источники данных в разработанной среде;
• Разработчики стимулируют тестирование среды Tableau Server;
• Аналитики QA тестируют рабочие журналы или источники данных в тестовой среде;
• Менеджеры по выпуску стимулируют производственную среду;
• Менеджеры по выпуску осуществляют окончательное тестирование производственной среды.

Как все это сделать?

В начале принимается решение переместить рабочие журналы; следующий шаг – определение, как именно они будут перемещаться через среду. Ниже будут приведены доступные опции, а затем обсудим, как выбрать необходимую.

Опции перемещения

Существует несколько разных опций для перемещения рабочих журналов. Ниже мы обсудим выбор оптимального соотношения и плюсы, и минусы каждого из них. В данный момент для перемещения рабочих журналов и источников данных есть такие опции:
Tabcmd Script
REST API
TabMigrate
Enterprise Deployment Tool от InterWorks

Tabcmd является утилитой, которая пришла с Tableau и позволила взаимодействовать с сервером Tableau через командную строку. Используя tabcmd в рамках скрипта, вы можете переместить свои рабочие журналы. Вы просто выполняете tabcmd get из источника и tabcmd publish в назначенное место.
Звучит достаточно просто, не так ли? Трудность в том, что если вам необходимо сделать какие-либо изменения (например, модифицировать источник данных), возникнет необходимость программной манипуляции .twb XM, который не достаточно надежен.
Tabcmd также не переносит разрешения для рабочих журналов, и вы должны вручную ввести разрешение для нового журнала.
Другим ограничением является то, что публикация tabcmd не получится, если есть два соединения источников данных в рабочем журнале.

Tableau REST API

API – программный интерфейс, а REST – просто обозначение способа, которым программист взаимодействует с API. API для Tableau позволяет программисту взаимодействовать с сервером Tableau посредством вариаций запросов API. Аналогично tabcmd вы можете «получить» и «опубликовать» рабочие журналы и источники данных, но – в отличии от tabcmd – вы также можете установить разрешение программно.
Самым большим недостатком использования REST API является требование создавать код разработчика, а это занимает много времени и требует тестирования.
Для получения более подробной информации о Tableau REST API, перейдите по ссылке – Онлайн помощь.

TabMigrate

TabMigrate – проект с открытым исходным кодом, выполненный на основе Tableau, а также программное обеспечение, созданное разработчиками Tableau для перемещения рабочих журналов и источников данных. Вы можете использовать TabMigrate таким, как есть, или же, если у вас есть возможности выполнить разработку по вашим требованиям, вы можете подогнать его под свои запросы.
TabMigrate имеет минимальный UI (пользовательский интерфейс), позволяющий экспортировать все рабочие журналы и источники данных из одного сервера в локальную папку, а затем загружать эти файлы на другой сервер. Вы можете вручную производить преобразование файлов, как только они будут помещены в локальную папку. Для этого нужно выполнить определенное редактирование XML и остальных файлов, необходимых для настройки перемещения.
TabMigrate обеспечивает как возможность выполнения повторяемых объемных перемещений, так и ограниченные преобразования в виде перемещения источника данных.

Enterprise Deployment Tool от InterWorks – инструменты корпоративного развертывания на основе InterWorks

Инструменты корпоративного развертывания (EDT) – это инструменты стороннего программного обеспечения для перемещения рабочих журналов и источников данных. У EDT есть интерфейс с мастером настройки, который ведет вас через выбранные рабочие журналы, применяет преобразование, устанавливает разрешение, а затем развертывает ваши рабочие журналы и источники данных. Также есть функция отката, позволяющая восстановить исходное состояние, если вы архивировали рабочие журналы.
EDT позволяет вам сохранить перемещения и восстановить их позже, или реализовать их из командной строки или же через скрипт.
EDT – наиболее полнофункциональный вариант в данном списке, но он также, и единственный, который требует оплаты, что является наибольшим ограничением.

Какое решение верное?
Лучшим решением послужит то, при котором все будет функционировать оптимально. Первый необходимый шаг – определить свои потребности. Начните с ответа на такие вопросы.
• Сколько рабочих журналов или источников данных вам необходимо развернуть? Сколько потребуется времени?
• Используете ли вы отдельные проекты, сайты или Tableau Server в качестве среды?
• Есть ли отдельные источники данных для каждой среды? К примеру, тестовая среда существует отдельно от среды разработки.
• Имеют ли место преобразования во время перемещения (например, рабочий журнал с водяными цифровыми знаками)?
• Есть ли у вас разработчик программного обеспечения для помощи с проектом?
Чем сложнее ваш сценарий развертывания, тем дольше и тяжелее будет процесс написания необходимого скрипта. Так как ваши развертывания будут становиться все больше и все сложнее, есть смысл сравнить TabMigrate и EDT, чтобы разобраться, какое их этих решений лучше соответствует вашим потребностям.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Говорит ли Ваш дэшборд с аудиторией?

Дэшборды эволюционируют как предельно сильный и незаменимый инструмент, который позволяет бизнес пользователям и руководителям принимать лучшие и быстрые решения, увеличивать операционную видимость и продвигать проактивную рабочую атмосферу. Дэшборды позволяют с одного взгляда иметь представления о KPI из потенциальных неизмеримых источников данных и помогает пользователям погрузиться в детали, чтобы найти корень проблемы, возможности, тенденции и угрозы.
Хотя, визуализация данных должна быть комбинацией полезности, удобства и красоты, чтобы стимулировать участие и активность. Давайте немного поговорим о способах, которые позволят вашим дэшбордам говорить с публикой.

Держите в голове потребности пользователя

Предоставление единственного дэшборда на всю организацию, потенциально может собрать всех на одной странице, но обслужить такую разнообразную аудиторию очень сложно. Когда вы создаете дэшборд, часто рекомендуется учитывать требования всех вашей аудитории: руководителей, клиентов или партнеров. Ключевой частью является уверенность в том, что дэшборд обращен к задаче каждого пользователя, которые имеет свои специфические, конкретные требования. Чаще всего выходом будет разделение дэшборда с учетом каждой пользовательской роли. Обязательно учитывайте информацию и показатели, важные для каждой аудитории, и типы решений, которые они должны делать на регулярной основе.

Создайте увлекательный дизайн

Хорошо продуманный дэшборд может сэкономить огромное количество времени, помогая вашей аудитории быстро определить идеи, которые важны для принятия эффективных решений. Но речь идет не только о предоставлении данных – также и о создании неотразимой среды обнаружения данных. Дэшборды могут быть похожими на холст художника — используйте эту возможность для создания красивых, визуально привлекательных дизайнов. Предоставляйте данные своей аудитории четким, сжатым образом, но также привлеките их, чтобы дать ответы, которые им нужны.

Сотрудничество

Эффективные дэшборды должны вызывать желание поделиться ими, тем самым способствовать сотрудничеству между командами и отдельными пользователями, обеспечивая обратную связь. Эти общие идеи могут облегчить анализ, ориентированный на пользователя, решив задачу в минуту вместо часов, что позволяет людям работать вместе и быть более продуктивными.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Первый взгляд на Google Data Studio

Google Data Studio — бесплатная версия продукта для визуализации данных Data Studio 360. В настоящее время он находится на стадии бета-тестирования, и позволяет создавать до 5 отчетов из подключений к источникам Google (например, Google Analytics, Google Таблицы, AdWords, YouTube). Вы можете делиться этими отчетами с другими пользователями, которые могут просматривать или редактировать их в зависимости от того, как вы их настраиваете, так же, как и с Google Docs.

Что мне понравилось

Я был очень впечатлен тем, насколько легко было подключиться к данным GA и настроить интерфейс пользователя. Создание представлений в интерфейсе дэшборда было довольно интуитивно понятным и простым. Попробуйте сами — выберите тип диаграммы, перетащите окно и поместите его там, где хотите.
Вот скриншот редактирования:

Форматирование самих диаграмм было немного сложнее. Нажмите на диаграмму, отредактируйте параметры данных и стиля на панели, которая открывается в правой части экрана, и вы можете идти дальше. Добавление фильтров, изображений и текста также было очень простым. Самая сложная часть для меня выяснить, как изменить «Scorecard» вверху сумму на среднее. В конце концов я получил его — мне просто нужно щелкнуть по полю данных, которое я хотел изменить на панели «Данные» справа, а затем щелкнуть «Создать новое измерение» и отредактировать таблицу метаданных.

Предоставление другим людям возможности просматривать и редактировать мои работы также было интуитивным опытом, главным образом потому, что я использовал те же элементы управления с Google Docs некоторое время. Так что это эффективно. Не так много для понимания.

Что я хотел сделать, но не смог

Создать дэшборд с несколькими объектами было просто; я хотел пойти дальше, но не смог. Например, я хотел бы добавить «богатую интерактивность» — позволить читателям щелкнуть по одной диаграмме (скажем, бар на гистограмме, отметку страны на карте или точка данных на временной шкале) и получить данный выбор фильтровать или выделять другие диаграммы в представлении. Насколько я могу судить, вы не можете этого сделать. Возможно, проблема эта только во мне. Я не утверждаю, что являюсь экспертом этого программного обеспечения. Поэтому для меня Google Data Studio — потрясающий инструмент визуализации, но не совсем инструмент аналитики.

Еще одно ограничение заключается в том, что нет опции встраивания, опять же, насколько я могу судить. Я могу легко отправлять электронную почту и отправлять ссылки людям, но мне пришлось поместить скриншот в этот пост, потому что я не мог понять, как вставлять его, как видео на YouTube напрямую. Поэтому мне кажется, что на самом деле это не для широкого распространения в Интернете, как для обмена мнениями между группой коллег. Но для последнего это довольно эффективно.

Хотя настройка представлений довольно проста, но также несколько ограничена. Например, я хотел, чтобы размер точек для каждого браузера в диаграмме рассеяния был внизу, исходя из того, сколько трафика поступало от каждого браузера, но я не мог. Так что это правдивый график рассеивания, но не пузырчатая диаграмма.

Параметры цвета также довольно ограничены — вы не можете использовать плотность цвета для кодирования количественных данных в барах на гистограммах или точках в диаграммах рассеяния. И вы не можете делать другие мелочи с цветом, как изменение цвета на оси. Тот факт, что нет этих функций, сделал это относительно простым для изучения, но я часто оказывался неспособным делать то, что хотел.

Итак, финал

Это простой в использовании инструмент визуализации данных для ваших источников данных Google, которые все еще довольно ограничены. В целом мне очень нравится пользовательский интерфейс, очень легко подключиться к источникам данных Google, и мне очень нравятся функции совместной работы. Но, хотя я мог быстро визуализировать свои данные и добавлять полезные фильтры, я не мог по-настоящему разобраться и изучить данные глубже.

Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Как создать карты в Qlik Sense и QlikView с помощью NPGeoMap

Ваши пользователи хотят карты, и они хотят их сейчас

Эта статья покажет, как добавить профессиональные качественные карты в ваши Qlik Sense или QlikView приложения.
За последний год ко мне всё чаще обращаются клиенты, желающие визуализировать свои данные, такие как продажи, местоположение клиентов и другие показатели, используя карту в QlikView или Qlik Sense. В наши дни создание карт — это ожидаемая функция любой BI платформы.

Проблема собственных карты QlikView – их нет

К сожалению, такого объекта как встроенные карты в QlikView не существует. Мы можем использовать бесплатное расширение или добавить фрагмент фоновой карты в точечную диаграмму (scatter chart). Есть несколько недостатков в каждом из этих подходов. Большая проблема, когда мы используем эти подходы для клиента, это сложно или невозможно сказать ДА следующему функциональному запросу. Поскольку решения являются либо обходными, либо разработаны сообществом пользователей, вы ограничены функциональности карт.

Карты в QlikView, используя бесплатные расширения

• Базовый набор того, что отображается;
• Модель As-is (как есть), нет сторонней поддержки;
• Могут не работать с усовершенствованной или обновленной версией QlikView;
• Ограниченная документация эксплуатации расширения.

Карты в QlikView с помощью точечных диаграмм

• Долгое время разработки;
• Ad-hoc (для каждого случая) метод для создания карт;
• Глубокие знания (или навыки) для создания формул, которые отображают точки и карту, правильно выровненные друг с другом;
• Понимание как использовать Google API;
• Необходимость изменения кода при изменении API.

Проблема карт Qlik Sense – мы имеем что-то очень простое

• Доступны только 2 вида базовых вида карт: точечная карта и карта области;
• Понимание KML данных для карт области и добавление этих данных в модель данных;
• Не настраивается; что вы видите, это то, что вы получаете.

Решение – NPGeoMap

К счастью есть ответ. NPGeoMaps предлагает богатый набор картографических решений, который создает высококачественный и универсальный опыт для ваших клиентов и пользователей. Это также чрезвычайно эффективно, поскольку NPGeoMaps резко сокращает время разработки для ваших клиентов.
Мы уже некоторое время используем NPGeoMaps и поделимся с вами некоторыми наблюдениями и результатами, которые мы создали с помощью этого инструмента.
Одна из моих любимых функций — пакет будет работать как для карт QlikView, так и для карт Qlik Sense, а конфигурация для расширений на стороне дизайнера идентична.

На что похож NPGeoMap

Здесь есть несколько примеров, чтобы показать вам, на что похожи карты и несколько функций, которые вы можете использовать для ваших приложений QlikView и Qlik Sense.

1. Точечная карта

Визуализируйте свои продажи или другую метрику по городу или местоположению клиента, используя точечные карты. Размер и цвет точки можно настроить. Также, можно изменять уровень детализации.
Мне очень нравится возможность добавлять визуальные данные на мои карты в виде всплывающих окон. Они полностью настраиваются и могут быть представлены любой визуализацией QlikView или Qlik Sense.

NPGeoMap дает конечному пользователю возможность просматривать и делать выборки на основе данных, попадающих в определенный радиус. Это ценная функция для определения направления или территорий продаж.

2. Граничная или областная карта

Вы можете легко создавать подробные карты в QlikView и Qlik Sense без необходимости добавления дополнительных данных в вашу модель данных. С NPGeoMap отпадает необходимость в KML данных. Данные включаются в установку NPGeoMap, а затем при необходимости берутся из расширения. Двенадцать популярных форматов файлов устанавливаются вместе с расширением с возможностью выбора из более чем 400 других. Раскомментируйте карту границ, которую вы хотите использовать в панели свойств расширения, введите свои измерения и метрику, и все готово. Как и в примере с точечной картой, настраиваемые кадры с помощью мыши и всплывающие окна могут быть созданы в любом из типов карт.

3. Комбинирование точечной и областной карты в одной карте

Это — то, где мы выходим из коробочного решения, что вы можете сделать в бесплатном решении. NPGeoMap позволяет пользователю совмещать точечную и областную карты в один объект мониторинга. С помощью этой функции вы можете использовать два отдельных измерения и/или несколько измерений в одной карте визуализации.

4. Тепловые карты

Хотели бы вы знать, где наибольшая концентрация ваших покупателей или продаж? Путем создания тепловых карт в NPGeoMap ваши данные полностью визуализированы. Окраска, интенсивность и непрозрачность легко настраиваются, и ответы у вас под рукой.

5. Кластерные карты

Кластерные карты дают возможность динамически агрегировать ваше измерение в централизованные группы или кластеры. Это снимает серьезное ограничение при использовании обходных решений или бесплатных расширений. Любой, кто работал с этими методами, знает, что, когда мы соединяем 100 000 различных частей данных, всё начинает замедляться. Возможность динамического создания этих групп, особенно при добавлении или удалении выбранных разделов, решает эту проблему. Помимо проблемы с производительностью, пользователи по достоинству оценят то, что мы отображаем данные таким образом, который имеет смысл, вместо того, чтобы показывать огромный кусок зеленых точек, как бывает в некоторых бесплатных приложениях.

Вот пример зума. По мере увеличения масштаба детали данных увеличиваются. Другими словами, агрегация масштабируется до более высокого уровня детализации, так что пользователи получают информацию на каждом уровне масштабирования.

Как настроить расширение NPGeoMap

Все, что вам необходимо для создания динамической и надежной карты QlikView или Qlik Sense, содержится в расширении NPGeoMap. Существует небольшая запутанность в обучения, когда вы начинаете понимать огромное разнообразие доступных вариантов, но единственное кодирование, которое вам потребуется, — это базовое понимание написания выражения для метрики, например, суммы (Sales).

Приятная особенность заключается в том, что в стандартном модуле сценария копирования / вставки вы можете решить, какие функции вы хотите иметь в расширении, а какие нет, комментируя или раскомментируя строки.

Создание карты в Qlik Sense выполняется так же, как и при создании карты в QlikView. Это устраняет необходимость изучения двух отдельных методологий при создании широкого спектра карт на панели инструментов.
Одна из главных проблем при построении карт без премиального пакета заключается в том, что вам нужно придумать данные широты и долготы для вашего измерения. NPGeoMap поставляется со списком более 600 000 почтовых кодов, ISO2 и кодов стран ISO3 в формате Excel. Каждый из них имеет соответствующие долготы и широты, что дает вам возможность связать геоцепи в своих данных за считанные минуты.

Собирая всё вышесказанное вместе

У меня есть опыт создания карт в QlikView с использованием бесплатных расширений и точечных диаграмм (scatter charts). Они имеют тенденцию быть очень громоздкими, требуют длительного времени разработки и никогда не обеспечивают уровень настраиваемых элементов, функций и элементов дизайна, которые я ищу. Клиенты иногда хотят изменить что-то в пределах карты или как карта представлена. Это требует от меня как разработчика либо поискать другое бесплатное расширение, либо потратить часы на разработку, внося изменения в скрипт или диаграмму. И как мы знаем, это время не бесплатно.
Хотя карты Qlik Sense легче разрабатывать, уровень настройки и ограниченное количество типов карт оставляют у меня чувство желания большего.
NPGeoMap объединяет все это в один прочный и простой в использовании продукт. Устраняется необходимость в бесчисленных часах времени разработки и разочарований, которые могут возникнуть в результате использования специального метода для создания карт QlikView. И мы получаем выгоду от наличия функционально богатых и имеющих возможности сильно изменяться карт.

Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Как усовершенствовать вашу библиотеку основных элементов (Master Item Library) Qlik Sense

Одной из лучших функций в Qlik Sense являются основные элементы. Мы дадим несколько советов по работе с ними.

Основные элементы Qlik Sense – почему Вы нуждаетесь в них

Список основных элементов может содержать исчисляемые поля, определения выражений и даже завершенные визуализации, которые организованы и настроены для пользователя. Существует несколько преимуществ создания основных элементов для ваших приложений Qlik Sense.
1. Обеспечивает простоту выражений для разработчиков. В другом продукте, QlikView, мы создаем переменные и помещаем определения в них для повторного использования. С Qlik Sense у нас появился настоящий механизм, предназначенный для повторного использования. Любые изменения, внесенные в главный элемент, проникают во всё приложение.
2. Создает интуитивно понятный способ для пользователей создавать собственную аналитику. Когда разработчик создает основной элемент, пользователю требуется только перетаскивание для создания визуализации. Это избавляет пользователей от необходимости понимать синтаксис выражений Qlik Sense.
3. Поскольку для каждого элемента существует централизованное единое определение, и оно создается разработчиком, у нас лучше получится создать одну истинную версию для нашего приложения.

Планирование вашей библиотеки основных элементов Qlik Sense

Первая вещь, которые вы захотите сделать – это создать три списка. Один для всех измерений, которые необходимо отобразить для ваших пользователей. Затем создайте список общих выражений, которые потребуются пользователям. Наконец, вы должны спроектировать примерный набор визуализаций, чтобы пользователь мог использовать в качестве примера для своих собственных объектов.
Вы не должны слишком заботиться о том, чтобы заполнять каждое поле или каждую отдельную метрику, которую можно было представить. Все поля в приложении по-прежнему доступны из горизонтальной панели. И, конечно же, у пользователей все еще есть возможность построить выражение.
Совет. Если есть ключевые поля или неассоциированные поля, которые не должны отображаться ни в одном списке, переименуйте эти поля со специальным символом типа «%» или аналогичным. Затем создайте строку кода в своем скрипте:


Как и в QlikView, это эффективно скроет эти поля из представления пользователя (включая ваше собственное представление). В крайнем случае, вы можете добавлять все поля, а затем создавать свои измерения и меры, тем самым предоставляя пользователям только одобренные элементы.

Создание ваших основных элементов

Есть несколько путей создания объектов для вашего листа основных элементов. Мы пройдёмся по каждому.

Метод 1 — Средство просмотра модели данных

Измерения или меры могут быть добавлены в средство просмотра модели данных в режиме предварительного просмотра. В приведенных ниже рисунках мы добавим измерение Customer:


Метод 2 – Списки полей

Второй способ создания основных элементов – доступ к списку полей в режиме редактирования. На этот раз мы создали измерение детализации, выбрав иерархические поля дат.


Метод 3 – Список основных элементов

Третий способ создания основных элементов – напрямую добавить через панель основных элементов.



Совет. Присвоение тега главному элементу делает его доступным для поиска по этому тегу. В этом примере поиск «Sales» отображает гистограмму, так как она содержит основное измерение с пометкой «Sales».
Совет. Также обратите внимание, что окружающее выражение с помощью функции num будет избавлять пользователя от необходимости обновлять формат числа каждый раз, когда выражение перетаскивается в новый объект.
Совет. К сожалению, мы не можем ссылаться на существующие имена основных элементов для создания новых основных элементов. Но мы все еще можем создавать переменные, содержащие определения выражений. Поэтому теоретически мы можем хранить базовые выражения в переменной, а затем использовать их для создания наших основных элементов. Это может иметь больше неприятностей, чем пользы, если у нас нет сложного, повторяющегося, заданного анализа.

Метод 4 – Проектная сетка

Последний способ создать основной элемент – использование проектной сетки. Здесь мы добавили визуализацию в нашу библиотеку.


Использование основных элементов пользователем

Итак, подходит часть удовольствия. Как только основные элементы созданы, создание визуализаций становится очень простым.
Во-первых, вы должны удостовериться, что основные элементы нельзя удалять, добавлять или корректировать в опубликованном приложении. Фактически, вкладка, которая появляется слева от Master Library, удаляется из опубликованных потоков.
Чтобы добавить основной элемент на объект, щёлкните на кнопку Меры или Измерения. Заметьте, что поле основных элементов перемещается наверх, когда вы нажимаете кнопку Измерения или Меры. Другие поля появятся снизу.

Объекты библиотеки также можно перетаскивать непосредственно на объект.

Финальные мысли

Вот список желаний будущих улучшений, которые, я надеюсь, добавят следующую функцию:
• Способность классифицировать и/или сортировать список основных элементов;
• Было бы прекрасно ссылаться на существующие выражения через новые выражения (примерно, как мы можем это сделать в QlikView). Я обнаружил необходимость копировать и вставлять куски кода и затем корректировать, чтобы создать новые меры;
• Способность перетаскивать выражения на другие поля, которые могут содержать, например, цветовое выражение;
• Также было бы замечательно иметь возможность создавать скрытые объекты. Таким образом, чтобы я мог управлять всеми выражениями, но не обязательно должен был предоставлять их пользователю.
По мере того, как мы быстро приближаемся к истинной самообслуживающейся бизнес-аналитике, мы всё ещё можем перейти на сторону подготовки данных. Но добавление основных элементов приводит область управления панелями мониторинга к успеху.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Улучшение проектирования таблиц данных

Плохие таблицы. Почему они получаются?
Будучи основой Интернета на протяжении больше части его юношеской истории, таблицы были отброшены многими дизайнерами, использующими более новые и модные макеты. Но появляясь все реже на просторах Интернета, таблицы данных все еще собирают и упорядочивают большую часть информации, с которой мы взаимодействуем каждый день.
Например, есть то, что я считаю матерью всех таблиц: «Гармонизированный тарифный план» Соединенных Штатов, таблица, которая охватывает более 3550 страниц и перечисляет все товары, которые могут быть импортированы в США, включая такие записи, как «Мужские пальто или пальто для мальчиков, полупальто, накидки, плащи, анораки (включая лыжные куртки), ветровки и аналогичные изделия (в том числе мягкие, без рукавов)».
Ярость, вызванная таблицами данных, несомненно, обусловлена тем, насколько ужасно они выглядят, когда они плохо разработаны. Конструкция таблицы — это ее краеугольный камень: если все сделано правильно, это упрощает поиск и сравнение сложных данных. Если это будет сделано неправильно, это может сделать информацию совершенно непонятной.

Знай свои цифры

Не все числа были созданы равными. Я не говорю о π и ∞; Я говорю о числах, которые являются табличными или старостильными (tabular/oldstyle), выровненными или пропорциональными (lining/proportional).
Вот краткий пример различия между стилем oldstyle и lining.

Старостильные цифры выглядят красиво в предложениях, где они лучше соответствуют размеру и интервалу строчных букв, lining более однородны и подходят сетчатой структуре таблицы.
Разница между tabular и propotional не столь очевидна:

Пропорциональные (propotional) цифры предназначены для соответствия цвету — то есть общей калибровке и интервалу шрифта. Табличные (tabular) цифры, с другой стороны, все одинакового размера, так что столбцы чисел выстраиваются правильно. Хотя разница может показаться незначительной в масштабе одной или двух строк, использование tabular позволяет значительно упростить сканирование больших таблиц и снизить вероятность ошибок.

Техническое примечание в использовании tabular

При проектировании вам нужно будет немного поработать, чтобы цифры, которые вы используете, были правильными (tabular обычно не используется по умолчанию). В продуктах Adobe есть панель «opentype», которая может использоваться для правильной установки цифр, а CSS предоставляет слегка критический синтаксис для включения этой функции. Помимо этого, простой поиск в Google поведёт вас по правильному пути.
Но теперь плохие новости: не все шрифты имеют табличное выравнивание tabular. Как правило, те, что имеют, очень дороги. Есть несколько исключений: отличный Work Sans — бесплатный шрифт с табличным выравниванием.
Если вы не можете найти подходящий шрифт, который имеет табличное выравнивание, хорошим отступлением будут моноширинные шрифты – пока они имеют более «исходный код», они всегда будут хорошо подходить для отображения чисел в таблицах. Кроме того, новый шрифт Apple по умолчанию (San Francisco) имеет отличное табличное выравнивание и отлично подходит для небольших размеров.

Вопросы выравнивания

Следуйте этим 3.5 правилам выравнивания:
1. Численные данные выравниваются по правому краю;
2. Текстовые данные выравниваются по левому краю;
3. Заголовки выравниваются так же, как и последующие за ними данные;
3.5 Не используйте выравнивание по центру.

Числовые данные читаются справа налево; то есть мы сравниваем числа, сначала рассматривая их единицы, затем десятки, затем сотни и т. д. Это также, как большинство людей учатся арифметике — начинайте справа и двигайтесь влево, перенося цифры. Таким образом, таблицы должны хранить числовые данные с выравниванием по правому краю.
Текстовые данные читаются слева направо. Сравнение текстовых элементов обычно выполняется путем сортировки в алфавитном порядке: если две записи начинаются с одной буквы, используется вторая буква и т. д. Попытка быстро просмотреть текст может привести в бешенство, если он не выровнен по левому краю.
Заголовки, как правило, должны выравниваться, как и их данные. Это обеспечивает чистоту вертикальных строк таблицы, а также обеспечивает согласованность и контекст.
Выравнивание по центру приводит к тому, что строки таблицы становятся «оборванными», что значительно усложняет поиск записей, часто требуя дополнительных разделителей и графических элементов.

Согласованные цифры после запятой= лучшее выравнивание

Один простой способ корректного выравнивания таблиц состоит в том, чтобы в каждом столбце было одинаковое количество цифр после десятичной запятой. Цифры после запятой — это целая кроличья нора в теме, поэтому я буду кратко излагать здесь свой совет: чем меньше вы рискуете, тем лучше.

Меньше и чище надписи

Предоставление надписей для сопровождения ваших данных имеет решающее значение. Эти части сопровождающего контекста позволяют прочитать таблицу данных более широкой аудитории в более широком круге обстоятельств.

Название

Это может звучать как обычная мудрость, но придание вашей таблице данных четкого и лаконичного названия также важно, как и любое другое дизайнерское решение, которое вы принимаете. При хорошем заголовке таблицы мобильны: их можно использовать в различных контекстах, а также ссылаться на внешние источники.

Единицы измерения

Наиболее общей меткой в таблице являются единицы измерения, они повторяются вместе с каждой ячейкой данных. Вместо повторения метки, просто включите её в первую запись каждого столбца.

Заголовки

Создавайте заголовки как можно короче; дизайн таблицы данных должен быть сфокусирован на самих данных, а длинные заголовки могут занимать много визуального пространства.

Как можно меньше чернил

При принятии решения о стиле графических элементов таблицы, цель всегда должна заключаться в уменьшении площади таблицы без потери структурной точности. Один из способов достичь этого — использовать как можно меньше «чернил», то есть, по возможности, не стилизовать элемент.

Линейки

Если вы верно выровняли ячейки в таблице, линейки становятся излишними. Основное преимущество, которое они предоставляют, заключается в том, что вы можете уменьшить пространство между элементами, но все же сможете различать элементы. Даже при использовании линейки должны быть очень легкими, чтобы не мешать быстрому просмотру.
Горизонтальные линейки являются наиболее полезными, так как они позволяют значительно уменьшить вертикальное пространство, занимаемое длинными таблицами, ускоряя работу по сопоставлению большого количества значений или наблюдению тенденций с течением времени.
Одно необоснованное мое мнение о линейках в том, что стилизация под зебру плохая. Действительно, очень плохо. Либо да, либо нет.

Фоны

Фоны наиболее полезны при указании различий в области данных: например, переключение между одиночными значениями и суммами или средними значениями.
Выделение значений, предоставление дополнительного контекста для данных или указание изменений в значениях из предыдущих периодов могут быть выполнены без фона, используя такие графические элементы, как ✻, † (один из моих любимых) или ▵.
Кроме того, таблицы должны быть монохроматическими. Использование цветов для обеспечения организационного контекста или добавленного значения увеличивает вероятность неправильного толкования или ошибки и приводит к проблемам с юзабилити для людей с нарушенным зрением.

В заключение

Таблицы могут быть скучными. Но они являются таким важным элементом любого богатого данными документа, что они стоят каждой унции дизайнерского мышления, которую мы можем применить к ним. Разрабатывая более эффективные, более четкие и простые в использовании таблицы, вы можете значительно улучшить часто болезненный опыт анализа и понимания больших наборов данных.


Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

Новые Tableau 10, Qlik Sense 3.0 и TIBCO Spotfire 7.6

Пока вы были на летних каникулах, несколько игроков по исследованию данных выпустили новые продукты. Долгожданный Tableau 10 теперь доступен для скачивания. Qlik Sense 3.0 был выпущен в конце июня, а TIBCO Spotfire месяцем ранее. Вот краткий обзор того, что нового для энтузиастов визуализации данных.

Tableau 10 Аналитическая смекалка

Tableau 10 теперь доступен для скачивания. Мои любимые улучшения Tableau 10 находятся в области Google Analytics. С тех пор, как я впервые увидел Tabbie Analytics, анонсированный несколько лет назад, я ждал его появления. В Tableau 10, наконец, вижу, что начинает происходить добавление кластеризации с перетаскиванием. Новый подход смиряет прежний подход R-скриптов.
Кластеризация Tableau использует популярный алгоритм интеллектуального анализа данных, называемый k-средствами, чтобы автоматически идентифицировать связанные записи. Такой вид интеллектуальных кнопок начинает проявляться в основных средствах визуальной аналитики.

Tableau 10 также содержит более сложные вычисления с группами и уровнем детализации выражений. Превосходное удобство для юзабилити было внесено в таблицу расчетов пользователей, а функция маркера для сравнений измерений — абсолютный восторг аналитики. Новые диаграммы Marimekko и предварительный просмотр дизайна для конкретных устройств — фантастические дополнения.

Овации стоя для Cross Database Joins и Cross Data Source Filtering, который способен выполнять фильтры по большинству типов источников данных, как если бы они были единым источником. Это огромное улучшение и самый востребованный запрос. Раньше, чтобы это обойти, вы должны были иметь “Tableau-ready”, сглаживающий ваши данные, чтобы их можно было фильтровать вместе. Теперь вы можете подключаться к разным источникам данных, локальным, гибридным или облачным, а также избегать трудоёмких задач моделирования. Еще один бонус производительности — соединения по требованию, которые запрашивают источник данных только тогда, когда требуется отображать данные.

Говоря об источниках данных, я всегда ценил статистические соединения (SPSS .sav, SAS .sas7bdat, R .rda и .rdata) для совместного анализа с другими ведущими в отрасли инструментами аналитики. Другие интересные коннекторы включают поддержку базы данных SQL Server, Cisco Information Server для современных архитектур виртуализации данных логических хранилищ данных и Google Таблицы.
Другие ценные функции, связанные с предприятием, включают в себя избранные источники обнаружения источников данных и более интеллектуальный поиск, управление версиями в Revision History для рабочих книг и источников данных, множество дополнений API, аутентификацию SAML на конкретных сайтах для регулируемых сред отчетности, упрощение кластеризации, и аутентификацию Kerberos для Oracle. Подписки были расширены, чтобы доставить панели мониторинга другим пользователям — больше нет необходимости запускать сценарий с TabCmd для общего сценария. Отчеты по корпоративному управлению и рекордер производительности Tableau были уже лучшими в своем классе. В Tableau 10 есть связанные с использованием визуальных источников данных и менее захватывающие отчёты о лицензиях.
В целом, Tableau 10 уже получает теплый прием на рынке. Финансовые аналитики, за которыми я слежу, сообщают о более высокой конкуренции и необходимости для Tableau повышать продажи уровня предприятия, но win-rates по-прежнему высоки. Одна из крупных компаний по управлению портфелем проектов отметила в своих исследованиях, что бизнес все еще уважает Tableau, в то время как профессионалы BI и ИТ в большой степени добиваются мега-вендоров.
Я бы хотел видеть больше инноваций от Tableau. Поскольку я был в восторге от демо-версии Kraken v8 key note, мои ожидания всегда были высоки. Что случилось с инфографическим приобретением или супер-классным машинным обучением Dato? Я вижу потенциал для Tableau расшириться и дифференцироваться даже на жёстком рынке. Поскольку мега-вендоры отвлекаются на более крупные облачные сражения, фокус ниши в Tableau может стать сильной стороной, если они инвестируют в нужные места и будут стремительно развиваться.
Для информации о новых деталях в Tableau 10 посетите официальный блог, небольшой сайт или онлайн-документацию.

Qlik Sense 3.0 Особенности подготовки данных в виде пузырей

Ранее этим летом был дебют Qlik Sense 3.0. Несмотря на то, что он не такой большой, как Tableau 10, у него есть ряд улучшений, которые я выделил. Если вы хотите получить более подробный обзор, посмотрите короткое видео Qlik Sense 3.0 и посмотрите официальное резюме.

Самая популярная возможность в Qlik Sense 3.0 — это уникальный «пузыристый» подход к визуальной подготовке данных, который профилирует данные и автоматически связывает их. Посмотрите на сайте Paxata — вы не единственные, кто нарушает подготовку данных с помощью интуитивных визуальных подходов.

Qlik Sense 3.0 также имеет творческую возможность Умного Поиска для нахождения опубликованных диаграмм. Были добавлены более 10 популярных источников данных, включая Twitter, Facebook, YouTube, MailChimp, SugarCRM, Google AdWords и REST connector, который предоставляет доступ к JSON, XML и CSV файлам для предоставления проектов в API. NPrinting для распространения отчетов — впечатляющая функция. Другие новые функции включают в себя стилизацию приложения, виджеты и графики с учетом времени.

Из того, что я могу сказать, недавняя покупка Thoma Bravo не затронула Qlik так сильно, как предполагал. Последнее ежеквартальное обновление превзошло ожидания, несмотря на интенсивную конкуренцию, решения QlikView / Qlik Sense и отсутствие полного паритета функций между двумя предложениями. Партнёр и сторона бизнеса OEM Qlik кажутся процветающими.
Дополнительные материалы о функциях Qlik Sense 3.0 можно посмотреть в видео и онлайн-документации на сайте Qlik Community.

Найдите отличия в Spotfire 7.6

Последнее, но не менее важное — TIBCO Spotfire выпустили впечатляющую версию 7.6.
Ознакомьте с полным списком нововведений. Здесь же представлены основные из них.
Была добавлена диаграмма Waterfall вместе с новыми диаграммами KPI. Перекрестные таблицы отредактированы более элегантно. Интересный флажок был добавлен в раскрывающийся список фильтров. Улучшены бокс-эффекты и Tile Map Services украшают параметры отображения/ощущения.

Говоря о картах, было добавлено автоматическое масштабирование и удивительная возможность выбора радиуса. Это моя любимая функция Spotfire. Используя выделение Rectangle или Lasso, пользователи теперь могут помечать данные вокруг местоположения на карте.

Другое великолепное улучшение — Source View для понимания данных таблицы и функциональных отношениях. Подобно другим вендорам исследования данных, теперь доступно больше функций по подготовке данных , включая splitting и unpivoting. Большая победа: в Spotfire 7.6 добавлена поддержка комбинированных связанных и сохраненных данных в одной таблице данных с гранулированными опциями обновления.

Spotfire 7.6 также добавил коннекторы данных для Salesforce, Google Analytics и SAP BW 7.4 вместе с расширенными параметрами подключения и хранимыми процедурами во многих других коннекторах, включая Amazon Redshift, Hortonworks, SQL Server, Oracle, MySQL, Pivotal Greenplum, HAWQ, PostgreSQL и Teradata.
Чтобы продемонстрировать Spotfire на веб-сайте, посмотрите, как внедрить видео в облако Spotfire. Хотя визуальные эффекты Spotfire не так просты для встраивания, как другие предложения, нетрудно скопировать URL и скрипты в HTML.
Когда дело доходит до Smart Data Discovery и помещения прогнозирующей аналитики в пользовательский интерфейс, Spotfire является пионером в статистических службах, TERR и интеллектуального моделирования. Несмотря на то, что Spotfire не получает столько же освещения в СМИ, как другие поставщики, работающие с аналитикой данных, они действительно значительно продвинулись вперед в работе с любым клиентом. Я заметил, что они добавили обновленный сайт сообщества и множество других ресурсов, которых не было два года назад. Покупка в 2014 году компанией Vista Equity, по-видимому, приносит им пользу.
Для дополнительной информации о Spotfire посетите веб-сайт TIBCO, список ссылок, другие источники, библиотеку YouTube и онлайн-документацию.

Найти решение у бизнес-партнера QlikTech (QlikView) в России.

Форум разработчиков QlikView и Qlik Sense. Получите ответы на все вопросы по QlikView и Qlik Sense!

104 queries in 0,442 seconds