ВИЗУАЛИЗАЦИЯ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ
ВИЗУАЛИЗАЦИЯ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ
ВИЗУАЛИЗАЦИЯ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ
ИНФОРМАЦИОННО-СЕТЕВЫЕ ТЕХНОЛОГИИ
УДК 330.43
Н. В. Богословская*
кандидат технических наук, доцент
А. В. Бржезовский*
кандидат технических наук, доцент
*Санкт-Петербургский государственный университет аэрокосмического приборостроения
N. V. Bogoslovskaia*
PhD, Tech., Associate Professor
A. V. Brzhezovskiy*
PhD, Tech., AssociateProfessor
*St. Petersburg State University of Aerospace Instrumentation
VISUALIZATIONFORDATAINTERPRETATION
WHEN USING ANALYTICAL PACKAGES
The necessity and possibility of joint use of visualization tools presented in professional specialized packages
and custom office programs are considered and demonstrated on practical examples. The problem is considered
in connection with the study of the discipline “Business Analytics “for students of 09.03.02(06) “Information sys-
tems and technologies in business”.
Keywords: analytical data processing, visualization methods, interpretation of analysis results.
Сложные аналитические процедуры обра- ма или модели, является входной для следую-
ботки информации, выполняемые специали- щего узла обработки или анализа. Очевидно,
зированными прикладными программами, яв- что данные, полученные при окончании оче-
ляются многошаговыми технологиями. Это редного этапа обработки, должны быть кор-
значит, что в процессе анализа к данным по- ректными, иначе дальнейшее их использова-
следовательно применяются многочисленные ние теряет смысл. Исходя из важности контро-
алгоритмы и модели, реализованные в анали- ля данных на выходе каждого алгоритма обра-
тических платформах функциями, компонен- ботки, в сценарии обработки данных необхо-
тами, сервисами, пакетами. Например, любые димо предусмотреть визуализацию промежу-
данные сначала должны пройти этап предпод- точных результатов.
готовки: консолидацию из различных источ- Цели и задачи визуализации на разных эта-
ников, трансформацию, очистку, нормализа- пах аналитического процесса показаны на
цию, сверку со справочниками и так далее. рис. 1.
Подготовленные данные могут быть использо- • Визуализация источников данных позво-
ваны в технологии DataMining: при построе- ляет определить метод загрузки данных в ана-
нии ассоциативных правил, формировании литическое приложение и параметры, которые
кластеров, классификации и регрессии, ма- при этом должны быть использованы.
шинном обучении и т. д. При этом выборка, • По результатам визуального анализа исход-
сформированная на выходе каждого алгорит- ной выборки делаются выводы о целесообразно-
сти применения тех или иных видов очистки и стями и характером данных, категорией зада-
трансформации данных, вырабатывается мето- чи, предпочтениями пользователя. Все пере-
дика и стратегия их анализа. численные аспекты выбора могут быть скор-
• Визуализация результатов предобработки ректированы возможностями программных
позволяет проверить результаты предобработ- средств, с помощью которых бизнес-анализ
ки, оценить готовность данных к анализу. был выполнен.
• Визуализация промежуточных результа- Различают следующие классификации мето-
тов анализа позволяет выполнить проверку кор- дов визуализации: таблицы и графики; одно-
ректности моделей и контроль правильности ре- мерные и многомерные визуализаторы; визуа-
зультатов. лизаторы общего назначения и специализиро-
• Визуализация результатов анализа – осно- ванные. Предметом исследования в докладе яв-
ва для интерпретации результатов и оценки до- ляются визуализаторы общего назначения, как
стоверности результатов. средства, которые обязательно включаются в
Результат аналитической обработки не всег- состав любой аналитической платформы – спе-
да дает окончательный ответ на вопросы, кото- циализированного программного обеспечения
рые интересуют лицо, принимающее решения. (ПО), а также имеются в офисных интегриро-
Процесс анализа позволяет выполнить преобра- ванных пакетах – программном обеспечении об-
зование данных к виду, позволяющему «до- щего прикладного назначения. К визуализато-
быть» нечто важное с точки зрения исследова- рам общего назначения относятся: графики, ди-
ния объекта или процесса. А дальше необходи- аграммы, кубы, гистограммы, статистика [2].
мо выполнить интерпретацию результатов и Цель исследования – продемонстрировать на
этот процесс может оказаться не менее сложной практических примерах необходимость и воз-
ипроблемной задачей, чем сам анализ. можность совместного использования механиз-
Неправильная интерпретация может не мов визуализации, представленных в професси-
только обесценить самые удачные результаты ональном специализированном ПО и ПО офис-
анализа, но и привести к ложным выводам и за- ного класса.
ключениям, что повлечет за собой неверныеу- Рассмотрим многочисленную категорию за-
правленческие решения. Именно поэтому в биз- дач анализа «изменений», например: измене-
нес-аналитике так много внимания уделяется ние уровня доходов и продолжительности жиз-
визуализации результатов анализа, позволяю- ни для разных стран за последние два года; из-
щей сделать их интерпретацию как можно бо- менение количества клиентов и среднего чека в
лее эффективной и свести к минимуму возмож- магазине; соотношение стоимости компании и
ность ошибочных выводов [1]. количества сотрудников в ней. Анализ может
В современной бизнес-аналитике использу- быть выполнен различными механизмами или
ются десятки методов визуализации. Выбор моделями, но визуализация результатов, в лю-
метода определяется, прежде всего, особенно- бом случае, требует наглядной демонстрации
состояния «до», состояния «после» и, что осо- [3]. На рис. 4 показан пример интерпретации ре-
бенно важно, «насколько и в какую сторону со- зультатов анализа, экспортированного из
стояние изменилось». Loginom в Excel.
Предположим, что требуется выполнить ана- Для импортированных данных в Excel мож-
лиз плановых и фактических показателей дея- но продолжить визуализацию динамики изме-
тельности компании за два последних года. Ре- нений и, например, наглядно продемонстриро-
зультаты могут быть получены с помощью сце- вать отклонения план-факт. Для этого требует-
нария, приведенного на рис. 1. ся добавить дополнительный столбец с вычисле-
Средства визуализации Loginom позволяют нием отклонения фактических показателей от
показать динамику изменений исследуемых плановых (рис. 5) и построить наглядный гра-
показателей, но интерпретация результатов с фик динамики отклонений.
помощью диаграммы на рис. 2 проблематична, Развитые средства визуализации являются
так как график строится без нарастающего обязательным компонентом аналитических
итога. платформ любого класса.
Подсистемы визуализации данных имеются Например, Loginom располагает обширным
не только в специализированных аналитиче- списком визуализаторов [4]:
ских платформах, но и практически во всех про- 1. Общие визуализаторы: круговые и линей-
граммных средах, связанных с обработкой дан- ные диаграммы, гистограммы и спектрограм-
ных – от офисных приложений до систем ком- мы, таблицы и различные точечные графики.
пьютерной математики. 2. Специальные визуализаторы: карты и по-
Несомненно, что в аналитических платфор- лярные графики, графики с параллельными
мах средствам визуализации уделяют особое осями, диаграммы Эйлера и др.
внимание, так как визуализация является со- 3. Визуализаторы концепций: демонстрация
ставной частью аналитического процесса. На сложных концепций, идей и планов с помощью
рис. 3 показан представительный список визуа- концептуальных карт, диаграмм Ганта, графов
лизаторов Loginom. с минимальным путем и других подобных видов
Табличный процессор MSExcel не может кон- диаграмм.
курировать с аналитическими платформами по 4. Стратегические визуализаторы: диаграм-
обработке данных, но имеет интересные и по- мы производительности, диаграммы жизненно-
лезные графические средства их представления го цикла и графики структур организаций.