Обзор Microsoft Power BI функции и преимущества

Занимаясь анализом данных я часто сталкивался с проблемой выбора программы в которой можно было объединить все необходимые функции. Обычно,  расчеты приходилась делать в одной, моделировать и прогнозировать в другой, а визуализацию в третьей. При этом хранить данные во всех трех и постоянно переключаться между ними. Это совсем неудобно и занимает много времени. Например, если нужно обновить данные, то делать это последовательно во всех трех программах по очереди. Это занимало много времени. 

Описание проблемы

     Общаясь со специалистами в своей отрасли можно часто услышать, что сбор, очистка и систематизация занимает большую часть времени. На анализ полученных результатов не остается сил. В моем случае на первоначальный сбор, упорядочивание и дальнейшее поддержание в актуальном состоянии уходило до 80% времени, а на сам анализ полученных результатов - 20%. 

Я постоянно находился в поисках такого продукта который смог бы решить все эти проблемы и при этом не был сложным в освоении. Изначально основной программой был Excel, но вскоре стало понятно, что не все задачи можно здесь реализовать. Это даже не смотря на то, что за последнии годы он сильно продвинулся от простых таблиц к более широкому функционалу. Основное преимущество Экселя, на мой взгляд - это простота в использовании в сравнении с тем какие задачи он может решить. Если у Вас небольшой набор данных и не слишком сложный проект - это идеальное приложение, которым можно подсчитать результаты и сделать визуализацию. 

Когда проект сложный, где уже могут присутствовать несколько пользователей, моделирование, статистика и интерактивная визуализация, здесь возникают трудности. Как раз это заставило меня обратиться к другим продуктам. Я начал изучать язык программирования R для моделирования и статистики. Пользовался  R Studio для построения визуализаций. Не могу себя назвать себя гуру программирования, но все же кое-каких результатов удалось достичь. Но опять таки, здесь я столкнулся с узкоспециализированной программой, заточенной больше под Data Science, чем под аналитику бизнеса. Я же больше занимался моделированием бизнес процессов.

Искал что то простое в понимании, например как эксель, но в тоже время способное решать сложные задачи по моделированию различных ситуаций в бизнесе и создавать интерактивные визуальные результаты этих расчетов. И как я был удивлен, когда узнал, что такое решение существует! И вы не поверите, это продукт компании Microsoft,  и при этом так и называется - Power Business Intelligence (мощность бизнес-аналитики) сокращенно Microsoft Power BI. Это комплексное решение для бизнес-аналитики.

Продукт молодой и берет свою историю с 2015 года. Вот почему о нем я узнал только в начале 2020 года. Первоначально Power BI создавался как web и был ориентирован на ограниченное количество аналитиков и исследователей данных. Но в 2017 года, выпустила версию Power BI Desktop, которая позволила создавать и публиковать разработанные BI-отчеты локально.  

Что такое Microsoft Power BI

Power BI это частично бесплатное решение для бизнес-аналитики. Главной особенностью которого является простое и интуитивное построение отчетов. Когда Вы пытаетесь провести какой-то анализ, обычно идете по следующему пути. Собираете данные, проводите расчеты, анализируете результаты и представляете результат в виде отчета. Как я уже писал выше можно настолько сильно погрузиться в сбор и очистку данных, что на сам отчет уже не остается ни времени ни сил.

В Power BI, все построено по другому. Здесь мы как бы идем от обратного, от отчета. Он здесь называется Dashboard (приборная доска). Мы представляем сначала то, что хотим получить и постепенно спускаемся ниже для решения задачи. Раньше я пытался сделать все наоборот, сначала занимался деталями, на которые уходило много времени и постепенно двигался к самому отчету, зачастую даже не понимая как он должен выглядеть в конечном варианте.

Сам Power BI это комплексное программное приложение, которое включает различные модули и помогает решать самые разнообразные задачи, начиная от загрузки данных из различных источников, преобразование и создание интерактивных отчетов.
Состоит из следующих продуктов:

  • Power BI Desktop  - локальная версия рассчитана на одного пользователя и под операционную систему Windows. Часто если говорят о программе имеют ввиду именно Desktop версию. 
  • Power BI Mobile  - это мобильная версия приложения, которая работает как на Android, так и iOS.
  • Power BI Report Server  - сервис для публикации отчетов с web-интерфейсом.
  • Power BI Embedded  - специальные дополнения Power BI для работы в Azure.
  • Дополнительные сервисы для работы с данными, такие как Power BI Services и Шлюзы.

Если простыми словами, для создания отчетов используется Power BI Desktop или же аналогичный web-интерфейс. Если используете только для себя, то можно использовать бесплатную версию, но как только возникнет необходимость поделиться отчетом, то уже понадобиться лицензия. Стоимость разная в зависимости от потребностей и стартует Power BI Pro от 10$ на одного пользователя.

Какие предоставляет возможности

Возможности продукта достаточно широкие и в основном заточены на анализ данных и построение отчетов. Среди многообразия функций выделить хочу следующие:

Импорт данных. В программе присутствует большое многообразие источников из которых можно получить данные. Начиная от Excel, SQL базы и заканчивая облачными решениями Azure. Но самое главное, что пользователю доступны широкие возможности обработке данных, еще до загрузке. Это можно сделать с помощью запросов и встроенного языка M. Встроенный модуль Power Query M, который успешно перекочевал из Excel, позволит с легкость справиться даже со сложными задачами импорта данных. 

Построение дашбордов и визуализация. Это основная фишка, за которую я полюбил этот продукт. Интуитивно понятное построение отчетов. Присутствует стандартный набор инструментов для построения различных визуализаций. У каждого из которых присутствует дополнительные тонкие настройки. Кроме стандартных, можно загружать дополнительные визуальные элементы, что может удовлетворить самые изысканные потребности.

Работа с данными и вычисления. Для работы с данными в Power BI используется язык функций и формул DAX (Data Analysis Expressions). Очень похож на Excel, поэтому не стоит его боятся. Через несколько месяцев практики можно спокойно писать формулы. По крайней мере у меня ушло столько времени, чтобы понять логику самого языка. Сам редактор, простенький, но удобный, многое получается интуитивно. Упор сделан на создание запросов к исходной модели данных, из которой берутся необходимые отфильтрованные данные и производятся с ними вычисления.

Публикация данных. Все отчеты получаются “живыми”. Это означает, что конечный пользователь постоянно взаимодействует с данными, меняя временной период, номенклатуру или другие фильтры и при этом происходит перестроение всех дашбордов в соответствии с запросом. Отчеты получаются интерактивными, а пользователь самостоятельно может посмотреть интересующий его набор данных.

Администрирование. Есть возможность настраивать различные уровни доступа и создавать группы пользователей. И изюминкой на торте является использование элементов искусственного интеллекта при взаимодействии с пользователем отчета.

Как видно, возможности действительно достаточно широкие и не ограничены только расчетами или визуализацией. Они в комплексе охватывают все задачи которые могут возникнуть у аналитика данных. Power BI позволяет в минимальные сроки получить получить приемлемый результат.

Описание интерфейса

Интерфейс имеет  классический стиль продуктов Microsoft. Многие вещи воспринимаются интуитивно. Обновления выходят примерно один раз в месяц, которые с каждым разом улучшают юзабилити интерфейса.

После запуска  Microsoft Power BI Desktop вы можете увидеть следующие элементы:

  • Холст. Самая большая по размерам часть страницы отчета белого цвета. Она служит для построения визуальных представлений отчетов.
  • Три раскрывающиеся панели. Расположены с правой стороны от холста. 
  1. Фильтры
  2. Визуализации
  3. Поля

Это очень удобно, учитывая основные задачи, которые приходиться решать в  процессе работы.

  • Вкладки. Нижняя часть окна напоминает Excel и здесь отображаются страницы. Добавление новой возможно по нажатию на кнопку “+”.  Правой кнопкой можно вызвать контекстное меню.
  • Основной рабочий элемент, как и во всех продуктах Microsoft - это лента. Здесь расположены основные вкладки и кнопки. Состоит из: Файл, Главная, Вставка, Моделирование, Представление и Справка.

Файл. Предназначена для работы с файлами и включает в себя следующие функции: Создать, Открыть, Сохранить, Получить данные, Импортировать и Экспортировать. Также здесь находиться кнопка - Параметры и Настройки, в которой собраны настройки самой программы и кнопка Начало работы с инструкциями по работе (блог, форумы, учебники).

Главная. Состоит из нескольких секций в каждую из которых включены соответствующие кнопки. Название секций можно увидеть внизу ленты - Буфер обмена, Данные, Запросы, Вставка, Вычисления, Конфиденциальность, Поделиться. 

Вставка. Здесь все, что относиться к добавлению. Состоит из: Страницы, Визуальные элементы, Визуализации ИИ, Power Platform, Элементы.

Моделирование. Все что связано с моделью данных. Связи, Вычисления, Обновление страницы, What If, Безопасность, Вопросы и Ответы.

Представление. Все что относиться к визуальной части. Темы, Масштабирование по содержимому, Мобильное устройство, Параметры страницы и Показать панели.

Справка. Сведения, Справка, Сообщество, Ресурсы.

Вышеперечисленные вкладки являются базовыми. Сама лента является адаптивной. Это означает, что в зависимости от того какой элемент выделен на холсте могут быть доступны новые вкладки.

  • Последний элемент на котором хочу остановиться это три небольшие кнопки с левой стороны холста. Это переключатели представлений: 

Отчет (по умолчанию). Это та часть где мы строим сам отчет. Тот самый холст который вы видите, когда только открываете программу. На него впоследствии будут добавлены различные элементы из которых в конечном итоге получится отчет.

Данные. Здесь можно посмотреть какие данные загружены и выполнять элементарные операции по просмотру (фильтр, сортировка и поиск). Это удобно для быстрого исследования данных.

Модель. Используется для управлениями связями между таблицами загруженными в модель. Это представление больше направлено на моделирование данных. Также здесь можно создавать частные диаграммы модели данных. 

Примеры отчетов

На сайте Microsoft посвященном Power BI в разделе документации есть примеры отчетов. Сами отчеты можно загрузить для ознакомления. Я хочу прокомментировать один из них с точки зрения возможностей Power BI. Он называется: “Управление персоналом”. Для ознакомления и лучшего понимания советую скачать его и открыть с помощью программы.

В этом примере рассматривается стратегия найма, путем анализа новых сотрудников, действующих сотрудников и сотрудников, которые покинули организацию. В процессе изучения данных можно определить тенденции добровольных уходов и дисбаланса в стратегии найма. Есть описание как загрузить их Power BI.

После загрузки отчета, видим что он состоит из пяти вкладок: Информация (Info), Новые сотрудники (New Hires), Активные и уволенные (Actives and Separations), Несоответствующие сотрудники (Bad Hires) и Оценочная карта новых сотрудников (New Hires Scorecard). На каждом из листов можно познакомиться с различными типами визуализаций. 

Например на графике и гистограмме с накоплением Новые и активные сотрудники по регионам и этнической принадлежности (New Hires and Active by Region and Ethnicity) хорошо видно как работает анализ по разным иерархиям.

Изначально, гистограмма показывает распределение по региону, но если воспользоваться кнопками: Перейти на следующий уровень иерархии или Развернуть все на один уровень вниз в иерархии, можно увидеть соответствующее распределение на одном графике. Это очень удобно, для анализа и такого я не встречал ни в Excel  или других программах.

Посмотреть саму модель данных можно на соответствующей кнопке слева. Здесь видно все загруженные таблицы  и их взаимосвязи. На стрелках, которые идут от таблице к таблице  можно увидеть какой тип связи используется какое влияние оказывают друг на друга. В нашем примере Gender связана с Employee связью один (1) ко многим (*) и это означает, множеству значений Employee может соответствовать единственное значение Gender. Это своего рода фильтр таблицы Employee по таблице Gender. Треугольник указывает направление связи, то есть  Gender оказывает влияние на Employee.

Модель данных помогает увидеть структуру и взаимосвязь данных и для аналитика такая систематизация является основой для построения будущих отчетов. В модели из примеров видно, что есть основная таблица данных Employee, все остальные связаны с ней через различные ключи (столбцы с одинаковыми значениями в обеих таблицах). Таблицу Employee называют транзакционной, а остальные таблицы справочниками. Это один из самых распространенных видов модели организации данных и называется - “Звезда”. Правильно построенная модель это целое искусство и залог хорошего отчета!

Заключение

Постарался максимально просто познакомить Вас с таким мощным программным продуктом как Microsoft Power BI. Надеюсь статья станет толчком для дальнейшего и более детального изучения программы. Считаю, что она является незаменимым инструментом любого аналитика. Конечно же в одной статье не расскажешь обо всех возможностях, которые открывает Power BI, поэтому в дальнейшем планирую написание цикла посвященного этой теме.

Если из моей статьи Вы смогли получить новую информацию, о том с помощью каких инструментов можно легко работать с данными, то поделитесь ссылкой на нее среди своих друзей в социальных сетях. Подписывайтесь на мой блог, чтобы не пропустить новые публикации. Буду рад ответить на  вопросы в комментариях.

Всех благ!

Нет комментариев

Оставить комментарий

Отправить комментарий Отменить

Сообщение