Business Intelligence (BI) системы для бизнес-анализа. Разница между Business Intelligence и Data Science Архитектура bi системы

  • Перевод

Пытаясь оценить различные BI платформы часто сложно понять, где миф, а где правда, поскольку каждый вендор позиционирует свой продукт, как “лучший на рынке”, приводя в качестве аргумента сотни субъективных обзоров, заполонивших Интернет. Если же вы хотите разобраться, какой инструмент подходит именно вашей компании, не пролистывая сотни страниц “честных” мнений, то ниже будет то, что нужно.

Мы рассмотрим наиболее популярные платформы, такие как QlikView, Klipfolio, Tableau и Power BI, и сравним их ключевые параметры: удобство использования, цену, легкость установки, поддержку, работу с различными типами данных и многое другое. Итак, вперед!

Все это, вместе или по отдельности, открывает огромные возможности для анализа различных метрик, создания и настройки уникальных визуализаций, чтобы в итоге извлекать полезную информацию для бизнеса из любых данных.

Также в платформе был сделан упор на совместимость с различными девайсами, от смартфонов и планшетов до Smart TV в конференц-залах.

Особенности

Лучше всего Klipfolio подходит для мониторинга и контроля в реальном времени непрерывных потоков данных, когда важна их динамика, и нужно быстро принимать важные решения.

Ключевые характеристики

  • Интеграция различных источников данных в один отчет.
  • Неограниченное количество потенциально подключенных пользователей.
  • Управление правами и ограничениями доступа к важной информации.
  • Доступность на мобильных ОС (iOS, Android, BlackBerry, Windows).
  • Гибкий REST коннектор для подключения специальных источников данных.
  • Поддержка форматов Excel, CSV, JSON, XML и др.
  • Возможность добавить удобные аннотации к отчетам, которые будут видны конечным пользователям.
  • Автоматическая система настройки KPI.
  • Возможность легко добавить пороговые индикаторы к графикам.

Удобство использования

В Klipfolio можно строить десятки различных типов графиков, включая круговые, гистограммы, диаграммы областей и еще множество различных комбинаций. Также, пользователь, владеющий HTML и CSS может создавать собственные, неповторимые визуализации, накладывая все необходимые компоненты на дашборд через WYSIWYG редактор, а более сложные элементы графиков можно добавить с помощью различных формул и функций. Таким образом, с помощью Klipfolio можно представить информацию практически в любом виде, однако сперва нужно подумать о том, как подготовить данные.

Цена

Являясь одним из самых старых игроков в BI отрасли с огромным опытом, сегодня Klipfolio делает ставку на свои облачные решения. Klipfolio Dashboard (в качестве SaaS) предлагается по цене за пользователя, начинающейся (с некоторыми вариациями) с 19$/месяц. Этот план можно подстроить под себя и добавить дополнительные опции. Также возможен и 14-дневный пробный период.

Tableau


Еще одна крупная платформа - это Tableau . Как и большинство BI инструментов, Tableau специализируется на анализе данных через их визуализацию. В нем легко создавать интерактивные дашборды, которые позволяют изучить динамику, тренды и структуру данных, с помощью удобных и простых, но не менее эффективных графиков.

Как и многие другие сервисы, Tableau поддерживает множество разных источников данных, организованных в формате файлов (CSV, JSON, XML, MS Excel и др.), реляционных и нереляционных БД (PostgreSQL, MySQL, SQL Server, MongoDB и др.) и облачных систем (AWS, Oracle Cloud, Google BigQuery, Microsoft Azure).

Ключевое отличие Tableau от конкурентов заключается в его особой функции - смешивании данных - комбинировании данных из разных БД и источников. Также Tableau позволяет нескольким пользователям одновременно работать над отчетом в реальном времени. Еще, в платформе реализовано несколько способов того, как можно делиться отчетами: 1) публикуя их на сервере Tableau; 2) через e-mail Tableau Reader; 3) через доступ по ссылке. Такое разнообразие добавляет гибкости и снимает многие ограничения.

Отличительные особенности

Tableau обладает широчайшими возможностями визуализации: богатая библиотека платформы включает в себя облака слов, пузырьковые и древовидные диаграммы, которые позволяют достигнуть более высокого уровня понимания своих данных и их контекста.

Как уже было сказано, дашборды Tableau чрезвычайно гибки. Основные функции сервиса позволяют невероятным образом размещать элементы на дашборде и совмещать и накладывать их друг на друга любым образом, что очень полезно в эпоху эргономики рабочего места.

Tableau довольно дружелюбен для начинающих пользователей, платформа направлена на тех, кто до этого еще не вдавался в технические детали процесса визуализации. Эта цель достигается за счет интуитивно понятного интерфейса: все необходимое чаще всего достигается не больше, чем за 2 клика мышкой, фильтры найти легко, а все операции понятно задокументированы.

С Tableau легко работать не только с точки зрения разработки и создания отчетов, но и со стороны конечного пользователя - менеджмента. Дополнительные фильтры, создание новых параметров, простая и понятная интерактивность данных - все это значительно ускоряет принятие решений и делает их более эффективными.

Ключевые характеристики

  • Отличные возможности для распространения отчетов и дашбордов.
  • Поддержка более 30 типов данных.
  • Смешивание данных из разных источников.
  • Интеграция с R.
  • Самое активное сообщество пользователей, которые создают тысячи обучающих видео, блогов и форумов.

Удобство использования

Потрясающее удобство и легкость использования - главная причина, почему Tableau считают одним из самых простых для освоения BI сервисов, а лучше всего он себя проявляет при анализе структурированной информации. Импортировать данные, строить красивые графики, делиться ими и публиковать их в открытом доступе - ни одна другая платформа не может обеспечить пользователей настолько широкими возможностями при такой простоте. Более того, огромное количество различных руководств и гайдов практически обнуляет вероятность столкнуться с какими-либо трудностями.

Цена

Tableau имеет 3 различных продукта с тремя различными ценами: Tableau Desktop, Tableau Online и Tableau Server. Детальную информацию можно найти .

Tableau Desktop предназначен для отдельных пользователей и стоит 999$ в год за человека и 1,999$ для корпоративного пользования, включая поддержку. В первом случае предполагается подключение до 6 источников данных, а во втором - до 44.

Tableau Online - это облачная платформа с веб-интерфейсом, которую можно использовать бесплатно, но при условии, что все решения будут храниться на общем сервере и будут опубликованы в открытом доступе. Приватная же версия стоит 500$ в год за одного пользователя.

Наконец, Tableau Server - это монолитный бизнес-инструмент для компаний, которые управляют своими серверами и хотят иметь полный контроль над потоками данных и их безопасностью. Однако стоить такое удовольствие будет 10,000$ в год за 10 пользователей, а поддержка обойдется в дополнительные 25% от этой суммы.

Power BI


Power BI - это онлайн-сервис, разработанный Microsoft для бизнес-аналитики с возможностью подключения различных источников данных и сторонних приложений. Платформа обладает веб-интерфейсом, позволяющим создавать кастомизированные визуализации, а с помощью настольного приложения можно проводить стандартизацию и очистку данных. Интересно, что существует также и мобильная версия Power BI, доступная на различных ОС, чтобы принимать решения на ходу.

Power BI прост и минималистичен, но в то же время обладает мощью и стабильностью. Как и любое другое ПО, у него есть как плюсы, так и минусы.

Отличительные особенности

Что отличает Power BI от других решений?

Во-первых, это продукт Microsoft, а значит он следует философии, принципам и архитектуре, схожими с другими продуктами IT-гиганта. Интерфейс программы будет хорошо знаком пользователям Windows.

Во-вторых, принадлежность к Microsoft дает и другое преимущество: Power BI тесно связан с главными продуктами компании, такими как MS Excel, Azure Cloud Service и SQL Server.

Вообще говоря, Power BI был создан с целью расширить функциональность MS Excel и прокачать его до нового уровня и использовать при решении задач, в которых он ранее не был задействован.

Ключевые характеристики

  • Есть бесплатная базовая версия, позволяющая сначала попробовать поработать с Power BI.
  • Поддерживает множество способов импорта данных (потоковые данные, облачные сервисы, книги Excel и сторонние приложения).
  • Интерактивные дашборды с изменением данных в реальном времени.
  • Простое API для интеграции Power BI в ваши приложения.
  • Делиться отчетами и дашбордами можно несколькими разными способами.
  • Поддержка нескольких платформ (Веб-, настольное или мобильное приложение).

Удобство использования

Интерфейс прост и будет понятен всем, кто знаком с Windows (то есть почти каждому), поэтому работать с Power BI обычно приятно. Множество кнопок и функций выглядят похоже на MS Excel и другие продукты MS Office.

Визуализации же создаются старым добрым способом drag-and-drop. Все, что вам нужно для создания какого-либо графика - нажать на необходимый элемент и перетащить его на пустое место в отчете. Тот же принцип работает и при выборе того, какие данные необходимо визуализировать - просто выделите кусок данных и поместите его на то место, где находится график.

Цена

Microsoft Power BI считается качественным инструментом бизнес-аналитики, многих привлекает и достаточно демократичная ценовая политика. В нее входят два варианта: бесплатная версия сервиса с ограниченными возможностями и корпоративная лицензия Power BI Pro с полным спектром функций.

Бесплатная версия доступна для любого отдельного пользователя и обладает следующими характеристиками: лимит памяти в 1 Гб, скорость обработки потоковых данных 10,000 строк/час вместе с ограничениями на обновление и совместную работу над отчетами.

Power BI Pro стоит 9,99$ за одного пользователя в месяц и увеличивает лимит памяти до 10 Гб на человека вместе со скоростью в 1 млн строк/час. Также появляется возможность доступа к источникам данных напрямую, связывая их с данными компаниями через Data Connectivity Gateway. Наконец, становятся доступными продвинутые инструменты совместной работы, такие как Office 365 Groups, Active Directory groups и каталог данных.

Теперь, чтобы структурировать все, что было сказано выше, приведем сравнительную таблицу всех рассмотренных платформ:

Теги: Добавить метки

Аналитический обзор: BI в России 2009

Аналитики центра TAdviser завершили подготовку открытого обзора рынка платформ для бизнес-анализа (BI), представленных на российском рынке. На этой странице Вы можете прочитать наиболее интересные разделы обзора.

Преимущества использования BI-системы

Системы для бизнес-анализа решают очень широкий спектр задач. Так, «ближним горизонтом» является мониторинг, анализ и корректировка оперативных целей:

    поддержка развития бизнес-процессов и структурных изменений предприятия;

    возможность моделирования различных бизнес-ситуаций в единой информационной среде;

    проведение оперативного анализа по нестандартным запросам;

    снижение рутинной нагрузки на персонал и высвобождение времени для более глубокой аналитической работы;

    устойчивая работа при увеличении объема обрабатываемой информации, возможность масштабирования.

В части поддержки стратегического развития предприятия BI-системы обеспечивают:

    оценку эффективности различных направлений бизнеса;

    оценку достижимости поставленных целей;

    оценку эффективности использования ресурсов, в том числе дочерними предприятиями;

    оценку эффективности операционной, инвестиционной и финансовой деятельности;

    бизнес-моделирование и оценку инвестиционных проектов;

    управление затратами, налоговое планирование, планирование капитальных вложений.

На сегодняшний день, по оценкам экспертов из Gartner, с BI-приложениями активно работают только 15-20% бизнес-пользователей, остальные же считают системы для бизнес-анализа чересчур сложными для использования. Однако активное развитие средств для интерактивной визуализации данных и дальнейшее распространение интернет-технологий должны будут в скором времени улучшить ситуацию.

По мнению аналитиков компании MiPro Consulting, внедрение в организации самостоятельной BI-системы обеспечивает целый ряд преимуществ перед использованием аналитических инструментов, встроенных в другие корпоративные информационные системы. Среди таких преимуществ BI-системы:

    большая наглядность и удобство работы с информацией для бизнес-пользователей, в том числе из числа топ-менеджмента;

    возможность использования несколько аналитических решений для различных направлений деятельности в масштабах всего предприятия, а не в рамках отдельных подразделений;

    позволяет извлекать, анализировать и консолидировать данные практически из любых источников;

    базируется на промышленной, поддерживаемой и развиваемой BI-платформе;

    имеет статус самостоятельного, стратегического, критически важного для бизнеса приложения;

    обеспечивает необходимую масштабируемость, эффективность, производительность;

    позволяет выстраивать и поддерживать в масштабах всей организации сквозные процедуры и процессы обработки, единые централизованные аналитические модели и проекты;

    содержит встроенные инструменты для решения различных и разнообразных аналитических задач, как с точки зрения бизнеса, так и с точки зрения ИТ;

    обеспечивает доступ к данным и аналитическим инструментам большего числа пользователей.

Использование же аналитических инструментов, встроенных в другие корпоративные информационные системы, например класса ERP или CRM, имеет, как правило, следующие ограничения:

    ограниченный набор реализованных аналитических инструментов, одинаковых для всех пользователей, независимо от их ролей и задач;

    возможность использования для анализа только собственных, внутренних данных, при этом информация из других систем остается недоступной, а данные из различных источников не могу быть консолидированы;

    отсутствие развитых встроенных инструментов для анализа приводит к тому, что система используется лишь для извлечения хранимых в ней данных, которые затем экспортируются и анализируются в Excel;

    ERP и CRM системы, как правило, имеют ограниченное число пользователей, что «отсекает» от аналитики большое число сотрудников компании, которым эта информация была бы полезна и интересна (существенное увеличение же числа пользователей снижает производительность транзакционных систем);

    транзакционные системы обычно не содержат всех необходимых для проведения анализа показателей, не включают в себя такие инструменты, как информационные панели (dashboards), ставшие уже стандартом для представления аналитической информации;

    результаты анализа в таких системах представляются обычно в виде табличных отчетов или диаграмм, что не позволяет получить детального и всестороннего представления о реальном положении дел и не дает ответа на многие возникающие вопросы;

    возможности создания гибких пользовательских (ad-hoc) запросов ограничена;

    ограничено использование больших объемов накопленной исторической информации.

Выбирая или обновляя систему для бизнес-анализа следует продумать способы хранения и интеграции данных, средства визуализации и аналитики.

Хранение данных

Если перед компанией стоит задача выявления долгосрочных или периодических трендов, то есть пользователям необходимо анализировать исторические данные, поступающие из различных подразделений в течение последних 3-5 лет, то, скорее всего, следует тщательнее продумывать организацию ETL-операций для загрузки данных в хранилища данных.

Если же компании или какому-либо из ее подразделений необходимо анализировать информацию ежемесячно или еженедельно, то оптимальным решением будет выделение и организация для этих целей (для каждого из подразделений или для решения конкретных задач) отдельных витрин данных, также с применением ETL-инструментов.

Если же компания планирует анализировать оперативные данные в режиме, приближенном к реальному времени (то есть обновляемые несколько раз в течение дня), то, возможно, следует отказаться от организации хранилища данных и обратить внимание на проработку средств интеграции на основе промежуточного виртуального слоя метаданных с проработкой соответствующих интерфейсов и алгоритмов (по принципу EII).

Интеграция данных

Как уже отмечалось выше, если целью внедрения BI-системы является решение отдельных, конкретных задач, то целесообразно ограничиться организацией витрин данных. При этом использование никаких отдельных интеграционных алгоритмов не потребуется.

Если же, напротив, BI внедряется с целью получения единого, целостного взгляда на общее состояние бизнеса, то без создания централизованного хранилища данных и, соответственно, внедрения необходимых ETL-инструментов, пожалуй, не обойтись. Кроме того, для получения действительно адекватной картины бизнеса необходимо обратить особое внимание на обеспечение высокого качества анализируемых данных, а для этого потребуется внедрение расширенного набора средств для их «очистки» - выявления неполных или ошибочных данных, дублирующейся информации, приведения данных из различных источников к единому формату.

Если же в компании делают акцент на изучении оперативных данных, то следует продумать средства репликации и обеспечения доступа.

Визуализация и аналитика

В зависимости от поставленных задач, а также от квалификации пользователей, выбираются и средства для визуализации данных – контрольные панели, карты показателей, отчеты, OLAP-кубы.

Для опытных, квалифицированных пользователей оптимальным инструментом станут OLAP-кубы, которые позволят им проводить глубокий и развернутый бизнес-анализ, с необходимой степенью детализации.

Пользователи, которые в своей повседневной деятельности сталкиваются с необходимостью принятия управленческих решений, а также анализа эффективности бизнеса, заинтересованы в организации рабочего места в виде контрольной панели, на которой в виде наглядных шкал и индикаторов отображается состояние бизнеса в целом, с возможностью переключения между отдельными направлениями деятельности.

Рядовым менеджерам необходимы средства для решения своих текущих задач, контроля хода выполнения отдельных видов операций, а также для контроля деятельности своих сотрудников (каждого отдельного работника и команды в целом). Кроме того, для организации четкого взаимодействия со смежными подразделениями (или регионами) необходимо иметь возможность получать представление о ходе выполнения взаимосвязанных задач.

Вертикальное или горизонтальное решение

На рынке существуют как горизонтальные BI-решения, в которых реализован набор общеприменимых инструментов, так и специализированные вертикальные решения, «заточенные» под конкретные отрасли или задачи. И те, и другие имеют свои достоинства и недостатки.

Преимуществом горизонтальных решений может считаться их способность расти вместе с организацией. Такие решения обычно масштабируемы и могут охватывать все направления деятельности и все подразделения крупной компании, а также легче поддаются изменениям. Обратной стороной такой широты возможностей является необходимость более длительной и тщательной настройки решений, адаптации под конкретные требования. Проекты внедрения становятся более дорогостоящими, а требования к ИТ-специалистам – более высокими.

Вертикальные решения, со своей стороны, не требуют отдельной длительной и трудоемкой настройки для решения специфических задач и для соответствия требованиям отраслевых регламентирующих организаций (финансовых, медицинских и т.п.). Однако может оказаться, что различные подразделения в рамках одной структуры не смогут использовать единое решение, и потребуется освоение и интеграция нескольких различных систем для бизнес-анализа.

Те организации, которые и в настоящее время, и в будущем планируют заниматься своей специфической деятельностью, требующей соблюдения определенных строгих регламентов, скорее всего, выиграют именно от внедрения вертикальных решений. Если же уверенности в такой приверженности определенному виду деятельности в будущем нет, и велика вероятность того, что специализация компании значительно расширится, то выбор вертикального BI-решения является определенным риском.

В 2007 году на рынке BI-платформ произошли серьезные изменения, связанные с его существенной консолидацией. Крупные вендоры совершили стратегические приобретения: Oracle завершила сделку по присоединению Hyperion, SAP объявила о присоединении Business Objects, Cognos закончила присоединение Applix и согласилась на слияние с IBM.

Как же данные события повлияли на рынок BI-платформ? Наиболее наглядный ответ на этот вопрос можно получить, взглянув на «магический квадрат» Gartner (рис. 1), где показано распределение ведущих производителей BI-платформ на начало 2007 и 2008 годов.

Рис. 1. Положение ведущих вендоров на рынке BI-платформ (источник: Gartner)

Перед тем как прокомментировать обозначенные выше изменения, кратко рассмотрим методологию Gartner по отбору и представлению вендоров BI-платформ на плоскости «магического квадрата». Прежде всего поясним, что Gartner понимает под понятием «BI-платформа».

Что такое BI-платформа в толковании Gartner

В самом общем плане Gartner определяет BI-платформу как инструмент, который дает организациям возможность строить приложения, позволяющие изучать и понимать их бизнес. Согласно более подробному толкованию, Gartner определяет BI-платформу (BI platform) как программную платформу, предоставляющую 12 функций, которые, в свою очередь, делятся на три группы: интеграция, средства предоставления информации и средства анализа информации.

Интеграция

Общая BI-инфраструктура - все инструменты платформы должны использовать одни и те же средства обеспечения безопасности, общие метаданные, общие средства администрирования, общие средства генерации запросов, а также иметь однотипные интерфейсы.

Управление метаданными - все инструменты приложения должны не только опираться на одни и те же метаданные, но также должны обеспечиваться быстрый поиск, хранение, использование и публикация таких объектов метаданных, как размерности, иерархии, параметры оценки производительности и параметры оформления отчетов.

Средства разработки - наряду со средствами создания отдельных BI-приложений, BI-платформа должна предоставлять средства программной разработки для интеграции приложений в общий бизнес-процесс или обеспечивать их встраивание в другое приложение. BI-платформа должна давать разработчикам возможность создания BI-приложений без кодирования, на основе применения мастеров (wizard-like components) для визуального редактирования.

Совместная работа и управление рабочими процессами - данная возможность позволяет BI-пользователям разделять информацию и обсуждать ее с помощью общих папок и средств ведения дискуссионных тредов (discussion threads). В дополнение BI-приложения могут назначать и отслеживать события или задачи, возложенные на отдельных пользователей, на основе неких заранее определенных бизнес-правил. Обычно данная функциональность предоставляется на базе интеграции с отдельным workflow-инструментом.

Средства предоставления информации

Средства создания отчетов (Reporting) - дают возможность создавать форматированные интерактивные отчеты. В дополнение к этому поставщики BI-платформ должны предоставлять широкий набор типов отчетов (финансовых, операционных и т.п.) в виде приборных панелей дэшбордов (dashboards).

Дэшборды (Dashboards) - одна из составных частей отчетов, представление информации в виде интуитивно понятного графического изображения, включая диаграммы, круговые шкалы, светофоры и т.п. Данные индикаторы показывают состояние анализируемого параметра на фоне его целевого назначения (рис. 2).

Рис. 2. Пример информационной панели (Dashboard)

Руководитель или аналитик, подобно пилоту самолета, видит перед собой «доску приборов» и управляет системой, ориентируясь на значения индикаторов. При этом ключевые факторы, необходимые для управления предприятием, должны быть так или иначе измерены и представлены в виде показателей. Девиз концепции: «Если вы не можете это измерить, значит вы не можете этим управлять» (“If you can’t measure it, you can’t manage it”).

Генератор нерегламентированных запросов (Ad hoc query) - данная функция, известная также как создание отчетов в режиме самообслуживания, дает пользователям возможность получать ответы на возникающие вопросы. Система предоставляет средства навигации по доступным ресурсам данных.

Интеграция с Microsoft Office - в ряде случаев BI-платформы используются как промежуточное звено в цепочке анализа информации, а Microsoft Office (в частности Excel) выступает как BI-клиент. В этих случаях очень важно, чтобы BI-вендор обеспечивал интеграцию с Microsoft Office, включая поддержку форматов документов, формул и сводных таблиц.

Средства анализа информации

OLAP (Online Analytical Processing - аналитическая обработка в реальном времени) - технология обработки информации, включающая составление и динамическую публикацию отчетов и документов. Используется для быстрой обработки сложных запросов к базе данных. Технология OLAP обеспечивает высокую скорость обработки запросов. Она делает мгновенный снимок реляционной БД и структурирует ее в пространственную модель для запросов. Дело в том, что реляционные БД хранят сущности в отдельных таблицах и сложные многотабличные запросы выполняются в них относительно медленно, в то время как пространственная БД является более удачной моделью для запросов. Заявленное время обработки запросов в OLAP составляет около 0,1% от аналогичных запросов в реляционную БД.

Продвинутая визуализация - инструменты продвинутой визуализации позволяют представлять данные для более эффективного их восприятия посредством использования интерактивных картинок и диаграмм вместо таблиц (рис. 3). Обычно пользователи в динамическом режиме могут менять графическое представление, использовать масштабирование, объединять данные, изменять цвета.

Рис. 3. Пример использования визуализации в предоставлении данных
на дэшборде Cognos

Предиктивное моделирование и дейта майнинг. Предиктивное моделирование (Predictive Modelling) - это процесс создания (или выбора) модели для предсказания вероятности наступления некоторого события. Дейта майнинг (Data Mining) - это процесс обнаружения в «сырых» данных ранее неизвестных, нетривиальных полезных и доступных интерпретации знаний, необходимых для принятия решений. Информация, найденная в процессе использования методов Data Mining, должна описывать новые связи между свойствами, предсказывать значения одних признаков на основе других и т.д. Найденные знания должны быть применимы и по отношению к новым данным с некоторой степенью достоверности. Когда извлеченные знания непрозрачны для пользователя, должны существовать методы постобработки, позволяющие привести их к интерпретируемому виду. Задачи, решаемые методами Data Mining, включают:

  • классификацию - отнесение объектов (наблюдений, событий) к одному из заранее известных классов;
  • регрессию, в том числе задачи прогнозирования; установление зависимости непрерывных выходных от входных переменных;
  • кластеризацию - группировку объектов (наблюдений, событий) на основе данных (свойств), описывающих сущность этих объектов. Объекты внутри кластера должны быть похожими друг на друга и отличаться от объектов, входящих в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше различий между кластерами, тем точнее кластеризация;
  • ассоциацию - выявление закономерностей между связанными событиями. Примером такой закономерности служит правило, указывающее на то, что из события X следует событие Y . Такие правила называются ассоциативными. Впервые эта задача была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом рыночной корзины (market basket analysis);
  • последовательные шаблоны - установление закономерностей между связанными во времени событиями, то есть обнаружение зависимости, согласно которой если произойдет событие X , то спустя заданное время произойдет событие Y ;
  • анализ отклонений - выявление наиболее нехарактерных шаблонов.

Карты показателей (Scorecards) используют контрольные показатели, отображаемые на информационной панели, для более глубокого анализа путем наложения их на некоторую стратегическую карту, которая увязывает ключевые параметры производительности со стратегическими задачами. Данную концепцию поясняет рис. 4. Технология предполагает дальнейший анализ на базе применения методологии управления производительностью, например Six Sigma.

Рис. 4. Сравнение ключевых параметров производительности
со стратегическими задачами

После того как мы пояснили термин BI-платформа, вернемся к анализу «магического квадрата» на рис. 1.

Критерии отбора и оценки компаний

В исследовании Gartner (см. рис. 1) участвовали компании, отобранные по следующим принципам:

  • предоставляющие как минимум 8 из 12 функций, свойственных BI-платформе;
  • занимающие заметную долю рынка BI-платформ, что подтверждается объемами продаж не менее 20 млн долл.;
  • решения на платформах которых работают на уровне предприятия, а не только на уровне отделов.

На рис. 1 использован ряд терминов, в соответствии с которыми вендоры расположены на плоскости квадрата. Поясним их значение:

  • возможность реализации - определяется следующими факторами:
    • насколько конкурентными и успешными являются продукты,
    • какова вероятность того, что вендор будет продолжать инвестировать в продукт/сервис,
    • насколько успешную ценовую политику проводит вендор,
    • насколько вендор устойчив к изменениям на рынке,
    • насколько клиенты информированы в области предложений вендора,
    • насколько вендоры имеют возможность выполнять маркетинговые обещания,
    • насколько клиенты довольны сервисной поддержкой вендора;
  • полнота видения - это умение вендора эксплуатировать тенденции на рынке для создания дополнительных сервисов для клиентов и соответствующих выгод для себя. Полнота видения может быть оценена исходя из качества:
    • прогнозов потребностей покупателей,
    • маркетинговой стратегии,
    • стратегии продаж,
    • стратегии развития на вертикальных сегментах рынка,
    • стратегии выхода на удаленные рынки;
  • лидеры - это вендоры, обеспечивающие широкую функциональность своих продуктов, их успешное внедрение и предоставляющие качественную поддержку на глобальном уровне;
  • претенденты - обладают ограничениями, которые могут быть связаны не только с широтой спектра технологических решений, но и с рыночными показателями, такими как качество сбытовой сети и т.п.;
  • провидцы - это вендоры, обладающие мощной стратегией продвижения BI-платформ, что проявляется в открытости стандартов, гибкости архитектуры решений и глубине функциональности создаваемых приложений. Это лидеры в области инновационной деятельности;
  • нишевые игроки - занимают лидирующие позиции в некоторой ограниченной продуктовой или технологической области.

Тенденции на рынке BI-платформ

Как видно из рис. 1, мегавендоры начинают доминировать на BI-рынке. Действительно, менее чем за год Microsoft, Oracle, SAP и IBM прошли путь от владения четвертью рынка до владения его двумя третями.

При сравнении квадратов за 2007-й и 2008 годы видно, что Microsoft поднялась и занимает первое место по возможностям реализации. SAP пока не попадает в лидеры, по всей видимости потому, что объединение с Business Objects еще не закончено. Oracle переместилась на второе место после SAS по полноте видения.

Таким образом, «магический квадрат» BI-платформ за 2008 год отражает тот факт, что лидерство переходит от независимых BI-вендоров, таких как Business Objects и Cognos, к мегавендорам.

В июле 2007 года Oracle завершила сделку по приобретению Hyperion. Это привело к тому, что две конкурирующие платформы - Hyperion System 9 и Oracle Business Intelligence Enterprise Edition - объединились под руководством Oracle и соответственно расширили BI-ресурсы Oracle как в технологическом плане, так и в отношении людских ресурсов.

В октябре 2007 года SAP объявила о присоединении Business Objects с целью расширения своего присутствия на рынке. Данное присоединение (оно было закончено в январе 2008 года) закрывает существенный пробел SAP в части генераторов запросов и отчетов.

Cognos закончила присоединение Applix, обладающего мощной OLAP-технологией, и, в свою очередь, согласилась на свое поглощение корпорацией IBM.

За тот же период такие факторы, как взросление BI-портфеля Microsoft, развитие технологий Web 2.0, развитие продуктов BI с открытым кодом, развитие предложений ПО как услуги (SaaS), привели к тому, что BI-функциональность стала более доступной, чем ранее.

OpenSource BI-решения существенно продвинулись в своем развитии, однако оборот от их внедрения пока незначителен. Один из крупнейших вендоров в этой области JasperSoft утверждает, что у него имеется более 7 тыс. коммерческих клиентов и более 70 тыс. активных внедрений.

Наблюдается также растущий интерес к предоставлению BI-решений в форме SaaS. В частности, компания Business Objects является лидером в бизнесе по предоставлению BI-приложений по запросу (OnDemand), но существуют и более мелкие фирмы, такие как Seatab, Oco и LucidEra, предоставляющие BI-решения как услугу. Использование BI-решений в виде OnDemand-сервиса подходит не всем организациям, оно малоприменимо для организаций, которые работают с секретными данными. Тем не менее с каждым годом все больше компаний выбирают SaaS-модель как более экономичную и достаточно надежную.

Анализ положения ведущих вендоров

Business Objects

Среди компаний, специализирующихся исключительно на BI-решениях, Business Objects предлагает наиболее полную платформу с хорошо проработанной технологией генерации отчетов и запросов.

Около 90% организаций, внедривших данное решение, отмечают, что оно является стандартным для их организации.

Business Objects расширила спектр BI-предложений в 2007 году после присоединения фирмы Inxight.

Быстрый рост BI-предложений Business Objects по запросу (OnDemand), количество пользователей которых составляет уже более 70 тыс., делает ее де-факто лидером в сфере SaaS-BI.

Business Objects должна будет скорректировать свою стратегию после приобретения нового статуса в результате перехода в собственность компании SAP, то есть должна будет потратить некоторое время на изменение каналов продаж, систему поддержки и т.п.

По отзывам клиентов, OLAP является слабой стороной в решениях Business Objects.

Cognos

Cognos имеет исключительно высокий процент внедрений своей BI-платформы в качестве стандартного для предприятий решения. Более 90% опрошенных считают Cognos стандартом для своей организации.

Cognos активно инвестирует в работы по улучшению архитектуры платформы. С появлением версии 8.2 и будущей версии 8.3 Cognos 8 BI практически избавилась от проблем с недостаточной стабильностью работы и слабой технической поддержкой. В настоящее время большинство клиентов эксплуатирует последнюю версию Cognos BI.

После завершения присоединения Cognos к компании IBM платформа Cognos BI выиграет из-за возможности интеграции с технологиями IBM.

Еще одно преимущество Cognos получит по мере освоения технологии Applix TM1 OLAP.

Дейтамайнинговые технологии Cognos по-прежнему слабее, чем предложения ее конкурентов.

Microsoft

Удачная ценовая политика и интеграция с MS Office делает решения Microsoft особенно привлекательными для организаций, которые базируются на инфраструктурных решениях этой компании.

При продвижении своих BI-решений Microsoft может опереться на большую аудиторию разработчиков. По оценкам Microsoft, это 2 тыс. OEM/ISV-партнеров по внедрению ее BI-решений.

По отзывам клиентов, BI-решения от Microsoft вызывают минимальные нарекания.

BI-решения Microsoft были созданы именно ею, а не приобретены вместе с присоединенной фирмой.

Microsoft с опозданием включилась в гонку по продвижению BI-платформ и поэтому сейчас ее стратегия - «догнать и перегнать». По оценкам клиентов, Microsoft все еще отстает от компаний, традиционно занимающихся продвижением BI-платформ, особенно в плане управления мета-данными, генерирования отчетов и создания дэшбордов.

MicroStrategy

Вместо тактики присоединения MicroStrategy полностью построила технологию своими собственными силами. Это обеспечивает высокую степень интеграции в рамках платформы.

MicroStrategy имеет положительные отзывы клиентов по всем 12 критериям, которые оценивает Gartner.

Развитие новых технологий может привести к ослаблению позиций MicroStrategy, которые она пока занимает в области обработки сверхбольших объемов данных.

MicroStrategy имеет репутацию компании, предлагающей дорогие решения, на которые трудно получить скидку.

MicroStrategy фокусируется исключительно на BI-платформах и уделяет недостаточно внимания смежным технологиям - CPM (Corporate Performance Management - управление производительностью корпораций) и интеграции данных.

MicroStrategy имеет малый объем продаж в Азиатско-Тихоокеанском регионе.

Oracle

Еще до присоединения Hyperion, в середине 2007 года, позиции Oracle на рынке BI были достаточно сильными: ее комбинация BI-платформы и аналитических приложений (Oracle BI Enterprise Edition (OBIEE) и Oracle Analytic Applications) представляла собой весьма успешное предложение.

Клиенты дают E положительные отзывы на OBIE. Они отмечают широкие возможности решения относительно организации коллективной работы, а также продвинутые средства визуализации, являющиеся, по их словам, одними из лучших на рынке.

Сильные стороны Essbase OLAP-движка и возможности интеграции Hyperion с Microsoft Office повышают потенциал Oracle на рынке BI.

Компания Oracle имеет хорошие шансы продвигать свои BI-технологии различным клиентам, а не только приверженцам платформы Oracle.

Процесс интеграции BI-решений, полученных в результате слияния, займет немало времени в 2008 году.

Есть сведения, что среди инсталяций базы Hyperion BI процент последней версии невелик, что указывает на тот факт, что клиенты не спешат переходить на последнюю версию продукта.

Oracle следует улучшить техническую поддержку.

SAP

Имея более 13 тыс. внедрений, компания SAP добилась больших успехов в продвижении решения NetWeaver BI. Более 75% клиентов SAP из опрошенных Gartner свидетельствовали, что BI-решения от SAP являются стандартными в их организациях.

После завершения интеграции SAP и Business Objects фирма SAP станет крупнейшим вендором BI-платформ, который будет вдвое больше любого другого своего конкурента.

Сильные стороны Business Objects, в первую очередь генерирование форматированных отчетов и генерирование отчетов в режиме самообслуживания (self-service report creation), удачно восполняют пробелы, имеющиеся в решениях SAP BI.

В ходе исследования Gartner клиенты SAP, использующие последнюю версию SAP BI, отметили трудности, касающиеся ее внедрения.

Присоединение Business Objects несколько снижает показатель SAP, который Gartner условно называет возможностью реализации. Это связано с неизбежной неопределенностью для клиентов, которые рассчитывали на уже существующие внутренние продукты SAP в области BI.

Несмотря на тот факт, что внедренные решения на базе NetWeaver BI способны импортировать данные из не SAP-приложений, SAP может назвать не более 25 крупных предприятий, внедривших NetWeaver BI, где бы не доминировали учетные системы SAP. Для достижения лидерства на рынке SAP необходимо продемонстрировать, что она может внедрять свою платформу и на предприятиях, где SAP-приложения не являются доминирующими.

SAS

SAS лидирует в области продвинутой аналитики (Advanced Analytic Solutions).

SAS предлагает аналитические решения, которые не только обеспечивают базовую функциональность на уровне анализа KPI, но и предлагают продвинутую аналитику обнаружения бизнес-проблем, например таких, как выявление мошенничества.

SAS - это известный бренд, решения SAS имеют сервисную поддержку по всему миру.

Приложения SAS считаются трудными в освоении. Многие приложения продвинутой аналитики требуют применения специального языка программирования SAS - это является достоинством для программистов и существенным ограничением для людей, не обладающих подобными навыками.

В заключение перечислим основные тенденции на рынке BI-платформ:

  • актуальность задачи оптимизации производительности компаний на всех уровнях стимулирует спрос на BI-решения;
  • возможности BI-платформ расширяются, и, помимо традиционных генераторов отчетов и запросов, а также OLAP-функциональности, активное развитие получили «приборные панели» (dashboards), карты показателей (scorecards) и продвинутая визуализация;
  • мегавендоры начинают доминировать на BI-рынке;
  • BI-решения в форме SaaS активно продвигаются многими производителями;
  • процесс слияний и стандартизации является двигателем рынка.

24.04.2003 Валерий Артемьев

Термин «business intelligence» существует сравнительно давно, хотя у нас он мало употребляется из-за отсутствия адекватного перевода и четкого понимания, что, впрочем, характерно и для Запада. Попытаемся разобраться в его сути.

В русском языке слово «интеллект» однозначно понимается, как мыслительная способность человека. На первый взгляд неплохой перевод для термина Business intelligence предложен в «интеллектуальный анализ данных», но сразу возникает вопрос, а имеется ли "неинтеллектуальный анализ данных".

На неопределенность обсуждаемого термина повлияла многозначность английского слова «intelligence»:

  • способность узнавать и понимать; готовность к пониманию;
  • знания, переданные или приобретенные путем обучения, исследования или опыта;
  • действие или состояние в процессе познания;
  • разведка, разведывательные данные.

В русском языке слово «интеллект» однозначно понимается, как мыслительная способность человека. На первый взгляд неплохой перевод для термина Business intelligence предложен в «интеллектуальный анализ данных», но сразу возникает вопрос, а имеется ли «неинтеллектуальный анализ данных». Пути языка неисповедимы, поэтому будем использовать и оригинал на английском и кальку «бизнес-интеллект».

Различные определения

Впервые термин «business intelligence» был введен в обращение аналитиками Gartner в конце 1980-х годов, как «пользователецентрический процесс, который включает доступ и исследование информации, ее анализ, выработку интуиции и понимания, которые ведут к улучшенному и неформальному принятию решений». Позже в 1996 году появилось уточнение - «инструменты для анализа данных, построения отчетов и запросов могут помочь бизнес-пользователям преодолеть море данных для того, чтобы синтезировать из них значимую информацию, - сегодня эти инструменты в совокупности попадают в категорию, называемую бизнес-интеллект (Business Intelligence)».

BI как методы, технологии, средства извлечения и представления знаний

Согласно первоначальным определениям, BI - это процесс анализа информации, выработки интуиции и понимания для улучшенного и неформального принятия решений бизнес-пользователями, а также инструменты для извлечения из данных значимой для бизнеса информации. Надо отметить, что большинство определений трактуют «business intelligence» как процесс, технологии, методы и средства извлечения и представления знаний.

BI, EIS, DSS, электронный бизнес и коммерция

За последние 10 лет менялись названия и содержание информационно-аналитических систем от информационных систем руководителя (executive information systems, EIS) до систем поддержки принятия решений (decision support systems, DSS) и сейчас до систем бизнес-интеллекта.

Во времена больших ЭВМ и миникомпьютеров, когда у большинства пользователей не было прямого доступа к компьютерам, организации зависели от своих подразделений ИТ, которые обеспечивали их стандартными и параметрическими отчетами. Но чтобы получить отчеты, отличные от стандартных, пользователям нужно было заказывать их разработку и ждать в течение нескольких дней или недель.

Приложения EIS были настроены на нужды руководителей и менеджеров и давали возможность получать основную агрегированную информацию о состоянии их бизнеса в виде таблиц или диаграмм. Обычно они включали регламентные запросы с набором параметров. Такие пакеты обычно разрабатывались силами своих подразделений ИТ. Для получения дополнительной информации и проведения дальнейшего анализа применялись другие приложения или создавались по заказу запросы или отчеты на SQL.

Приложения DSS первого поколения были пакетами прикладных программ с динамической генерацией SQL-скриптов по типу запрашиваемой пользователем информации. Они позволяли аналитикам получать информацию из реляционных БД, не требуя знания SQL. В отличие от EIS приложения DSS могут отвечать на широкий спектр вопросов бизнеса, имеют несколько вариантов представления отчетов и определенные возможности форматирования. Однако гибкость таких пакетов все же была ограничена из-за ориентации на конкретный набор задач.

С приходом ПК и локальных сетей следующее поколение приложений DSS строится уже на основе BI и позволяет пользователю-непрограммисту легко и оперативно извлекать информацию из различных источников, формировать собственные настраиваемые отчеты или графические представления, проводить многомерный анализ данных. Развитие систем бизнес-интеллекта прошло путь от «толстых» клиентов до Web-приложений, в которых пользователь ведет исследование с помощью браузера и может работать удаленно. Можно также создавать сценарии «что если» и коллективно просматривать и обновлять информацию.

Хотя пользователи корпоративной BI-информации традиционно находятся внутри предприятия, с распространением Web для электронного бизнеса, B2B, CRM и SCM BI-пользователи могут быть и внешними по отношению к предприятию , а в B2C, C2B и на торговых площадках пользователями BI являются пользователи Internet.

BI и хранилища данных

Концепция, методы и средства хранилища данных (Data warehousing) определяют подходы и обеспечивают интеграцию, очистку, ретроспективное хранение информации, предназначенной для анализа , отвечают на вопрос «Как подготовить информацию для анализа?». Технология бизнес-интеллекта определяет методы и средства доступа и оперативного анализа информации в терминах предметной области. BI-средства не обязательно должны работать в инфраструктуре хранилища данных, но в этом случае проблема очистки и согласования данных возлагается на них, причем осуществлять эти операции придется на лету или же предварительно, но для обособленного информационного ресурса. Кроме того, есть эффект влияния на производительность и надежность оперативной системы обработки транзакций. Вот почему хорошей корпоративной практикой является выделение транзакционной и аналитической составляющих и применение для второй различных решений по хранилищу данных. Основные стыки идут не только на уровне информации, но и на уровне метаданных. В случае хранилища данных можно обеспечить централизованное управление метаданными.

Следует отметить, что часто термином «хранилище данных» обозначают систему поддержки принятия решений DSS или информационно-аналитическую систему, основанные на технологиях хранилища данных и бизнес-интеллекта .

Классификация продуктов business intelligence

Сегодня категории BI-продуктов включают: BI-инструменты и BI-приложения. Первые, в свою очередь, делятся на: генераторы запросов и отчетов; развитые BI-инструменты, - прежде всего инструменты оперативной аналитической обработки (online analytical processing, OLAP); корпоративные BI-наборы (enterprise BI suites, EBIS); BI-платформы. Главная часть BI-инструментов делится на корпоративные BI-наборы и BI-платформы. Средства генерации запросов и отчетов в большой степени поглощаются и замещаются корпоративными BI-наборами. Многомерные OLAP-механизмы или серверы, а также реляционные OLAP-механизмы являются BI-инструментами и инфраструктурой для BI-платформ. Большинство BI-инструментов применяются конечными пользователями для доступа, анализа и генерации отчетов по данным, которые чаще всего располагаются в хранилище, витринах данных или оперативных складах данных. Разработчики приложений используют BI-платформы для создания и внедрения BI-приложений, которые не рассматриваются как BI-инструменты. Примером BI-приложения является информационная система руководителя EIS.

Инструменты генерации запросов и отчетов

Генераторы запросов и отчетов - типично «настольные» инструменты, предоставляющие пользователям доступ к базам данных, выполняющие некоторый анализ и формирующие отчеты. Запросы могут быть как незапланированными (ad hoc), так и иметь регламентный характер. Имеются системы генерации отчетов (как правило, серверные), которые поддерживают регламентные запросы и отчеты. Настольные генераторы запросов и отчетов расширены также некоторыми облегченными возможностями OLAP. Развитые инструменты этой категории объединяют в себе возможности пакетной генерации регламентных отчетов и настольных генераторов запросов, рассылки отчетов и их оперативного обновления, образуя так называемую корпоративную отчетность (corporate reporting) . В ее арсенал входят сервер отчетов, средства рассылки, публикации отчетов на Web, механизм извещения о событиях или отклонениях (alerts). Характерные представители - Crystal Reports, Cognos Impromptu и Actuate e.Reporting Suite.

OLAP или развитые аналитические инструменты

Инструменты OLAP являются аналитическими инструментами, которые первоначально были основаны на многомерных базах данных (МБД) .

МБД - это базы данных, сконструированные специально для поддержки анализа количественных данных с множеством измерений, содержат данные в «чисто» многомерной форме. Большинство приложений включают измерение времени, другие измерения могут касаться географии, организационных единиц, клиентов, продуктов и др. OLAP позволяет организовать измерения в виде иерархии. Данные представлены в виде гиперкубов (кубов) - логических и физических моделей показателей, коллективно использующих измерения, а также иерархии в этих измерениях. Некоторые данные предварительно агрегированы в БД, другие рассчитываются «на лету».

Средства OLAP позволяют исследовать данные по различным измерениям . Пользователи могут выбрать, какие показатели анализировать, какие измерения и как отображать в кросс-таблице, обменять строки и столбцы «pivoting», затем сделать срезы и вырезки («slice&dice»), чтобы сконцентрироваться на определенной комбинации размерностей. Можно изменять детальность данных, двигаясь по уровням с помощью детализации и укрупнения «drill down/ roll up», а также кросс-детализации «drill across» через другие измерения.

Для поддержки МБД используются OLAP-серверы , оптимизированные для многомерного анализа и поставляемые с аналитическими возможностями. Они обеспечивают хорошую производительность, но обычно требуют много времени для загрузки и расширения МБД. Поставляются с возможностью «reach-through», позволяя перейти от агрегатов к деталям в реляционных БД. Классический OLAP-сервер - Hyperion Essbase Server.

Сегодня реляционные СУБД применяются для эмуляции МБД и поддерживают многомерный анализ . OLAP для реляционных БД (ROLAP) имеет преимущество по масштабируемости и гибкости, но проигрывает по производительности многомерному OLAP (MOLAP), хотя существуют методы повышения производительности, наподобие схемы «звезда». Несмотря на то что МБД являются по-прежнему наиболее подходящими для оперативной аналитической обработки, сейчас эту возможность встраивают в реляционные СУБД или расширяют их (например, MS Analysis Services или ORACLE OLAP Services - это не то же самое, что ROLAP). Также существует гибридная оперативная аналитическая обработка данных (HOLAP) для гибридных продуктов, которые могут хранить многомерные данные естественным образом, а также в реляционном представлении. Доступ к МБД осуществляется с помощью API для генерации многомерных запросов, тогда как к реляционным БД доступ производится посредством запросов на SQL. Примером ROLAP-сервера является Microstrategy7i Server.

Настольные OLAP-инструменты (например, BusinessObjects Explorer, Cognos PowerPlay, MS Data Analyzer), встроенные сейчас в EBIS, облегчают конечным пользователям просмотр и манипулирование многомерными данными, которые могут поступать из серверных ресурсов данных ROLAP или MOLAP. Некоторые из этих продуктов имеют возможность загружать кубы, так что они могут работать автономно. Как часть EBIS эти настольные инструменты оснащены возможностями серверной обработки, которые выходят за пределы их традиционных возможностей, но не конкурируют с MOLAP-инструментами. Настольные инструменты по сравнению с MOLAP-средствами имеют небольшую производительность и аналитическую мощь. Нередко обеспечивается интерфейс через Excel, например, MS Eхcel2000/OLAP PTS, BusinessQuery for Excel. Практически все OLAP-инструменты имеют Web-расширения (Business Objects WebIntelligence к примеру), для некоторых они являются базовыми.

Корпоративные BI-наборы

EBIS - естественный путь для предоставления BI-инструментов, которые ранее поставлялись в виде разрозненных продуктов. Эти наборы интегрируются в наборы инструментов генерации запросов, отчетов и OLAP. Корпоративные BI-наборы должны иметь масштабируемость и распространяться не только на внутренних пользователей, но и на ключевых заказчиков, поставщиков и др. Продукты BI-наборов должны помогать администраторам при внедрении и управлении BI без добавления новых ресурсов. Из-за тесного родства Web и корпоративных BI-наборов некоторые поставщики описывают свои BI-наборы как BI-порталы. Эти портальные предложения обеспечивают подмножество возможностей EBIS с помощью Web-браузера, однако поставщики постоянно увеличивают их функциональность, приближая ее к возможностям инструментов для «толстых» клиентов. Типичные EBIS поставляют Business Objects и Cognos.

BI-платформы

BI-платформы предлагают наборы инструментов для создания, внедрения, поддержки и сопровождения BI-приложений. Имеются насыщенные данными приложения с «заказными» интерфейсами конечного пользователя, организованные вокруг специфических бизнес-проблем, с целевым анализом и моделями. BI-платформы, хотя и не так быстро растут и широко используются как EBIS, являются важным сегментом благодаря ожидаемому и уже происходящему росту BI-приложений. Стараниями поставщиков реляционных СУБД, создающих OLAP-расширения своих СУБД, многие поставщики платформ, которые предоставили многомерные СУБД для OLAP, чтобы выжить были вынуждены мигрировать в область BI-приложений. Семейства продуктов СУБД, обеспечивающие возможности BI, действительно подталкивают рост рынка BI-платформ. Отчасти это происходит благодаря большей активности ряда поставщиков СУБД. Рассматривая различные инструменты, видим, что EBIS являются высоко функциональными средствами, но они не имеют такого большого значения, как BI-платформы или заказные BI-приложения. Зато BI-платформы обычно не так функционально полны, как корпоративные BI-наборы. При выборе BI-платформ нужно учитывать следующие характеристики: модульность, распределенную архитектуру, поддержку стандартов XML, OLE DB for OLAP, LDAP, CORBA, COM/DCOM и обеспечение работы в Web. Они должны также обеспечивать функциональность, специфическую для бизнес-интеллекта, а именно: доступ к БД (SQL), манипулирование многомерными данными, функции моделирования, статистический анализ и деловую графику. Эту категорию продуктов представляют фирмы Microsoft, SAS Institute, ORACLE, SAP и другие.

BI-приложения

В приложения бизнес-интеллекта часто встроены BI-инструменты (OLAP, генераторы запросов и отчетов, средства моделирования, статистического анализа, визуализации и data mining). Многие BI-приложения извлекают данные из ERP-приложений. BI-приложения обычно ориентированы на конкретную функцию организации или задачу, такие как анализ и прогноз продаж, финансовое бюджетирование, прогнозирование, анализ рисков, анализ тенденций, «churn analysis» в телекоммуникациях и т.п. Они могут применяться и более широко как в случае приложений управления эффективностью предприятия (enterprise perfomance management) или системы сбалансированных показателей (balanced scorecard).

Разведка данных

Разведка данных (data mining) представляет собой процесс обнаружения корреляции, тенденций, шаблонов, связей и категорий . Она выполняется путем тщательного исследования данных с использованием технологий распознавания шаблонов, а также статистических и математических методов. При разведке данных многократно выполняются различные операции и преобразования над сырыми данными (отбор признаков, стратификация, кластеризация, визуализация и регрессия), которые предназначены: 1) для нахождения представлений, которые являются интуитивно понятными для людей, которые, в свою очередь, лучше понимают бизнес-процессы, лежащие в основе их деятельности; 2) для нахождения моделей, которые могут предсказать результат или значение определенных ситуаций, используя исторические или субъективные данные.

В отличие от использования OLAP разведка данных в значительно меньшей степени направляется пользователем, вместо этого полагается на специализированные алгоритмы, которые устанавливают соотношение информации и помогают распознать важные (и ранее неизвестные) тенденции, свободные от предвзятости и предположений пользователя.

Другие методы и средства BI

Кроме перечисленных инструментов, в состав BI могут входить следующие средства анализа : пакеты статистического анализа и анализ временных рядов и оценки рисков; средства моделирования; пакеты для нейронных сетей; средства нечеткой логики и экспертные системы.

Дополнительно нужно отметить средства для графического оформления результатов : средства деловой и научно-технической графики; «приборные доски», средства аналитической картографии и топологических карт; средства визуализации многомерных данных.

Архитектура business intelligence

Корпоративная BI-архитектура должна быть разработана после того, как определены BI-потребности пользователей, но до выбора BI-инструментов. Архитектура Business Intelligence определяет компоненты доставки BI-информации и компоненты BI-технологии (рис.1). После определения профилей использования BI-информации, может быть спроектирована архитектура доставки информации, основанная на этих профилях и на требуемом типе внедрения. Это может быть любая смесь настольных клиентов с сетевым подключением, настольных клиентов и сервера, тонких клиентов на основе Web и других мобильных вычислительных устройств. Архитектура доставки информации определит пользовательские интерфейсы, которые часто являются порталами с возможностью персонализации.

Рис.1. Архитектура Business intelligence

Архитектура BI-технологии определяет инфраструктуру и компоненты, необходимые для поддержки внедрения, эксплуатации и администрирования BI-инструментов и приложений, а также связи этих компонентов. Прочная архитектура BI-технологии будет состоять из двух важных слоев: инфраструктуры и прикладных сервисов (или функциональности). Инфраструктурный слой включает информационные ресурсы, администрирование и сети. На этом слое данные собираются, интегрируются и становятся доступными. Хранилище данных является одним из возможных компонентов инфраструктурного слоя. Для использования BI в оперативных системах может потребоваться оперативный склад данных (operational data store, ODS), возможно связанный с корпоративными структурами workflow. Прикладные сервисы включают все BI-сервисы, такие как механизмы запросов, анализа, генерации отчетов и визуализации, а также средства безопасности и метаданные.

Среда хранения и доступ к BI-информации

Помимо традиционных решений по хранилищам данных Oracle9i и MS SQL Server2000, растет число применений хранилищ ERP, например, SAP BW для R/3, или PeopleSoft Enterprise Warehouse с BI-приложениями Enterprise Performance Management. Однако в обоих случаях функциональность привязана к конкретным системам ERP, а следовательно ограничена.

Быстро растет применение ROLAP для хранения BI-информации, из-за удобства реляционных СУБД для приложений с очень большими базами детальных данных и благодаря включению возможностей OLAP в СУБД. Использование МБД и OLAP остается неизменным и наиболее преобладающим, т.к. они обеспечивают лучшую производительность и функциональность там, где важны агрегированные данные и сложные аналитические расчеты.

Неудивительно, что при дороговизне двухзвенных клиент-серверных структур доступ к BI все чаще происходит через Web. Центр тяжести перемещается на сервер, отражая тот факт, что важным элементом является доступ к корпоративной BI-информации, автономные же ПК явно недостаточно функциональны. Популярна и растет доставка BI-отчетов по электронной почте, а мобильные и беспроводные способы доставки пока распространяются медленно.

Метаданные

Большинство BI-инструментов, представленных на рынке, используют слой метаданных или репозиторий. Бизнес-метаданные включают определения данных, которые хранятся в источниках данных, в терминах предметной области. Они также могут содержать правила и вычисления, которые должны быть определены для этого бизнеса. Кроме того, существуют технические метаданные для доступа к физическим данным. CASE-средства, реляционные СУБД, средства извлечения, преобразования и загрузки данных используют метаданные. При создании хранилища и витрин данных часто можно автоматически извлечь метаданные из источников данных, но иногда пользователям самим приходится доставать метаданные. Так, возможна сложная ситуация с несколькими репозиториями, существующими в одной организации. Отсутствие общих метаданных для инструментов - из-за отсутствия стандартов для метаданных - серьезная проблема для подразделений ИТ.

Плюсы и минусы технологии

Возможности пользователя по ведению многоаспектного оперативного анализа информации в терминах предметной области для поддержки принятия бизнес решений быстро расширяются. Параллельное движение от информационной анархии или диктатуры к информационной демократии расширяет контингент пользователей business intelligence. На первое место выходит потребность гибкого доступа к корпоративным данным, а не просто потребность решить конкретную функциональную задачу. Снижается прямая зависимость от подразделений ИТ, изготавливающих по заказу отчеты или запросы. Возможен переход от статических регламентных отчетов к «живому отчету», а наиболее продвинутые аналитики получают возможность проводить кросс-тематический анализ и построение сводных отчетов с нуля, имея семантических слой, описывающий все показатели и разрезы корпоративной информации. Эти же средства могут использовать программисты для быстрого создания регламентных, параметрических отчетов. Web-доступ к BI (как к статическому, так и к динамическому контенту) позволит обеспечить реальное корпоративное информационное пространство и коллективную работу сотрудников.

Основным риском является слишком быстрые изменения в технологии BI, использование непроверенных решений и средств. Нужно отслеживать поставщиков, оценивать их устойчивость, направления развития, регулярно пробовать новые средства, проводить типизацию и унификацию BI. Другой риск связан с качеством данных - если они должным образом не преобразованы, не очищены и не консолидированы, то никакие «навороченные» возможности BI-инструментов или приложений не смогут увеличить достоверность данных. Ряд проблем могут возникнуть из-за не согласованности метаданных. В рамках большой корпорации эти вопросы решаются на инфраструктурном уровне путем создания корпоративного хранилища данных и централизованного управления метаданными. Создание хранилища поможет навести порядок в номенклатуре собираемых показателей, сборе данных, их распространении и санкционировании доступа. Сама BI-технология не в состоянии решить комплексно эти проблемы, а пренебрежение ими возвращает к информационной анархии и «силосным ямам данных» .

Основные игроки на поле BI

В соответствии с пресловутыми магическими квадратами Gartner технологическими лидерами EBIS являются сегодня Business Objects и Cognos, на границе между лидерами и претендентами - Information Builders, а Microsoft и Oracle - в претендентах. У одной нет самостоятельного OLAP-клиента, а используется функциональность сводной таблицы Excel200x, и нет генератора отчетов, у другой - пока нет замены для Oracle Express Analyzer. В группе «провидцев» выделяются Crystal Decisions на границе с лидерами. Также следует отметить Actuate и MicroStrategy.

Для BI-платформ практически нет лидеров, что свидетельствует о незрелости технологий и рынка. На границе этой области находится пока только Microsoft за счет решений по встраиванию OLAP-сервисов в MS SQL Server и развития их до аналитического сервера. Среди других претендентов - SAS Institute, далее плотную группу образуют Oracle, PeopleSoft и SAP. Hyperion в буквальном смысле на перепутье - SAS и Hyperion потеряли лидирующие позиции 2000 года. Среди провидцев следует отметить MicroStrategy. К сожалению, Crystal Decisions пока выступает как нишевой игрок.

Тенденции

Среди BI-инструментов наибольший рост испытывают EBIS, что отражает усилившуюся конкуренцию в сегодняшней экономике. Использование инструментов для генерации запросов и отчетов, анализа данных снижается, организации обновляют их и заменяют корпоративными BI-наборами. Основные инструменты (незапланированные запросы, отчетность и основной OLAP-анализ) все еще остаются наиболее распространенными, удовлетворяя большинство потребностей. Также растет применение OLAP и других развитых BI-инструментов, подобных технологии data mining. Однако автономные инструменты data mining исчезают, эта технология поглощается и включается в другие BI-инструменты, например, в расширения СУБД.

Ожидается, что в течение 5 лет такие возможности, как XML для анализа (XML/A), BI Web-сервисы, совместная работа, беспроводные и мобильные коммуникации объединятся в виде сетей бизнес-интеллекта (BI networks), которые будут дополнены средствами мониторинга бизнес деятельности (Business activity monitoring, BAM).

XML для анализа. XML/A первоначально появился как коммуникационный протокол между разными BI-слоями (клиент, аналитический сервер, сервер БД). У XML/A имеются серьезные проблемы производительности - он создает большие накладные расходы и пока применим лишь для «облегченного» OLAP-клиента. Однако если эти проблемы будут решены, XML/A мог бы стать единым языком общения (lingua franca) между различными BI-средами, пересекая множество доменов, поставщиков и технологий, таким образом поддерживая BI networks.

BI Web-сервисы. Поставщики часто идентифицируют продукты EBIS как BI-порталы, потому что версии этих продуктов для Web обеспечивают точку входа к корпоративной информации. Фактически зачастую эти BI-порталы поддерживают также связи с неструктурированной информацией, хотя обычно для этого требуется некая система интеграции. Все более и более продукты EBIS фокусируются на внешних составляющих корпорации (extranet e-business intelligence). Новая компонентная архитектура SOA, ориентированная на сервисы (службы), является развитием серверов приложений и корпоративных порталов. Эта новация связана также с технологиями J2EE и.NET. BI Web-сервисы делают BI-инструменты открытыми компонентами с известными интерфейсами и доступными во всех видах сетей. Увеличивается число поставщиков BI-продуктов, которые реализуют их в виде Web-служб, но чаще под соусом порталов.

Совместная работа. Добавление аннотаций к отчетам и разделение результатов анализа между несколькими пользователями возможно со времен EIS, однако сейчас эта функциональность популярна и во многие BI-приложения добавлены возможности workflow. Ожидается, что пользователи смогут работать одновременно с одной моделью или будет обеспечена связь разных BI-приложений в реальном времени.

Беспроводной и мобильный бизнес-интеллект. Другая устойчивая тенденция по доставке BI-информации видна у поставщиков, дающим возможность BI-продуктам доставлять отчеты посредством мобильной технологии, включая персональных электронных помощников PDA, Internet-телефонов и пейджеров.

Мониторинг бизнес-деятельности. Новая технология BAM является по существу операционным BI и сочетает интеграцию приложений реального времени с возможностями бизнес-интеллекта. Используя транзакционные данные, извлеченные из систем обработки транзакций в реальном времени, BI-инструменты анализируют эти данные и выдают предупреждения о критических событиях и информацию операционным пользователям, принимающим непосредственные решения.

Литература
  1. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. // М.: Нолидж, 2001
  2. Том Салливан.
  3. Kimbal R. The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses. John Willey&Sons, 1996
  4. Thomsen E. OLAP Solutions: Building Multidimensional Information Systems. Wiley Computer Publishing, 1997
  5. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. Том.1: Пер. с англ. // М.: Вильямс, 2001
  6. Архипенков С., Голубев Д., Максименко О. ХРАНИЛИЩА ДАННЫХ. От концепции до внедрения/ Под общ. Ред. С.Я. Архипенкова // М.: ДИАЛОГ-МИФИ, 2002
  7. В., Самойленко А. Data mining: учебный курс. // СПб: Питер, 2001
  8. Inside Gartner Group (рус.), Дрезнер Х., Хостманн Б. и Ф. Байтендийк. Вниманию руководства: Обновленные Волшебные Квадраты Gartner для систем интеллектуальной поддержки бизнеса, 2003, февраль
  9. Liautaud B., Hammond M. e-Business Intelligence: Turning Information into Knoledge into Profit. McGraw-Hill, 2001
  10. Кристин Комафорд. .
  11. Том Салливан. .

Валерий Артемьев (avi @cbr.ru) - советник директора Главного центра информатизации Банка России (Москва).



Business Intelligence

Business intelligence или сокращенно BI - бизнес-анализ, бизнес-аналитика. Под этим понятием чаще всего подразумевают программное обеспечение , созданное для помощи менеджеру в анализе информации о своей компании и её окружении. Существует несколько вариантов понимания этого термина.

  • Бизнес-аналитика - это методы и инструменты для построения информативных отчётов о текущей ситуации. В таком случае цель бизнес-аналитики - предоставить нужную информацию тому человеку, которому она необходима в нужное время. Эта информация может оказаться жизненно необходимой для принятия управленческих решений.
  • Бизнес-аналитика - это инструменты, используемые для преобразования, хранения, анализа, моделирования, доставки и трассировки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных. При этом с помощью этих средств лица, принимающие решения, должны при использовании подходящих технологий получать нужные сведения и в нужное время.

Таким образом, BI в первом понимании является лишь одним из секторов бизнес-аналитики в более широком втором понимании. Помимо отчётности туда входят инструменты интеграции и очистки данных (ETL), аналитические хранилища данных и средства Data Mining .

BI-технологии позволяют анализировать большие объёмы информации, заостряя внимание пользователей лишь на ключевых факторах эффективности, моделируя исход различных вариантов действий, отслеживая результаты принятия тех или иных решений.

История возникновения термина

Термин впервые появился в 1958 году в статье исследователя из IBM Ханса Питера Луна (англ. Hans Peter Luhn ). Он определил этот термин как: «Возможность понимания связей между представленными фактами.»

BI в сегодняшнем понимании эволюционировал из систем для принятия решений, которые появились в начале 1960-х и разрабатывались в середине 1980-х.

В 1989 году Говард Дреснер (позже аналитик Gartner) определил Business intelligence как общий термин, описывающий «концепции и методы для улучшения принятия бизнес-решений с использованием систем на основе бизнес-данных».

Примечания

Ссылки

  • На смену Business Intelligence приходит Business Analytics? (ж-л PC Week/RE № 41 (599) 6 ноября - 12 ноября 2007)
  • BI как инструмент оптимизации маркетинговых кампаний (PC Week Review: Бизнес-аналитика, май 2010)
  • Бизнес-аналитика: сегодня и завтра (Журнал Intelligent Enterprise № 2 (212), февраль 2010 года)
  • Бизнес-аналитика на российской почве (Ж-л PC Week Review: Бизнес-аналитика, май 2010)

Wikimedia Foundation . 2010 .

Смотреть что такое "Business Intelligence" в других словарях:

    Business intelligence - (BI) refers to technologies, applications and practices for the collection, integration, analysis, and presentation of business information and sometimes to the information itself. The purpose of business intelligence a term that dates at least… … Wikipedia

    Business Intelligence 2.0 - (BI 2.0) is a loose term referring to some new (2006 7) trends and advances in Business Intelligence (BI). The 2.0 version number alludes to version numbers assigned to software even though it is only an abstract concept not a specific… … Wikipedia

    Business Intelligence - Der Begriff Business Intelligence (deutsch etwa betriebswirtschaftliche Erkundung oder Geschäftsaufklärung), Abk. BI, wurde Anfang bis Mitte der 1990er Jahre populär und bezeichnet Verfahren und Prozesse zur systematischen Analyse (Sammlung,… … Deutsch Wikipedia

    Business-Intelligence - Der Begriff Business Intelligence (engl. etwa Geschäftsanalytik Abk. BI) wurde Anfang bis Mitte der 1990er Jahre populär und bezeichnet Verfahren und Prozesse zur systematischen Analyse (Sammlung, Auswertung und Darstellung) von Daten in… … Deutsch Wikipedia

    Business Intelligence - Informatique décisionnelle Pour les articles homonymes, voir DSS et BI. L’informatique décisionnelle (Management du système d information, en anglais: DSS pour Decision Support System ou encore BI pour Business Intelligence) désigne les… … Wikipédia en Français

    business intelligence - noun Any information that pertains to the history, current status or future projections of a business organization … Wiktionary

    business intelligence - / bɪznɪs ɪnˌtelɪdʒ(ə)ns/ noun information that may be useful to a business when it is planning its strategy … Marketing dictionary in english

    Business Intelligence - Sammelbegriff für den IT gestützten Zugriff auf Informationen, sowie die IT gestützte Analyse und Aufbereitung dieser Informationen. Ziel dieses Prozesses ist es, aus dem im Unternehmen vorhandenen Wissen, neues Wissen zu generieren. Bei diesem… … Lexikon der Economics

    Business intelligence tools - are a type of application software designed to report, analyze and present data. The tools generally read data that have been previously stored often, though, not necessarily, in a data warehouse or data mart. Types of business intelligence tools … Wikipedia

    Business Intelligence Development Studio - (BIDS) is the IDE from Microsoft used for developing data analysis and Business Intelligence solutions utilizing the Microsoft SQL Server Analysis Services, Reporting Services and Integration Services. It is based on the Microsoft Visual Studio… … Wikipedia

Книги

  • Business Intelligence. Data Mining and Optimization for Decision Making , Carlo Vercellis , Business intelligence is a broad category of applications and technologies for gathering, providing access to, and analyzing data for the purpose of helping enterprise users make better… Издатель: