Выбор системы управления контентом. Система управления содержимым

Вообще системы управления контентом можно разделить на несколько типов, смотря на степени открытости и лицензии на программное обеспечение.

Степень открытости определяется правами доступа к исходному коду программы. Этот критерий разделяет следующие типы CMS:

  • - CMS с закрытым исходным кодом -это когда пользователь не имеет доступ к исходному коду. Большинство коммерческих систем распространяются таким образом. Другое название этого вида патентованные CMS.
  • - CMS с открытым исходным кодом - это когдапотребитель получает доступ к исходному коду программы при определенных условиях. Есть различные типы лицензий и условий, при которых пользователь получает доступ к исходному коду.
  • - CMS с свободным исходным кодом - это программное обеспечениене только с открытым исходным кодом, но и бесплатно. Последнее означает, что потребитель получает исходный код программы и свобода делать все, что они хотят с исходным кодом и программой.

Пользователь получает следующие права -право использовать программу для любых целей, право изучать как она работает, право изменять ее под своими нуждами, право распространять копии программы, право улучшать программу и публиковать ее.

Лицензия на программное обеспечение: CMS представляет собой программное обеспечение, и поэтому является предметом авторского права. Как правило отношения между автором и конечным пользователем, регулируются специальными договорами, названы лицензии на программное обеспечение. Лицензия обеспечивает пользователю право на использование CMS при определенных условиях. Предоставление этого права обычно происходить в рамках нескольких широко применяемых моделей:

  • - Платные CMS: Пользователь платит одноразовую или периодический фиксированную сумму автором CMS. Это наиболее распространенная модель в CMS, которая разработана с коммерческими целями.
  • - Бесплатные CMS: Пользователь не платить за использование CMS.
  • - Свободная CMS: Бесплатная CMS с открытым исходным кодом, которую пользователь может изменять и публиковать в определенных условиях.

Широкое недоразумение происходить при толковании терминов "Свободное программное обеспечение" и "ПО с открытым исходным кодом". Есть большие различия между этими двумя терминами.

Термин "свободное программное обеспечение" имеет тенденцию быть неправильно понятым. Неоднозначность происходит от английского слова "free", которое является многозначным. На русском слово можно перевести как свободный, но и как бесплатный. В русском языке эта двусмысленность не существует.

В английском языке термин "свободное программное обеспечение" может означать "программное обеспечение, которое можно получить по нулевой цене", а также означает "программное обеспечение, которое дает пользователю определенные свободы".

Второе понятие является необходимым значением. Объяснение термина "свободное программное обеспечение" простое - это свободное использование программного обеспечения во всех его значениях. На английском говорят "free speech, not free beer" ("свобода слова, а не бесплатное пиво") - разные значения четко выделяются в этом выражении - свободный, а не бесплатный. Это вопрос свободы, а не цены.

Программное обеспечение называется "бесплатно", потому что пользователи имеют свободу, запустить его, изучить его, изменить его и распространять измененные или неизмененные копии. Большинство людей никогда не слышали об этических соображениях сообщества свободного программного обеспечения, потому что сегодня эта система и сообщество более часто упоминаются как "открытый исходный код".

В 1998 году некоторые из людей в сообщества свободного программного обеспечения отделяются и начинают использовать термин "программное обеспечение с открытым исходным кодом" вместо "свободного программного обеспечения", чтобы описать то, что они делают.

Первоначально термин был предложен, чтобы избежать возможного непонимания термина "свободное программное обеспечение", но потом термин "с открытым исходным кодом" быстро принял другой подход, другую философию, различные значения, и даже другой критерий, при котором лицензии являются приемлемыми.

Почти любое программное обеспечение с открытым исходным кодом является свободным программным обеспечением. Эти два термина описывают почти одну и ту же категорию ПО, но они стоят за принципами, основанных на различных значениях. Различные слова передают разные идеи. Открытый исходный код - это методология разработки, а бесплатное программное обеспечение - это нравственный императив.

Открытый исходный код принимает некоторые лицензии, которые являются недопустимо ограниченными для пользователей, с точки зрения свободного программного обеспечения.

Очевидный смысл термина "программное обеспечение с открытым исходным кодом" является "Вы можете увидеть исходный код", и большинство людей думают, что это и на самом деле означает. Такое значение включает в себя много программ, которые не являются ни свободными, ни с открытым исходным кодом.

Этот критерий намного слабее, чем определение свободного программного обеспечения,а также слабее, чем официальное определение открытого исходного кода.

Для некоторых людей "программное обеспечение с открытым исходным кодом" просто означает, что любой человек может получить копии файлов исходного кода. Этим очевидным смыслом «открытого исходного кода» не является то, что первоначально имели в виду создатели термина и результат в том, что большинство людей понимают его неправильно.

Еще одна интерпретация - программного обеспечения с открытым исходным кодом это программное обеспечение, исходный код которого свободно и публично доступен, хотя конкретные лицензионные соглашения варьироваться в зависимости от того, что вы имеете право сделать с этим кодом.

В программном обеспечении с закрытыми исходными кодами (патентованное ПО) часто встречаются вредоносные функции, такие как шпионаж за работу пользователя, ограничение потребителя, задние двери и принудительное обновление.

Некоторые сторонников программного обеспечения с открытым исходным кодом хотят реализовать эти вредоносные функции в программное обеспечение с открытым исходным кодом. Под давлением со стороны различных компаний, программное обеспечение все чаще и чаще разрабатывается специально, чтобы ограничить права пользователей.

Определение программного обеспечения с открытым исходным кодом является достаточно ясным. Вполне очевидно, что типичная несвободная программа не отвечает на требовании ПО с открытым исходным кодом, но многие компании пытаются дать другое значение.

Это манипулятивная практика не была бы менее вредной, если это было сделано с помощью термин "свободное ПО". Но компании, кажется, не использовать термин "свободное программное обеспечение" таким образом, поэтому термин "ПО с открытым исходным кодом" открывает двери для злоупотреблений такого рода.

Преимущества CMS закрытым исходным кодом:

  • - Большая безопасность от хакерских атак и кражи исходного кода. Когда исходный код не находится в открытом доступе, как правило, сайт не является уязвимой для хакерских атак "defacements", которые используются для изменения внешнего вида сайта;
  • - Техническое обслуживание - как правило, имеет команду людей, которые круглосуточно на связи. Потребители получают качественную и быструю поддержку по телефону, электронной почте или в специализированных форумах;
  • - Настройки - иногда предлагаются возможности и функции, которые не доступны в ПО с открытым исходным кодом;
  • - Полная и простая для использования документация для различных категорий пользователей;
  • - Описание прикладного программного интерфейса (API).

Основные недостатки CMS с закрытым исходным кодом:

  • - Недостаточная гибкость к изменениям;
  • - Закрытая система - вы не можете переместить сайт и программное обеспечение у другого разработчика;
  • - Зависимость от разработчиков, у которых находится код - в случаях, когда есть проблема с сайта, когда Вам нужны улучшение и новые функций, когда необходимо исправление ошибок, приходиться обращаться к этим разработчикам;
  • - Цена обслуживание - оплачивается каждая дополнительная услуга;
  • - Расходы на хостинг - может потребоваться использование патентованных хостинг услуг, таких как Microsoft Office с IIS и NET.
  • - Для некоторых из существующих CMS отсутствуют доступных учебных материалов.

Существует также разновидность систем с закрытым исходным кодом - это система на сервере разработчика. Владелец CMS предоставляет место на своем сервере без доступа к исходному коду и все управление осуществляется с помощью панели управления. Преимуществом использования таких видов CMS является лучше обслуживание, а минусами являются абонентская плата и то, что собственность сайта остается у разработчика.

Преимуществами CMS с открытым исходным кодом являются:

  • - Простая и быстрая адаптация функциональности, предлагаются больше функций;
  • - Гибкость - с бесплатным кодом может сделать все, добавлять, изменять и т.д.;
  • - Сообщество пользователей: высокая распространенность CMS с открытым исходным кодом, предоставляет возможность иметь большую базу пользователей и больше людей, работающих над исправлением программных ошибок, созданием новых модулей и лучших версий;
  • - Большое количество разработчиков обеспечивает высокое качество кода;
  • - Большое количество независимых компаний, предлагающих услуги по внедрению и поддержке системы.

Среди недостатков появляются:

  • - Существует возможность легко найти пробелы в коде безопасности, когда код сайт открытый. Это открывает потенциальные риски безопасности и уязвимостей;
  • - Существующие лицензионные ограничения на использование определенных форматов данных в системах с открытым исходным кодом;
  • - Часто отсутствует обучение и сертификация специалистов, участвующих в реализации и обслуживании системы;
  • - Нет прямой поддержки - система не имеет службу поддержки, некому позвонить, когда что-то сломалось на сайте.
  • - Документация - есть проекты с открытым исходным кодом в Интернете, о которых действительно существует большое количество документов, но есть и такие о которых никаких документов нету. Так, что документация является либо очень хорошей, либо отсутствует.

Платные CMS разработаны компаниями, чтобы их продать и получить прибыль, а бесплатные системы разрабатываются отдельными программистами и некоммерческими организациями (таких как университеты) в интересах развития и использования системы.

Бесплатные системы, как правило, распространяется под лицензией GPL и, соответственно, никто не отвечает для их технического обслуживания, а также и никто не несет ответственность за охрану и безопасность данных. Если вы покупаете платную CMS, обычно разработчик отвечает за поддержку продуктов, исправление ошибок, советы по использованию системы.

Таб. 1.2. Что оплачивается при покупке CMS?

Описание

Основной продукт (ядро)

Цена основного продукта будет зависеть от количества сайтов, пользователей, серверов и т.д.. Клиент должен убедиться, что как можно больше необходимые ему требования включены в базовым продукте. Если ему нужны дополнительные функции, придется искать дополнительные модули.

Это область, в которой очень быстро можно потратить весь бюджет. Возможные модули: персонализация, инструменты для социальных медий, каталоги для электронной коммерции, интеграция с другими продуктам, таких как CRM системы и другие. Модули могут быть лицензированы также как и основной продукт и это приведет к дополнительным затратам для каждой рабочей среди. Придется оплачивать и за поддержку.

Базы данных и серверов приложений

Следует включить лицензии для Oracle/SQL Server баз данных и серверов приложений и т.д.

Aрхитектура аппаратного обеспечения

Надо принять во внимание архитектуру. Количество серверов и процессоров может повлиять на окончательную цену. При динамической CMS это может быть трудно определить в самом начале. Все зависит от того, как CMS реализуется и как она будет развиваться.Рекомендуемая архитектура будет зависеть от интенсивности трафика.

Непродуктивные лицензии на рабочую среду

Непродуктивные лицензии на рабочую среду добавляют расходы, хотя это, как правило, маленькая доля от полной стоимости. Это может включать в себя тестирование, разработку и аварийное восстановление.

Поддержка

Это ежегодные расходы на абонемент, которые, как правило, составляют 18-20% от закупочной цены.

В последнее время бесплатные и свободные CMS с открытым исходным кодом, как Drupal, Joomla и WordPress становятся большой конкуренцией патентованных CMS. Причины этого в том, что они простые для использования и не требуют никаких навыков программирования, чтобы сделать обновления или изменения. Есть и другие преимущества этих CMS:

  • - Нет платы за патенты, свободная лицензия - не должны платить за приобретение своей собственной копии;
  • - SEO Friendly - программное обеспечение с открытым исходным кодом позволяет пользователю изменять заголовки страниц, мета-описания, "дружественные" URL-адреса и постоянные ссылки (permalinks) для поддержки поисковой оптимизации;
  • - Являются масштабируемыми - программное обеспечение CMS с открытым исходным кодом может расширяться с расширением компании. Возможно легко добавлять новый контент, услуги и функции;
  • - Надежность и безопасность - Drupal, например, уже давно считается безопасной и надежной платформой для веб-сайтов;
  • - Браузер-администрирование. Независимо откуда работает пользователь, из дома или из офиса, он может добавить текст и загрузить мультимедийные файлы непосредственно из браузера.
  • - Сайт не обвязанный работать только с одной компанией для веб-разработки;
  • - Большое сообщество разработчиков - Open Source поддерживается огромным количеством сторонников, а значит, будет легко найти разработчика.
  • - Высокое качество и стабильный код. Каждый коммерческий CMS разработан ограниченным количеством разработчиков. Ни одна компания не имеет ресурсов сообщества разработчиков, которое поддерживает Open Source. Программное обеспечение с открытым исходным кодом является более стабильным, поскольку тысячи разработчиков постоянно усовершенствовать его.
  • - Персонализация - ПО с открытым исходным кодом предлагает множество модулей для всего - от социальных сетей и управления документами до форумов и интернет-магазинов, предоставляя неограниченные функциональности.
  • - Обновления - продукты с открытым исходным кодом обновляются быстро, потому что новые версии этих продуктов создаются регулярно.Чтобы корригировать ошибки, не нужно ждать очередного «патча» или пакета обновления, как обычно и происходить в коммерческих решениях. Благодаря большому сообществу и взаимной поддержке, системы управление контентом с открытым исходным кодом развиваются быстрее, чем их коммерческие конкуренты. Благодаря свежих идей и постоянной поддержки со стороны сообщества, открытые продукты не только конкурируют с коммерческими решениями, но и доминируют на рынке.
  • - Стандарты - продукты с открытым исходным кодом почти всегда основаны на стандартах, а не против них. Это значительно упрощает процесс доработки продукта и обеспечивает совместимость с другими продуктами, поддерживающими стандарт.
  • - Каждый специалист видит исходный код программного обеспечения и имеет возможность анализировать продукт и высказать свое мнение о его надежности, безопасности и совместимости.

Все большее количество людей в наше время обзаводится интернет-ресурсами. Интернет-магазины, сайты портфолио и просто личные блоги. Но не каждый хочет при этом вникать в суть сайтостроения, изучать основы верстки и языки программирования. Как же быть? На помощь приходят CMS - системы управления сайтами. Простые, функциональные и удобные интерфейсы, позволяющие вносить изменения на сайте, не открывая исходный код.
Но какие из них удобнее, а какие функциональнее?

Не так давно компания iTrack предоставила независимый рейтинг систем управления сайтом, составленный по информации о реальных установках на сайтах. Всего было проверено около миллиона сайтов.
Места распределились так (на июль 2014):

Рассмотрим самые популярные системы этого рейтинга.

1. WordPress (Вордпресс)

Бесплатная CMS, последнее обновление от 08.05.2014, сайт
WordPress очень популярен в рунете и мире CMS, особенно среди новичков. Хорошо русифицирован. Легко устанавливается. Процесс установки занимает менее 5 минут от начала до конца. Наполнение сайта контентом не требует никаких дополнительных знаний.
Позволяет создавать сайты различного типа, но всё же, когда говорят о Вордпресс, подразумевают, что это, в первую очередь, движок для блогов. Поэтому если необходимо легко и быстро создать свой блог, либо несложный сайт информационного типа, то именно Вордпресс – хороший выбор.
Минусы Вордпресса типичны для популярных CMS - возможность сбоев при высокой посещаемости и периодическое обнаружение тех или иных уязвимостей в скрипте.
Также Вордпресс вряд ли подойдёт для сложного сайта с большой функциональностью, например портала или интернет-магазина, т.к. просто не имеет необходимых модулей для этого.

Интересный факт:
Около 40 тысяч новых сайтов в день создается с помощью WordPress. То есть, практически каждые две секунды рождается сайт на этой CMS.

2. Joomla! (Джумла)

Бесплатная CMS, последнее обновление 11.06.2014, сайт
Несколько сложнее в освоении, чем Вордпресс, но имеет и большую сферу применения. Потребуются некоторые усилия для установки этой CMS. Наполнение сайта станет для вас достаточно легким процессом после того, как вы разберетесь в структуре элементов Joomla.
Для Джумлы разработано огромное число модулей, включая форумы, чаты, блоги, интернет-магазины. Джумла позволяет создавать самые различные сайты, как простые, так и сложные, это достаточно универсальная CMS. Также для Джумлы существует огромное число шаблонов.
Но есть и минусы. Уязвимости в коде тоже время от времени встречаются, поэтому периодически необходимо обновлять систему.

Интересный факт:
Joomla поддерживает 64 различных языка.


3. 1С-Битрикс

Платная CMS, последнее обновление 16.04.2014, сайт
Перед установкой Битрикса, возможно, придется задуматься над выбором хостинга. Если вы планируете разместить на сайте обширный каталог товаров, объявлений и т.п., то нужно будет выбрать специальный тариф на хостинге (помощнее), только тогда система будет работать нормально. Но это единственная сложность при установке.
Важнейшим преимуществом Битрикса является его многофункциональность. Разработчики предлагают не только пакетные сборки, но и готовые решения. Можно при установке выбрать готовый сайт (на одном из стандартных шаблонов), например, сразу создать готовый интернет-магазин (с настроенной корзиной, формой заказа, способами доставки и оплаты, с личным кабинетом пользователя). Также несомненный плюс - высокая надежность, безопасность, стабильное обновление. Обновления, касающиеся безопасности, всегда будут доступны клиенту абсолютно бесплатно.
Управление контентом в этой системе значительно отличается от других CMS. В принципе, если привыкнуть к этому, то вы легко сможете менять информацию на сайте.
Первым минусом Битрикса является его цена. Да, цена действительно высокая, но она оправдана мощностью системы - правда, чтобы использовать эту мощность, скорее всего, понадобится специально обученный под Битрикс программист. Таким образом, CMS подходит либо для тех, кому не жалко денег, чтобы получить готовый работающий шаблонный сайт, либо для серьезных проектов (крупных порталов и интернет-магазинов).

Интересный факт:
Сайт компании «Эльдорадо» (www.eldorado.ru) работает на Битриксе.

4. DataLife Engine (DLE)

Платная CMS, последнее обновление 01.04.2014, сайт dle-news.ru
Описание системы DLE стоит начать с того, что она платная. Многие считают, что это – ее основной минус. Как и у любого продукта, у DLE есть и бесплатная демо-версия. Но так как она распространяется бесплатно, то имеет ряд недостатков, как, например, ограничение в количестве новостей – 100, комментариев – 200. В то же время многие дополнительные модули для DLE бесплатны.

Работать с содержимым сайта совсем не сложно, так как в DLE всего два типа контента – новости и статические страницы. Но в системе нет понятия Меню и Блоки, а это очень удобные и необходимые решения. Поэтому такое упрощение структуры делает систему недостаточно гибкой и не позволяет легко менять внешний вид сайта.

В следующей статье мы продолжим наш обзор систем управления сайтом и постараемся дать рекомендации о том, какая CMS больше подойдет для того или иного сайта.

Понятие CMS

Любой Web-сайт состоит из набора страниц, а различия заключаются лишь в том, как они организованы. Существует два вида организации Web-сайта – статический и динамический. В первом случае специалисты, отвечающие за создание и поддержку сайта пишут в HTML-форме каждую в отдельности страницу, включая ее оформление и контент. Во втором – в основе любой Web-страницы лежит шаблон, определяющий расположение в окне Web-браузера всех компонентов страницы, и вставка конкретной информации производится с использованием стандартных средств, не требующих от участника процесса знания языка HTML и достаточно сложных для неспециалиста процедур публикации Web-страницы.

Если сайт состоит из множества страниц или он должен часто обновляться, то преимущество динамической организации становится очевидным. Разработчикам Web-сайта не надо переписывать всю страницу при изменении ее информационного наполнения или дизайна. Страницы не хранятся целиком, а формируются динамически при обращении к ним.

Таким образом, отделение дизайна от контента является главной отличительной особенностью динамических сайтов от статических. На этой основе возможны дальнейшие усовершенствования структуры сайта, такие как определение различных пользовательских функций и автоматизация бизнес-процессов , а самое главное, контроль поступающего на сайт контента.

Для создания динамического сайта возможны два пути. Во-первых, это написание собственных программ, отвечающих за создание нужных шаблонов и поддерживающих необходимые функции. При этом созданная система будет полностью отвечать потребностям, однако возможно потребует больших программистских усилий и времени. Второй путь - это воспользоваться уже существующими системами, которые и называются системами управления Web-контентом. Преимуществом этого пути является уменьшение затрат времени и сил. К его недостаткам можно отнести снижение гибкости, предоставление недостаточного или чрезмерного набора возможностей.

Под контентом (дословный перевод английского термина content, означающего содержание, содержимое) понимают информационное наполнение сайта – то есть все типы материалов, которые находятся на сервере: web-страницы, документы, программы, аудио-файлы, фильмы и так далее. Таким образом, управление контентом – это процесс управления подобными материалами. Он включает следующие элементы: размещение материалов на сервере, удаление материалов с сервера, когда в них больше нет необходимости, организацию (реорганизацию) материалов, возможность отслеживать их состояние.

Системы управления контентом (в английском языке существует устоявшийся термин – Content Management Systems или, сокращенно, CMS ) – это программные комплексы, автоматизирующие процедуру управления контентом.

Функции CMS

Функции систем управления контентом можно разделить на несколько основных категорий:

  1. Создание - предоставление авторам удобных и привычных средств создания контента.
  2. Управление - хранение контента в едином репозитории . Это позволяет следить за версиями документов, контролировать, кто и когда их изменял, убеждаться, что каждый пользователь может изменить только тот раздел, за который он отвечает. Кроме того, обеспечивается интеграция с существующими информационными источниками и ИТ-системами. CMS поддерживает контроль над рабочим потоком документов, т.е. контроль за процессом их одобрения. Таким образом, управление контентом включает в себя хранение, отслеживание версий, контроль за доступом, интеграцию с другими информационными системами и управление потоком документов.
  3. Публикация - автоматическое размещение контента на терминале пользователя. Соответствующие инструменты автоматически адаптируют внешний вид страницы к дизайну всего сайта.
  4. Представление - дополнительные функции, позволяющие улучшить форму представления данных; например, можно строить навигацию по структуре репозитория .

Cистемы управления контентом делятся на четыре основных категории, которые частично перекрываются:

  1. Системы управления исходными кодами традиционно поддерживают управление исходными кодами программ, и часто предоставляют некоторый web-интерфейс, который может использоваться внутри корпоративной сети , а также вне ее для параллельной работы с исходными кодами.
  2. Системы управления документами предназначены для организаций, оперирующих с большим количеством документов, например, офисы больших компаний, редакции и страховые компании.
  3. Системы управления web-контентом представляют собой новую индустрию программных продуктов. Эти системы предназначены для разработки и управления Web-сайтами различной степени сложности. Обычно такие системы поддерживают и некоторый тип управления потоками работ .
  4. Системы электронной коммерции – обеспечивают хранение и управление электронными каталогами товаров. По сути, эти системы незначительно отличаются друг от друга. Самое главное отличие этих систем – это люди, которые их используют.

Использование CMS предоставляет следующие преимущества:

  1. Оперативное обновление информации - информацию публикует сотрудник, владеющий информацией, без дополнительных посредников в виде технических специалистов. CMS предназначены для автоматизации процесс публикации информации на web-сайте, предоставляя пользователям возможность самим публиковать материалы в WWW и определять их визуальное представление, используя для этого стандартные средства, не требующие знания языка HTML и достаточно сложных для неспециалиста процедур. С помощью CMS можно, не будучи профессиональным разработчиком, создавать и модифицировать информационное наполнение сайтов.
  2. Снижение стоимости поддержки – обновление информации производится самостоятельно, нет необходимости оплачивать труд собственного или внешнего web-мастера. Снижение стоимости происходит за счет снижения потерь времени на поиски документов, пресечения дублирования и ошибок, увеличения скорости связи с партнерами и клиентами.
  3. Предоставление дополнительных сервисов пользователю – часть сервисов – поиск, форумы, голосования и т.д., требуют интерактивного взаимодействия с пользователем. Они уже реализованы в рамках CMS .
  4. Уменьшение сроков и стоимости разработки – наиболее востребованная функциональность уже реализована в CMS и может быть сразу использована.
  5. Повышение качества разработки – при разработке полностью или частично используются готовые модули, которые уже прошли неоднократное тестирование.
  6. Снижение стоимости дальнейших модификаций – CMS позволяют разделить данные и их представление. Это позволяет гораздо проще изменить внешний вид сайта, чем в случае со статическим сайтом.

Среди CMS -систем часто выделяют так называемые каркасы ( content management framework, CMF) - инструментарии для создания системы.

Разработкой систем управления контентом занимаются многие компании, в том числе IBM, Microsoft, Oracle, Macromedia.

Стандартизация CMS

В последнее время начали появляться организации, пытающиеся объединить разработчиков CMS , создать единую информационную среду для потенциальных пользователей подобных систем, продвигать и утверждать единые стандарты. Прежде всего, это ассоциации OSCOM ( Open Source Content Management ), и CMSWatch.

OSCOM утвердила такие стандарты, как WebDav , RSS , ATOM и JSR -170.

В свою очередь, CMSWatch ежегодно выпускает отчет, включающий в себя обзор рынка CMS -систем, сравнение некоторых из них, описание жизненного цикла контента и управления им в CMS -системах.

Модели представления данных в CMS

Существует классификация CMS , основанная на модели представления данных - объектной, сетевой или модульной.

Объектная модель

Объектная модель представления данных оперирует такими понятиями, как класс и объект. Классы определяют структуру данных и представляют собой набор атрибутов (текстовая строка, целое число, изображение и т.д.). Экземпляры класса (объекты) имеют определенную структуру и могут содержать другие объекты, образуя произвольную иерархическую структуру. Объекты могут наследовать свойства, содержание и поведение объектов, которые в них содержатся. Примерами объектов служат документы, картинки, папки и учетные записи пользователей. Класс контента не хранит в себе реальных данных - такую информацию содержат объекты (экземпляры класса). Определив один класс, можно создать множество его представителей (контент объектов). извлечения данных из направленного графа обычно используются рекурсивные процедуры обработки, такие как составление списков узлов, определение атрибутов узла по атрибутам родителя и др.

Модульная модель

В подобных системах контент разделен на отдельные модули по типам содержимого . Структура данных зависит от модуля, и вся работа с контентом сосредоточена внутри модуля. Модули независимы и полностью отвечают за работу с документами данного типа. Документы описываются с помощью фиксированного набора характеристик - типы документов строго фиксированы. Расширять функциональность можно за счет добавления нового модуля, замены или редактирования существующего кода. Чаще всего нет никакой системы связей между документами разных модулей и между документами одного и того же модуля. Стандартный набор типов контента (модулей) таков: ссылки, статьи, файлы, новости, разделы, форум.

Несмотря на очевидную ограниченность модели данных , системы на ее основе наиболее популярны благодаря своей простоте. У модульных CMS -систем есть один общий недостаток - строго фиксированная в пределах модуля структура содержимого. Однако для расширения их функциональности можно воспользоваться внешними модулями, которых в Сети немало. Очевидное преимущество этих систем - возможность получения почти полностью готового к использованию портала за короткое время.

И вы, наверное, уже поняли что движок для сайта — это не просто отдельная сущность, которую мы создаем или выбираем без оглядки на все остальное (особенности и задачи нашего проекта). В программном плане , это не просто программа для удобного наполнения сайта желательно , это, собственно, и есть ваш сайт. Тут имеется некоторая путаница в понятиях. Некоторые специалисты предпочитают расшифровывать аббревиатуру CMS — как «система управления сайтом», это более популярная формулировка. И происходит это потому, что по сути CMS одновременно является и «движком» вашего сайта и программой для его наполнения. Собственно, как вы уже поняли из названия поста, я предлагаю именовать CMS не иначе как системой управления контентом.

Как правило, подобные системы оснащены графическим веб-инсталлятором, что позволяет новичку без особых знаний веб-технологий установить CMS, создать свой сайт и сконцентрироваться, например, на написании статей. Для работы большинства CMS необходима поддержка веб-сервером баз данных MySQL. Так что система управления контентом предопределяет структуру вашей новой БД и берет на себя сразу несколько функций.

Что умеют системы управления контентом?

Система управления содержимым/контентом (по-русски сокращ. СУС/СУК) управляет различными составляющими , а именно она отвечает за вывод меню, страниц сайта, а также предоставляет удобный интерфейс для создания новых страниц, меню и для изменения дизайна сайта. Идеальный вариант для человека не владеющего кодингом — не нужно редактировать код страницы, чтобы изменить пункт меню или добавить текст. Вывод страниц — все происходит автоматически, внесенные изменения отобразятся на всех целевых страницах. При добавлении или редактировании страницы вас заботит лишь текст, а о разметке, внешнем виде, стилях и шрифтах позаботится ваша CMS. Понятно, что внешний вид сайта тоже можно изменять с помощью панели управления, к тому же с помощью пары щелчков мыши — установил тему и готово. Совсем другое дело — адаптировать эту тему под свой сайт, но это уже другая «песня».

Но нужно ли методично изучать веб-технологии, чтобы работать с CMS? Я не призываю вас к стремлению не изучать базовую связку HTML + CSS + JavaScript, игнорирование подобных знаний приведет вас, в конечном итоге, к тому, что проблемы с CMS (а их может быть очень много) со временем сыграют с вами злую шутку. Вы хотели просто и без проблем создать сайт, а на деле получилось, что часами «гуглите» на тему: «Как мне изменить цвет фона в выбранной теме?», или «Поплыл шаблон, как правильно отцентрировать блок с новостями?». Хотя я и не люблю тех, кто «бьет по рукам указкой» новичкам, но если вы серьезно решили заниматься сайтостроением, то данный минимум, считаю, вам необходим.

Какие бывают системы управления контентом?

Темы сравнений CMS систем по качественным характеристикам очень популярны в интернете, но перечислю только некоторые — открытые и бесплатные системы, как мне кажется, наиболее привлекательные для начинающего сайтостроителя. Но у open source CMS и расширений для них много проблем с безопасностью, с валидностью кода, с регулярностью и своевременностью обновлений, но для начинающего разработчика все эти недостатки часто компенсируются одним главным достоинством — доступностью. DRUPAL, JOOMLA, WORDPRESS – самые яркие, на мой взгляд, представители условной категории «просто и бесплатно». Есть более сложные для освоения системы — MODX и TYPO3. Отмечу, что многие из перечисленных решений считаются CMF — фреймворками для проектирования и создания систем управления контентом CMS, но о деталях этого вопроса вам еще рано задумываться. Многие специалисты называют эти системы – «попсовыми», но не стоит путать все вышеперечисленные системы с разного рода конструкторами сайтов, блог-сервисами (Google Blogger, LiveJournal), аккаунтами в социальных сетях. Об этих и других CMS системах для профессионального создания сайтов мы поговорим отдельно в одной из моих будущих статей. Этим постом я заканчиваю серию статей, посвященную начальным теоретическим основам создания сайта.

Документы - это кровь, снабжающая тело (компанию) кислородом (информацией),
который позволяет ему функционировать (делать бизнес).
Xerox

Данные и контент

Сегодня вместо термина «автоматизация документооборота» все чаще употребляется термин «системы управления контентом», или ECM (Enterprise Content Management). Да и сам термин «документ» теперь трактуется все более широко. С чем же это связано?

В развитии документооборота можно выделить две тенденции: переход от автоматизации структурированных данных к автоматизации неструктурированных данных и от использования узкоспециализированных решений к применению интегрированных систем масштаба предприятия.

Первые системы электронного документооборота появились еще в 70-е годы. Это были преимущественно автономные приложения, фокусирующиеся на отдельных задачах, таких как оцифровка документа, его распознавание и управление записями о документах, реализованных на уровне отдела предприятия.

Приложения для документооборота, как и офисные приложения Word, Excel и PowerPoint, в начале 80-х годов существовали в виде отдельных продуктов и лишь со временем были интегрированы в комплексные решения.

Первые системы документооборота в основном были предназначены для управления структурированными записями. По сути, они представляли собой специализированные базы данных, хранящие записи о документах: о поступающем документе делалась запись, а далее к ней привязывались все действия, которые выполнялись с документом.

Со временем подобные системы стали включать и сами документы в электронном виде, понятие «запись» расширилось и стало обозначать не только запись в базе данных, но и, например, электронное письмо, документ и его индекс и т.д. Постепенно изменилось само понятие «документ».

Действительно, в организацию документ может поступить в бумажном виде, затем его отсканируют, распознают и поместят на web-сайте. С точки зрения содержания это будет один и тот же документ, а по формату файла и способу хранения - разные.

В компаниях осознали, что ручной перевод документа из одного формата в другой, из одной формы хранения в другую, а также повторное создание одного и того же содержания для web-хранения или хранения в другом виде - это неоправданные затраты. Так появилась концепция ECM, в соответствии с которой внимание стали акцентировать на автоматизации контента.

Говоря о трансформации понятия «документ», хотелось бы привести результаты опроса компании IDC (рис. 1), в ходе которого 956 руководителей европейских компаний ответили на вопрос: «Что следует понимать под термином “документ”?»

Рис. 1. Результаты опроса «Что следует
понимать под термином “документ”?»
(источник: IDC, 2006)

Как свидетельствуют результаты опроса, почти 50% респондентов отнесли к понятию «документ» web-странички и почти 80% - сообщения электронной почты.

Что же такое документ? Безусловно, что этот термин постоянно изменяется. По всей видимости, наиболее удачным следует признать определение компании Xerox: «Документы - это кровь, снабжающая тело (компанию) кислородом (информацией), который позволяет ему функционировать (делать бизнес)». Из этого определения становится понятно, что многим организациям пора сделать анализ крови, чтобы оценить свое состояние здоровья и принять соответствующие меры.

Понятие «документооборот», подразумевающее полную автоматизацию работы с документами на предприятии, невозможно свести к какому-то одному общеупотребимому английскому ИТ-термину. Наиболее полно такому подходу соответствует современная концепция Enterprise Content Management.

В последнее десятилетие стратегия использования ИТ в большинстве компаний была нацелена на снижение расходов. Сегодня акцент постепенно смещается в область привлечения и удержания клиентов за счет предоставления им более качественных информационных сервисов. Дальнейшее развитие информационных технологий приведет к увеличению спроса на качественные информационные услуги, и те фирмы, которые не смогут обеспечить подобных сервисов, будут вынуждены уйти с рынка. Одна из главных тенденций развития ИТ - резкий рост контента в компаниях. Современные дешевые средства хранения данных позволяют накапливать контент, но для эффективного управления им требуются новые, интегрированные технологии ввода, хранения, управления и дистрибьюции контента. Управление контентом в условиях жесткого ИТ-бюджета - это мощный стимул для организаций внедрять корпоративные системы управления контентом.

Управление контентом становится первоочередной задачей для большинства современных компаний. При этом очень многие руководители хорошо понимают, сколь существенные вложения требуются для построения интегрированной системы управления контентом, однако плохо представляют себе, сколько они теряют из-за недоавтоматизированности подобных систем и как много операций приходится дублировать. Более 90% руководителей организаций, участвовавших в вышеупомянутом опросе IDC, не смогли даже примерно оценить, сколько они тратят на управление контентом при той степени автоматизации, которая принята на их предприятии. Две трети признались, что такие расчеты (оценка расходов на управление контентом) в организации не проводились.

Для того чтобы понять, каковы же затраты на работу с контентом, обратимся к расчетам компании IDC. На рис. 2 представлено распределение затрат на выполнение типичных задач сотрудниками среднестатистической организации, занятыми в сфере обработки информации. Авторы исследования исходили из западных норм оплаты труда (в среднем 60 тыс. долл. в год); для российских предприятий в количественном выражении картина, конечно же, будет несколько иная, однако качественное распределение (временны е затраты) останется примерно таким же.

Рис. 2. Средняя стоимость выполнения информационных операций
на одного сотрудника в неделю (источник: IDC, 2006), долл.

Как следует из рис. 2, в среднем организации в США тратят около 270 долл. (из расчета на одного сотрудника в неделю) только на поиск информации и 195 долл. - на ручное заполнение форм и создание документов.

Результаты еще более интересного исследования представлены на рис. 3. Здесь анализируются дополнительные затраты по разным категориям задач из-за потерь времени на неавтоматизированную работу с контентом. Очевидно, что оптимизация работы с контентом сулит большую экономию.

Рис. 3. Ежегодные потери, связанные с тратой времени на неавтоматизированную
работу с контентом (для американской компании с тысячей сотрудников, занятых
в сфере обработки информации), млн долл.

Все больше руководителей компаний понимают, что нужна такая интеграция контента в рамках организации, при которой сотрудникам не приходится повторно создавать документы с одним и тем же содержанием в разных форматах.

Концепция Enterprise Content Management

ЕСМ - это сравнительно новая концепция, терминология для которой еще окончательно не сложилась. Ее логическая структура представлена на рис. 4.

Рис. 4. Логическая структура ECM

Рассмотрим ключевые элементы, входящие в данную схему.

Системы ввода (Capture)

Система ввода документов включает функции создания, захвата и обработки вводимой информации. Документы могут вводиться со сканера или импортироваться из любого приложения.

Если документ вводится с бумажного носителя, то на первом этапе производится его сканирование и создается электронная копия документа (образ). В процессе сканирования может выполняться программная обработка изображения, а также визуальный контроль качества. Сканеры для корпоративного применения обычно оснащены рядом дополнительных функций, например могут принимать разноформатные документы. На втором этапе (если это необходимо) полученный образ переводится в текстовый документ, то есть выполняется распознавание отсканированных документов. Для этого используются программы оптического распознавания символов (Optical Character Recognition, OCR).

Документы, переводимые в электронный вид, условно делят на формализованные, неформализованные и специальные. В формализованных документах заранее определена форма - расположение и размер обязательных полей, в которые заносятся данные (бланки, накладные, анкеты, картотеки и т.д). К неформализованным относятся документы произвольной формы: договоры, письма и т.д. В качестве специальных документов можно назвать карты или отпечатки пальцев.

Перевод документов каждого из перечисленных выше видов в электронный формат имеет свою специфику: для ввода фотографий достаточно электронного изображения, если документ содержит текст - его необходимо распознать, если это анкета - то обычно нужна только содержащаяся в ней информация, например при обработке избирательных бюллетеней обычно не требуется изображение самого документа - достаточно информации о том, за кого отдан голос.

Особенностью ввода форм в компьютер является необходимость распознавания текстов, заполненных от руки, - так называемого рукопечатного текста. Технологии распознавания рукопечатных символов получили название Intelligent Character Recognition (ICR). Задачи распознавания при вводе форм необязательно связаны с текстом. При вводе форм может потребоваться распознавание различных меток и знаков, или Optical Mark Recognition (OMR), например в избирательных бюллетенях. При массовом вводе документов производятся распознавание, верификация и индексирование. Далее система определяет, куда должен направиться каждый документ и под каким именем, то есть происходит автоматическое управление потоком ввода.

Решения по автоматизации ввода предлагают такие компании, как EMC (Captiva), ABBYY и Cognitive Technologies.

Управление документами (Document Management)

Управление документами - старейший компонент ECM. Он позволяет контролировать документ с момента его создания до архивирования. Назначение технологии - снабжать документы метаданными (атрибутами) для того, чтобы связывать их с бизнес-процессами. Она предоставляет основные библиотечные функции, включая хранение, поиск, контроль версионности и выписку документов.

К основным задачам управления документами можно отнести:

  • контроль документов на вход/выход, контроль целостности документа;
  • управление версионностью (отслеживание версий с той же информацией на разных стадиях работы над документом, а также одной и той же информации в различных форматах);
  • поиск и навигация с целью поиска информации;
  • визуализация информации для представления в структурах типа виртуальных файлов или папок.

Функции Document Management все в большей степени пересекаются с управленческой функциональностью офисных приложений, таких как Outlook/Exchange и Notes/Domino, и с функциями Library Services по администрированию хранения информации.

Лидерами данного сегмента рынка являются компании EMC (Documentum), Open Text (Hummingbird) и IBM (FileNet).

Управление web-контентом (Web Content Management)

Данная технология поддерживает процесс создания, согласования, публикации и постоянного обновления информации на сайтах и обычно интегрируется с системой управления документами. Она позволяет организациям публиковать информацию и документы в Web, не ограничиваясь Интернетом, экстранетом или интранетом. Использование ПО для управления web-контентом позволяет публиковать информацию быстро и безопасно в разных каналах, даже не зная языка HTML. Благодаря этому организации могут возложить задачу публикации документов в Web на бизнес-пользователей - владельцев контента. Эффективность применения такого ПО заключается в том, что разным службам не нужно повторно вносить изменения в документ, а следовательно, контент содержит меньше ошибок и нестыковок.

ПО для управления web-контентом предусматривает:

  • создание/редактирование контента в рамках контролируемого процесса опубликования информации;
  • доставку и администрирование информации для создания web-презентаций;
  • автоматическое преобразование контента под различные форматы представления;
  • надежное разграничение доступа к публичной и непубличной информации;
  • визуализацию интернет-презентаций.

Системы для управления контентом помогают распределить между сотрудниками обязанности по созданию содержания и обеспечивают возможность его публикации. По мере роста контента на сайте техническим сотрудникам (web-мастерам) все труднее поддерживать его. Основными поставщиками подобного ПО являются компании EMC (Documentum), IBM (FileNet), Open Text (Hummingbird) и Microsoft (SharePoint).

Управление записями (Records Management)

Данная технология обеспечивает работу с архивами документов длительного хранения, как электронных, так и бумажных. Она поддерживает полный жизненный цикл документа - от его создания до уничтожения - и связана с процессами архивирования, возвращения или удаления документов. Сейчас компании предпочитают создавать архивы критически важных документов вне офиса, однако при этом необходимо вовремя восстанавливать документы и обеспечивать их хранение в соответствии с госстандартами. ПО для управления записями позволяет компаниям специфицировать бизнес-правила для электронных документов, определять, когда документы должны архивироваться, а когда - уничтожаться, и т.п. Эти правила могут основываться на государственных законах или на бизнес-требованиях самой компании.

Программное обеспечение Records Management не зависит от среды хранения данных и позволяет управлять информацией, хранящейся не в электронном виде. Среди его функций обычно выделяют следующие:

  • визуализация структуры файлов и других структурирующих индексов для упорядоченного хранения информации;
  • однозначная индексация информации, поддерживаемая словарем;
  • управление графиком хранения и уничтожения записей;
  • защита информации в соответствии с ее характеристиками.

Лидерами данного сегмента рынка являются те же компании - EMC (Documentum), Open Text (Hummingbird) и Tower Software.

Управление рабочими потоками (Workflow/Business Process Management)

ПО для управления рабочим процессом служит для автоматизации деловых процедур, управления потоками автоматизации бизнес-процессов, включая разработку маршрутов, контроль исполнения и т.д. К его задачам обычно относят:

  • визуализацию процессов и организационных структур;
  • ввод, администрирование, визуализацию и доставку сгруппированной информации с ассоциированными документами или данными;
  • средства напоминания, установки дедлайнов и делегирования задач.

Реальный выигрыш от внедрения ECM-системы можно получить только при ее интеграции с основными бизнес-системами предприятия. ПО для управления рабочим процессом следует рассматривать как связующее звено между средствами управления контентом и транзакционными системами. Управление Workflow позволяет организациям автоматизировать бизнес-процессы и существенно снизить необходимость в дополнительных контактах в виде электронных писем, телефонных звонков и других средств коммуникации. Процесс глобализации требует лучшего контроля над хранимой информацией. Обмен данными с партнерами и поставщиками должен происходить с соблюдением правил безопасности, чтобы исключить утечки критичных сведений.

Системы для управления рабочим процессом присутствуют в продуктах таких компаний, как IBM (FileNet), EMC (Documentum), Open Text (Hummingbird) и Microsoft (SharePoint). К этой группе также можно отнести компании SAP и Oracle, в составе ERP-систем которых есть развитые модули управления потоками работ.

Управление в рабочих группах (GroupWare)

Системы GroupWare обеспечивают работу виртуальных распределенных команд, включая ведение дискуссий, обсуждение документов, а также проектно-ориентированные методы взаимодействия. Средства организации совместной работы позволяют наладить совместную работу в случаях, не поддающихся строгой формализации.

С ростом числа мобильных сотрудников и при все чаще применяемом удаленном взаимодействии совместная работа становится весьма актуальной. Традиционный порядок хранения информации в системе хранения данных конкретного отдела уходит в прошлое, при этом необходимость в коллаборативных инструментах внутри организации возрастает. Такие системы, как Instant Messaging, управление web-базированными проектами и даже видеоконференц-связь, рассматриваются в качестве элементов ECM. Средства для организации совместной работы обычно предусматривают:

  • коллективное совместное использование баз данных;
  • совместную одновременную контролируемую обработку информации;
  • применение систем знаний, созданных с учетом тематики данных и позволяющих совместно обрабатывать информацию;
  • использование «белых досок» (whiteboards) для мозгового штурма, согласования планов, проведения совещаний, управления проектами и т.п.;
  • интеграцию информации из разных приложений в формат коллективного приложения.

Одним из первых решений, направленных на организацию совместной работы, был продукт Lotus. Сегодня в данном сегменте рынка лидируют компании EMC (Documentum), Open Text (Hummingbird),Microsoft (SharePoint), Oracle (Collaboration Suite) и Xerox (DocuShare).

Следует отметить, что те логические системы, которые мы рассмотрели выше, нельзя назвать технологическими модулями, из которых складывается то или иное решение ECM. Они представляют собой, скорее, наборы функций, объединенных неким маркетинговым термином. При интеграции их в единую ECM-систему многие технологические модули оказываются общими, что поясняет схема, приведенная на рис. 5.

Рис. 5. Схема построения типового ECM-решения (