НовостиОбзорыСобытияIT@WorkРеклама
Документооборот/ECM:

Блог

ECM и неструктурированные данные

Сейчас получил новостную рассылку, в ней ссылка на статью Антона Шмакова Основные направления развития ECM. Собственно в первоисточнике она была опубликована более года назад, но почему-то сайт Директума решил ее воспроизвести только сейчас (кстати, я думаю, что с такой перепечаткой все обстоит лицензионно чисто, нет точной ссылки на первоисточник).

Но сейчас о другом. Традиционное определение ECM – работа с неструктурированной (иногда добавляется – и полуструктурированной) информацией.
[spoiler]
Вот из Википедии:

По определению Gartner, ECM — это стратегическая инфраструктура и техническая архитектура для поддержки единого жизненного цикла неструктурированной информации (контента) различных типов и форматов.
А что такое – структурированная, полуструктурированная, неструктурированная?

Неструктурированная – это контент. А структурированная – это что?

Получается как-то так: неструктурированная – это ECM, а струтурированная – это ERP.
А дальше выводы такие: ERP работает с числовой (в основном) информацией, а ECM – с текстовой (условно говоря). ERP – это машинная обработка, а ECM – человеческая…
Т.е. неструктуриванная – это информация, в смословом содержании которой может разобраться только человек?
Можно, конечно, понимать и так. Но все же есть и другой важный аспект.

В статье Антона Шмаков в этом плане есть определение (статья начинается с него), которое проясняет суть вопроса:

Концепция Enterprise Content Management (ЕСМ) является частью ИТ, которая помогает людям сделать из набора неструктурированных данных связанную информацию в контексте бизнеса
Т.е. из некоторого "хаоса" получается нечто полезное.
Очень точное замечание!

Я недавно сам, "размышляя о природе документа", написал в блоге, что документ становится документов только в тот момент, когда он попадает в "ведение" какой-то системы.

В развитие этой идеи получается, что ECM как раз позволяет преобразовать неуправляемый хаос информационных ресурсов (которые существуют, но, как бы, вне зоны видимости корпоративной ИТ) в нечто управляемое и потому полезное.
Колесов Андрей
В рассылке была приведена ссылка: url=http://ecm-journal.ru/docs/Osnovnye-napravlenija-razvitija-ECM.aspx?from=subsday
Она работала. Сейчас она не работает (страница не находится)

Ваша  ссылка тоже не работает.
Vladislav Artukov
Переход от неструктурированной к структурированной информаций - не обязательно прерогатива человека. Например, фотографируем текст, он "кидается" в клиент Evernote, где-то на серверах Evernote выполняется распознавание текста - и вот уже готова структурированная информация.
Колесов Андрей
Но вопрос как раз и заключается в том, что такое "неструктурированная" информация. В такой (вашей, да и традиционной тоже) это инфо, которую может понимать компьютер (для какой-то обработки), у прощенно говоря - оцифрованная. А я предлагаю вариант, что неструктурированная - это "неуправляемая", вне управления ИТ-системы.