Разработка автоматизированных архивных технологий

Ю.В. Грум-Гржимайло, А.Г. Сергеева, Н.А. Ткаченко, Э.А. Чернин
Всероссийский научно-исследовательский институт документоведения и архивного дела





Одной из крупнейших информационных систем России является Архивный фонд, в составе которого насчитывается свыше 460 млн. дел (единиц хранения), раскрывающих историю создания и развития российского государства. В соответствии с «Основами законодательства Российской Федерации об Архивном фонде Российской Федерации и архивах» от 7 июля 1993 г. «совокупность документов, отражающих материальную и духовную жизнь народов, имеющих историческое, научное, социальное, экономическое, политическое или культурное значение и являющихся частью историко-культурного наследия народов Российской Федерации образуют Архивный Фонд Российской Федерации».

Архивный фонд Российской Федерации (АФ РФ) складывается из отдельных архивных фондов и собраний архивных документов, независимо от источника их образования, вида носителя, места хранения и формы собственности. Он состоит из государственной и негосударственной частей.

Архивные фонды и архивные документы государственной части Архивного фонда Российской Федерации подлежат постоянному (вечному) хранению в федеральных архивах и центрах хранения документации, в государственных архивах и центрах хранения документации субъектов Российской Федерации, муниципальных архивах органов местного самоуправления, государственных и муниципальных библиотеках и музеях, учреждениях Российской академии наук. В систему Федеральной архивной службы России входят федеральные государственные архивы, государственные архивы субъектов Российской Федерации и муниципальные (городские и районные) архивы.

Архивные документы являются важнейшим источником достоверной информации практически обо всех возможных аспектах развития общества. К архивным источникам постоянно обращаются как отечественные, так и зарубежные исследователи. Особенностью архивного фонда и одним из основных отличий его от других информационных фондов является то, что его объем постоянно возрастает за счет новых поступлений, причем с течением времени информационная, историческая и научная ценность архивной информации не снижается, а, напротив, постоянно возрастает. Поэтому увеличивается и интерес исследователей к архивной информации.

Одним из факторов, определяющих способность архивов полно и точно удовлетворять все возрастающую потребность в ретроспективной информации, является степень автоматизации архивных технологий, охватывающих процессы комплектования архивных фондов, учета и обеспечения их сохранности, работы с научно-справочным аппаратом, выполнения информационных запросов и учета использования фондов.

В настоящее время, когда реформированию подвергаются практически все стороны общественного устройства, многократно возрастает ценность архивной информации. Удовлетворить потребность общества в ней возможно лишь путем информатизации архивной отрасли, то есть создания оптимальных условий для этого. В связи с новым пониманием архива как части информационных ресурсов и информационной системы, важнейшей задачей архивной отрасли становится развитие рациональной системы формирования, обеспечения сохранности и всестороннего использования Архивного фонда России.

Компьютеризация архивного дела базируется на Концепции информатизации архивного дела в России, принятой Государственной архивной службой в 1995 году. Одним из важнейших ее принципов является типизация методов и проектных решений при разработке технического, программного, информационного и организационного обеспечения. При создании информационных систем с использованием типовых модулей уменьшаются общие трудовые и финансовые затраты, сроки разработки и внедрения, увеличивается надежность программного обеспечения за счет многократной его проверки, облегчается обучение и повышение квалификации пользователей.

Для архивных учреждений актуальными являются справочно-информационные системы, обеспечивающие автоматизацию учета, анализа и технологии выполнения основных функций архивов, а также автоматизированные информационные системы и базы данных, оперирующие полнотекстовой информацией. Информационная поддержка основных видов деятельности государственных архивов осуществляется путем создания совместимого программного обеспечения в виде комплекса взаимосвязанных баз данных, его внедрения, практического использования.

В оптимальном варианте эти базы данных должны функционировать в локальной вычислительной сети архивного учреждения как комплекс локальных или распределенных баз данных. Ядром этого комплекса является база данных, содержащая сведения учетного характера на уровне фонда и описи о сохранности архивных материаОдной из крупнейших информационных систем России является Архивный фонд, в составе которого насчитывается свыше 460 млн. дел (единиц хранения), раскрывающих историю создания и развития российского государства. В соответствии с «Основами законодательства Российской Федерации об Архивном фонде Российской Федерации и архивах» от 7 июля 1993 г. «совокупность документов, отражающих материальную и духовную жизнь народов, имеющих историческое, научное, социальное, экономическое, политическое или культурное значение и являющихся частью историко-культурного наследия народов Российской Федерации образуют Архивный Фонд Российской Федерации».

Архивный фонд Российской Федерации (АФ РФ) складывается из отдельных архивных фондов и собраний архивных документов, независимо от источника их образования, вида носителя, места хранения и формы собственности. Он состоит из государственной и негосударственной частей.

Архивные фонды и архивные документы государственной части Архивного фонда Российской Федерации подлежат постоянному (вечному) хранению в федеральных архивах и центрах хранения документации, в государственных архивах и центрах хранения документации субъектов Российской Федерации, муниципальных архивах органов местного самоуправления, государственных и муниципальных библиотеках и музеях, учреждениях Российской академии наук. В систему Федеральной архивной службы России входят федеральные государственные архивы, государственные архивы субъектов Российской Федерации и муниципальные (городские и районные) архивы.

Архивные документы являются важнейшим источником достоверной информации практически обо всех возможных аспектах развития общества. К архивным источникам постоянно обращаются как отечественные, так и зарубежные исследователи. Особенностью архивного фонда и одним из основных отличий его от других информационных фондов является то, что его объем постоянно возрастает за счет новых поступлений, причем с течением времени информационная, историческая и научная ценность архивной информации не снижается, а, напротив, постоянно возрастает. Поэтому увеличивается и интерес исследователей к архивной информации.

Одним из факторов, определяющих способность архивов полно и точно удовлетворять все возрастающую потребность в ретроспективной информации, является степень автоматизации архивных технологий, охватывающих процессы комплектования архивных фондов, учета и обеспечения их сохранности, работы с научно-справочным аппаратом, выполнения информационных запросов и учета использования фондов.

В настоящее время, когда реформированию подвергаются практически все стороны общественного устройства, многократно возрастает ценность архивной информации. Удовлетворить потребность общества в ней возможно лишь путем информатизации архивной отрасли, то есть создания оптимальных условий для этого. В связи с новым пониманием архива как части информационных ресурсов и информационной системы, важнейшей задачей архивной отрасли становится развитие рациональной системы формирования, обеспечения сохранности и всестороннего использования Архивного фонда России.

Компьютеризация архивного дела базируется на Концепции информатизации архивного дела в России, принятой Государственной архивной службой в 1995 году. Одним из важнейших ее принципов является типизация методов и проектных решений при разработке технического, программного, информационного и организационного обеспечения. При создании информационных систем с использованием типовых модулей уменьшаются общие трудовые и финансовые затраты, сроки разработки и внедрения, увеличивается надежность программного обеспечения за счет многократной его проверки, облегчается обучение и повышение квалификации пользователей.

Для архивных учреждений актуальными являются справочно-информационные системы, обеспечивающие автоматизацию учета, анализа и технологии выполнения основных функций архивов, а также автоматизированные информационные системы и базы данных, оперирующие полнотекстовой информацией. Информационная поддержка основных видов деятельности государственных архивов осуществляется путем создания совместимого программного обеспечения в виде комплекса взаимосвязанных баз данных, его внедрения, практического использования.

В оптимальном варианте эти базы данных должны функционировать в локальной вычислительной сети архивного учреждения как комплекс локальных или распределенных баз данных. Ядром этого комплекса является база данных, содержащая сведения учетного характера на уровне фонда и описи о сохранности архивных материалов, о составе и содержании документов. Состав программного обеспечения определяется существующими нормативно-методическими документами, регулирующими деятельность архивных учреждений, и характером сложившихся внутриотраслевых информационных потоков. Вместе с тем, в случае необходимости, он может быть расширен.

В настоящее время в архивных учреждениях страны внедряется разработанная под руководством специалистов Росархива единая технология ведения фондовых каталогов – унифицированное ПО «Архивный фонд». Она функционирует в значительном числе государственных и муниципальных архивов. На ее основе в отрасли решается задача представления учетных данных в едином электронном формате для построения автоматизированной системы централизованного учета архивных фондов. Программа «Архивный фонд» представляет собой автоматизированный информационный массив о составе и содержании документов, состоянии их сохранности и научно-справочного аппарата на уровне фонда и описи. ПО позволяет автоматически формировать паспорт архива, составлять тексты путеводителей по фондам архива, статистические отчеты, осуществлять контроль за хранением документов, развитием и совершенствованием научно-справочного аппарата.

Структура разделов базы данных организована в соответствии со структурой и группировкой основных показателей, описывающих объект. К ним отнесены характеристики научно-справочного аппарата к документам фонда; классификация документов по различным параметрам; физическое состояние документов фонда, а также показатели, характеризующие виды архивных документов, их носители, язык, условия хранения, использования, форму организации материала; показатели, характеризующие объем документов фонда.

В комплексе с программой «Архивный фонд» работает программа «Фондовый каталог», предназначенная для автоматизации централизованного государственного учета архивных документов и контроля над сохранностью документов. Программа реализована в виде автоматизированного каталога архивных фондов. Это дает возможность передавать сведения в Центральный фондовый каталог Росархива в электронном формате. Система автоматически формирует сводные паспорта, сводные статистические отчеты, перечни архивных фондов, статьи для подготовки структурных и тематических межархивных путеводителей. ПО «Фондовый каталог» функционирует во взаимодействии с ПО «Архивный фонд». Сведения из базы данных «Архивный фонд» регулярно передаются в базу данных «Фондовый каталог» и заменяют ранее существовавшие данные. Рассмотренные программы распространяются Росархивом бесплатно. Следует отметить, что они предназначены для использования в федеральных и государственных архивах. Некоторые муниципальные архивы крупных городов как, например, Краснодара, Красноярска, Санкт-Петербурга, также используют данное ПО в своей работе.

Всероссийский научно-исследовательский институт документоведения и архивного дела (ВНИИДАД) на основе анализа характеристик информационных потоков в архивных учреждениях проводит работу по созданию прикладного программного обеспечения для компьютерной поддержки основных функций архивных учреждений и его внедрению в практику архивов. Разработанные базы данных: «Паспорт архива», «Учет фондов», «Аннотация фонда», «Учреждения — источники комплектования», «Читальный зал», «Учет исполнения запросов», «Физическое состояние документов» — составляют программный комплекс первой очереди.

БД «Паспорт архива» обеспечивает обработку статистических сведений о видовом составе и объеме документов Архивного фонда Российской Федерации, хранящихся в архивных учреждениях, состоянии работы по их страховому копированию, государственному учету и созданию научно-справочного аппарата, о количестве специальных и приспособленных архивных зданий, их вместимости и степени загруженности, а также о составе и объеме научно-справочных библиотек.

Информационную основу БД составляют сведения о составе и объеме документов, составе и объеме страхового фонда копий документов, государственном учете и научно-справочном аппарате к документам, составе и объеме научно-справочной библиотеки, зданиях.

При разработке БД «Учет фондов» в качестве объекта автоматизации выступали функции, выполняемые госархивами по учету документов как государственной, так и негосударственной части Архивного фонда Российской Федерации. Типовые решения ведения государственного учета для архивов Российской Федерации разного уровня вырабатывались с условием последующей адаптации к специфике каждого отдельного архива. БД способствует совершенствованию деятельности архивов по обеспечению сохранности, организации рационального хранения, оперативного адресного поиска фондов и описей, фиксации объема хранящихся дел, его изменений и подготовке статистических данных как по архиву в целом, так и по отдельным хранилищам. БД «Учет фондов» отражает и отслеживает информацию о движении документов, об учете и внесении изменений по описи, об учете и внесении изменений по фонду.

Логическим продолжением компьютерной поддержки архивной деятельности в области учета документов является БД «Аннотация фонда», которая обеспечивает оперативность и качественный уровень тематического поиска и подготовки межфондовых и внутрифондовых справочников (путеводителей, кратких справочников, тематических путеводителей, указателей и др.). Локальное или совместное с БД «Учет фондов» использование разрабатываемой базы данных позволит повысить качественный уровень обслуживания потребителей архивной информации.

Функция государственного учета органически связана с комплектованием АФ РФ. Организация хранения, комплектования, работа с ведомствами создают условия для расширения состава документов АФ и обеспечения их долговременного использования в перспективе. Разработанная база данных «Учреждения – источники комплектования» – информационная система, которая способствует совершенствованию ведения списков учреждений – источников комплектования, повышению оперативности контроля работы ведомственных архивов, а также быстрому поиску информации и получению справочных (статистических) сведений на уровне областного и муниципального архивов с постоянным составом документов.

С учетом современных представлений и конкретных задач отрасли по организации государственного хранения документов и обеспечению физической сохранности документов необходимой и важной является работа по проверке физического состояния и выявлению документов с дефектами. При все возрастающих объемах требующих реставрации документов и ограниченности технической возможности их восстановления традиционно существующая технология учета и анализа физического состояния документов становится малоэффективной и все более актуален вопрос применения вычислительной техники для обоснования очередности мероприятий по обеспечению сохранности документов.

Разработанная ВНИИДАД БД «Физическое состояние документов в государственных архивах» позволит создать для государственных архивов методическую основу организации их практической деятельности по обеспечению физической сохранности документов и улучшению их статистического учета.

Организация использования архивных документов является частью научно-информационной деятельности государственных архивов и направлена на введение в научный оборот и предоставление государственным, общественным организациям и гражданам ретроспективной документной информации. В современных условиях использование архивных документов отличается большим тематическим, географическим, хронологическим разнообразием. Расширилась сфера применения документной информации, происходят изменения в категориях ее потребителей.

Разработанные базы данных «Читальный зал» и «Учет исполнения запросов» позволят повысить качество и оперативность получения данных и сводных статистических сведений в целях повышения эффективности использования документов АФ РФ, обеспечения потребителей релевантной документной информацией и будут способствовать организации комплексного использования документов архива. Эти программные комплексы также распространяются в архивной системе бесплатно.

Помимо программного обеспечения, ориентированного на автоматизацию основных функций и направлений деятельности архивов, создаются и другие общеотраслевые БД: «Зарубежная архивная Россика», «Зарубежстройпроект», «Росприоритетпроект», «Государственный реестр уникальных документов», «Нормативно-методическая база отрасли» и др.

Примером полнотекстовой автоматизированной базы данных, разрабатываемой ВНИИДАД, является «Нормативно-методическая база отрасли».

Развитие автоматизации информационного обслуживания архивных учреждений и специалистов на современном этапе осуществляется во ВНИИДАД как на основе общеправовых информационных систем типа «Инфосеть» и «Кодекс», так и собственных разработок. В настоящее время институт завершил второй этап создания автоматизированной нормативно-правовой базы отрасли, в ходе которого осуществлен переход на современную программную оболочку под Windows-95. Помимо этого, существенно расширены поисковые возможности и внесены определенные коррективы в стратегию формирования базы данных, благодаря которым она может рассматриваться как основа для автоматизации нашего справочно-информационного фонда, включавшего на начало 1999 года 1744 перевода зарубежной информации, 190 депонированных рукописей, 6939 неопубликованных материалов и 1151 стандарт. Принято принципиальное решение о представлении, наряду с полнотекстовой, также и реферативной информации по части документов, разработаны внутренние требования к содержанию реферата, направленные на представление в его тексте терминов, имеющих наибольшую значимость при проведении автоматизированного поиска. Структура самой базы данных при этом максимально упрощена и приближена к сложившейся форме организации информационной деятельности и услуг Отраслевого центра научно-технической информации (ОЦНТИ) по документоведению и архивному делу. Использование созданной базы данных ведется в автономном режиме, в ближайшей перспективе предполагается организация системы удаленного доступа к ней.

Учитывая сложность создания полнотекстовых баз данных и значительную трудоемкость массового перевода справочно-информационного фонда на электронные носители, ВНИИДАД вступил в кооперацию с консалтинговой группой «Термика-плюс» и разработчиками ИПС «Кодекс», результатом чего станет создание базы данных «Кодекс-Документовед». Эта совместная разработка позволит существенно расширить круг потребителей наших информационных услуг, поскольку «Кодекс-Документовед» предполагается распространять на CD-ROM и в составе семейства БД «Кодекс».

Интересные перспективы имеет использование комплексных информационных технологий, объединяющих средства хранения информации (электронные архивы типа «Евфрата»), средства интеллектуального поиска информации (к примеру, CrossReader) и средства автоматического реферирования. Сегодня разработчики программного обеспечения не ставят перед собой таких задач, продукты достаточно сложно стыкуются друг с другом. Используя различные комбинации доступных поисковых стратегий, можно существенно повысить качественные характеристики поиска при общем снижении затрат на подготовку информационных массивов. Так, по нашим оценкам, использование готовых программных средств для полнотекстовых баз данных снижает общие затраты на их разработку в 2–2,5 раза, сводя процесс разработки программного обеспечения базы данных к выбору наиболее подходящего из предлагаемых фирмами-разработчиками. Одновременно эти программные средства служат хорошим инструментом для разработки электронных изданий, в условиях дороговизны традиционной полиграфии представляющих определенный интерес.

Повысить качество и эффективность автоматизации информационного обслуживания вовсе не означает «завалить» потребителя информации разнообразными полнотекстовыми и реферативно-библиографическими базами данных, перед которыми иной из них будет испытывать такую же растерянность, как перед многочисленностью библиотечных каталогов. Интерфейс доступа к информации должен быть для потребителя информации единым, интуитивно ясным, используемые средства – простыми, технологии – распространенными. От потребителя информации требуется только одно – запрос, сформулированный на естественном языке, от автоматизированной информационной службы – возможность приема запроса по телекоммуникационным каналам, умение преодолеть нечеткость запроса и организовать выдачу из имеющихся массивов полной и точной информации. Этого можно добиться при грамотном решении ряда задач.

1. Планирование информационного наполнения автоматизированной информационной службы с учетом реального потребителя.
2. Определение требований к составу информации и целей информирования.
3. Организация технологии сбора информации и ведения информационных массивов.
4. Использование эффективных технологий непрерывного обновления информации в оперативных информационных массивах.
5. Выполнение требований технико-программной совместимости в рамках комплекса используемых информационных технологий.
6. Проведение постоянного обновления применяемых информационных технологий.
7. Осуществление маркетинга предлагаемых потребителю информационных продуктов и услуг, рекламирование автоматизированной информационной службы.

В соответствии с перечисленными задачами данная служба должна включать следующие технологические звенья:

а) программно-технического обеспечения пользовательского интерфейса (в том числе с удаленными пользователями) и обработки запросов;
б) оцифрования информации и ведения необходимых информационных массивов (включая организацию сканирования и операторского ввода информации);
в) макетирования электронных изданий и предварительной аналитической обработки информационных массивов по запросам;
г) подготовки специализированной информации и ведения специализированных массивов (например, библиографии, зарубежных переводов, нормативно-правовых документов);
д) работы с потребителями информации.

В соответствии с целями информирования из всех имеющихся в ОЦНТИ информационных ресурсов для создания автоматизированной информационной службы первоочередной интерес представляют:

Автоматизированная информационная служба рассматривается нами как совокупность информационных массивов, объединенныu общностью решаемых информационных задач и программно-технических средств доступа к ним. В рамках информационной службы один и тот же массив может использоваться различными базами данных и поисковыми системами в соответствии с той или иной стратегией поиска. Совокупность баз данных, как известно, образует автоматизированный банк данных – техническую форму организации доступа к информации, в том числе, и удаленного. Использование специальных средств поиска неструктурированной информации, о которых говорилось выше, не позволяет, на наш взгляд, свести сущность информационной службы только к банку данных. Речь идет скорее об объединении различных информационных технологий, направленных на обработку запросов потребителей информации.

Требования к программной совместимости в рамках комплекса используемых информационных технологий определяются с учетом того, что при их завышении мы можем потерять часть потенциальных потребителей. Например, ставя условием передачу информации через модем или на CD-ROM, мы отсекаем потребителей, не имеющих в компьютерах модемов или устройств чтения компакт-дисков. В то же время, занижение требований в условиях конкурентной борьбы на рынках информации возможно лишь в той степени, в какой ВНИИДАД является монопольным поставщиком того или иного информационного ресурса. В рамках ОЦНТИ будет создана локальная информационная сеть, позволяющая концентрировать доступ к имеющимся информационным массивам. Первый участок такой сети используется для формирования массива правовой и нормативно-методической информации на двух компьютерах. Впоследствии возможно подключение к данной сети других подразделений ОЦНТИ и института, отвечающих за ведение других электронных массивов информации.

Имеющийся опыт информационного обслуживания свидетельствует, насколько сложной оказывается проблема сбыта информации. По нашему мнению, следует применить гибкую стратегию, позволяющую выработать тот вариант, который удобен пользователю, хотя в целом себестоимость продукции при этом возрастет, в частности, из-за дублирования информации в разных формах предоставляемых услуг. Но основным фактором останется готовность отрасли к потреблению новых информационных услуг. По нашему мнению, создание автоматизированной информационной службы ОЦНТИ станет катализатором информационной активности для отраслевых потребителей информации, но для этого требуется поддержка Росархива и целевое финансирование проекта на уровне отраслевой программы.

Информатизация архивных учреждений позволит существенно улучшить информационное обслуживание потребителей как в самих архивах, так и его абонентов, пользующихся каналами связи. А это, в свою очередь, будет способствовать углублению и повышению эффективности научных исследований, осуществляемых на основе архивной информации.

Применение современных средств коммуникации совместно с автоматизацией процессов поиска архивной информации позволит в значительной степени укрепить межрегиональные, межотраслевые и международные связи благодаря возможности проведения межархивного тематического поиска информации.



© Информационное общество, 2000, вып. 2, с. 35 - 39.