Межведомственная программа "Российские электронные библиотеки": подходы и перспективы

Т.В. Ершова, Ю.Е. Хохлов





Введение

Стремительное развитие и активное использование современных информационных и коммуникационных технологий (ИКТ) позволило приступить к широкомасштабному переводу накопленной человечеством информации в электронную форму и созданию большого числа новых электронных информационных ресурсов. Эта новая форма представления информации позволяет на качественно ином уровне организовать процессы производства, хранения и распространения информации. Обеспечение публичного (в том числе удаленного) доступа пользователей к информационным ресурсам стало одной из первоочередных задач обслуживания науки, культуры и образования. Сегодня очевидно, что наиболее эффективно это достигается путем создания электронных библиотек (ЭБ) – распределенных информационных систем, позволяющих надежно сохранять и эффективно использовать разнообразные коллекции электронных документов (текст, графика, аудио, видео и др.), доступные в удобном для конечного пользователя виде через глобальные сети передачи данных.

В той или иной форме идея электронной библиотеки уже работает во многих университетах и крупных библиотеках ведущих стран мира. Например, электронная «библиотека XXI века» создается в Японии совместными усилиями Агентства по внедрению новых технологий, Национальной парламентской библиотеки, целого ряда министерств, более 20 библиотек и культурных центров. Несколько лет назад Библиотека Конгресса США начала реализацию национальной программы создания электронной библиотеки. Начиная с 1994 г. по инициативе NSF, DARPA и NASA в США была развернута исследовательская программа Digital Libraries Initiative (DLI) по электронным библиотекам. На второй стадии развития в начале 1998 г. эти программы были объединены в единую межведомственную программу (DLI – Phase 2), в которой, кроме того, участвуют Национальная медицинская библиотека, Агентство по статистике США, Национальный гуманитарный фонд, Национальный архив США и другие федеральные агентства. Начиная с 1995 г. осуществляется проект создания электронных библиотек для стран G7 Bibliotheca Universalis. С 1995 г. осуществляется национальная программа Великобритании eLib. В других странах (Канада, Германия и т. д.) многочисленные разрозненные проекты в последние годы также стали превращаться в национальные и международные программы создания электронных библиотек.

Предпосылки для национальной программы создания и использования электронных библиотек в России

В течение последних лет, несмотря на социально-экономический кризис, в России наблюдается заметный прогресс в создании отечественных электронных ресурсов. Согласно данным Госкомстата, еще в 1996 г. имелось в общей сложности около 800 тысяч баз данных общим объемом 160 терабайт. В последнее время быстро растет количество российских Web-сайтов: их число на русском языке (собственно Web-сайтов и отдельных крупных информационных разделов, содержащих разнообразную научную, культурную, образовательную, массовую и другую некоммерческую информацию) достигает 6 тысяч, их количество по сравнению с 1996 г. увеличилось примерно в 9 раз.

В стране создано несколько тысяч оригинальных учебно-образовательных программ, в том числе для дистанционного обучения. Тысячи исследовательских и учебных организаций, библиотеки, музеи, архивы имеют компьютерное оснащение и подключены к Интернет. Как на федеральном уровне, так и на уровне субъектов Федерации из бюджета финансируются многочисленные проекты по созданию электронных информационных ресурсов. В той же сфере активно действуют государственные и негосударственные фонды, а также коммерческие организации.

В России активно формируется рынок электронной информационной продукции и услуг, в котором основную роль играют негосударственные структуры. Быстрыми темпами развивается индустрия мультимедиа: если в 1993 г. был выпущен всего один отечественный CD-ROM, то в 1994 году – уже 25, в 1995 г. – более 100, сегодня – более 800.

Проблемы создания и использования информационных ресурсов, доступных через глобальные сети передачи данных, в течение последних лет широко обсуждались на российских и международных конференциях:

Динамичному развитию современной инфраструктуры для науки и образования во многом способствовали целевые государственные программы:

Ряд направлений последней посвящен организации распределенных предметно-ориентированных и общенаучных информационных систем и сетей. Среди них – проекты создания сетей для специалистов в области физики высоких энергий (RuHEP) и молекулярной биологии (EMBnet), математики (EMnet) и востоковедения, проект распределенной библиотечной сети (LibWeb) и др.

Сегодня в повестке дня – развертывание полномасштабной национальной межведомственной программы создания и использования электронных библиотек, которая должна служить естественным дополнением уже имеющихся программ и быть направлена на наполнение отечественным содержанием активно формирующейся национальной информационной инфраструктуры. Очевидно, что решение этой задачи требует вложения значительных ресурсов и невозможно без координации усилий различных федеральных, региональных и местных органов власти, учреждений науки, культуры и образования, общественных и коммерческих структур, действующих в области формирования и использования электронных информационных ресурсов.

Начальная стадия программы «Российские электронные библиотеки»

Идея межведомственной программы создания и использования ЭБ в России, ее цели и основные положения впервые на официальном уровне были рассмотрены и одобрены Рабочей группой по телекоммуникациям Российско-американской комиссии по экономическому и технологическому сотрудничеству (комиссии «Гора-Черномырдина») [1].

Далее эта идея была поддержана на Парламентских слушаниях, организованных Комитетом по информационной политике и связи Государственной Думы РФ [2].

В 1998 г. Российский фонд фундаментальных исследований и Российский фонд технологического развития объявили о конкурсе по пилотной программе «Российские электронные библиотеки» (РЭБ) [3]. Из более чем 300 поступивших заявок был поддержан 31 проект (28 – РФФИ, 3 – РФТР).

Начальной стадии реализации пилотной программы РЭБ был посвящен российско-американский семинар “Электронные библиотеки” (Миннауки, РФТР, РФФИ, NSF, апрель 1998 г.), а также семинар-совещание “Электронные библиотеки: перспективные методы и технологии, электронные коллекции” (РФФИ, РАН, декабрь 1998 г.).

С конца 1998 г. осуществляется проект информационной и научно-методической поддержки проектов межведомственной программы РЭБ. В рамках проекта созданы и функционируют:

В настоящее время ведется подготовка концепции межведомственной программы РЭБ. Эта работа будет осуществляться с участием уполномоченных представителей Министерства РФ по делам печати, телерадиовещания и средств массовых коммуникаций, Государственного комитета РФ по телекоммуникациям, Министерства образования РФ, Министерства культуры РФ, Министерства науки и технологий РФ, Российской академии наук, Российского фонда фундаментальных исследований, Федеральной архивной службы России и др.

Предложения по разработке и реализации межведомственной программы «Российские электронные библиотеки»

В настоящей работе излагаются подходы, которые представляются авторам наиболее перспективными для создания концепции межведомственной программы РЭБ.

Концептуальные подходы

Представления авторов основаны на посылке, что концепция информационного обслуживания, базирующегося только на основе печатных носителей, устарела, и ей на смену приходит другая, – основанная на электронном представлении самой разнообразной информации, тиражируемой в неограниченном количестве и мгновенно доступной из мировой компьютерной сети независимо от времени и местонахождения пользователя. В связи с этим существенно меняется роль и функции такого социального института как библиотека – основного хранилища и распространителя информации.

Одним из наиболее эффективных способов информационно-библиотечного обслуживания науки, культуры и образования сегодня (и, тем более, завтра) является создание электронных библиотек, не столько состоящих из отдельных коллекций документов (как оцифрованных традиционных материалов, так и созданных первоначально в электронном виде), сколько представляющих из себя среду, обеспечивающую унифицированный подход к производству, хранению и организации разнообразной информации в электронном виде с целью поиска, анализа и доступа к ней с использованием глобальных компьютерных сетей.

Основное различие между традиционной библиотекой и электронной заключается в том, что пользователь обращается к сервисам последней за необходимой информацией, а не просто за отсылками к документу и/или самими документами. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к гетерогенным банкам электронных данных. Так как в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен далеко не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме, необходимы такие информационные системы, которые обеспечат эффективный комплексный поиск и анализ информации в коллекциях гетерогенных объектов.

Не менее важным является решение проблемы представления разнородной информации в удобном виде для конечного пользователя, что требует новых исследований и разработок в области человеко-машинных интерфейсов.

Особое внимание при создании электронных библиотек необходимо уделять согласованию используемых стандартов (в первую очередь – выполнению требований интероперабельности), технологических решений, юридических аспектов их использования (включая вопросы интеллектуальной собственности).

Одно из представлений об этапах развития системы электронных библиотек состоит в том, что на начальной стадии электронные библиотеки будут представлять собой сеть распределенных депозитариев, где объекты любого типа могут быть найдены в индексированных коллекциях электронных документов. Затем технологии должны будут развиться так, чтобы можно было осуществить прозрачный поиск непосредственно в самих депозитариях с учетом различных используемых протоколов и форматов представления данных. На последующей стадии технологии информационного поиска должны позволить осуществлять прозрачный поиск, учитывающий изменения как в содержании, так и в смысле накопленной информации. Это – последовательные шаги на пути удовлетворения запросов пользователей по отысканию информации: документ – данные – знание.

Множественный взгляд на распределенные депозитарии электронных документов означает, что различные механизмы информационного поиска могут и должны быть одновременно использованы для поиска в сети. Среди них – тезаурусы предметных областей, частотные списки, контекстный поиск, поиск по фрагменту образа и т.п. Так, например, для работы с полнотекстовыми базами данных пользователи должны иметь возможность применять любой из подходящих механизмов, чтобы в интерактивном режиме получать наиболее оптимальный результат.

Необходимо отметить, что для работы с большими объемами полнотекстовой информации особое значение имеют средства поиска по свободной лексике естественных языков. Русский язык обладает существенными особенностями, не позволяющими эффективно использовать для этой цели зарубежные программные средства, ориентированные, например, на английский язык. В последние годы в России разработано несколько программных продуктов, предоставляющих возможность поиска информации на русском языке с учетом его грамматики, более того, с учетом орфографии, существовавшей до реформы русского языка 1917 г. Эти же средства позволяют осуществлять поиск на других языках, использующих латинский алфавит.

Кроме того, необходима активизация исследований, направленных на решение проблем семантической интероперабельности, обеспечивающей однозначное отображение содержания или смысла информации из распределенных коллекций электронных документов. Сеть электронных библиотек России должна быть организована как открытая среда, представляющая собой распределенный комплекс информационных, программных и технических средств регистрации разнообразных электронных коллекций, их унифицированного представления в базе метаинформационной среды, поиска информации в интегрированной совокупности зарегистрированных коллекций, формирования персонализированных представлений найденной информации для разнообразных категорий пользователей.

Цели и задачи Программы

Целями межведомственной программы РЭБ с нашей точки зрения должны стать:

Для реализации этих целей в рамках программы РЭБ необходимо обеспечить создание распределенной сети электронных библиотек, доступных в удобном виде для конечного пользователя – научного работника, инженера, работника культуры, студента, учащегося. Это предполагает выполнение ряда конкретных задач, к которым следует отнести:

Основные направления реализации Программы

Работы по межведомственной Программе РЭБ предлагается вести по следующим направлениям:

1. Общесистемные вопросы создания и функционирования электронных библиотек
Организация и управление ЭБ
Проекты данного направления должны быть направлены на выбор и конкретизацию эталонной модели открытой среды, позволяющей идентифицировать совокупность интерфейсов и протоколов взаимодействия между приложениями и средой, в которой функционируют приложения ЭБ.

Стандарты представления данных
Одно из важнейших направлений Программы, призванное решить проблему выбора системы развивающихся стандартов представления разнообразных электронных данных, обеспечивающих, с одной стороны, возможность долгосрочного или даже бессрочного хранения создаваемых электронных коллекций, а с другой стороны – соответствующих международным стандартам и форматам, обеспечивающим интеграцию создаваемых ЭБ в глобальную информационную инфраструктуру.

Нормативно-правовые аспекты функционирования ЭБ
Должны быть рассмотрены и решены вопросы, связанные с авторским правом и защитой интеллектуальной собственности в ЭБ, сохранностью информации, правами доступа и использования информации в ЭБ (включая международный обмен) и т. д.

Экономические аспекты создания и использования ЭБ
Необходимо решение вопросов, связанных с определением стоимости создаваемых ЭБ, стоимости информации предоставляемой для использования в ЭБ, механизмы ценообразования информационных услуг связанных с использованием ЭБ, экономические механизмы взаимоотношений между производителями, распространителями и потребителями при использовании ЭБ и т. д.

Информационная безопасность
Должны быть рассмотрены методологические аспекты информационной безопасности функционирования ЭБ и разработан комплекс мер по обеспечению информационной безопасности в ЭБ.

2. Развитие инфраструктуры электронных библиотек, разработка инструментальных средств

Средства создания электронных ресурсов
Должны финансироваться проекты, посвященные эффективным средствам создания и конвертирования электронных коллекций и созданию открытой динамически изменяющейся информационной среды, позволяющей на уровне отдельного пользователя, рабочей группы или организации превращать большие, неструктурированные, постоянно увеличивающиеся объемы электронных данных в соответствующие пользовательским потребностям структуры соответствующего масштаба.

Средства организации хранения больших и сверхбольших объемов информации
Необходимо финансирование проектов создания средств организации хранения больших и сверхбольших объемов информации, а также проектов, реализующих возможности хранения и совместного использования коллекций текстовых документов в разнообразных форматах: ASCII, LaTex, HTML, SGML, XML, PostScript и т. д., а также оцифрованной аудио и видеоинформации. Особое внимание следует уделить проектам, направленным на совершенствование методов сжатия информации с целью повышения эффективности хранения и передачи данных.

Средства поиска разнородной информации
Для эффективного поиска информации в ЭБ потребуются разработка и совершенствование таких поисковых средств и механизмов как поиск метаданных, контекстный поиск, поиск изображений, а также поиск аудио- и видеоинформации по содержанию. Необходима поддержка проектов, направленных на улучшение эффективности поиска информации путем препроцессинга документов с целью экстракции дополнительных метаданных, использования автоматически создаваемых пользовательских профилей, а также разнообразных методов фильтрации, основанных на создании программируемых агентов. Кроме того, должны поддерживаться проекты, направленные на разработку и реализацию автоматических методов классификации, индексирования, реферирования, интерпретирования и каталогизации, специфических для каждого из типов данных. Особое внимание должно быть уделено поисковым механизмам, применимым к разноязычным электронным коллекциям.

Средства организации сверхбыстрых методов доступа к большим и сверхбольшим объемам данным
Должны быть разработаны эффективные способы обмена информацией как между компонентами ЭБ, так и между собственно ЭБ и пользователями. Для передачи больших объемов информации помимо каналов, используемых для поиска информации, могут быть использованы дополнительные каналы (типа кабельного телевидения, спутниковых каналов, каналов для видеоконференций и т. п.). Повышение пропускной способности необходимо как в связи с необходимостью передачи мультимедийных данных, так и в связи с увеличением числа пользователей.

Интероперабельные системы
Важным условием эффективной работы ЭБ является высокая степень взаимодействия всех ее компонентов в ходе рабочей сессии, поэтому в рамках Программы необходимо финансирование специального проекта, посвященного выработке рекомендаций по выбору соответствующих стандартов, технологий и программных решений, позволяющих обеспечить интероперабельность создаваемых ЭБ. В рамках этого же проекта необходимо обеспечить постоянный мониторинг хода выполнения проектов и соблюдения выработанным рекомендациям.

Пользовательские средства и интерфейсы
Проекты данного направления должны быть направлены на обеспечение эффективной поддержки работы пользователя с информацией. В частности, должны быть обеспечены возможности эффективного, адаптивного и универсального отображения больших объемов разнородной информации, ее масштабирования, а также поддержка многооконного режима и способность к самонастройке. Особое внимание следует уделить проектам, позволяющим организовать совместное использование ЭБ и проектам создания пользовательских средств и интерфейсов для мало подготовленных пользователей.

Создание эффективных методов администрирования электронных библиотек
Современные ЭБ используют стандартные средства защиты, предоставляемые операционными системами, которых, безусловно, недостаточно. Разработка новых методов администрирования должна обеспечить разные права доступа к электронным коллекциям для разных пользователей, возможность одновременной работы в режиме реального времени над одним документом, персонифицированное предоставление и фильтрацию информации и т. д.

3. Создание конкретных электронных библиотек по областям науки, культуры и образования
Создание ЭБ характеризуется большими объемами информационных ресурсов, которые либо требуется перевести в электронную форму, либо конвертировать в форматы, допускающие использование этих электронных коллекций в открытой среде ЭБ. Современные электронные библиотеки должны содержать библиографические данные, полнотекстовую информацию, фактографию, графику, аудио, видео и т. п., поэтому к участию в данном разделе Программы необходимо привлечение основных фондодержателей и производителей информационных ресурсов России: библиотеки, музеи, галереи, архивы, издательства, исследовательские организации, органы НТИ, учебные заведения и другие.

При этом одним из важнейших становится вопрос экспертного отбора материалов и очередности их перевода в электронную форму. В этом случае в рамках Программы необходимо определить наиболее значимые информационные массивы как в науке, культуре, промышленности, сельском хозяйстве, образовании, экономике, праве, здравоохранении, так и в других областях, которые будут конвертироваться или изначально создаваться в электронной форме.

Выбор проектов по данному направлению должен осуществляться в два этапа – сначала специалисты в предметной области (конкретного ведомства) определяют приоритетные информационные массивы, на основе которых предлагается создать ту или иную ЭБ, а затем Технический совет программы определяет правильность предлагаемого технологического решения и рекомендует (или не рекомендует) проект для включения в программу.

4. Сопровождение работ по Программе
Для успешного выполнения Программы необходимо финансирование нескольких специальных проектов, направленных на:

Организация работ по Программе
Предполагаемый срок выполнения программы – 3 года. Детальное содержание программы, сроки реализации и стоимость отдельных проектов необходимо изложить в системном проекте, разработка которого может быть завершена во второй половине 1999 г. Участниками Программы РЭБ должны стать следующие федеральные ведомства и фонды:
и их подведомственные исследовательские организации (коллективы вузов, отраслевых и академических НИИ) и организации, хранящие наиболее ценные и значимые коллекции документов и материалов (библиотеки, информационные центры и агентства, музеи, галереи, архивы, издательства и др.).

Указанные ведомства создают наблюдательный совет и технический комитет программы РЭБ, которые осуществляют непосредственную координацию проектов программы. Эти коллегиальные органы должны организовать работу над системным проектом, разработка которого должна быть завершена в 1999 г.

Механизм финансирования Программы
Финансовое обеспечение программы планируется осуществлять из нескольких источников:
Прежде всего, необходимо принятие государственного решения о включении Программы РЭБ в федеральный бюджет 2000 г. для финансирования отдельной строкой. Одним из оснований для этого является то, что данная Программа является естественным дополнением упоминавшихся ранее программ «Создание национальной сети компьютерных телекоммуникаций для науки и высшей школы» и «Развитие суперкомпьютерных центров России», финансирующихся из федерального бюджета и направленных, в основном, на создание и использование телекоммуникационной и современной вычислительной инфраструктуры, необходимой для науки и образования. Централизованные средства Программы РЭБ должны составлять 100–150 млн. рублей в год.

Собственные средства ведомств-участников должны составлять такую же сумму – 100–150 млн. рублей, а проекты программы должны финансироваться из расчета 50% на 50% (централизованные средства – собственные средства). Исключение должны составлять лишь отдельные общесистемные проекты (типа разработки системного проекта программы, стандартов или нормативно-правовых документов), которые выполняются комплексными временными коллективами и могут финансироваться из централизованных источников (скажем, из средств Министерства науки и технологий РФ или одного из федеральных фондов).

Одновременно должны быть предприняты усилия по получению дополнительных средств на реализацию Программы из других источников путем привлечения в состав участников программы других федеральных ведомств, органов власти субъектов Федерации, а также международных и российских инвестиционных и благотворительных фондов, зарубежных партнеров. Опыт деятельности российских фондов последних лет и пилотной программы РЭБ показывает, что эти средства могут составить примерно половину централизованного бюджета, т. е. 50–75 млн. рублей.

Таким образом, планируемый годовой бюджет программы должен составлять от 250 до 375 млн. рублей (10–15 млн. долларов США), что сравнимо с бюджетами соответствующих национальных программ по электронным библиотекам США, Великобритании, Германии и т. д.

Все средства по программе следует распределять на конкурсной основе в соответствии с правилами и требованиями каждого из ведомств. Отбор из представляемых ведомствами проектов для включения в программу РЭБ должен осуществляться ежегодно упомянутыми выше межведомственными коллегиальными органами, обязанностями которых также являются непосредственная координация и контроль за ходом выполнения проектов. рублей, а проекты программы должны финансироваться из расчета 50% на 50% (централизованные средства – собственные средства). Исключение должны составлять лишь отдельные общесистемные проекты (типа разработки системного проекта программы, стандартов или нормативно-правовых документов), которые выполняются комплексными временными коллективами и могут финансироваться из централизованных источников (скажем, из средств Министерства науки и технологий РФ или одного из федеральных фондов).

Прогнозируемые результаты реализации Программы

Применение технологий электронных библиотек позволит решить проблему хранения огромных объемов научной информации, осуществить интеграцию разобщенных информационных ресурсов, а также предоставит возможность хранения ранее не хранимой и безвозвратно теряемой информации (лабораторных журналов, фотографий, изображений, звуковой и видеоинформации). Разработанные в рамках программы технологии и программно-аппаратные решения оперирования с большими и сверхбольшими объемами разнородных данных могут найти применение в других отраслях, таких как геологоразведка, космос, оборонная промышленность и т. д.

Будут сокращены расходы по многочисленному дублированию создаваемых локальных баз данных и информационных систем и в то же время устранены досадные пробелы, препятствующие ускоренному развитию отечественной науки, культуры и образования. В результате реализации программы будет развита инфраструктура для генерации, организации, поиска и передачи разнородной электронной информации от информационных центров-производителей к конечному пользователю, что может кардинально изменить ситуацию в науке, культуре, образовании.

Электронные библиотеки позволят коренным образом изменить сам принцип информационного обслуживания пользователей: обращаясь к системе, они будут получать не только ссылку (библиографию или реферат) на имеющийся электронный документ, но и сам документ (полную копию оригинальной статьи, автореферат диссертации, графический образ картины или технического чертежа, видеозапись проведенного исследования или экскурсии по музею и т. д.).

Использование электронных библиотек позволит по-новому организовать рабочее место научного работника, инженера, студента, учащегося путем реализации возможности коллективной работы и обучения, создания коллективных виртуальных сред. Кроме того, это позволит снизить стоимость научных исследований и дистанционного образования за счет коллективного использования ресурсов (научных приборов, информационных образовательных систем и т. д.). Особое значение имеет использование электронных библиотек для образования и воспитания молодежи и уровня культуры общества.

Будет решена важнейшая социально-политическая задача адекватного представления богатейшего научного, культурного и образовательного наследия России в мировом информационном пространстве, что позволит ей занять достойное место в формирующемся глобальном информационном обществе XXI века.



Работа выполнена при поддержке Российского фонда фундаментальных исследований (гранты 98-07-90394, 98-07-91120), Российского гуманитарного научного фонда (проект 96-05-12025).


Литература


1. Протокол заседания Рабочей группы по телекоммуникациям Российско-американской комиссии по экономическому и технологическому сотрудничеству 19 февраля 1998. –http://www.iis.ru/RDLP/backg/prehist.ru.htm.
2. Хохлов Ю. Е. О развитии информационного общества в России. Выступление на Парламентских слушаниях «Развитие информационного пространства России», 2 декабря 1997 г. –http://www.iis.ru/ru/publish/yh01.htm.
3. Межведомственная программа «Российские электронные библиотеки» // «Поиск», № 13 (463), 21–27 марта 1998 г. С. 7. –URL: http://www.iis.ru/RDLP/.



Об авторах:

Ершова Татьяна Викторовна - директор Института развития информационного общества, председатель комиссии Общественного экспертного совета Московской городской Думы по направлению "Информация, информатизация, связь, телекоммуникации и телевидение".

Хохлов Юрий Евгеньевич - доцент, кандидат физико-математических наук, председатель Совета директоров Института развития информационного общества, председатель Общественного экспертного совета Московской городской Думы по направлению "Информация, информатизация, связь, телекоммуникации и телевидение".


© Информационное общество, 1999, вып. 3, с. 21 - 27.