Электронная библиотека Сибирского отделения РАН

А.М. Федотов, Ю.И. Шокин
Институт вычислительных технологий Сибирского отделения РАН





Введение
В условиях современного динамического развития общества информация становится таким же стратегическим ресурсом, как традиционные материальные и энергетические ресурсы, и наибольший экономический и социальный успех сегодня сопутствует тем странам, которые активно используют современные средства компьютерных коммуникаций и сетей, информационных технологий и систем управления информационными ресурсами. Становление информационного общества немыслимо без использования информационных ресурсов в электронном виде.

Современные информационные технологии позволили приступить к широко-масштабному переводу накопленной человечеством информации в электронную форму и созданию принципиально новых видов информационных ресурсов – электронных коллекций и библиотек. Организация доступа к электронным коллекциям стала одной из важнейших задач информационного обслуживания науки и образования. Создание электронных коллекций и библиотек представляет собой качественно иной уровень производства, хранения, организации и распространения самой разнообразной информации (фактографические и картографические данные, текст, графика, звук, видео и др.).

В Сибирском отделении РАН накоплена и постоянно собирается уникальная научная информация как по различным отраслям наук, так и по природному комплексу. Но, к сожалению, пока отсутствует единая технология сбора информации, существует ее разобщенность, как по месту хранения, так и по форме представления и, что самое главное, отсутствует информация об информации. Массивы оригинального научного материала находятся в виде бумажных архивов и в большинстве случаев не представляют собой организованную информационную среду, которая могла бы служить основой для научных исследований. Научные подразделения России не имеют надежных и быстродействующих каналов обмена информацией как между собой, так и с зарубежными коллегами, что является существенным препятствием на пути развития интеграционных проектов и других форм научного взаимодействия. Все это не позволяет широко использовать информационные ресурсы для интенсификации и кооперации фундаментальных междисциплинарных и прикладных исследований.

В силу не зависящих от нас причин происходит непрерывное уменьшение внешних контактов сотрудников Отделения (особенно молодых), уменьшается число командировок, поездок на конференции, количество приходящих в библиотеки журналов и т. д., а это, в свою очередь, приводит к дальнейшему уменьшению количества информации об информации.

Существенной проблемой, связанной с информационными ресурсами Отделения, является факт «гибели» информации, вызванный постоянным оттоком кадров исследователей и технического персонала, ответственного за ее хранение.

Отсутствие основной информации (или отсутствие информации об этой информации), необходимой для научных сотрудников, приводит к чрезмерной перегрузке внешних каналов Интернета. Для решения проблемы информационной обеспеченности необходимо создание собственной универсальной информационной системы Отделения. В нее должна войти «Электронная библиотека Сибирского отделения РАН», содержащая полнофункциональную систему об интеллектуальном потенциале Отделения (информацию об институтах, сотрудниках, достижениях и других аспектах, связанных с работой Отделения) и систему электронной поддержки сбора и накопления информации (системы электронных коллекций, баз данных и т. п.).

Электронные публикации научных коллекций представляют собой новую форму хранения и обмена информацией. Для нее характерны, прежде всего, динамичность (возможность обновления) и глобальный доступ (через компьютерные сети). Пока электронные публикации не преобладают в общем объеме опубликованных информационных ресурсов, но их доля стремительно растет. При этом возрастает и качество таких публикаций. Изначально электронная публикация появилась как электронный вариант бумажной. В последние годы она приобретает все более самостоятельное значение. Более того, часть научных проектов в процессе их выполнения переориентируется с бумажной формы на электронную.

Направления работ
Информационная система Сибирского отделения РАН должна обеспечить:

Важной проблемой выступает организация разнородной информации в удобном для конечного пользователя виде, что требует новых исследований и разработок интерфейсов для корректного отражения предметной области. Кроме того, требуют решения задачи стандартизации данных, разработки технологических решений и юридических аспектов использования информации, включая вопросы интеллектуальной собственности. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к банкам электронных данных. Так, ответом на запрос к электронной библиотеке может быть не один, а несколько электронных документов или их фрагментов, причем, совсем не обязательно в текстовой форме. Поэтому необходимы информационные системы, которые бы обеспечивали эффективный комплексный поиск и анализ информации в коллекциях разнородных объектов.

В одном из основных пунктов постановления Президиума СО РАН «О Сети Интернет Новосибирского Научного Центра» (№ 81 от 22.03.99) сказано: «Считать первоочередной задачей создание и активное расширение объемов собственных информационных ресурсов сети, используя, в том числе, конкурс интеграционных проектов».

Организационно-технологическое обеспечение процесса создания полнофунк-циональной информационной системы включает в себя большой спектр работ, связанных с организацией системы доступа пользователей к информационно-вычислительным ресурсам и базам данных, сохранение, поддержку и создание информационных ресурсов Отделения и, что самое главное, воспитание нового пользователя, способного работать в современном информационном мире. Для решения этой задачи необходимо обеспечить:

При создании электронной библиотеки решается целый ряд технологических задач хранения и накопления информации, с одной стороны, и задач организации удобного доступа к информации, с другой стороны. Принципиально можно выделить следующие направления работ:

Часть из этих вопросов носит чисто организационно-технологический характер, другая часть требует решения новых, не возникавших ранее, задач.

Проекты
В январе-июне 1998 года в Сибирском отделении была сформирована целевая программа создания и развития информационных ресурсов под общим названием «Электронная библиотека Сибирского отделения РАН» (рис. 1). В ее рамках разработан и осуществляется ряд проектов поддержки работ по созданию информационных ресурсов с использованием Internet/Intranet-технологий и организации системы доступа к информации через WWW-сервис Интернета. Часть проектов поддержана РФФИ или другими фондами.

Основные направления программы связаны с формированием собственных электронных ресурсов по основным отраслям наук (науки о Земле, химия, биология, археология и др.), с созданием и поддержкой электронных коллекций и электронных публикаций, с организацией удобных систем доступа к библиотечным и библиографическим базам данных ГПНТБ СО РАН и базам данных институтов Отделения, с организацией зеркал наиболее значимых мировых информационных ресурсов.

В настоящий момент в программу включены следующие проекты:

1. Информационно-телекоммуникационная среда Отделения – «Сеть Интернет Новосибирского научного центра» (руководитель – академик РАН Ю. И. Шокин). Интеграционный проект по созданию информационно-телекоммуникационной среды Отделения и координации работ по созданию информационных ресурсов [22].

2. Создание нормативно-правовой базы использования информационных ресурсов Отделения (руководитель – доктор ф. наук В. В. Целищев). Методологические основания разработки нормативной базы, регламентирующей отношения, возникающие при формировании, передаче, использовании и защите информации в системе электронных библиотек [21].

3. Информационная безопасность полнотекстовых баз данных в среде Интернет (руководитель – доктор физ.-мат. наук А. М. Федотов) [19].

4. Создание электронной библиотеки ГПНТБ СО РАН (руководитель – доктор техн. наук Б. С. Елепов). Проект направлен на решение проблем информационного сопровождения фундаментальных научных исследований, проводимых в Сибирском регионе. Он предусматривает создание и внедрение многофункциональной автоматизированной системы распределенных баз данных для поддержки научных исследований в Отделении, обеспечивающей интегральное использование разнородных информа-цион-ных ресурсов, работающей в сетевом режиме и поддерживающей более 50 тематических баз данных с глубиной ретроспективы от 5 до 10 лет. В качестве источников информации для создаваемой электронной библиотеки предполагается использовать в сетевом режиме накопленные в ГПНТБ СО РАН базы данных по физике, химии, механике, экологии, медицине и др. (общий объем более 26 млн. документов).

В результате электронные каталоги, базы данных научно-технической информации регионального характера, полные тексты изданий ГПНТБ СО РАН – сборники научных трудов и монографии ученых библиотеки, серия аналитических обзоров мировой литературы «Экология», коллекция фонда редких книг и рукописей (рис. 2) будут предоставлены мировому научному сообществу через Интернет [6].

5. Полнотекстовые базы данных научных публикаций: электронные журналы по математике СО РАН (руководитель – академик РАН Ю. И. Шокин) [28–30]. Проект ориентирован на создание полнофункциональной системы одновременной подготовки электронных (рис. 3) и печатных версий матема-тических журналов Отделения. В качестве первого этапа выбраны журналы «Вычислительные технологии» и «Сибирский математический журнал». Планируе-мая работа состоит из двух частей:

6. Электронный атлас «Биоразнообразие животного и растительного мира Сибири» (руководитель – академик РАН И. Ю. Коропачинский) [18].

Электронный атлас призван обеспечить систематизацию и организацию широкого доступа к разнообразной информации по биоразнообразию растительного мира Сибири на основе современных информационных технологий. Предполагается разработать общие подходы по систематизации и сохранению разнородной ботанической и экологической информации, интегрировать эту информацию в Геоинформационную систему, сделать доступными через Интернет массивы данных материалов и коллекций.

Основные источники информации – данные, собранные исследователями в течение нескольких десятилетий в биологических институтах Отделения, научные журналы, монографии, учебники, материалы, хранящиеся в зоологических музеях и гербариях, а также результаты экспериментальных исследований и полевые журналы экспедиций. В рамках атласа создаются базы данных со средствами поиска по важнейшим группам растений и растительных сообществ. В частности, базы данных «Редкие виды растений Сибири», «Охраняемые природные территории», «Определители таксономической принадлежности», «Лекарственные растения», «Природно-очаговые болезни», «Генофонд сельскохозяйственных растений и животных» и т. д. (рис. 4). Основой атласа являются уникальные коллекции и массивы данных по биоразнообразию растительного мира Сибири. Так, например, в гербариях ЦСБС СО РАН хранится около 310 тыс. образцов высших сосудистых растений, собранных на территории Сибири, в числе которых и уникальные типовые образцы. Имеются коллекции мхов, грибов, лишайников, низших растений. В фитоценотеке хранятся материалы более чем 10 тыс. описаний разнообразных растительных сообществ. Собрание древесных растений ЦСБС насчитывает около 800 видов, гибридов и форм, что в 2,5 раза превышает количество видов дендрофлоры Сибири.

7. Интегральная электронная библиотека по пространственным структурам и функциям ДНК, РНК и белков (руководитель – доктор биологических наук Н. А. Колчанов) [9].

Проект направлен на изучение принципов структурно-функциональной организации биологических макромолекул (ДНК, РНК, белков), молекулярных механизмов формирования их пространственных структур и, что не менее важно, исследование взаимосвязей между пространственными структурами этих макромолекул и их специфической биологической активностью. Решение именно этих задач является исключительно важным и определяющим для широкого круга генно-инженерных, биотехнологических и медико-биологических исследований (рис. 5).

8. Объединенная информационная система по наукам о Земле СО РАН (руководитель – кандидат физ.-мат. наук О. Л. Жижимов) [7].

Проект направлен на создание в ННЦ интегрированной информационной системы по наукам о Земле коллективного пользования на базе внутренних и внешних информационных ресурсов и современных сетевых технологий, интегрированных с Интернетом. В рамках этой системы предполагается организация доступа к распределенным базам данных формата CDS/ISIS, предоставление доступа к электронным копиям журналов «Геология и геофизика», «Криосфера Земли», «География и природные ресурсы» (рис. 6).

9. Объединенная информационная система по химическим наукам СО РАН (руководитель – академик РАН В. Н. Пармон) [16].

Создание объединенного центра по химическим наукам СО РАН предполагает развитие унифицированной технологии ведения электронной библиотеки по химическим наукам, включающей в себя создание системы электронных библиографических каталогов, позволяющих осуществлять эффективный поиск первоисточников информации; приобретение и создание собственных фактографических баз данных по свойствам химических соединений, встраивание их в общую информационную систему; создание аннотированных электронных каталогов химических журналов, издаваемых в СО РАН; создание полнотекстовых электронных версий химических журналов СО РАН [12].

10. Электронные ресурсы сибирской и мировой археологии и этнографии (руководитель – доктор исторических наук Ю. П. Холюшкин) (рис. 7) [20].

Электронная библиотека предназначена для накопления, систематизации, хранения и организации широкого доступа к информации о древней истории, культуре и искусству Северной Азии. В комплект работ входят:

11. Обеспечение унифицированного доступа к разнородным коллекциям и информационным ресурсам на основе технологии CORBA (руководитель – доктор физ.-мат. наук А. Г. Марчук).

Проект направлен на организацию доступа к информационным ресурсам Интернета, которые, как правило, являются разнородными и несовместимыми, тогда как пользователю часто требуется однородный доступ к информации, вне зависимости от ее источника. При этом существенными являются две составляющие доступа: запрос на поиск документа (или ресурса) и форма получаемого документа. В основу проекта положена разработка технологии, позволяющей объединить информационные источники, родственные по предоставляемой информации, в единую пользовательскую среду доступа к ним.

12. Информационная система поддержки исследований в области математики (руководители – академик РАН Ю. И. Шокин, доктор физ.-мат. наук А. М. Федотов).

В заключении отметим, что программа открыта для включения в нее других проектов, способствующих накоплению и развитию информационных ресурсов Сибирского отделения РАН.

Информационный сервер Отделения
Создаваемая электронная библиотека базируется на информационном WWW-сервере Отделения (http://www-sbras.nsc.ru/), который является интегрирующим звеном для системы поддержки информационных ресурсов Отделения (рис. 8) [10].

Сервер содержит разнообразную информацию о деятельности Сибирского отделения РАН, распределенную по рубрикам: научно-исследовательские и конструкторско-технологические институты (База данных СО РАН – рис. 9 [2]); публичная доска объявлений; основные результаты исследований и годовые отчеты СО РАН; интеллектуальный (научный) потенциал Сибири; конференции СО РАН; электронная библиотека СО РАН; поддержка исследований в области математики; важнейшие разработки институтов СО РАН, предлагаемые для широкого использования; Сеть Internet Новосибирского научного центра; информационные проекты СО РАН; «Геоинформационные технологии в СО РАН» (информационный бюллетень); Дом ученых СО РАН; газета «Наука в Сибири» (рис. 10); справочные материалы по информационным ресурсам; нормативные документы РФ, касающиеся науки, информатизации и средств связи; схемы автомобильных дорог Новосибирской области; фотоальбом Сибирского отделения РАН; история Сибирского отделения РАН и др.

Из наиболее важных информационных систем отметим следующие.

Библиотечно-информационное обслуживание
Среди других немаловажных проектов Отделения следует отметить разработку системы библиотечно-информационного обслуживания сотрудников СО РАН, включающую:

Среди систем библиотечно-информационного обслуживания наиболее развитыми являются:

Собственные информационные ресурсы
Наиболее важной работой, связанной с созданием информационных ресурсов Отделения, входящих в состав «Электронной библиотеки», является создание собственных электронных коллекций, аккумулирующих гигантский научный потенциал Отделения, особенно в области биологических и гуманитарных исследований. Среди начатых работ следует отметить, как наиболее продвинутые, следующие:

Используемые технологии
В основу создания Электронной библиотеки СО РАН положен принцип Internet/Intranet-технологий, использование которых при создании информационных ресурсов и построении информационных систем различного назначения в ближайшее время станет доминирующим в мировом информационном пространстве. Это связано с тем, что указанные технологии:

Интернет-технология позволяет удачно сочетать возможности гипертекстового оформления информации с использованием возможностей современных систем управления базами данных, причем со стороны клиента полностью унифицируются запросы на поиск и предоставление информации, а также получение аналитических справок и данных из информационных систем. Что самое главное, Internet-технология позволяет оперативно управлять и актуализировать информацию, хранящуюся в базах данных, через просмотрщик (браузер) WWW-страниц, и создавать динамические системы формирования коллекций.

В основу создания электронных коллекций в наших работах положена концепция динамических документов, в которой каждый тип документов, содержащих информацию о конкретных фактах, представляется в виде набора объектов со своими характеристиками и атрибутами (аналогично тому, как это принято в объектных языках программирования). При этом выделяются три основных типа объектов, характеризующих документ:

Для занесения в электронную коллекцию фактографической информации, последняя подлежит паспортизации – формальному описанию структуры объектов, составляющих документы, (например, унифицированный паспорт описания сообществ в информационной системе «Зеленая книга Сибири» [1], содержащей информацию о редких и нуждающихся в охране растительных сообществах Сибири).

Разработанная технология позволяет оперативно управлять и актуализировать информацию, хранящуюся в разнородных и распределенных по сети базах данных, организовать гибкий поиск, и, самое главное, создать достаточно удобный интерфейс для ее наполнения.

По данной технологии создаются и уже функционируют коллекции электронного атласа «Биоразнообразие животного и растительного мира Сибири» [13], коллекции полнотекстовых документов (см. электронную версию журнала «Вычислительные технологии» [28], публичную доску объявлений СО РАН, информационную систему «Геоинформационные технологии в СО РАН» [8]), и др.

Таким образом, программа «Электронная библиотека Сибирского отделения РАН» сформировалась как интеграционная мультидисциплинарная программа и, более того, можно говорить о завершении ее первого этапа.

 

Литература



1. База данных «Зеленая книга Сибири».
http://www-sbras.nsc.ru/win/elbib/bio/green/.
2. База данных СО РАН.
http://www-sbras.nsc.ru/win/sbras/copan/.
3. Базы данных и электронные каталоги ГПНТБ СО РАН.
http://info.spsl.nsc.ru/.
4. Библиографический WEB сервер ОИГГиМ СО РАН. http://geolibr.uiggm.nsc.ru/LWS/.
5. Виртуальный музей «Древняя История, Культура и Искусство Северной Азии».
[http://sati.archaelogy.nsc.ru/virtual_e.htm].
6. Елепов Б. С. Создание электронной библиотеки ГПНТБ СО РАН.
http://www-sbras.nsc.ru/libr/win/Rffi98.htm.
7. Жижимов О. Л. Объединенная информационная система по наукам о Земле СО РАН.
http://www-sbras.nsc.ru/win/elbib/geo/.
8. Информационная система «Геоинформационные технологии в СО РАН».
http://www-sbras.nsc.ru/win/gis/.
9. Колчанов Н. А. Интегральная электронная библиотека по пространственным структурам и функциям ДНК, РНК и белков.
http://wwwmgs.bionet.nsc.ru/mgs/.
10. Информационный сервер Сибирского отделения РАН.
http://www-sbras.nsc.ru/.
11. Информационный сервер Сибирского информационно-консультативного центра по сотрудничеству Российской Федерации и Европейского Союза в области науки и техники.
http://www-sbras.nsc.ru/sicc/
12. Информационный сервер «Химия в СО РАН». http://www.catalysis.nsk.su/chem.
13. Коропачинский И. Ю., Шокин Ю. И., Шумный В. К., Ермаков Н. Б., Колчанов Н. А., Федотов А. М. Электронный атлас «Биоразнообразие животного и растительного мира Сибири».
http://www-sbras.nsc.ru/win/elbib/bio/.
14. Материалы рабочего совещания по электронным публикациям El-PUB’99. http://www-sbras.nsc.ru/win/mathpub/ws-ep99.html.
15. Марчук А. Г., Осипов А. Е. Обеспечение унифицированного доступа к разнородным коллекциям и информационным ресурсам на основе технологии CORBA. / Тезисы докладов семинара-совещания «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». // М., 1998. (С. 2–3).
16. Пармон В. Н. Объединенная информационная система по химическим наукам СО РАН.
http://www-sbras.nsc.ru/win/ellib/parmon.html
17. Публичная доска объявлений СО РАН.
http://www-sbras.nsc.ru/win/anons/show.html.
18. Федотов А. М., Артемов И. А., Ермаков Н. Б., Красников А. А., Потемкин О. Н., Рябко Б. Я., Федотов А. А., Хорев А. Г. Электронный атлас «Биоразнообразие растительного мира Сибири» //Вычислительные технологии, 1998, т. 3, № 5.
19. Федотов А. М., Рябко Б. Я. Информационная безопасность полнотекстовых баз данных в среде Интернета.
http://www-sbras.nsc.ru/win/elbib/security.html.
20. Холюшкин Ю. П. Электронные ресурсы сибирской и мировой археологии и этнографии
http://www-sbras.nsc.ru/win/elbib/arch/.
21. Целищев В. В. Создание нормативно-правовой базы использования информационных ресурсов Отделения.
http://www-sbras.nsc.ru/win/elbib/law.html.
22. Шокин Ю. И., Белов С. Д., Бредихин С. В., Мушер С. Л., Никульцев В. С., Федотов А. М. «Сеть Интернет Новосибирского научного центра».
http://www-sbras.nsc.ru/win/nsc-net/nsc.html.
23. Шокин Ю. И., Федотов А. М. Информационные технологии Internet. //Вычислительные технологии, 1997, т. 2, № 3.
24. Шокин Ю. И., Федотов А. М. Распределенные информационные системы //Вычислительные технологии, 1998, т. 3, № 5.
25. Шокин Ю. И., Федотов А. М. Информационно-телекоммуникационная среда Отделения – «Сеть Интернет Новосибирского научного центра». http://www-sbras.nsc.ru/win/nsc-net/rfbr-sbras.html.
26. Шокин Ю. И., Федотов А. М. Электронная библиотека Сибирского отделения РАН (проект).
http://www-sbras.nsc.ru/win/elbib/.
27. Шокин Ю. И., Федотов А. М. Информационная система поддержки исследований в области математики.
http://www-sbras.nsc.ru/win/mathpub/math_www.html.
28. Шокин Ю. И., Федотов А. М., Богомяков П. А. Электронные журналы по математике (на примере электронной версии журнала «Вычислительные технологии»).
http://www-sbras.nsc.ru/win/elbib/journals/.
29. Шокин Ю. И., Федотов А. М., Богомяков П. А. Электронные журналы по математике / Доклад на конференции «Электронные издательские системы для науки и образования» (EPS4SE-98).
http://www.botik.ru:8101/PSI/EmNet_NIS/transa-ctions/fedotov/fedotov.koi8.html.
http://www-sbras.nsc.ru/win/elbib/journals/ct/jct.html
30. Электронная версия журнала «Вычислительные технологии».
http://www-sbras.nsc.ru/win/mathpub/comp-tech/.



© Информационное общество, 2000, вып. 2, с. 22 - 31.