2.1. Структура автоматизированных информационных ресурсов
Системное описание АИР, которыми обладает в настоящее время Россия, затруднено, так как они создавались разрозненно как по министерствам, ведомствам, так и в территориальном разрезе. Не велся и не ведется специального учета АИР как самостоятельного информационного ресурса. До сих пор не разработана классификация информационных ресурсов, нет общепринятых классификаторов. Хотя на уровне отдельных инициативных авторских разработок такие попытки предпринимались, но, как правило, в основе классификации доминировал какой-либо один или несколько отдельных критериев.
Излагаемая ниже структура АИР построена на многокритериальном делении, однако полученная классификация и характеристика информационных ресурсов в их терминах носят сугубо практический характер и ориентированы на задачи и проблемы настоящего Национального доклада.
Информационные ресурсы России делятся по следующим двум равнозначным основаниям:
Негосударственными являются информационные ресурсы, созданные на собственные средства организаций (предприятий) и частных лиц.
Информационные ресурсы смешанной формы собственности создаются на основе долевого финансирования государственными и негосударственными организациями (частными лицами).
Государственные информационные ресурсы и информационные ресурсы смешанной формы собственности призваны обслуживать социально значимые потребности страны, а также потребности органов власти и управления.
Негосударственные информационные ресурсы в этом отношении представляются состоящими как бы из двух частей: первая обслуживает общественно значимые потребности общества, вторая — используется для обеспечения исключительно внутрифирменной или личной деятельности и общественной значимости не представляет.
Исходя из социальной значимости, созданные информационные ресурсы подразделяются на:
национальные информационные ресурсы России, включающие государственные информационные ресурсы, информационные ресурсы смешанной формы собственности и часть негосударственных информационных ресурсов;
информационные ресурсы личного и внутрифирменного использования, не являющиеся национальными ресурсами.
Государственные информационные ресурсы по признаку "право владения и распоряжения" могут быть:
частными информационными ресурсами;
информационными ресурсами негосударственных предприятий;
информационными ресурсами общественных объединений (организаций).
По основанию "форма представления информационных ресурсов" выделяются:
Основное внимание в Национальном докладе уделено АИР, которые складываются из АИР общего назначения и встроенных в системы.
На рисунке представлено схематическое изображение структуры АИР и даны количественные показатели отдельных частей АИР.
Структура автоматизированных информационных ресурсов
Под АИР общего назначения понимаются информационные ресурсы, функции которых заключаются в формировании и предоставлении информационной продукции и услуг непосредственно конечному пользователю. К ним относятся:
К числу встроенных относятся АИР, функционирующие в составе:
Схема описания БД
По структуре БД делятся на:
документографические с подразделением их на библиографические и реферативные;
фактографические; числовые; полнотекстовые; лексикографические.
По назначению содержащейся информации БД делятся на:
БД деловой информации (социальная информация, кадастры, регистры, статистическая, коммерческая, финансовая, управленческая информация, данные о продукции и т. п.);
БД информации для специалистов (научно-техническая, экономическая, маркетинговая, правоохранительная, исследовательская, производственная, конструкторская, технологическая информация и т. п.);
БД массовой информации (правовая, библиотечно-библиографическая, архивная, учебная, справочная, общественно-политическая, словарно-энциклопедиче-ская информация, информация о культуре, спорте, досуге и т. п.).
По способу доступа БД делятся на:
2.2. Общая характеристика баз данных
Из-за отсутствия регламентированного учета точное количество БД, созданных к настоящему времени в России, неизвестно, поэтому экспертные оценки по этому вопросу носят косвенный опосредованный характер.
В 1991 г. Роскоминформ совместно с Госкомстатом РФ провел разовую перепись БД. Кроме того, в течение последних трех лет проводился добровольный учет БД средствами, инициирующими заинтересованность в нем владельцев БД. Таким образом, в электронном каталоге НТЦ "Информрегистр" оказалось представлено более 10 тыс. БД, из них около 8 тыс. — российские БД, остальные — БД стран ближнего зарубежья.
Выборочный анализ показал, что переписью 1991 г. было охвачено порядка 30% организаций, владеющих БД, хотя по отдельным классам БД, где учетом удалось охватить почти все БД (прежде всего БД по НТИ в информационных центрах и службах), процент учтенных БД гораздо выше. На основе этих данных общее количество БД в России оценивается в 25—30 тыс.
Количественные оценки функционирования БД приведены на основе анализа сокращенного массива сведений о 3000 российских БД, представляющих интерес для массовых пользователей. Этот массив является крупнейшим в России.
При анализе рассматривались следующие типы БД: документографические, включающие в себя библиографические и реферативные БД; документально-фактографические, фактографические, полнотекстовые и гипертекстовые. За пределами рассмотрения остался весьма многочисленный тип БД — числовые БД, большинство из которых создано в рамках САПР или относится к классу расчетных научно-исследовательских БД. Эти БД, как правило, имеют ограниченные распространение и спрос, создаются под частные задачи, в большинстве случаев имеют краткий срок жизни и поэтому несущественно влияют на общую оценку состояния АИР страны. Исключение составляют базы статистических данных.
Обобщенные характеристики АИР, хранящихся в виде БД, представлены в табл. 1.
Качество БД, в частности, достоверность содержащейся в них информации, во многом определяется оперативностью их актуализации. Однако 15% БД обновляются ежегодно, примерно 13% — ежемесячно, 11% — ежеквартально, около 7% — ежедневно.
Научно-исследовательские институты, высшие учебные заведения и музеи являются генераторами многих уникальных БД, не имеющих коммерческой ценности, но по праву (содержательной ценности и уникальности информации) претендующих на статус общенациональных интеллектуальных ценностей.
Пользователями 45 % БД являются все желающие, 26 % БД — только работники предприятия-владельца; число БД, к которым требуется специальный допуск, крайне невелико.
Если учесть, что 25% БД используются абонентами на основе договора с владельцами БД, и тот факт, что в данном анализе не учитывалась довольно многочисленная группа БД, предназначенных для научных исследований, а также расчетных, кадровых БД, не представляющих интереса для внешних пользователей, то число БД, интересных внешним пользователям, оценивается в 75 %.
Источниками для формирования БД являются в основном первичные документы: монографии, статьи из журналов, техническая документация, отчеты, формы статистической отчетности, информационные листки, материалы конференций, выставок, проспекты изданий и услуг, справочники, обзоры.
Таблица 1
Основные характеристики автоматизированных информационных ресурсов России
В последнее время все больше используются такие источники информации, как периодическая печать, лицензии, каталоги отечественных и зарубежных фирм, теле- и радиоинформация, рекламные объявления, адресные справочники, регистрационные карточки, балансы предприятий и банков, письма, анкеты, паспорта предприятий, статистические публикации, договора, прейскуранты и т. д. В состав источников для наполнения БД вовлечено много новых видов информационных материалов, что вызвано необходимостью создания в первую очередь БД адресно-справочной, деловой и коммерческой информации.
"Новые" источники не обладают одинаковой достоверностью информации, что сказывается на качестве создаваемых на их основе БД.
Более 500 БД, эксплуатирующихся в России, представлены на 14 иностранных языках: на английском (65 %), немецком (17 %), французском (более 12 %) и др.
Основными владельцами БД на иностранных языках являются вычислительные и информационные центры, научно-исследовательские организации, учреждения культуры. Предприятиями государственной формы собственности создано 11 % англоязычных БД, кооперативами, акционерными обществами и товариществами — 14 %, частными предприятиями — более 28 %. Характерно, что доля частных англоязычных БД более чем вдвое превосходит государственную долю и общую долю англоязычных БД во всем рассматриваемом массиве иноязычных БД.
Одной из важнейших характеристик АИР является тематический состав БД. Анализ тематики БД проводился по тематической классификации Государственного рубрикатора научно-технической информации (ГРНТИ), при этом учитывалось, что многие БД по своей тематике относятся к нескольким рубрикам ГРНТИ.
Наиболее многочисленную группу представляют БД, относящиеся к типовым рубрикам, имеющимся во всех отраслях знаний. Среди них руководящие материалы, в частности, законы и подзаконные акты, носящие отраслевой характер; персоналии; коммерческие вопросы, маркетинг, конъюнктура, реклама; описания предприятий и организаций, кадры; материалы выставок, конференций и т. д., содержащие информацию, на которую в современных экономических условиях резко растет спрос. В основном —это БД законодательной, персональной информации, адресно-справочные БД, БД коммерческой информации и т. д.
К этой группе БД тематически примыкают 16% БД, относящихся к таким рубрикам ГРНТИ, как "Экономика и экономические науки", "Государство и право. Юридические науки".
Далее следуют БД по таким рубрикам, как "Геофизика и геология" (~6 %), "Машиностроение" (более 6 %), "Химическая технология и химическая промышленность" (более 3 %), "Строительство и архитектура" (~3 %), "Сельское и лесное хозяйство" (4 %), "Внешняя торговля" (более 3 %), "Транспорт" (~4 %); "Статистика" (более 3 %), "Охрана окружающей среды, экология человека" (более 5%).
Следующую группу составляют" БД по рубрикам, содержащим 1—3% от общего количества обследованных БД. К ним относятся: "Информатика", "Энергетика", "Связь", "Автоматика и телемеханика", "Вычислительная техника", "Горное дело", "Приборостроение", "Внутренняя торговля", "Медицина и здравоохранение", "Металлургия".
К последней группе относятся БД по рубрикам, составляющим менее 1 % БД от общего количества обследованных БД (в подавляющем большинстве — единицы БД).
Основываясь на приведенном выше материале, все обследованные БД можно разделить на следующие сектора:
БД коммерческой, правовой и справочной информации — ведущий по количеству отечественных БД сектор;
БД преимущественно для хозяйственных сфер деятельности — сектор, недостаточно обеспеченный БД;
БД преимущественно гуманитарной тематики — сектор, чрезвычайно слабо обеспеченный БД.
2.3. Мониторинг автоматизированных информационных ресурсов
Эффективное использование любого информационного ресурса невозможно без доведения до потенциальных пользователей сведений о его наличии, составе и способах доступа к нему. Для ориентации потребителей печатной продукции традиционно существует большое число библиографических и обзорных изданий, эту функцию выполняют также многочисленные документографические автоматизированные информационные системы и БД.
Существуют единые для большинства стран международные системы регистрации продолжающихся изданий (ISSN) и книг (ISBN), позволяющие идентифицировать большую часть печатной продукции, при описании которой применяются международные стандарты.
Подготовка и распространение сведений об АИР не достигли пока подобной степени развития, организации и стандартизации. Тем не менее во всем мире, в том числе и в России, постоянно возрастает число публикуемых каталогов, справочных и рекламных материалов о БД.
Наиболее эффективным средством представления сведений о БД являются их электронные каталоги или базы метаданных.
С помощью баз метаданных могут решаться следующие задачи:
Примером территориальной (муниципальной) базы метаданных является "Общегородская библиотека программных продуктов, баз данных и систем" ГИВЦ "Москва", содержащая около 560 описаний БД, включающих сведения о владельцах, разработчиках, назначении БД и информационных систем, об условиях предоставления услуг и др. Эта база метаданных.по существу, относится к встроенным БД, так как ее регулярными пользователями являются только специалисты ГИВЦ, организующие информационное обеспечение муниципальных служб. Однако ГИВЦ "Москва" осуществляет и тиражирование базы метаданных для заинтересованных организаций, что расширяет реальную сферу ее применения.
Базы метаданных являются обязательным инструментом крупных дистрибьюторов БД и информационных посредников. К ним относятся БД АО "МБИТ", содержащая описания более 200 предлагаемых к реализации БД, и БД "Держатели банков данных" АО "Мосвнешинформ".
Значительный материал для анализа состояния АИР может быть получен из встроенных баз метаданных крупных политематических банков данных организаций, обеспечивающих работу хостов и входы в крупные информационные сети. Обобщение имеющихся в таких организациях (ИАС, ВИНИТИ, МЦНТИ и др.) сведений о БД представляет значительный интерес. Так, созданный фактически на основе встроенных баз метаданных крупнейших диалоговых информационных служб электронный каталог ИАС "Зарубежные базы данных" полезен не только для организации поиска конкретной информации, но и для решения отдельных задач стратегического планирования развития информационных ресурсов, проведения специальных исследований.
Базы метаданных, не связанные непосредственно с деятельностью их владельцев по распространению БД, используются как общедоступные справочные средства, а также для анализа, - исследований и учета АИР. К таким базам метаданных относятся:
Представляется необходимым в ближайшее время объединить разрозненные усилия отдельных федеральных ведомств (Роскоминформа, ФАПСИ, Миннауки, РосАПО) для организации учета АИР и приступить к обязательной государственной регистрации в первую очередь следующих БД:
БД, созданных или закупленных за счет бюджетных или внебюджетных средств органов государственной власти и управления; БД, содержащих персональные данные;
БД, затрагивающих различные аспекты безопасности граждан и государства.
© Информационное общество, 1994, вып. 4-5, с. 12-19.