Часть 2 национального доклада "Современное состояние российских автоматизированных информационных ресурсов"

________________________



2. СОВРЕМЕННОЕ СОСТОЯНИЕ РОССИЙСКИХ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ

2.1. Структура автоматизированных информационных ресурсов

Системное описание АИР, которыми обладает в настоящее время Россия, затруднено, так как они создавались разрозненно как по министерствам, ведомствам, так и в территориальном разрезе. Не велся и не ведется специального учета АИР как самостоятельного информационного ресурса. До сих пор не разработана классификация информационных ресурсов, нет общепринятых классификаторов. Хотя на уровне отдельных инициативных авторских разработок такие попытки предпринимались, но, как правило, в основе классификации доминировал какой-либо один или несколько отдельных критериев.

Излагаемая ниже структура АИР построена на многокритериальном делении, однако полученная классификация и характеристика информационных ресурсов в их терминах носят сугубо практический характер и ориентированы на задачи и проблемы настоящего Национального доклада.

Информационные ресурсы России делятся по следующим двум равнозначным основаниям:


Государственными являются информационные ресурсы, созданные на основе бюджетного финансирования.

Негосударственными являются информационные ресурсы, созданные на собственные средства организаций (предприятий) и частных лиц.

Информационные ресурсы смешанной формы собственности создаются на основе долевого финансирования государственными и негосударственными организациями (частными лицами).

Государственные информационные ресурсы и информационные ресурсы смешанной формы собственности призваны обслуживать социально значимые потребности страны, а также потребности органов власти и управления.

Негосударственные информационные ресурсы в этом отношении представляются состоящими как бы из двух частей: первая обслуживает общественно значимые потребности общества, вторая — используется для обеспечения исключительно внутрифирменной или личной деятельности и общественной значимости не представляет.

Исходя из социальной значимости, созданные информационные ресурсы подразделяются на:

национальные информационные ресурсы России, включающие государственные информационные ресурсы, информационные ресурсы смешанной формы собственности и часть негосударственных информационных ресурсов;

информационные ресурсы личного и внутрифирменного использования, не являющиеся национальными ресурсами.

Государственные информационные ресурсы по признаку "право владения и распоряжения" могут быть:


Негосударственные информационные ресурсы, являющиеся национальными информационными ресурсами России, по признаку "право владения и распоряжения" могут быть:

частными информационными ресурсами;

информационными ресурсами негосударственных предприятий;

информационными ресурсами общественных объединений (организаций).

По основанию "форма представления информационных ресурсов" выделяются:


Каждая из выделенных по данному основанию группа ресурсов, естественно, может быть охарактеризована по признакам "форма собственности", "право распоряжения и владения", а также быть частью национальных информационных ресурсов.

Основное внимание в Национальном докладе уделено АИР, которые складываются из АИР общего назначения и встроенных в системы.

На рисунке представлено схематическое изображение структуры АИР и даны количественные показатели отдельных частей АИР.

Структура автоматизированных информационных ресурсов

Под АИР общего назначения понимаются информационные ресурсы, функции которых заключаются в формировании и предоставлении информационной продукции и услуг непосредственно конечному пользователю. К ним относятся:


Под АИР, встроенными в системы, понимают информационные ресурсы, которые функционируют для получения промежуточной информации, необходимой для работы системы, в рамках которой они функционируют.

К числу встроенных относятся АИР, функционирующие в составе:


Наиболее многочисленный и важный класс в составе АИР составляют БД, относящиеся к АИР как общего назначения, так и к встроенным в системы. Основной организационно-технической формой создания и использования БД являются банки данных

Схема описания БД

По структуре БД делятся на:

документографические с подразделением их на библиографические и реферативные;

фактографические; числовые; полнотекстовые; лексикографические.

По назначению содержащейся информации БД делятся на:

БД деловой информации (социальная информация, кадастры, регистры, статистическая, коммерческая, финансовая, управленческая информация, данные о продукции и т. п.);

БД информации для специалистов (научно-техническая, экономическая, маркетинговая, правоохранительная, исследовательская, производственная, конструкторская, технологическая информация и т. п.);

БД массовой информации (правовая, библиотечно-библиографическая, архивная, учебная, справочная, общественно-политическая, словарно-энциклопедиче-ская информация, информация о культуре, спорте, досуге и т. п.).

По способу доступа БД делятся на:


Объектом рассмотрения в Национальном докладе является самый многочисленный класс национальных АИР — БД, имеющие наибольшую социальную значимость. Учитывая основную цель доклада — формулирование предложения по выработке государственной политики в сфере АИР — основное внимание уделено государственным БД и отношению государства к негосударственным АИР.

2.2. Общая характеристика баз данных

Из-за отсутствия регламентированного учета точное количество БД, созданных к настоящему времени в России, неизвестно, поэтому экспертные оценки по этому вопросу носят косвенный опосредованный характер.

В 1991 г. Роскоминформ совместно с Госкомстатом РФ провел разовую перепись БД. Кроме того, в течение последних трех лет проводился добровольный учет БД средствами, инициирующими заинтересованность в нем владельцев БД. Таким образом, в электронном каталоге НТЦ "Информрегистр" оказалось представлено более 10 тыс. БД, из них около 8 тыс. — российские БД, остальные — БД стран ближнего зарубежья.

Выборочный анализ показал, что переписью 1991 г. было охвачено порядка 30% организаций, владеющих БД, хотя по отдельным классам БД, где учетом удалось охватить почти все БД (прежде всего БД по НТИ в информационных центрах и службах), процент учтенных БД гораздо выше. На основе этих данных общее количество БД в России оценивается в 25—30 тыс.

Количественные оценки функционирования БД приведены на основе анализа сокращенного массива сведений о 3000 российских БД, представляющих интерес для массовых пользователей. Этот массив является крупнейшим в России.

При анализе рассматривались следующие типы БД: документографические, включающие в себя библиографические и реферативные БД; документально-фактографические, фактографические, полнотекстовые и гипертекстовые. За пределами рассмотрения остался весьма многочисленный тип БД — числовые БД, большинство из которых создано в рамках САПР или относится к классу расчетных научно-исследовательских БД. Эти БД, как правило, имеют ограниченные распространение и спрос, создаются под частные задачи, в большинстве случаев имеют краткий срок жизни и поэтому несущественно влияют на общую оценку состояния АИР страны. Исключение составляют базы статистических данных.

Обобщенные характеристики АИР, хранящихся в виде БД, представлены в табл. 1.

Качество БД, в частности, достоверность содержащейся в них информации, во многом определяется оперативностью их актуализации. Однако 15% БД обновляются ежегодно, примерно 13% — ежемесячно, 11% — ежеквартально, около 7% — ежедневно.

Научно-исследовательские институты, высшие учебные заведения и музеи являются генераторами многих уникальных БД, не имеющих коммерческой ценности, но по праву (содержательной ценности и уникальности информации) претендующих на статус общенациональных интеллектуальных ценностей.

Пользователями 45 % БД являются все желающие, 26 % БД — только работники предприятия-владельца; число БД, к которым требуется специальный допуск, крайне невелико.

Если учесть, что 25% БД используются абонентами на основе договора с владельцами БД, и тот факт, что в данном анализе не учитывалась довольно многочисленная группа БД, предназначенных для научных исследований, а также расчетных, кадровых БД, не представляющих интереса для внешних пользователей, то число БД, интересных внешним пользователям, оценивается в 75 %.

Источниками для формирования БД являются в основном первичные документы: монографии, статьи из журналов, техническая документация, отчеты, формы статистической отчетности, информационные листки, материалы конференций, выставок, проспекты изданий и услуг, справочники, обзоры.

Таблица 1

Основные характеристики автоматизированных информационных ресурсов России

Характеристика БД
Значение характеристики
Количество БД, %
Тип БДФактографические
Документографические
Лексикографические
Полнотекстовые
прибл-но 67
более 20
более 4
более 4
Объем БДКрупные БД (более 100 тыс. записей и 50 Мб
Средние БД
Малые БД (менее 1 тыс. записей и 1 Мб)
прибл-но 60

прибл-но 15
прибл-но 25
Способ генерации БДСобственная генерация
Заимствование
Комбинированный (заимствование
с добавлением собст. инф-ции)
Крупнейшие генераторы БДВИНИТИ, ВНТИЦентр, БАН, ГИВЦ Госкомстата, ВНИИГМИ -МЦД, ИНИОН, ВНИИМС, ВНИИ СМВ, ГПНТБ Росии, ГПНТБ СО РАН, ВИМИ, ВНИИКИ, ВНИЦ "Экология", МНПП, "Телекосмос", МОСоблЦНТИ, НПО "Поиск", РГБ, РКП, ГИПЭ, ГИЦ ВСЕИНГЕО, ГВЦ Минэкономики, Институт географии РАН, ИнформВЭС, Информприбор, Информэлектро, МЦНТИ, НИИ экономики АП, РГГУ, Челябинский ЦНТИ, АО "Нефтехим", АО "Мосвнешинформ"
Владельцф БД по видам собственностиГосударственные предприятия
Негосударственные предприятия
более 86
более 13
Организации - владельцы БДНаучно-исследовательские институты
и проектно-конструкторские бюро
Информационные и вычислительные центры
Учреждения культуры
Промышленнные предприятия
Органы управления
Прочие
более 50

прибл-но 29
более 5
более 4
более 4
менее 8
Услуги, предоставляемые на основе БДТиражирование БД
Разовый поиск
ИРИ
Выборки из БД
Подготовка справок
Расчеты
Прочие виды услуг
более 35
более 28
более 8
прибл-но 7
прибл-но 5
прибл-но 4
прибл-но 13
БД по назначению информацииНаучно-технические
Справочная
Управленческая
Исследовательская
Учетно-статистическая
Коммерческая
Официальная
Массовая
Финансовая
Проектно-конструкторская
Производственно-техническая
Учебная
Архивная
Конъюнктурная
36,6
16
более 12
10,4
7,5
4,7
более 3
2,7
более 2,5
более 2
более 2
более 1
0,2
0,1

В последнее время все больше используются такие источники информации, как периодическая печать, лицензии, каталоги отечественных и зарубежных фирм, теле- и радиоинформация, рекламные объявления, адресные справочники, регистрационные карточки, балансы предприятий и банков, письма, анкеты, паспорта предприятий, статистические публикации, договора, прейскуранты и т. д. В состав источников для наполнения БД вовлечено много новых видов информационных материалов, что вызвано необходимостью создания в первую очередь БД адресно-справочной, деловой и коммерческой информации.

"Новые" источники не обладают одинаковой достоверностью информации, что сказывается на качестве создаваемых на их основе БД.

Более 500 БД, эксплуатирующихся в России, представлены на 14 иностранных языках: на английском (65 %), немецком (17 %), французском (более 12 %) и др.

Основными владельцами БД на иностранных языках являются вычислительные и информационные центры, научно-исследовательские организации, учреждения культуры. Предприятиями государственной формы собственности создано 11 % англоязычных БД, кооперативами, акционерными обществами и товариществами — 14 %, частными предприятиями — более 28 %. Характерно, что доля частных англоязычных БД более чем вдвое превосходит государственную долю и общую долю англоязычных БД во всем рассматриваемом массиве иноязычных БД.

Одной из важнейших характеристик АИР является тематический состав БД. Анализ тематики БД проводился по тематической классификации Государственного рубрикатора научно-технической информации (ГРНТИ), при этом учитывалось, что многие БД по своей тематике относятся к нескольким рубрикам ГРНТИ.

Наиболее многочисленную группу представляют БД, относящиеся к типовым рубрикам, имеющимся во всех отраслях знаний. Среди них руководящие материалы, в частности, законы и подзаконные акты, носящие отраслевой характер; персоналии; коммерческие вопросы, маркетинг, конъюнктура, реклама; описания предприятий и организаций, кадры; материалы выставок, конференций и т. д., содержащие информацию, на которую в современных экономических условиях резко растет спрос. В основном —это БД законодательной, персональной информации, адресно-справочные БД, БД коммерческой информации и т. д.

К этой группе БД тематически примыкают 16% БД, относящихся к таким рубрикам ГРНТИ, как "Экономика и экономические науки", "Государство и право. Юридические науки".

Далее следуют БД по таким рубрикам, как "Геофизика и геология" (~6 %), "Машиностроение" (более 6 %), "Химическая технология и химическая промышленность" (более 3 %), "Строительство и архитектура" (~3 %), "Сельское и лесное хозяйство" (4 %), "Внешняя торговля" (более 3 %), "Транспорт" (~4 %); "Статистика" (более 3 %), "Охрана окружающей среды, экология человека" (более 5%).

Следующую группу составляют" БД по рубрикам, содержащим 1—3% от общего количества обследованных БД. К ним относятся: "Информатика", "Энергетика", "Связь", "Автоматика и телемеханика", "Вычислительная техника", "Горное дело", "Приборостроение", "Внутренняя торговля", "Медицина и здравоохранение", "Металлургия".

К последней группе относятся БД по рубрикам, составляющим менее 1 % БД от общего количества обследованных БД (в подавляющем большинстве — единицы БД).

Основываясь на приведенном выше материале, все обследованные БД можно разделить на следующие сектора:

БД коммерческой, правовой и справочной информации — ведущий по количеству отечественных БД сектор;

БД преимущественно для хозяйственных сфер деятельности — сектор, недостаточно обеспеченный БД;

БД преимущественно гуманитарной тематики — сектор, чрезвычайно слабо обеспеченный БД.

2.3. Мониторинг автоматизированных информационных ресурсов

Эффективное использование любого информационного ресурса невозможно без доведения до потенциальных пользователей сведений о его наличии, составе и способах доступа к нему. Для ориентации потребителей печатной продукции традиционно существует большое число библиографических и обзорных изданий, эту функцию выполняют также многочисленные документографические автоматизированные информационные системы и БД.

Существуют единые для большинства стран международные системы регистрации продолжающихся изданий (ISSN) и книг (ISBN), позволяющие идентифицировать большую часть печатной продукции, при описании которой применяются международные стандарты.

Подготовка и распространение сведений об АИР не достигли пока подобной степени развития, организации и стандартизации. Тем не менее во всем мире, в том числе и в России, постоянно возрастает число публикуемых каталогов, справочных и рекламных материалов о БД.

Наиболее эффективным средством представления сведений о БД являются их электронные каталоги или базы метаданных.

С помощью баз метаданных могут решаться следующие задачи:


Примерами баз метаданных, охватывающих АИР отдельных отраслей или сфер деятельности, являются электронный отраслевой справочник БД, подготовленный Информэлектро; БД "Отечественные и зарубежные базы и банки данных", созданная ВНИЦ СМВ; БД "Характеристики популярных БД деловой, коммерческой и специальной информации", генератором и владельцем которой является МП "ДИЗ".

Примером территориальной (муниципальной) базы метаданных является "Общегородская библиотека программных продуктов, баз данных и систем" ГИВЦ "Москва", содержащая около 560 описаний БД, включающих сведения о владельцах, разработчиках, назначении БД и информационных систем, об условиях предоставления услуг и др. Эта база метаданных.по существу, относится к встроенным БД, так как ее регулярными пользователями являются только специалисты ГИВЦ, организующие информационное обеспечение муниципальных служб. Однако ГИВЦ "Москва" осуществляет и тиражирование базы метаданных для заинтересованных организаций, что расширяет реальную сферу ее применения.

Базы метаданных являются обязательным инструментом крупных дистрибьюторов БД и информационных посредников. К ним относятся БД АО "МБИТ", содержащая описания более 200 предлагаемых к реализации БД, и БД "Держатели банков данных" АО "Мосвнешинформ".

Значительный материал для анализа состояния АИР может быть получен из встроенных баз метаданных крупных политематических банков данных организаций, обеспечивающих работу хостов и входы в крупные информационные сети. Обобщение имеющихся в таких организациях (ИАС, ВИНИТИ, МЦНТИ и др.) сведений о БД представляет значительный интерес. Так, созданный фактически на основе встроенных баз метаданных крупнейших диалоговых информационных служб электронный каталог ИАС "Зарубежные базы данных" полезен не только для организации поиска конкретной информации, но и для решения отдельных задач стратегического планирования развития информационных ресурсов, проведения специальных исследований.

Базы метаданных, не связанные непосредственно с деятельностью их владельцев по распространению БД, используются как общедоступные справочные средства, а также для анализа, - исследований и учета АИР. К таким базам метаданных относятся:


Эта метабаза активно используется различными группами пользователей, среди которых видное место занимают сотрудники министерств, ведомств, других органов государственного управления. База метаданных НТЦ "Информрегистр" нередко используется для аналитических работ, в частности, использовалась при подготовке Национального доклада.

Представляется необходимым в ближайшее время объединить разрозненные усилия отдельных федеральных ведомств (Роскоминформа, ФАПСИ, Миннауки, РосАПО) для организации учета АИР и приступить к обязательной государственной регистрации в первую очередь следующих БД:

БД, созданных или закупленных за счет бюджетных или внебюджетных средств органов государственной власти и управления; БД, содержащих персональные данные;

БД, затрагивающих различные аспекты безопасности граждан и государства.


© Информационное общество, 1994, вып. 4-5, с. 12-19.