По отношению к собственному эталонному банку в каждой системе должны выполняться процедуры:
Графическая модель информационного взаимодействия представлена на рис. 4. Полученная информационная модель дает возможность проследить информационные связи между элементами системы и направление основных информационных потоков, обеспечить интеграцию банков данных всех уровней и эффективную организацию доступа к ним [5].
Важно отметить, что уже сегодня существует целый ряд источников правовой информации, вполне готовых к работе в рамках РАСИПО. Однако из-за отсутствия структурного ядра системы имеющаяся информация обрабатывается и предоставляется пользователям с временными задержками и зачастую не в полном объеме. Решить поставленную задачу без формирования целостной информационной системы, а создавая только локальные информационно-правовые системы в органах государственной власти, не представляется возможным. В то же время реализуемый механизм формирования информационной инфраструктуры позволяет организовать асинхронный процесс ее создания, чтобы “менее готовые” узлы не заставляли ждать “более готовых”. Информационная система - это совокупность соединенных коммуникационными линиями баз и банков данных, в которых накапливается информация, приходящая как из самой информационной системы, так и из внешних источников. Каждый банк данных (в соответствии с Концепцией правовой информатизации России [2] будем называть его узлом системы) может получать и передавать информацию любому другому узлу, причем невозможно предсказать, какому конкретно - эта связь носит случайный характер. Изучением стохастических процессов, описывающих подобные связи, занимается термодинамика, в рамках которой поведение большого ансамбля случайно взаимодействующих частиц описывается специальной функцией - энтропией. В соответствии с [6] "в настоящее время принято отождествление термодинамического и информационного понятия энтропии и даже более того, если рассматривать лишь первую вариационную задачу теории информации и задачу, решение которой приводит к распределению Больцмана в статистической механике, то обе теории считаются "изоморфными" друг другу". В [7] предложена математическая модель транспортной сети региона с обоснованием применимости энтропии к данной задаче. На основе этой модели в [8] рассмотрен закон накопления информации в узлах. Пусть в узле i имеется ni правовых актов. Приращение информации ni в узле i за время t имеет вид: ni = knit, где k - коэффициент, показывающий, какая часть имеющейся информации ni изменяется или дополняется за единицу времени. В каждом узле накопление информации носит дискретный характер с произвольными разрывами во времени, однако для большой системы с независимым случайным накоплением информации в каждом узле можно принять, что n(t) - непрерывная функция, или провести аппроксимацию ni(t) непрерывной функцией. При этом условии , т. е. задача миграции населения в транспортных сетях региона аналогична задаче передачи информации в сетях передачи данных. Если при рассмотрении системы, состоящей их n узлов, считать, что процесс накопления информации через внешние каналы является экспоненциальным с показателем , одинаковым для всех узлов, и что локально-стационарное состояние сети x*(y(t)) устанавливается за время, малое по сравнению с характерным временем изменения состояния системы y(t), то поведение y(t) может быть описано системой дифференциальных уравнений , (1) где xij(t) - количество информации, переходящее за единицу времени из i-го узла в j-й узел, i=1,n. Первое слагаемое в правой части есть прирост информации за счет внешних источников, второе - суммарный поток информации из сети в i-й узел, третье - поток из i-го узла в сеть. Локально-стационарное состояние сети x*(y(t)) определяется с использованием энтропийной модели стохастических коммуникационных систем [9]. В каждый момент времени в распределительном процессе участвует k-я доля информации базы данных каждого узла. Параметр vij характеризует “привлекательность” j-го узла для i-го. При этом vii>0, т.к. в каждом узле допускаются обращения к собственному банку данных. Тогда, в соответствии с [8], x*(y(t)) дается решением n оптимизационных задач вида
Важно отметить, что уже сегодня существует целый ряд источников правовой информации, вполне готовых к работе в рамках РАСИПО. Однако из-за отсутствия структурного ядра системы имеющаяся информация обрабатывается и предоставляется пользователям с временными задержками и зачастую не в полном объеме. Решить поставленную задачу без формирования целостной информационной системы, а создавая только локальные информационно-правовые системы в органах государственной власти, не представляется возможным. В то же время реализуемый механизм формирования информационной инфраструктуры позволяет организовать асинхронный процесс ее создания, чтобы “менее готовые” узлы не заставляли ждать “более готовых”.
Уравнения (1)-(2) составляют замкнутую математическую модель информационной макросистемы с пополнением базы данных и сбалансированным распределением, причем процесс обращения из одного узла к другому носит для всей системы стохастический характер. Решение оптимизационной задачи (2) можно получить методом множителей Лагранжа:
Подставляя (3) в правую часть (1), получим
В силу сбалансированности распределения в системе суммарное количество информации возрастает экспоненциально с показателем :
В силу сбалансированности распределения в системе суммарное количество информации возрастает экспоненциально с показателем
где — множество допустимых значений X. Известно, что этому условию, при введении соответствующих понятий предпочтительности, удовлетворяет ряд значений образующих множество Парето, которое содержит решение многокритериальной задачи. С учетом специфики решаемых задач можно выделить следующие основные факторы, влияющие на принятие решений при оптимизации структуры РАСИПО: среднее время обработки запроса (Tq); удельные затраты на пересылку запроса и получение ответа (Ct); пороговое количество попыток (n) установления соединения с заданной вероятностью
где Tc — среднее время установления соединения с узлом РАСИПО; To — среднее время обработки запроса в узле, включая время на пересылку информации по каналам связи; T`c — среднее время, затрачиваемое на установление соединения с одной попытки; Pq и Pb — вероятность обслуживания и блокировки запроса, соответственно. Исследование особенностей функционирования системы показало, что в качестве математической модели для оценки характеристик можно использовать многофазную систему массового обслуживания с одним прибором на первой фазе (сервер) и несколькими приборами — на второй (каналы) и с блокировкой. При этом входящие потоки полагались пуассоновскими, а время обслуживания — распределенным по экспоненциальному закону. Однако создание стройной системы региональных узлов требует серьезных финансовых вливаний, на что в сегодняшних условиях надеяться не приходится. В это же время маловероятной представляется эффективная работа системы с федеральным центром в единственном числе. Тогда суть поставленной задачи с учетом реалий сегодняшнего дня будет заключаться в том, чтобы распараллелить потоки информации, сходящиеся на федеральном центре, путем создания в региональных узлах подмножеств эталонной БД и обслуживания внутрирегиональных информационных потребностей. Вообще говоря, требуется, зная количество информации, которое должно быть передано между каждыми двумя пунктами, синтезировать сеть, принимая при этом в расчет: стоимость технических средств; дислокацию абонентов сети; объемы информации, циркулирующие в системе; характеристики сети обмена данными; ограничения по организации федерального центра и региональных узлов. При этом рассматривается сеть передачи данных, работающая в режиме прямого доступа к ресурсам с пересылкой "порций" информации. Построение такой сети предполагает выбор оборудования, конфигурации и числа линий связи, причем этот выбор должен минимизировать среднегодовые приведенные затраты на систему. Вместе с тем упомянутые ограничения не позволяют использовать классические подходы к решению задачи синтеза. Можно лишь говорить о формализации выбора минимального числа региональных узлов с подмножеством эталонной БД с обеспечением прямого доступа пользователей других регионов к федеральным ресурсам и об оценке числа каналов связи в условиях неопределенных ресурсных ограничений. Такая задача рассмотрена в [12] для системы с трехуровневой структурой, т.е. системы, образованной федеральным (ФЦ), региональными (РЦ) и абонентскими (АЦ) центрами. С федеральным центром связан следующий объем О пересылаемой информации: , где ti - суммарная длительность запросов (пополнения региональных баз данных) из i-го региона в ФЦ; ci - бинарная переменная, принимающая значение 1, если i-й РЦ существует, и 0 - в противном случае; - суммарная длительность запросов из k-го АЦ в ФЦ. Суть задачи заключается в определении минимального количества РЦ, исходя из требования обеспечения вероятности реализации запроса не менее 0.8. Исходя из изложенного, целевая функция задачи представляется в виде: F(O/Kmax)>Pmin, , где Pmin - ограничение по вероятности реализации запроса; Kmax - максимально допустимое число каналов связи; F - функциональная зависимость вероятности реализации запроса от числа каналов связи. Имитационная модель процесса функционирования вычислительного комплекса подробно описана в [15]. Проведенный анализ, базирующийся на максимально возможных значениях потоков информации и имитационной модели (использованной для определения связи вероятности реализации запроса с числом каналов - квазилинейная зависимость при фиксированном входном потоке), показал, что для организации обслуживания запросов оперативного характера с вероятностью реализации запроса не менее 0.8 потребуется не менее 10 РЦ и 19 каналов связи. Из сказанного следует, что устойчиво может работать только большая разветвленная система с приблизительно равными информационными, программными и техническими возможностями в узлах и линиях коммуникации. “Приблизительность” заключается в том, что требуемая информация будет получена и обработана если не в одном узле, то в другом, и за время, меньшее, чем характерное время изменения работы всей системы. Экспоненциальный рост количества информации показывает, что эффективность работы небольших локальных систем будет снижаться: концентрация всей информации в одном или нескольких банках данных требует гораздо больше времени и материальных затрат, чем распределенное накопление и хранение информации во всех узлах системы. Кроме того, уменьшение числа узлов приводит к уменьшению характерного времени работы системы и, соответственно, к понижению порога устойчивости. Литература 1. Новая технократическая волна на Западе. Сборник //М., "Прогресс" 1986 - 450с. 2. Концепция правовой информатизации России. Утверждена Указом Президента Российской Федерации от 28 июня 1993 г. № 966 //СА ПП 1993, № 27, ст. 2521 3. Киселев Б.В., Хургин В.М. Информационные проблемы в правовой сфере //Вестник РОИВТ, ВИМИ 1994, Вып. 1-2 - с. 38-41 4. Копылов В.А. О создании Российской автоматизированной системы информации о нормативных актах //НТИ, Сер.1, 1992 - № 10-11 - с. 8-13 5. Хургин В.М. О формировании телекоммуникационной инфраструктуры системы правовой информатизации России //НТИ, Сер.1, 1997 - № 6 - с. 8-12 6. Вильсон А. Дж. Энтропийные методы моделирования сложных систем //М., “Наука” 1978 7. Швецов В. И. Состояния равновесия и бифуркации в динамических региональных моделях //Сб. трудов ВНИИСИ, 14, 1989 8. Щербина И. Е. Равновесие и устойчивость в информационных динамических макросистемах // “Правовая информатика”, вып. 2, НЦПИ, 1997 - с. 123-129 9. Samuelson P.A. Foundation of Economic Analysis //Harvard University Press, Cambridge, Mass., 1947 10. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение //М., “Наука” 1970 11. Швецов В. И. Кандидатская диссертация //ВНИИСИ, 1990 12. Капитанов В. Т., Киселев Б. В., Стеценко Ю. П., Хургин В. М. О формализации выбора структуры РАСИПО // “Информационное общество”, 1997 - № 2-3 - с. 39-42.
Исследование особенностей функционирования системы показало, что в качестве математической модели для оценки характеристик можно использовать многофазную систему массового обслуживания с одним прибором на первой фазе (сервер) и несколькими приборами — на второй (каналы) и с блокировкой. При этом входящие потоки полагались пуассоновскими, а время обслуживания — распределенным по экспоненциальному закону.
© Информационное общество, 1998, вып. 6, с. 57 - 66.