Национальные проблемы 2000 года: межнациональный информационный обмен с использованием языков народов России
А.А. Шевцов
фирма "Пара Тайп"
– Вы понимаете английский?
– А что, есть другие языки?
Разговор двух программистов
Россия – страна многонациональная, и это не только политическая, экономическая и культурная проблема. Это – серьезная компьютерная проблема. Все компьютеры, используемые в нашей стране, не могут работать как с национальными языками народов России, так и с языками народов бывшего СССР.
Многие из жителей России и ближнего зарубежья, тех, кто работает на персональных компьютерах, не знают английского языка, а, порой, даже русским не владеют в полном объеме. Или, например, в прибалтийских странах, знают русский лучше национального, но это скрывают.
Персональный компьютер в своем первоначальном виде – устройство англоязычное и в «девственном» состоянии может работать с английским и основными западноевропейскими языками. Даже самые современные программные средства позволяют работать с тем же набором плюс все европейские и прибалтийские языки. В этом списке нет многочисленных языков народов России и СНГ.
Представительства ведущих зарубежных фирм, например, Microsoft, сообщают, что в новейших версиях их программ, которые готовятся к выпуску, не будет поддержки татарского, башкирского, калмыцкого и других языков народов России.
Вот некоторые из сфер деятельности, для которых возможность пользоваться национальным языком является неотъемлемой частью работы:
образование;
охрана правопорядка и паспортизация населения;
финансы;
все виды страхования;
социальное обеспечение;
медицинское обслуживание;
издательство и полиграфия;
библиотечные организации;
информационно-справочная индустрия;
информационный обмен через Интернет.
В регионах эту проблему пытаются решать порой самостоятельно, а это привело к тому, что в каждом ведомстве используют свои стандарты. Например, в Татарстане принято несколько решений на уровне ведомств или административных органов, которые несогласованны между собой, что делает невозможным их использование даже в качестве местного стандарта.
Все это указывает на необходимость федерального Закона о межнациональном информационном обмене.
Необходимость такого закона для России обусловлена тремя факторами:
разнообразным этническим составом страны – более 70 народов, 6 языковых семей, 11 языковых групп;
существующим федеративным устройством;
быстрым развитием информационных технологий на базе компьютерных систем и средств связи.
В этих условиях значимость решения проблемы информационного обмена на базе национальных компьютерных систем и средств связи сопоставима с созданием в свое время письменности для многих народов России и бывшего Союза. народов. принципиально важно, чтобы эта проблема решалась не субъектами федерации, не этническими группами и тем более не стихийно, как это происходит в настоящее время, а была бы рассмотрена на государственном уровне. Это следует сделать путем принятия Закона и последующей разработки государственных нормативных требований к межнациональному информационному обмену.
Историческая справка и обзор международной практики
США и Европа
Первые компьютерные системы создавались исключительно на базе английского языка. С развитием вычислительной техники и распространением ее в промышленно развитых западных странах были приняты стандарты, позволяющие работать с большинством языков, имеющих письменность на базе латиницы. Задача была решена сравнительно легко, так как различия в наборах символов для английского и большинства европейских языков незначительны. Большинство зарубежных компьютерных систем и программных продуктов работают с набором в 256 символов, в которые помимо специальных и управляющих входят наборы символов для всех современных языков Западной Европы. При этом данная кодовая страница не включает восточноевропейские, балтийские и русский языки.
Таким образом, благодаря объективным обстоятельствам и грамотной политике стандартизации, в США и у ведущих европейских стран не существовало проблем с международным информационным обменом.
СССР и страны Совета экономической взаимопомощи (СЭВ)
В СССР развитие и широкое внедрение компьютерных систем происходило в рамках сотрудничества и международной интеграции между странами СЭВ. Были принята соответствующая законодательная база и стандарты, которые соответствовали развитию вычислительной техники того времени, политической и экономической ситуации. Компьютерные системы, использовавшиеся в СССР, поддерживали русский и английский язык. Большинство отраслевых стандартов того времени было привязано к аппаратным решениям, например, к системам ЕС ЭВМ, которые в настоящее время устарели и практически не используются.
Другие страны
Проблемы использования национальных языков в компьютерных системах существуют во всех странах с языками и письменностью отличной от латиницы. Арабские страны пошли по пути принятия де-факто компьютерных систем и программ, навязанных им западными производителями. Такие компьютерные системы являются частным решением и не охватывают всего многообразия народов и культур данного региона. Индия, где число народов и языков сопоставимо с Россией, принимает участие в разработке международных стандартов. В настоящее время доступна информация о стандартах по 12 языкам народов Индии и еще 2 языка обсуждаются. Особняком стоит ряд стран, например, Китай и Япония, где языки и алфавиты принципиально отличны от остальной Азии, Америки, Европы, России и стран бывшего СССР, поэтому рассмотрение проблем в этих государствах выходит за рамки статьи. Наиболее близким аналогом России в контексте рассматриваемой проблемы могут быть страны Европейского Союза и Восточной Европы, однако для них также существуют готовые решения и стандарты позволяющие осуществлять международный информационный обмен.
Состояние проблемы в России
В настоящее время на территории России массово используются импортные компьютерные системы, которые используют английский и русский, украинский и белорусский языки. В данную кодовую страницу также входит сербский язык.
Характерны следующие недостатки:
кириллические символы находятся на местах символов западноевропейских языков, т. е. без дополнительных средств невозможно одновременно использовать, например, немецкий и русский языки, или французский и русский;
существует несколько стандартов на размещение кириллических символов для разных аппаратных платформ и операционных систем, не совпадающих друг с другом (DOS, MS Windows 3.*, MS Windows 9.*, Mac OS, UNIX и другие);
большинство новых зарубежных компьютерных систем не соблюдают требования совместимости и преемственности со старыми версиями, что приводит к дополнительным затратам при модернизации старых систем;
не существует стандартов регламентирующих использование в компьютерных системах национальной письменности и шрифтов народов России, в первую очередь базирующихся на русском алфавите, что приводит к решению проблемы в инициативном порядке на местах.
В настоящее время за рубежом ведется интенсивная разработка новых международных стандартов, включающих все существующие языки и письменности мира. Это связано с рядом причин:
глобальным переходом на новейшие программные и аппаратные средства, изменением геополитической ситуации и переориентацией бывших социалистических стран на западные технологии и стандарты;
решением «Проблемы 2000»;
развитием Интернета.
Большинство проблем решается комплексно, например, совместно с «Проблемой 2000». В частности уже выпущены и получили широкое распространение в России программные средства, позволяющие одновременно работать со всеми европейскими и кириллическими языками. Ведутся работы по включению в этот список армянского и грузинского языков.
Следует отметить, что работы курируются специалистами крупнейших транснациональных корпораций и зачастую преследуют цели захвата новых рынков сбыта, порой, без учета национальных интересов других стран участвующих в международном интеграционном процессе. Информация о разработке стандартов не является закрытой и доступна соответствующим государственным организациям по стандартизации. Существует международная практика рассмотрения и принятия национальных стандартов в качестве международных, например, для языков и письменностей, принципиально отличных от латиницы. Соответствующим государственным организациям России необходимо в кратчайшее время активно включиться в работу.
Компьютерная система может считаться национальной, если выполняются следующие требования по поддержке национального языка:
существует и установлен шрифт с изображениями всех символов национального алфавита;
установлена программа, переключающая клавиатуру с латиницы на национальный алфавит;
существует корректная сортировка текстовых сообщений на национальном алфавите;
система «понимает» национальные названия дней недели и обозначение национальной валюты:
– имеется возможность замены прописных символов на строчные и наоборот;
– имеется возможность расстановки символа переноса и подключения словарей для проверки орфографии и грамматики.
Существующее законодательство РФ
Законы РФ «О стандартизации», «Об информации, информатизации и защите информации», «Об участии в международном информационном обмене» и другие рассмотренной выше проблемы не охватывают. Стандарты РФ по кодированным наборам символов для ЭВМ сильно устарели и не соответствуют внутренним и международным требованиям. Отсутствуют стандарты по кодированным наборам символов национальных алфавитов.
Экономическое обоснование
Прямой арифметический расчет рентабельности принятия федерального Закона о межнациональном информационном обмене вряд ли возможен из-за отсутствия точных данных. Однако, после принятия закона и последующих стандартов их требования не смогут игнорировать поставщики компьютерных систем. Это снизит огромные затраты, связанные с поддержкой и компьютерной системой национального языка. В ряде сфер деятельности возможен экономический эффект, сопоставимый по масштабу с решением «Проблемы 2000».
© Информационное общество, 2000, вып. 1, с. 67 - 69.