Конечно, подход к вычислениям как к коммунальной услуге соответствует взгляду со стороны клиента. Со стороны же сервера, то есть изнутри, сеть распределенных вычислений – это выделение ресурсов, распределение информации и обеспечение высокой степени готовности. Выделение ресурсов означает, что все, кто нуждается в ресурсах или запрашивает их, получат то, что им нужно. При наличии свободных ресурсов запросы не могут оставаться неудовлетворенными. Распределение информации означает, что информация, необходимая пользователям и приложениям, доставляется туда и тогда, где и когда она требуется. Высокая степень готовности означает, что все данные и вычисления доступны постоянно – точно так же, как энергетическая компания обеспечивает бесперебойную подачу электроэнергии.
Сеть распределенных вычислений в корне меняет способ использования предприятиями своих ресурсов – она их виртуализирует. Ресурсы становятся виртуальными, т.е. их можно распределять между серверами вычислительного центра, между вычислительными центрами предприятия и между самими предприятиями.
Недорогое оборудование, такое как blade-серверы, и недорогие операционные системы, такие как Linux, гарантируют максимальную экономическую эффективность сети распределенных вычислений. Чтобы использовать имеющиеся ресурсы с полной отдачей, рекомендуется применять именно эти компоненты.
Концепция сети распределенных вычислений созвучна с подходами корпорации Oracle к построению информационных систем. Она согласуется с функциональностью продуктов и технологиями, которые Oracle разрабатывает уже много лет. И сегодня корпорация предлагает реальную технологию сети распределенных вычислений, которая поможет извлекать из нее максимум преимуществ. Oracle 10g содержит оригинальные базовые технологии для создания GRID – Oracle Real Application Clusters, Oracle Streams и Oracle Transportable Tablespaces. Семейство программных продуктов Oracle 10g отвечает эксплуатационным требованиям сети распределенных вычислений, таким как универсальность, RAS (надежность, готовность, удобство обслуживания), защищенность, масштабируемость и управляемость.
Oracle 10g обладает необходимой архитектурой для создания будущих компьютерных технологий на основе сети распределенных вычислений. Все технологии Oracle продуманы и разработаны таким образом, чтобы оптимально работать в сети. Комплект инструментов Oracle Globus Development Kit (OGDK) позволяет применять технологию Oracle со стандартными инструментами Globus. Корпорация Oracle намерена полностью поддерживать новые стандарты сети распределенных вычислений и сотрудничает с этой целью с организацией Global Grid Forum (GGF).
В Oracle Database 10g включены усовершенствованные возможности автоматизированного управления и новая консоль Database Control с web-интерфейсом. Database Control представляет собой диагностический монитор, отображающий в графическом виде текущее состояние функционирующей базы данных. Администраторы могут проводить профилактический мониторинг баз данных и быстро получать предупреждения и рекомендации с целью обеспечения оптимальной производительности и надежности работы систем. Консоль Database Control может даже выявить неудачно написанный фрагмент кода приложения, предложить лучший вариант и автоматически настроить базу данных для обеспечения оптимальной производительности.
Кроме того, возможность Oracle Database 10g осуществлять автоматическое управление избавляет от необходимости выполнять сложные повторяющиеся задачи, такие как диагностика производительности, настройка приложений и управление распределением памяти. Новое программное обеспечение включает механизм самодиагностики, который автоматически выявляет любые проблемы, связанные с производительностью или функциональностью системы, и предоставляет рекомендации по устранению неполадок. Эти возможности обеспечивают немедленное снижение нагрузки на сотрудников, обслуживающих информационные системы, а также долговременные преимущества при построении сети распределенных вычислений предприятия.
Oracle Database 10g включает также модуль автоматического управления хранилищем данных (Automatic Storage Management, ASM) – новое ПО, предназначенное для упрощения конфигурирования системы хранения данных и управления базами данных. Модуль ASM избавляет от необходимости знать о том, как база данных взаимодействует с файлами данных и подсистемами хранения данных. Он также автоматически распределяет нагрузку на систему хранения данных с целью достижения наивысшей производительности системы. Модуль ASM исключает необходимость постоянного мониторинга систем хранения данных на предмет поиска «точек повышенной загрузки» и «узких мест», которые снижают скорость обработки данных.
Модуль ASM также позволяет сэкономить на приобретении программного обеспечения сторонних производителей, обеспечивающего управление томами системы хранения данных и файловой системой, за счет полной автоматизации хранения файлов и данных. Используя модуль ASM, клиенты могут значительно упростить структуру информационного центра и снизить расходы на управление системой. Oracle наладил сотрудничество с компаниями-разработчиками промышленных систем хранения данных, такими, как EMC, Hitachi, HP, Network Appliance и Xiotech, для того чтобы обеспечить возможность совместной работы модуля ASM с сетевыми устройствами хранения данных и сетями хранилищ данных, предлагаемыми этими компаниями.
Oracle Database 10g проявила себя как лучшая СУБД на недорогих компьютерных платформах. СУБД Oracle 10g для Linux-кластеров обладает высокой масштабируемостью, что было доказано на вычислительных комплексах с 32 и более узлами. Как выяснилось, не существует принципиальных технологических барьеров для увеличения числа узлов в кластерах. RAC обеспечивает высокую степень утилизации ресурсов, причем на недорогих blade-фермах.
Технология Oracle RAC основана на архитектуре с разделяемым диском (shared disk architecture), что отличает ее от СУБД других производителей, которые строятся на принципиальной иной архитектуре (shared nothing architecture). Данные в такой архитектуре искусственно разнесены по сегментам базы данных. При добавлении новых blade-серверов все данные нужно заново сегментировать, чтобы перенести часть из них на новые серверы. Аналогично, когда нужно изъять из системы blade-серверы, данные тоже приходится предварительно сегментировать.
В данную группу включены следующие продукты:
Mainframe Integration Gateways – подгруппа продуктов (шлюзов), обеспечивающих доступ к СУБД DB2 на мэйнфреймах. В эту же подгруппу включены продукты Replication Services (сервисы репликации), обеспечивающие репликацию данных из БД Oracle в «чужие» базы данных (равно как и репликацию из «чужих» баз данных в БД Oracle). Для репликации используются прозрачные шлюзы к соответствующим базам данных.
Enterprise Integration Gateways – подгруппа продуктов, включающая шлюзы к СУБД DB2 для платформы AS/400 (DB2/400) и шлюз к системам IBM DRDA, а также Procedural Gateways (процедурные шлюзы), обеспечивающие обработку вызовов удаленных процедур, причем удаленные процедуры определены и выполняются в отличной от Oracle программной системе. В эту подгруппу включен и Access Manager (менеджер доступа), основным назначением которого является поддержка доступа «чужих» приложений посредством языка запросов SQL к базам данных Oracle.
Корпорация Oracle разработала и уже в течение длительного времени предлагает пользователям семейство продуктов, называемое Oracle Transparent Gateways. Продукты Oracle Open Gateway направлены на решение интеграционных задач и позволяют в совокупности с другими продуктами Oracle построить эффективную программную инфраструктуру современной ИС. Главная идея, положенная в основу технологии шлюзов Oracle, состоит в возможности простой интеграции СУБД и других продуктов ведущих поставщиков ПО в программную среду на основе продуктов Oracle. То есть технология шлюзов Oracle позволяет унифицировать доступ к данным (Oracle SQL) и процедурам, равно как и сетевое взаимодействие на прикладном уровне (Oracle SQL*Net) в вычислительной системе со сложной неоднородной архитектурой.
Комплект инструментов разработки Oracle Globus
Утилизация ресурсов
Тем не менее утилизация ресурсов посредством сети распределенных вычислений успешно применяется для решения сложных проблем. Примером такой реализации сети распределенных вычислений можно считать проект SETI@home, в котором свободные компьютеры, подключенные к интернету, обрабатывают данные радиотелескопа с целью поиска признаков существования внеземных цивилизаций.
Как и в примере с утилизацией ресурсов, множество администрируемых доменов сети распределенных вычислений может привести к возникновению проблем для организации. Не всем системам в рамках сети распределенных вычислений можно доверить конфиденциальные данные, а перемещение больших объемов данных к доступным ресурсам может оказаться экономически неэффективным. Политические проблемы тоже могут повлиять на эффективность проектов с разделением ресурсов, так как многие организации не склонны выпускать из-под контроля принадлежащие им ресурсы.
Для внедрения сети распределенных вычислений такого типа многие заказчики применяют технологию Oracle. CERN выбрал технологических партнеров для реализации проекта сети распределенных вычислений LHC (Большой Адронный Коллайдер), которая позволит тысячам физиков во всем мире анализировать петабайты распределенных данных об элементарных частицах. Одним из участников проекта является компания Oracle с программными продуктами Oracle Database 10g и Oracle Application Server 10g, отвечающие требованиям сети распределенных вычислений LHC. Oracle Database 10g гарантирует масштабируемость, разделение информации и функции поддержки сверхбольших баз данных (VLDB), необходимые тысячам пользователей для обмена данными в рамках сети распределенных вычислений LHC. Oracle Transportable Tablespaces обеспечит CERN быстродействующим механизмом распределения больших объемов данных между множеством узлов.
В этих новых пулах выделяемых ресурсов будут доминировать, скорее всего, фермы недорогих blade-серверов. Они обеспечивают лучшее соотношение цена/производительность и занимают мало места, что снижает потребность в строительстве новых, дорогостоящих вычислительных центров. Фермы blade-серверов обеспечивают разнообразные ресурсы, которые можно легко выделять приложениям по мере необходимости. Степень дробления (степень гранулярности) этих ресурсов велика, и это позволяет добавлять или убавлять выделяемые приложениям ресурсы с увеличением или уменьшением нагрузки.
Многие организации уже успешно внедрили сети распределенных вычислений с выделением ресурсов. Управление полиции земли Северный Рейн-Вестфалия консолидировало все свои приложения для управления бюджетом, складским хозяйством, снабжением, инвентарными запасами и основными фондами, а также бухгалтерские приложения на состоящем из трех узлов кластере Linux-серверов N800 с программным обеспечением Oracle Database 10g и Oracle Real Application Clusters 10g (RAC).
Существует целый ряд тенденций, которые в совокупности делают внедрение сети распределенных вычислений неизбежным:
· тенденции в области компьютерных платформ:
*Oracle — зарегистрированная торговая марка Oracle Corporation. Другие наименования упомянутых здесь продуктов и услуг могут быть торговыми марками Oracle Corporation. Все прочие наименования и торговые марки могут принадлежать соответствующим владельцам. – www.oracle.com.
Copyright © Oracle Corporation. Все права защищены.
© Информационное общество, 2004, вып. 3-4, сс. 145-151.