Операционная система

Технология кластеров Windows. Архитектура службы кластеров

Информационный документ

Аннотация

Служба кластеров – одна из двух технологий кластеров Microsoftâ Windowsâ, существующая в семействе серверных продуктов Microsoftâ Windowsâ 2000 и Microsoft Windows NTâ. Серверы на базе Windows 2000 и Windows NT, работающие со службой кластеров, обеспечивают поддержку восстановления после сбоев для серверных приложений и служб, требующих высокой доступности и целостности данных. Среди этих серверных приложений есть приложения масштаба предприятия, такие, как базы данных, файловые серверы, приложения ERP (Enterprise Resource Planning – планирование ресурсов предприятия) и почтовые системы. В данном информационном документе рассматривается архитектура и возможности службы кластеров и описывается ее терминология, понятия, проектные цели, ключевые компоненты и планируемые направления развития.

 

© Корпорация Майкрософт (Microsoft Corporation), 1999. Все права защищены.

Информация, содержащаяся в настоящем документе, представляет текущую точку зрения корпорации Майкрософт по обсуждаемым вопросам на момент публикации. В условиях меняющейся рыночной конъюнктуры данную информацию не следует рассматривать в качестве какого бы то ни было обязательства со стороны Майкрософт; корпорация не может гарантировать точность информации, представленной после даты публикации.

Данный документ имеет чисто информативный характер. КОРПОРАЦИЯ МАЙКРОСОФТ НЕ ПРЕДОСТАВЛЯЕТ НИКАКИХ ГАРАНТИЙ, НИ ЯВНО ВЫРАЖЕННЫХ, НИ ПОДРАЗУМЕВАЕМЫХ В СВЯЗИ С ДАННЫМ ДОКУМЕНТОМ.

Microsoft, Windows и Windows NT являются охраняемыми товарными знаками корпорации Майкрософт в США и других странах.

Названия других продуктов или предприятий, указанные здесь, могут быть товарными знаками соответствующих владельцев.

Microsoft Corporation • One Microsoft Way • Redmond, WA 98052-6399 • USA

11/99


содержание


введение..................................................................................... 1

Обоснование разработки                                                                   1

терминология кластеров................................................... 3

Кластеры серверов                                                                            3

Виртуальные серверы                                                                        5

Группы ресурсов                                                                               7

АРХИТЕКТУРА СЛУЖБЫ КЛАСТЕРОВ...................................... 8

Компоненты службы кластеров                                                         8

Диспетчер узла                                                                                  9

Диспетчер базы данных настройки                                                     9

Диспетчер контрольных точек                                                          10

Диспетчер журналов                                                                        10

Диспетчер восстановления                                                              10

Обработчик событий                                                                        12

Диспетчер связи                                                                               12

Диспетчер глобального обновления                                                12

Диспетчер объектов                                                                         12

Мониторы ресурсов                                                                         12

Ресурсы кластера................................................................. 13

Администрирование кластера...................................... 15

Формирование и работа кластера............................... 16

Создание кластера                                                                           16

Формирование кластера                                                                  16

Присоединение к кластеру                                                               17

Выход из кластера                                                                           18

Обнаружение отказов........................................................ 19

Обнаружение отказов узлов                                                             19

Обнаружение отказов ресурса                                                         19

Направления развития...................................................... 21

Дополнительные сведения............................................ 22

Книги                                                                                                22

Веб-узлы                                                                                          22

 


введение


Спроектированная изначально для операционной системы Windows NT Server 4.0, служба кластеров в операционных системах Windows 2000 Advanced Server и Datacenter Server значительно обогащена. Служба кластеров дает возможность соединения нескольких серверов в кластер серверов, что обеспечивает высокую степень доступности и простоту управления данными и программами, работающими в пределах кластера. Служба кластеров обеспечивает в технологии кластеризации три принципиальных преимущества.

·         Улучшенная доступность – благодаря тому, что в кластере серверов службы и приложения могут работать во время отказа аппаратного или программного компонента либо в процессе планового обслуживания.

·         Улучшенная масштабируемость – благодаря поддержке серверов, в которые можно добавить несколько процессоров (до восьми процессоров в системе Windows 2000 Advanced Server и 32 процессоров в системе Datacenter Server) и дополнительную память (до 8 ГБ ОЗУ в системе Advanced Server и 64 ГБ ОЗУ в системе Datacenter Server).

·         Улучшенная управляемость – благодаря предоставленной администраторам возможности управлять устройствами и ресурсами в пределах целого кластера как ресурсами одного компьютера.

Служба кластеров является одной из двух дополнительных технологий кластеров Windows, предлагаемых в качестве расширения базовых операционных систем Windows 2000 и Windows NT. Другая технология кластеров – балансировка сетевой нагрузки – дополняет службу кластеров путем поддержки высокодоступных и масштабируемых кластеров интерфейсных приложений и служб, таких, как узлы Интернета или интрасети, веб-приложения, потоки мультимедиа и службы терминалов (Microsoft).

Данный информационный документ посвящен исключительно архитектуре и возможностям службы кластеров и описывает ее терминологию, понятия, проектные цели, ключевые компоненты и планируемые направления развития. Раздел «Дополнительные сведения» в конце данного документа содержит список ссылок, из которых можно более подробно узнать о службе кластеров и технологии балансировки сетевой нагрузки.

Обоснование разработки

Кластеры компьютеров строятся и используются уже более десяти лет. Один из первых архитекторов кластерной технологии Дж. Пфистер (G. Pfister) определил кластер как «параллельную или распределенную систему, состоящую из набора взаимосвязанных компьютеров, используемую как один унифицированный вычислительный ресурс».

Объединение нескольких серверных компьютеров в одном кластере позволяет распределить между ними вычислительную нагрузку таким образом, что пользователи и администраторы не обязаны знать, что в работе участвует более одного сервера. Например, в случае отказа какого-либо ресурса в кластере сам кластер как целое продолжает предоставлять службу пользователям, используя ресурс какого-либо другого сервера из кластера, независимо от того, является отказавший компонент программным или аппаратным ресурсом.

Другими словами, в случае отказа ресурса пользователи, подключенные к кластеру серверов, могут почувствовать временное снижение быстродействия, но не теряют доступа к службе. Если нужны дополнительные обрабатывающие мощности, администраторы могут добавлять новые ресурсы, используя поочередное обновление. Кластер как целое остается во время этого процесса подключенным к сети и доступным, а быстродействие кластера после обновления увеличивается.

На основе требований пользователей и бизнеса к технологии кластеров был сформирован проект и определено развитие службы кластеров для операционных систем Windows 2000 Advanced Server, Windows 2000 Datacenter Server и Windows NT Server 4.0. Главной проектной целью была разработка службы операционной системы, отвечающей потребностям в кластерах широкого сегмента предприятий и организаций, а не малого и специального сегмента рынка.

Маркетинговые исследования корпорации Майкрософт выявили большой и растущий спрос на системы высокой доступности в малом и среднем бизнесе, где базы данных и электронная почта стали существенной частью ежедневной работы. Для организаций такого масштаба простота установки и управления были определены как ключевые требования. В то же время исследования корпорации Майкрософт показали растущий спрос на серверы на базе Windows в больших предприятиях, где ключевыми требованиями становятся высокое быстродействие и высокая доступность.

Эти исследования привели к разработке службы кластеров как интегрированного расширения базовых операционных систем Windows 2000 и Windows NT. Служба кластеров предназначена для того, чтобы объединять несколько серверов и компонентов хранения данных в единую легко управляемую единицу – кластер серверов. Кластеры серверов могут быть использованы малыми и большими предприятиями для создания высокодоступных и простых в управлении систем, выполняющих приложения на базе Windows 2000 и Windows NT. Служба кластеров также обеспечивает интерфейсы приложений и средства для разработки новых приложений, рассчитанных на работу в кластере.

терминология кластеров


Служба кластеров – принятое в Windows 2000 название для предлагаемой корпорацией Майкрософт технологии, ранее известной как сервер MSCS (Microsoft Cluster Server) для операционной системы Windows NT Server 4.0 (выпуск для предприятий). При упоминании серверов, составляющих кластер, отдельные компьютеры называются узлами. Название служба кластеров относится к набору компонентов на каждом узле, выполняющих связанную с кластером работу, а название ресурс относится к аппаратным и программным компонентам в пределах кластера, которыми управляет служба кластеров. Инструментальным механизмом, который служба кластеров предлагает для управления ресурсами, являются библиотеки ресурсов. Библиотеки ресурсов задают абстрактные определения ресурсов, интерфейсы связи и операции управления.

Ресурс включен в сеть, если он доступен и предоставляет свои услуги кластеру. Ресурсами являются физические или логические сущности, обладающие следующими характеристиками:

·         они могут быть включены в сеть и отключены от сети;

·         ими можно управлять в пределах кластера серверов;

·         в каждый момент времени ресурс принадлежит только одному узлу.

Ресурсы кластера включают аппаратные устройства, такие, как дисководы или сетевые карты, и логические единицы, такие, как адреса IP (Internet Protocol), приложения и базы данных приложений. Каждый узел кластера будет иметь свои собственные локальные ресурсы. Однако кластер имеет также общие ресурсы, например, общие хранилища данных и частная сеть кластера. Эти общие ресурсы доступны каждому узлу в пределах кластера. Особым общим ресурсом является ресурс кворума – физический диск в общем дисковом массиве кластера, играющий в работе кластера критическую роль. Он должен присутствовать, чтобы можно было выполнять операции с узлами – например, формирование кластера или присоединение к нему узла.

Группа ресурсов – это набор ресурсов, которыми служба кластеров управляет как одной логической единицей. Ресурсами приложений и сущностями кластеров легко управлять путем объединения логически связанных ресурсов в группу ресурсов. Когда служба кластеров выполняет операцию над группой ресурсов, результаты операции сказываются на каждом ресурсе группы. Как правило, группа ресурсов создается так, чтобы она содержала все элементы, необходимые конкретному серверу приложений и клиенту для успешной работы приложения.

Кластеры серверов

Служба кластеров базируется на модели архитектуры кластера «с индивидуальным доступом». Эта модель характеризует способ, которым серверы в кластере управляют локальными и общими устройствами и ресурсами кластера и используют их. В кластере с индивидуальным доступом каждый сервер владеет собственными локальными устройствами и управляет ими. Устройства, общие для кластера, такие как общий дисковый массив или среда подключения, в каждый конкретный момент находятся в собственности и под управлением только одного сервера.

Модель с индивидуальным доступом облегчает управление дисковыми устройствами и стандартными приложениями. Эта модель не требует специальных кабельных соединений или специальных приложений и дает службе кластеров возможность поддерживать стандартные приложения и дисковые ресурсы на базе Windows 2000 и Windows NT.

Служба кластеров использует стандартные драйверы операционных систем Windows 2000 и Windows NT Server для локальных запоминающих устройств и подключений носителей. Служба кластеров поддерживает несколько типов сред подключения для общих внешних устройств, которые должны быть доступными всем серверам кластера. Внешние запоминающие устройства, общие для кластера, требуют интерфейса устройств SCSI (Small Computer System Interface) и поддерживают стандартные подключения SCSI с использованием шины PCI, а также подключения SCSI по волоконно-оптическому каналу и шине SCSI с несколькими инициаторами. Волоконно-оптические подключения – это устройства SCSI, просто включенные в шину волоконно-оптического канала вместо шины SCSI. Концептуально волоконно-оптическая технология инкапсулирует команды SCSI в волоконно-оптический канал и дает возможность использовать команды SCSI, на поддержку которых рассчитана служба кластеров. Эти команды SCSI – Reserve/Release и Bus Reset, и они будут функционировать точно так же в стандартной или не волоконно-оптической среде подключения SCSI.

На следующем рисунке показаны компоненты двухузлового серверного кластера, который может состоять из серверов, работающих под управлением систем Windows 2000 Advanced Server или Windows NT Server 4.0 (выпуск для предприятий) с общими подключениями запоминающих устройств, использующими интерфейс SCSI или SCSI по волоконно-оптическому каналу.

Рис. 1. Двузхузловой кластер серверов, работающих под управлением системы Windows 2000 Advanced Server или Windows NT Server 4.0 (выпуск для предприятий).

Система Windows 2000 Datacenter Server поддерживает четырехузловые кластеры и требует подключения устройств с использованием волоконно-оптического канала, как показано на следующем рисунке, иллюстрирующим компоненты четырезузлового кластера.

Рис. 2. Четырехузловой кластер серверов, работающих под управлением системы Windows 2000 Datacenter Server.

Виртуальные серверы

Одним из преимуществ службы кластеров является то, что приложения и службы, работающие на кластере серверов, могут быть представлены пользователям и рабочим станциям как виртуальные серверы. Для пользователей и клиентов подключение к приложению и службе, работающей как кластерный виртуальный сервер, представляет собой тот же процесс, что и подключение к одиночному физическому серверу. Фактически подключение к виртуальному серверу может выполняться через любой узел кластера. Пользователь или клиентское приложение не будут знать, на каком узле фактически содержится виртуальный сервер.

Примечание. Службы или приложения, к которым не обращаются пользователи или клиентские приложения, могут работать на узле кластера без организации их в виде виртуального сервера.

В кластере может находиться несколько виртуальных серверов, представляющих несколько приложений. Это проиллюстрировано на рис. 3.

Рис 3. Физическое представление виртуальных серверов в службе кластеров.

На приведенном выше рисунке проиллюстрирован двухузловой кластер с четырьмя виртуальными серверами; на каждом узле есть два виртуальных сервера. Служба кластеров управляет виртуальным сервером как группой ресурсов, и группа ресурсов для каждого виртуального сервера содержит два ресурса: адрес IP и сетевое имя, сопоставленное этому адресу IP.

Подключения клиента приложения к виртуальному серверу выполняются сеансом клиента, которому известен только адрес IP, опубликованный службой кластеров в качестве адреса виртуального сервера. Представление клиента – это просто представление отдельных сетевых имен и адресов IP. На рис. 4 показано представление клиента узлов кластера и четырех виртуальных серверов на примере двухузлового кластера, поддерживающего четыре виртуальных сервера.

Рис. 4. Представление клиента виртуальных серверов службы кластеров.

Как показано на рис. 4, клиент видит только адреса IP и имена, и ему не нужна информация о физическом расположении виртуальных серверов. Это позволяет службе кластеров обеспечивать высокую доступность приложений, работающих как виртуальные серверы.

В случае сбоя приложения или отказа сервера служба кластеров перемещает всю группу ресурсов виртуального сервера на другой узел кластера. При возникновении подобного сбоя клиент обнаружит отказ в сеансе работы с приложением и попытается подключиться вновь тем же самым образом, каким был подключен. И у него будет возможность успешно это выполнить, поскольку служба кластеров просто перенесет опубликованный адрес IP виртуального сервера на один из работающих узлов в кластере в рамках действий по восстановлению. Сеанс клиента сможет заново установить подключение к приложению, при этом ему не нужно знать, что физически оно теперь помещается на другом узле кластера.

Заметим, что в то время как подобная возможность обеспечивает высокую доступность приложения или службы, информация о состоянии сеанса, относящаяся к неудачному сеансу клиента, теряется, если только приложение не спроектировано или не настроено для хранения на диске данных сеанса клиента, чтобы использовать их при восстановлении приложения после сбоя. Служба кластеров обеспечивает высокую доступность, но не отказоустойчивость приложения, если само приложение не поддерживает отказоустойчивое транзакционное поведение. Служба Microsoft DHCP представляет собой пример приложения, хранящего данные клиента, и потому оно может быть восстановлено после сбойного сеанса клиента. Резервированные адреса IP клиентов сервера DHCP сохраняются в базе данных DHCP. Если отказывает ресурс сервера DHCP, база данных DHCP может быть перемещена на доступный узел кластера, а сеанс – перезапущен с восстановленными данными клиентов из этой базы данных DHCP.

Группы ресурсов

Группы ресурсов – это логические объединения ресурсов кластера. Как правило, группа ресурсов состоит из логически связанных ресурсов, таких, как приложения с соответствующей периферией и данными. Однако группы ресурсов могут содержать и сущности кластера, которые связаны только с администрированием, такие как административные наборы имен и IP-адресов виртуальных серверов. Группа ресурсов в каждый момент времени может принадлежать только одному узлу, и индивидуальные ресурсы группы должны существовать на том узле, которому она в данный момент принадлежит. Ни в какой момент разные серверы кластера не могут владеть различными ресурсами одной и той же группы.

Каждой группе ресурсов соответствует общая для всего кластера политика, которая указывает, какой сервер кластера является предпочтительным для работы данной группы и на какой сервер группа должна быть перемещена в случае отказа. Кроме того, каждая группа имеет имя и адрес сетевой службы, чтобы клиенты сети могли подключаться к службе, обеспечиваемой данной группой ресурсов. В случае отказа группа ресурсов может быть восстановлена или целиком перемещена с отказавшего узла на другой доступный узел кластера.

Каждый ресурс группы может зависеть от других ресурсов кластера. Зависимости – это отношения между ресурсами, которые указывают, какие ресурсы должны быть запущены и доступны, чтобы возможно было запустить другой ресурс. Например, база данных может зависеть от доступности диска, адреса IP и сетевого имени, необходимых ей для запуска и предоставления своих служб другим приложениям и клиентам.

Зависимости ресурсов определяются с помощью свойств группы службы кластеров и дают возможность службе кластеров управлять порядком включения и отключения ресурсов. Область действия любой определенной таким образом зависимости ограничивается ресурсами в пределах той же группы ресурсов. Управляемые кластером зависимости не могут выходить за пределы группы ресурсов, поскольку каждая группа ресурсов может быть независимо подключена, отключена или перемещена.

АРХИТЕКТУРА СЛУЖБЫ КЛАСТЕРОВ


Служба кластеров создана в виде отдельного изолированного набора компонентов, которые работают совместно с операционной системой. Такое решение позволяет избежать сложных зависимостей в последовательности работы, возникающих между службой кластеров и операционной системой. Однако для осуществления кластеризации в базовой операционной системе необходимы некоторые изменения, а именно:

·         поддержка динамического создания и удаления сетевых имен и адресов;

·         модификация файловой системы для того, чтобы при отсоединении дисков происходило закрытие открытых файлов;

·         модификация подсистемы ввода-вывода для создания возможности общего доступа к дискам и наборам томов для нескольких узлов.

Если не считать указанных выше и других незначительных изменений, возможности кластеров строятся на базе существующих операционных систем Windows 2000 и Windows NT.

Компоненты службы кластеров

Служба кластеров работает в операционных системах Windows 2000 или Windows NT 4.0, используя сетевые драйверы, драйверы устройств и процессы работы с ресурсами, созданными специально для процессов службы кластеров и ее компонентов. Эти тесно связанные и совместно работающие компоненты службы кластеров следующие.

·         Диспетчер контрольных точек. Он сохраняет ключи реестра, относящиеся к приложениям, в каталоге кластера, хранимом на ресурсе кворума.

·         Диспетчер связи. Управляет связью между узлами кластера.

·         Диспетчер базы данных настройки. Управляет данными по настройке кластера.

·         Обработчик событий. Получает от ресурсов кластера сообщения о событиях, таких, как изменения статуса и запросы от приложений на открытие, закрытие или перечисление объектов кластера.

·         Диспетчер журнала событий. Реплицирует записи журнала событий с одного узла кластера на все остальные.

·         Диспетчер восстановления. Управляет ресурсами и инициирует соответствующие действия, такие, как запуск, перезапуск и восстановление после сбоя.

·         Диспетчер глобального обновления. Обеспечивает службу глобального обновления, используемую компонентами кластера.

·         Диспетчер журналов. Записывает изменения в журналы восстановления, хранимые на ресурсе кворума.

·         Диспетчер членства. Управляет членством узла в кластере и отслеживает состояние других узлов кластера.

·         Диспетчер узла. Назначает узлам владение группами ресурсов на основе списка предпочтений групп и доступности узлов.

·         Диспетчер объектов. Управляет всеми объектами службы кластеров.

·         Мониторы ресурсов. Следят за состоянием каждого ресурса кластера с помощью ответных вызовов библиотек ресурсов. Мониторы ресурсов работают в отдельном процессе и общаются со службой кластеров путем вызовов удаленных процедур RPC (Remote Procedure Call), чтобы служба кластеров была защищена от индивидуальных отказов ресурсов кластера.

Диспетчер узла

Диспетчер узла работает на каждом узле и ведет локальный список узлов, принадлежащих кластеру. Периодически диспетчер узла рассылает сообщения (называемые сигналами активности) другим диспетчерам узлов в кластере для определения отказов узлов. Существенно, чтобы все узлы кластера всегда имели одну и ту же информацию о членстве в кластере.

В случае, когда один узел кластера обнаруживает отказ связи с другим узлом, он рассылает сообщение всему кластеру, чтобы все члены кластера проверили информацию о членстве узлов в кластере. Это называется событием перегруппировки. Служба кластеров не допускает записи ни на какое дисковое устройство, общее для всех узлов, пока не стабилизируется структура членства. Если диспетчер узла на каком-то узле не отвечает, то этот узел удаляется из кластера, и его активные группы ресурсов переносятся на другой активный узел. Для выбора узла, на который следует переместить группу ресурсов, диспетчер узла определяет узел, предпочтительный для данной группы ресурсов, и возможных владельцев (т.е. узлов), которым могут принадлежать отдельные ресурсы. На двухузловом кластере диспетчер узла просто переносит группы ресурсов с отказавшего узла на работающий. На трех- или четырехузловом кластере диспетчер узла по отдельности распределяет группы ресурсов между работающими узлами.

Примечание. В случае отказа процессов службы кластеров и ее компонентов ресурсы, закрепленные за узлом, где произошел отказ, останавливаются, чтобы быть перезапущенными на работающем узле кластера.

Диспетчер базы данных настройки

Диспетчер базы данных настройки реализует функции, необходимые для поддержки базы данных настройки кластера. База данных настройки содержит данные о физических и логических сущностях кластера. Эти сущности включают сам кластер, членство узлов кластера, группы ресурсов, виды ресурсов и описание конкретных ресурсов, таких как диски и адреса IP.

Постоянные и переменные данные, которые хранятся в базе данных настройки, используются для слежения за текущим и желательным состоянием кластера. Каждый диспетчер базы данных настройки, работающий на каждом узле кластера, взаимодействует с остальными для поддержания согласованности данных настройки на всем кластере. Для гарантии соответствия всех копий базы данных настройки на всех узлах используется однофазная фиксация. Диспетчер базы данных настройки также обеспечивает интерфейс, который используют другие компоненты службы кластеров. Этот интерфейс аналогичен интерфейсу реестра, предоставляемому набором интерфейсов API (Application Programming Interface) Win32. Ключевая разница состоит в том, что изменения, сделанные над сущностями кластера, регистрируются диспетчером базы данных настройки и потом реплицируются на другие узлы диспетчером глобального обновления.

Примечание. Данные и изменения ключей реестра, относящихся к приложениям, регистрируются диспетчером контрольных точек в журнале регистрации кворума на ресурсе кворума.

Диспетчер контрольных точек

Чтобы гарантировать возможность восстановления службы кластеров после отказа ресурса, диспетчер контрольных точек проверяет ключи реестра при включении ресурса в сеть и записывает данные контрольной точки на ресурс кворума при отключении ресурса от сети. Приложения, рассчитанные на работу в кластере, используют базу данных настройки кластера для хранения данных, необходимых для восстановления. Приложения, не рассчитанные на работу в кластере, хранят эти данные в реестре локального сервера.

Диспетчер журналов

Диспетчер журналов совместно с диспетчером контрольных точек следит за тем, чтобы журнал восстановления, находящийся на ресурсе кворума, содержал самые свежие данные по настройке и контрольным точкам изменений.

Диспетчер восстановления

Диспетчер восстановления отвечает за остановку и запуск ресурса, управление зависимостями ресурсов и за инициирование восстановления групп ресурсов. Для выполнения этих действий он получает данные по состоянию ресурсов и системы от мониторов ресурсов и от узла.

Диспетчер восстановления отвечает также за принятие решения, какому из узлов кластера какая группа ресурсов должна принадлежать. Когда распределение групп ресурсов заканчивается, узлы, владеющие конкретными группами ресурсов, передают управление ресурсами группы диспетчеру узла. Если отказ ресурса в пределах группы ресурсов не может быть преодолен узлом, который владеет этой группой, диспетчеры восстановления на каждом узле кластера совместно принимают решение об изменении владельца данной группы ресурсов.

В случае отказа ресурса диспетчер восстановления может перезапустить этот ресурс или отключить его от сети вместе с зависящими от него ресурсами. Если ресурс будет отключен от сети, диспетчер восстановления укажет, что владение ресурсом должно быть передано другому узлу, и ресурс должен быть перезапущен во владении нового узла. Это называется восстановление после отказа.

Восстановление после отказа

Восстановление после отказа может произойти автоматически в связи с неожиданным отказом оборудования или программного обеспечения, или может быть запущено вручную лицом, которое является администратором кластера. Алгоритм для обеих этих ситуаций один и тот же, разница в том, что при инициированном вручную восстановлении после отказа отключение ресурсов происходит «мягко», а в случае незапланированного отказа – принудительно.

Если отказывает целый узел кластера, его группы ресурсов переносятся на другой или другие доступные серверы кластера. Автоматическое восстановление после отказа аналогично плановому административному переназначению владения ресурсами. Однако оно более сложно, поскольку на отказавшем узле нормальная фаза отключения выполнялась не мягко.

Для автоматического восстановление после отказа требуется определить, какие группы работали на отказавшем узле и какие узлы должны принять на себя владение различными группами ресурсов. Все узлы кластера, способные принять эти группы ресурсов, согласовывают владение между собой. Согласование основано на возможностях узла, текущей нагрузке, обратной связи с приложениями или на списке предпочтений узла. Список предпочтений узла является частью свойств группы ресурсов и используется для назначений группы ресурсов тому или иному узлу. Когда согласование по поводу группы ресурсов будет закончено, все узлы кластера обновляют свои базы данных и продолжают следить, какой узел какой группой ресурсов владеет.

В кластерах, имеющих более двух узлов, список предпочтений узла для каждой группы ресурсов может указывать предпочтительный сервер и один или несколько альтернативных в порядке предпочтения. Это позволяет выполнять каскадное восстановление после отказа, в котором группа ресурсов проявляет устойчивость к нескольким отказам сервера, каждый раз переходя на следующий сервер, используя свой список предпочтения узлов. Администраторы кластера могут задать различные списки предпочтения узлов для каждой группы ресурсов на сервере таким образом, чтобы при отказе сервера группы были распределены между работающими серверами кластера.

Альтернативная схема, обычно называемая восстановление после отказа «N+1», определяет списки предпочтения узлов для всех групп кластера. Список предпочтения узлов указывает резервные узлы кластера, на которые следует переместить ресурсы при первом восстановлении после отказа. Резервные узлы – это серверы кластера, которые в основном простаивают или обычная нагрузка которых может быть вытеснена в случае, когда нагрузка отказавшего сервера должна быть передана на резервный узел.

Ключевым вопросом для администраторов кластера при выборе между каскадным восстановлением после отказа и схемой «N+1» является местоположение дополнительных резервов кластера, которые должны позволить справиться с потерей сервера. При каскадном восстановлении после отказа делается допущение, что у всех остальных серверов кластера есть некоторые дополнительные возможности, чтобы принять часть нагрузки отказавшего сервера. При восстановлении после отказа по схеме «N+1» предполагается, что этот самый «+1-й» резервный сервер и есть главный держатель дополнительных возможностей.

Возврат после отказа

Когда узел возвращается обратно в сеть, диспетчер восстановления может принять решение переместить некоторые группы ресурсов обратно на восстановленный узел. Это называется возврат после отказа. Среди свойств группы ресурсов указан предпочитаемый владелец для возвращения группы на восстановленный или перезапущенный узел. Группы ресурсов, для которых этот восстановленный или перезапущенный узел является предпочтительным владельцем, будут перемещены на него с текущего узла-владельца. Служба кластеров обеспечивает защиту от возврата группы ресурсов в момент пиковой нагрузки или на узлы, которые не были восстановлены или перезапущены правильно. Свойства группы ресурсов, относящиеся к возврату после отказа, могут включать указание времени суток, когда возврат разрешен, а также предельное число попыток возврата.

Обработчик событий

Обработчик событий служит электронным коммутатором, распределяющим события, которыми обмениваются приложения и работающие на узлах кластера компоненты службы кластеров. Обработчик событий помогает компонентам службы кластеров рассылать информацию о важных событиях всем остальным компонентам и поддерживает механизм работы с событиями кластерного интерфейса API. Обработчик событий предоставляет различные услуги, такие как доставка сигнальных событий приложениям, рассчитанным на работу в кластере, и управление объектами кластера.

Диспетчер связи

Диспетчер связи на каждом узле поддерживает связь внутри кластера, непрерывно общаясь с работающей на других узлах службой кластеров с помощью механизма вызова удаленных процедур RPC. Диспетчер связи гарантирует надежную доставку внутрикластерных сообщений в правильном порядке и притом доставку каждого сообщения только один раз. Кроме того, диспетчер связи гарантирует, что сообщения от узлов, более не являющихся членами кластера или отключенных от сети, будут игнорироваться.

Диспетчер глобального обновления

Диспетчер базы данных настройки использует службу обновления, предоставляемую диспетчером глобального обновления, для репликации изменений базы данных кластера на все узлы. Диспетчер глобального обновления гарантирует, что все узлы получат обновления настройки. Узлы, которые не могут выполнить обновление, исключаются из кластера и их состояние меняется на «отключен от сети», поскольку невозможно поддерживать их согласованность с остальными узлами.

Диспетчер объектов

Диспетчер объектов обеспечивает поддержку управления всеми объектами службы кластеров. Он дает возможность создания, поиска, перечисления объектов различных типов и поддержания информации о ссылках на них.

Мониторы ресурсов

Мониторы ресурсов обеспечивают интерфейс связи между библиотеками ресурсов и службой кластеров. Когда службе кластеров необходимо получить данные от ресурса, монитор ресурсов принимает запрос и передает его библиотеке соответствующего ресурса. И наоборот, когда библиотеке ресурса необходимо сообщить службе кластеров сведения о своем состоянии или известить о событии, монитор ресурсов передает эти данные службе кластеров.

Монитор ресурсов работает в процессе, отдельном от службы кластеров, чтобы защитить службу кластеров от отказа ресурса и предпринять соответствующие действия в случае отказа службы кластеров. Монитор ресурсов также обнаруживает отказы службы кластеров и в этом случае принимает на себя все ресурсы и группы. По умолчанию служба кластеров запускает только один монитор ресурсов для взаимодействия со всеми ресурсами, находящимися на данном узле. Однако на каждом узле могут работать один или несколько мониторов ресурсов. Это определяется доступными на каждом узле ресурсами и связанными с ними библиотеками DLL, а также действиями администратора. По умолчанию работает один монитор ресурсов, но это можно изменить с помощью администратора кластера или другого приложения для управления.

Ресурсы кластера


Служба кластеров управляет всеми ресурсами как идентичными неделимыми объектами с помощью мониторов ресурсов и библиотек ресурсов. Интерфейс монитора ресурсов обеспечивает стандартный интерфейс связи, который позволяет службе кластеров инициировать команды управления ресурсами и получать сведения о состоянии ресурсов. Фактическое исполнение команд и получение данных выполняется мониторами ресурсов посредством библиотек ресурсов. Служба кластеров использует библиотеки ресурсов для включения ресурсов в сеть, управления их взаимодействием с другими ресурсами кластера и – что наиболее важно – для слежения за их работоспособностью с целью обнаружения отказов.

Служба кластеров предоставляет библиотеки ресурсов как для поддержки приложений, разработанных корпорацией Майкрософт и рассчитанных на работу в кластере, так и для поддержки не рассчитанных на работу в кластере приложений независимых производителей. Кроме того, независимые производители могут предоставлять библиотеки ресурсов, которые превращают разработанные ими продукты в продукты, рассчитанные на работу в кластере. (Более подробную информацию об оборудовании и приложениях, рассчитанных на работу в кластере, можно найти в разделе «Дополнительные сведения».)

Чтобы иметь возможность управления ресурсами, библиотеки ресурсов должны предоставить всего несколько простых интерфейсов и свойств ресурсов. Монитор ресурсов загружает конкретную библиотеку ресурса в свое адресное пространство как привилегированный код, работающий под системной учетной записью. Системная учетная запись – это та, которая используется только операционной системой и службами, интегрированными с базовой операционной системой. Использование системной учетной записи позволяет службе кластеров выполнять различные функции в контексте операционной системы. Более подробные сведения об архитектуре системных служб и безопасности систем Windows 2000 или Windows NT можно найти по адресу: http://www.microsoft.com/ntserver/nts/exec/prodstrat/nt_foundation.asp.

Все библиотеки ресурсов, предоставляемые корпорацией Майкрософт для ее приложений, рассчитанных на работу в кластере, выполняются в одном процессе монитора ресурсов. Для библиотек ресурсов независимых производителей потребуется свой монитор ресурсов. Мониторы ресурсов создаются службой кластеров по мере необходимости при установке или запуске ресурса на узле кластера.

Когда функционирование ресурсов зависит от доступности других ресурсов, эти зависимости могут быть определены в библиотеке ресурса. В случае, когда ресурс зависит от других ресурсов, служба кластеров включит его в сеть только после включения в сеть в правильной последовательности тех ресурсов, от которых зависит его работа.

Отключение ресурсов от сети выполняется аналогично. Служба кластеров отключает ресурс от сети только после отключения зависящих от него ресурсов. Это препятствует появлению циклических взаимозависимостей при загрузке ресурсов.

Каждая библиотека ресурса может также определить тип компьютера и подключенных устройств, которые этому ресурсу нужны. Например, для дискового ресурса может потребоваться, чтобы им владел только узел, к которому физически подключено дисковое устройство. В библиотеке ресурса могут также быть определены локальные политики перезапуска и требуемые действия при восстановлении после отказа.

Библиотеки ресурсов, поставляемые с системой Windows NT Server 4.0 (выпуск для предприятий), позволяют службе кластеров поддерживать следующие ресурсы:

·         общие файлы и принтеры;

·         службы и приложения общего назначения;

·         физические диски;

·         координатор MSDTC (Microsoft Distributed Transaction Coordinator – координатор распределенных транзакций);

·         службы IIS (Internet Information Services – информационные службы Интернета);

·         очереди сообщений;

·         сетевые адреса и имена.

 

Системы Windows 2000 Advanced Server и Windows 2000 Datacenter Server включают библиотеки ресурсов для следующих дополнительных служб:

·         файловая система DFS (Distributed File System – распределенная файловая система);

·         служба DHCP (Dynamic Host Configuration Protocol);

·         протокол NNTP (Network News Transfer Protocol);

·         протокол SMTP (Simple Message Transfer Protocol);

·         служба WINS (Windows Internet Naming Service – служба межсетевой адресации в среде Windows).

 

Приложения, рассчитанные на работу в кластере, которые имеют собственные библиотеки ресурсов и мониторы ресурсов, обладают некоторыми преимуществами в масштабируемости и при восстановлении после отказа. Например, приложение сервера базы данных с собственной библиотекой ресурса базы данных позволяет службе кластеров восстанавливать после отказа отдельную базу данных, перенося ее с одного узла на другой. При отсутствии своей уникальной библиотеки ресурса базы данных приложение базы данных работало бы на кластере с использованием общей библиотеки ресурса серверного приложения. При использовании общей библиотеки ресурса серверного приложения служба кластеров может восстановить только общее серверное приложение целиком (и все его базы данных). А индивидуальная библиотека ресурса, такая, как приведенная в качестве примера библиотека ресурса базы данных, позволяет рассматривать базу данных как ресурс, состояние которого может отслеживаться и который управляться службой кластеров. Таким образом, приложение более не является единственным ресурсом и единицей восстановления после отказа, доступными службе кластеров. Это позволяет организовать одновременную работу нескольких экземпляров приложения на разных узлах кластера, каждый экземпляр со своим набором баз данных. Создание библиотек ресурсов, определяющих специфические ресурсы приложения, – это первый шаг к созданию приложения, рассчитанного на работу в кластере.

Список серверных приложений, в настоящее время предоставляющих библиотеки ресурсов для службы кластеров, можно найти по адресу:

http://www.microsoft.com/ntserver/ntserverenterprise/exec/overview/Clustering/partnerlist.asp.

Сведения о создании библиотеки ресурса для службы кластеров можно найти по адресу: http://msdn.microsoft.com/library/backgrnd/html/msdn_mscs_resource_dlls.htm.

Сведения о спецификациях для распределенных приложений Windows 2000, где описываются минимальные требования к серверным приложениям, рассчитанным на работу в кластере, можно найти по адресу: http://msdn.microsoft.com/certification/downloads/AppSpec-Distributed.exe.

Администрирование кластера


Графическое средство администратор кластера обеспечивает поддержку, слежение и управление восстановлением после отказа. Кроме того, служба кластеров предоставляет интерфейс автоматизации, с помощью которого можно создать собственные средства написания сценариев для администрирования ресурсов кластера, узлов и самого кластера. Приложения и средства управления, такие, как администратор кластера, могут обращаться к этому интерфейсу с помощью вызова удаленных процедур (RPC) независимо от того, работает такое приложение или средство на узле кластера или на внешнем компьютере. Этот административный интерфейс обеспечивает доступ к диспетчерам компонентов кластера, описанным в данном документе, что позволяет управлять такими сущностями кластера, как узлы, ресурсы, группы ресурсов и сам кластер. Сведения о разработке средства администратора с помощью интерфейса автоматизации можно найти в разделе «Windows Clustering» набора для разработчиков программного обеспечения Platform Software Developer Kit: http://msdn.microsoft.com/isapi/msdnlib.idc?theURL=/library/psdk/mscs/win_clus_9nfr.htm.

Сведения об использовании администратора кластера можно найти в справке по системам Windows 2000 Advanced Server, Windows 2000 Datacenter и Windows NT Server 4.0 (выпуск для предприятий).

Формирование и работа кластера


Когда на сервере установлена и запущена служба кластеров, сервер может участвовать в работе кластера. Работа в кластере уменьшает число непродублированных элементов подверженных отказам и обеспечивает высокую доступность ресурсов кластера. В следующем разделе кратко описывается поведение узла в процессе создания и работы кластера.

Примечание. Сведения об установке службы кластеров можно найти в справке по системам Windows 2000 и Windows NT Server 4.0 (выпуск для предприятий), а также в руководствах по развертыванию этих систем.

Создание кластера

Служба кластеров включает служебную программу установки, которая устанавливает на сервер новое программное обеспечение и создает кластер. Для создания нового кластера эта служебная программа запускается на компьютере, который выбирается в качестве первого члена кластера. Этот первый шаг определяет новый кластер, задавая его имя и создавая базу данных и первоначальный список членов кластера.

Следующий шаг к созданию кластера – добавление общих запоминающих устройств, которые будут доступны всем членам кластера. Таким образом, создается новый кластер с единственным узлом, собственными локальными запоминающими устройствами и общими ресурсами кластера – обычно это диск или хранилище данных и ресурсы среды подключения.

Последний шаг для создания кластера – запуск программы установки на каждом из дополнительных компьютеров, которые будут членами кластера. При добавлении к кластеру нового узла этот узел автоматически получает копию существующей базы данных кластера от первого члена кластера. Когда узел добавляется к кластеру или формирует его, служба кластеров обновляет принадлежащую этому узлу копию базы данных настройки.

Формирование кластера

Сервер может сформировать кластер, если на нем работает служба кластеров и при этом она не может найти в кластере других узлов. Чтобы сформировать кластер, узел должен иметь возможность получить в свое исключительное владение ресурс кворума. Ресурс кворума поддерживает целостность данных и единство кластера и в операциях кластера играет ключевую роль. Он должен присутствовать, чтобы можно было выполнять операции с узлами – например, формирование кластера или присоединение к нему узла. Ресурс кворума – это физический диск в общем дисковом массиве кластера, и он обладает следующими возможностями.

·         Поддержка команд низкого уровня для решения вопроса о владении, что позволяет одному узлу получать и сохранять физический контроль над ресурсом кворума. Например, команды Reserve и Release диска SCSI дают возможность такого непрерывного решения.

·         Наличие доступа из любого узла кластера.

·         Возможность форматирования с использованием файловой системы NTFS.

Ресурс кворума играет роль арбитра при формировании кластера или при отказе сетевых подключений между узлами. При формировании кластера первый узел кластера содержит базу данных настройки кластера. При присоединении к кластеру каждого из дополнительных узлов такой узел получает и потом поддерживает собственную локальную копию базы данных настройки кластера. Ресурс кворума на общем устройстве кластера хранит самую последнюю версию базы данных настройки кластера в форме журналов восстановления, которые содержат независимые от узлов данные по настройке и состоянию кластера.

В процессе работы служба кластеров использует журналы восстановления на ресурсе кворума для достижения следующих целей.

·         Гарантировать, что только один набор активных и поддерживающих связь узлов сможет сформировать кластер.

·         Предоставлять узлу возможность формирования кластера только в том случае, если этот узел может получить управление ресурсом кворума.

·         Предоставлять узлу возможность присоединиться к существующему кластеру или остаться в нем, только если он может поддерживать связь с узлом, контролирующим ресурс кворума.

С точки зрения других узлов кластера и интерфейсов управления службы кластеров после формирования кластера каждый узел в нем может находиться в одном из трех различных состояний. Эти состояния регистрируются обработчиком событий и реплицируются диспетчером регистрации событий на другие узлы кластера. Состояния службы кластера следующие.

·         Отключен от сети. Узел не является полностью активным членом кластера. Узел и его служба кластеров могут в этот момент работать или не работать.

·         Включен в сеть. Узел является полностью активным членом кластера. Он участвует в обновлении базы данных кластера, его вклад учитывается в алгоритме кворума, поддерживает сигналы активности и может владеть группами ресурсов и обеспечивать их работу.

·         Приостановлен. Узел является полностью активным членом кластера. Он участвует в обновлении базы данных кластера, его вклад учитывается в алгоритме кворума, поддерживает сигналы активности, но не может брать на себя новые группы ресурсов. Он может поддерживать только те группы ресурсов, которыми в текущий момент владеет. Состояние приостановки введено для того, чтобы выполнять некоторые работы по обслуживанию. Состояния «включен в сеть» и «приостановлен» большинством компонентов службы кластеров рассматриваются как эквивалентные.

Присоединение к кластеру

Чтобы сервер мог присоединиться к существующему кластеру, на нем должна работать служба кластеров, и он должен найти какой-либо узел этого кластера. После нахождения другого узла кластера должна быть проверена подлинность для членства в кластере присоединяющегося сервера, и он должен получить реплику базы данных настройки кластера.

Процесс присоединения к существующему кластеру начинается, когда диспетчер управления службами Windows 2000 или Windows NT запускает на узле службу кластеров. В процессе запуска служба кластеров настраивает и подключает работающие с данными локальные устройства узла. Она не пытается подключить к сети общие устройства кластера, работающие с данными, поскольку эти устройства могут в данный момент использоваться существующим кластером.

Для нахождения других узлов запускается процесс поиска. Когда узел обнаруживает какой-либо член кластера, он выполняет процедуру проверки подлинности. Первый член кластера проверяет подлинность новичка и возвращает признак успеха, если новый сервер эту проверку прошел. Если проверка не прошла – в случае, когда присоединяющийся узел не распознан как член кластера или имеет неверный пароль учетной записи, запрос на присоединение к кластеру отклоняется.

После успешной проверки подлинности первый включенный с сеть узел кластера проверяет копию базы данных настройки кластера на новом узле. Если эта копия устарела, сервер, проверивший подлинность присоединяющегося сервера, посылает ему обновленную копию базы данных. Получив реплику базы данных, новый узел может ее использовать для поиска общих ресурсов и включения их в сеть по мере необходимости.

Выход из кластера

Узел может выйти из кластера, если он перестает работать или если перестает работать служба кластеров. Кроме этого, узел может быть принудительно выведен из кластера (изгнан), когда он не может выполнить кластерную операцию, например, в случае отказа при обновлении базы данных настройки кластера.

Когда узел выходит из кластера при плановом отключении, он посылает всем остальным членам кластера сообщение ClusterExit, извещая их о своем выходе. Узел не ждет ответа и немедленно начинает останавливать ресурсы и закрывать все подсоединения кластера. Поскольку оставшиеся узлы получили сообщение о выходе, они не выполняют процесс перегруппировки для переустановления членства в кластере, который выполняется, если узел неожиданно отказывает или прерывается связь по сети.

Если узел изгнан, например, вручную, посредством операции выполненной в администраторе кластера, его состояние меняется на изгнан.

Обнаружение отказов


Обнаружение и предотвращение отказов – главные преимущества, предоставляемые службой кластеров. Когда в кластере отказывает узел или приложение, служба кластеров может ответить на это перезапуском отказавшего приложения или перераспределением нагрузки отказавшей системы между работающими узлами кластера. Обнаружение и предотвращение отказов службы кластеров включает двустороннее восстановление после отказов, восстановление приложения после отказа, параллельное восстановление и автоматический возврат после отказа.

Служба кластеров динамически обнаруживает отказы отдельных ресурсов или всего узла и перезапускает ресурсы приложений, ресурсы данных и файловые ресурсы на доступном работающем сервере кластера. Это позволяет сохранять высокую доступность для пользователей и клиентских приложений таких ресурсов, как базы данных, общие файлы и приложения.

В службе кластеров предусмотрены два различных механизма обнаружения отказов.

·         Сигналы активности для обнаружения отказов узлов.

·         Монитор ресурсов и библиотеки ресурсов для обнаружения отказов ресурсов.

Обнаружение отказов узлов

Каждый узел периодически обменивается датаграммами с другими узлами кластера по частной сети кластера. Эти сообщения называются сигналами активности. Обмен сигналами активности позволяет каждому узлу проверить доступность других узлов и их приложений. Если на сервере происходит сбой при обмене сигналами активности, работающие серверы инициируют процессы восстановления после отказа, в том числе принятие решения о владении ресурсами и приложениями, которыми владел отказавший сервер. Решение принимается с использованием протокола оклика и отзыва.

Сбой при обмене сигналами активности может быть вызван различными событиями, такими, как отказ компьютера, отказ сетевого интерфейса или отказ сети. Как правило, когда все узлы обмениваются сообщениями, диспетчер базы данных настройки рассылает обновления глобальной базы данных настройки на каждый узел. Однако при нарушении обмена сигналами активности диспетчер журнала дополнительно записывает изменения базы данных настройки на ресурсе кворума. Этим гарантируется, что оставшиеся работоспособными серверы в процессе восстановления будут иметь доступ к самым последним данным настройки кластера и данным ключей реестра локального узла.

Обнаружение отказов ресурса

Диспетчер восстановления и мониторы ресурсов работают совместно для обнаружения отказов ресурса и восстановления после этих отказов. Мониторы ресурсов следят за состоянием ресурсов, периодически опрашивая ресурсы с использованием библиотек ресурсов. Опрос проводится в два этапа: коротким запросом LooksAlive (с виду живой) и более долгим и детальным запросом IsAlive (действительно живой). Когда монитор ресурсов обнаруживает отказ ресурса, он извещает об этом диспетчер восстановления и продолжает следить за ресурсом.

Диспетчер восстановления поддерживает ресурсы и состояние групп ресурсов. Он также отвечает за выполнение восстановления, когда ресурс отказывает, и вызывает монитор ресурсов в ответ на действия пользователя или на отказы.

После обнаружения отказа ресурса диспетчер восстановления может выполнять действия по восстановлению, которые включают либо перезапуск ресурса и зависящих от него ресурсов, либо перемещение целой группы ресурсов на другой узел. Какое из этих действий будет выполнено, определяется в зависимости от свойств ресурса и группы ресурсов и доступности узлов.

В процессе восстановления после отказа группа рассматривается как единое целое, чтобы зависимости ресурсов были правильно восстановлены. Когда ресурс восстановлен после отказа, монитор ресурса извещает диспетчер восстановления, который может выполнить автоматический возврат группы ресурсов после отказа на основе настройки свойства возврата после отказа данной группы ресурсов.

Направления развития


По мере развития продуктов на базе системы Windows будущее развитие службы кластеров сосредоточится на следующих главных направлениях.

·         Сертификация и поддержка еще больших многоузловых конфигураций кластера.

·         Упрощение установки и проверки конфигураций кластера, в том числе поддержка новых видов оборудования.

·         Более простое и мощное управление приложениями и службами на основе кластеров, при этом постоянное внимание уделяется дистанционному управлению, управлению по сценарию и на управлении «в режиме маскировки».

·         Расширение предоставляемых кластеризацией преимуществ доступности и масштабируемости на еще большее число системных служб.

·         Более тесная интеграция инфраструктуры и интерфейсов всех технологий кластеров на базе Windows для улучшения быстродействия, гибкости и управляемости.

·         Постоянная поддержка независимых производителей программного обеспечения и корпоративных разработчиков с целью упрощения разработки, установки и поддержки приложений, рассчитанных на работу в кластере, для повышения как доступности, так и масштабируемости.

Примечание. Независимые разработчики могут создавать уникальные виды ресурсов кворума, рассчитанные на работу в кластере, удовлетворяющие перечисленным выше требованиям. Сведения о разработке продуктов, рассчитанных на работу в кластере, можно найти в документе «Platform SDK Components for Windows Base Services Developers» (Компоненты платформы разработчика программного обеспечения для разработчиков основных служб Windows) на веб-узле MSDN Online по адресу:
http://msdn.microsoft.com/developer/sdk/winbase.asp.

Дополнительные сведения


Книги

Windows NT Microsoft Cluster Server, Richard R. Lee, Osborne McGraw-Hill, 1999.

Windows NT Cluster Server Guidebook, David Libertone, Prentice Hall, 1998.

Windows NT Backup & Recovery, John McMains и Bob Chronister, Osborne McGraw-Hill, 1998.

Windows NT Clustering Blueprints, Mark A. Sportack, SAMS Publishing, 1997.

In Search of Clusters, Second Edition: The Coming Battle in Lowly Parallel Computing, Gregory F. Pfister, Prentice Hall, 1998, ISBN: 0138997098.

The Book of SCSI, Peter M. Ridge, No Starch Press, 1995, ISBN: 1886411026.

Transaction Processing Concepts and Techniques, Gray, J., Reuter A., Morgan Kaufmann, 1994. ISBN 1558601902, обзор отказов и способы выполнения транзакций.

Веб-узлы

Можно также посетить веб-узел корпорации Майкрософт, чтобы больше узнать о технологиях кластеров в системе Windows.

Сведения о семействе продуктов Windows 2000 Server можно найти по адресу:

http://www.microsoft.com/Windows/server/

 

Сведения о системе Windows NT Server 4.0 (выпуск для предприятий), можно найти по адресу:

http://www.microsoft.com/ntserver/ntserverenterprise/

 

Сведения о надежности и средствах обеспечения доступности системы Windows NT Server можно найти по адресу:
http://www.microsoft.com/ntserver/ntserverenterprise/exec/overview/reliabilitypv.asp

 

 Сведения о технологии кластеров в семействе Windows можно найти по адресу:
http://www.microsoft.com/ntserver/ntserverenterprise/exec/overview/clustering/default.asp

 

Список продуктов, рассчитанных на работу в кластере, разработанных партнерами корпорации Майкрософт, можно найти по адресу:
http://www.microsoft.com/ntserver/ntserverenterprise/exec/overview/Clustering/partnerlist.asp

 

Технические статьи Microsoft TechNet по применению службы кластеров можно найти по адресу
http://www.microsoft.com/technet/avail/

 

Документацию по архитектуре базовых служб Windows, в том числе по технологии службы кластеров, можно найти в разделе Base Services (Базовые службы), комплекта Platform Software Developer Kit (SDK) (Комплект разработчика программного обеспечения платформы) по адресу:

http://msdn.microsoft.com/library/default.htm

и

MSDN Online: Platform SDK Components for Windows Base Services Developers (Компоненты платформы разработчика программного обеспечения для разработчиков основных служб Windows) по адресу
http://msdn.microsoft.com/developer/sdk/winbase.asp