A High-Speed User-Level Communication Mechanism for the General-Purpose Massively-Parallel OS: SSS{CORE
نویسندگان
چکیده
1 はじめに 並列計算機システムへの汎用性(マルチユーザ・ マルチジョブ)導入による保護機能の実現や実資源 の仮想化は並列処理性能の大幅な低下の原因となる ため、現状の並列計算環境および並列計算機は基本 的にバックエンドプロセッサとしてバッチ処理で使 用されることが多い。つまり、ソフトウェアによる 様々な最適化方式の適用および軽い通信同期手法が システムの独占的使用を要求し、システムの柔軟か つ汎用的な使用形態と相容れないのである。 このような状況を改善するため、我々は 1989年 よりすべての CPUから等距離でアクセス可能な 集中共有メモリを持つ Uniform Memory Access (UMA)型並列計算機を対象にして、ユーザによ る最適化を支援する汎用オペレーティングシステム 核 SS{CORE [1]を研究開発してきた。 SS{CORE の研究においては議論を単純化するために、UMA 型並列計算機に対象を限定し、実プロセッサの資源 管理に的を絞った研究を行った。しかし、 UMA型 並列計算機よりも多くのプロセッサを接続可能であ り、構成のスケーラビリティが高い NUMA(NonUniform Memory Access)型並列計算機 が現在 実用化されつつある。そこで、汎用性を持った使用 形態においても NUMA型並列計算機を高い効率で 使用するためのキーとなるオペレーティングシステ ム SSS{CORE(Scalable SS{CORE) [2]の研 究開発を 1994年より開始した。本稿では、 NOW 版 SSS{CORE Ver.1.0の構成と SSS{COREにお いて高速かつ仮想化され保護されたユーザレベル通 信同期を可能とするソフトウェアメモリベース通信 の高速実装技術を説明する。最後に、 100BaseTX を用いて実装したメモリベース通信と高並列計算機 のユーザレベル通信の基本性能について比較する。
منابع مشابه
A general-purpose scalable operating system: SSS-CORE
Recently, di erence between a Massively Parallel Processor and a network of workstations (NOW) almost disappears from hardware point of view. However, current performance of NOWs is still much lower than that of MPPs because of huge overheads of operating systems. Furthermore, both MPPs and current NOWs are not general-purpose because they have not succeeded in giving users (1) a single system ...
متن کاملResource Management Methods for General Purpose Massively Parallel OS SSS-Core
We propose two resource management methods; a scheduling policy that re ects resource consumption states and a memory-replacement strategy based on page classi cation under distributed shared memory architecture. The performances of the two mechanisms are evaluated by a probabilistic simulation. An instruction-level simulator simulates variety of process sets with nite resources on proposed res...
متن کاملMassively Parallel OS SSS { CORE
We propose two resource management methods; a scheduling policy that re ects resource consumption states and a memory-replacement strategy based on page classi cation under distributed shared memory architecture. The performances of the two mechanisms are evaluated by a probabilistic simulation. An instruction-level simulator simulates variety of process sets with nite resources on proposed res...
متن کاملUser-level Process towards Exascale Systems
The process oversubscription, which binds multiple parallel processes to one CPU core, can hide the communication latency and reduce CPU idle time. However, the lightweight OS kernels for Exascale systems may no longer support OS task scheduling. Without OS task scheduling, only one parallel process per CPU core is allowed, and then the process oversubscription is impossible. Even if the OS tas...
متن کاملInter-OS Communication on Highly Parallel Multi-Core Architectures
The next generation of large-scale machines for scientific computing will consist of a large number of nodes, each supporting many-core and multicore processor configurations. On one hand, to extract performance from such machines, the operating system will have to be streamlined. On the other hand, the heterogeneity of these machines – i.e., the variety of communication channels and computing ...
متن کامل