當前位置:才華都>實用範文>論文>

論文:高性能虛擬技術的研究

論文 閱讀(2.45W)

當前,在服務整合、安全管理等方面已經實現了虛擬化技術的廣泛應用。高性能計算技術向着高產出率的方向不斷髮展,傳統的高效能計算機共享服務模式已經不能夠滿足其發展的需求了,同時還會給共享使用環境造成一定的安全隱患。當前,虛擬化技術由於性能等方面的原因在高效能計算機中的應用並不廣泛,本文針對這種現象提出了針對高效能計算機的虛擬化技術,實現系統安全性、可靠性與易用性的增強。

論文:高性能虛擬技術的研究

一、高性能虛擬域技術的設計目標

高性能虛擬域技術(High Performance Virtual Zone ,HPVZ)的設計目標包括兩個方面:第一,對高效性計算系統的計算性能實現儘可能的保持;第二,實現了系統管理最大限度的簡化,同時增強其安全性、可靠性與易用性。

(一)高效性

高性能並行計算機在進行設計的過程中,其核心的目標就是要實現計算服務的高性能。虛擬化技術具有開銷較低的特點,透過操作系統層中虛擬化技術的應用,實現用戶在編程、編譯及任務提交、計算等環節中性能損失的降低。

(二)易用性

傳統的高性能並行計算機爲用戶提供的共享使用環境是一致的,在這種情況之下,在對共享使用環境進行管理與使用的過程中就會變得較爲複雜。透過虛擬化技術的應用,能夠實現計算環境的`靈活構建,滿足不同用戶的需求,實現屬於用戶自身的高性能計算系統。

(三)安全性

在傳統高性能並行計算機系統進行設計的過程中,往往會忽略安全問題,對系統的性能造成較大的損失。在高性能計算機中,其安全的核心就是確保數據的安全。系統內部出現的攻擊、誤用等情況是用戶數據安全威脅的主要來源,因此計算機在確保其性能的基礎上應該實現用戶之間的安全隔離,透過這種方式實現安全性的提高。

二、高性能虛擬域技術的體系結構

高性能虛擬域技術的系統中包括服務結點虛擬計算域、計算結點高性能計算域、面向虛擬域的作業管理系統三個方面。

服務結點的虛擬計算域主要的作用是爲用戶提供獨立登陸環境,而且這種獨立登陸環境是可以定製的,用戶在對虛擬計算域進行配置的過程中可以將自身的需求作爲依據,使用編程、編譯、調試、提交等功能。面向虛擬域的作業管理系統主要的作用是實現系統資源的管理,在對計算資源進行管理的過程中,要將據用戶提交任務的規模與服務質量需求作爲依據。此外,面向虛擬域的作業管理系統的作用還包括構建高性能計算域的動態構建。計算結點的高性能計算域的檔案目錄視圖與服務結點的虛擬計算域相同,同時還增加服務質量保證、檔案隔離等功能,爲高性能的計算服務提供支援。

三、面向高性能計算的高性能虛擬域技術

(一)服務結點虛擬計算域

服務結點的虛擬計算域是以操作系統級虛擬化技術爲基礎形成的。操作系統級虛擬化技術能夠在操作系統中實現多個用戶執行環境的構建,而且這些用戶執行環境之間是相互獨立的,從而實現了多個獨立的用戶執行環境在同一個操作系統內核中執行。系統性能的損失較小是操作系統級虛擬化技術的特點。高性能虛擬域技術採用雙分區單影像優化技術,這種方式具有兩方面的優點,一方面能夠滿足服務陣列的單系統映像需求,另一方面能夠進一步實現性能損失的降低。

(二)計算結點高性能計算域

用戶在高性能並行計算機中進行作業提交的過程中,這些作業將會被提交到服務結點中,之後在計算結點中對這些作業進行處理。計算結點的功能只包括用戶任務計算,不包括登陸服務。因此,大部分的高性能並行計算機爲了能夠降低軟件開銷,在計算結點操作系統中採用精簡內核。因此,如果在計算結點中實現完整的Open VZ環境的構造,將會造成系統性能的損失。依據計算結點的使用方式,高性能虛擬域技術實現了基於檔案路徑轉換的高性能計算域構成技術的應用。高性能虛擬域技術透過CHROOT的方式實現了用戶作業的轉換,依據用戶作業的VZ根路徑資訊將其切換到對應的VZ環境中,實現了服務結點與計算結點檔案視圖的一致性。

(三)面向虛擬域的作業管理

在服務結點虛擬計算域與計算結點高性能域之間,作業管理主要的作用就是實現兩者之間的連接。高性能虛擬域技術的作業管理系統是以Slurm爲基礎進行構造的,在用戶加載作業的過程中,作用管理系統依據用戶的任務規模對計算資源進行分配,之後提取虛擬計算的執行路徑,將虛擬計算執行路徑作爲環境變量,與作業一起加載到計算結點。高性能虛擬域技術在批處理作業加載的過程中,採用了修改路徑名與路徑切換相結合的方式,從而確保系統執行的準確性。

總結:

高性能虛擬域技術是針對高性能並行計算機所具有的特點而提出的虛擬化方案。以系統計算性能保持爲前提條件,透過高性能虛擬域技術實現了傳統高性能並行計算機共享使用模式向着獨立使用模式的轉變,爲用戶的使用提供了更多的便捷。未來針對高可靠計算需求進行研究的過程中,還需要對虛擬化網絡通信設備的進程動態遷移計算進行研究,確保計算結點在出現故障之前實現用戶任務的遷移,從而實現系統可靠性的進一步增強。