国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      數(shù)據(jù)存儲設(shè)備及其數(shù)據(jù)存儲方法

      文檔序號:6632791閱讀:98來源:國知局
      專利名稱:數(shù)據(jù)存儲設(shè)備及其數(shù)據(jù)存儲方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及適合于應(yīng)用到例如HDD陣列單元的一種數(shù)據(jù)存儲設(shè)備及其數(shù)據(jù)存儲方法。
      背景技術(shù)
      近年來,HDD(硬盤驅(qū)動器)陣列單元已經(jīng)在廣播站和后處理中經(jīng)常用于存儲AV(音頻/視頻)數(shù)據(jù)。在HDD陣列單元中,多個HDD被安裝到單個的單元中以便同時實現(xiàn)大容量存儲和高的數(shù)據(jù)傳輸率。
      例如,在廣播站中對用作非線性編輯系統(tǒng)的AV服務(wù)器提出了巨大的存儲容量、高可靠性和高數(shù)據(jù)傳輸率的要求,因此HDD陣列單元被用作存儲器。這種AV服務(wù)器具有多個記錄/再現(xiàn)端口,其中的每個端口在操作期間以高比特率輸入和輸出數(shù)據(jù)流。對于AV服務(wù)器提出的要求包括(1)在例如直播傳送期間防止視頻或音頻流出故障方面的絕對可靠性,和(2)滿足一定最小水平的響應(yīng)性能(實時特性)。
      然而,作為存儲器使用的HDD甚至于系統(tǒng)中的其它裝置相比也是具有低的可靠性的裝置。因此,為HDD陣列單元提供了按照RAID(RedundantArrays of Inexpensive Disks,廉價盤的冗余陣列)配置的冗余,從而支持處理各種故障的功能。這樣的功能的示例包括基于奇偶的錯誤校正、通過重建的數(shù)據(jù)重構(gòu)、數(shù)據(jù)再分配處理(其中,當(dāng)一個HDD發(fā)生響應(yīng)延遲時,從另一HDD校正并輸出該HDD的數(shù)據(jù))、通過安裝備用HDD而得到縮短了的MTTR(Mean Time To Repair,平均修復(fù)時間)在過去,在這種AV服務(wù)器以及類似設(shè)備中使用的HDD陣列單元被配置為RAID級別3或級別5系統(tǒng),而HDD冗余僅僅是1(例如,見專利對比文獻(xiàn)1)。
      專利對比文獻(xiàn)1日本專利申請公開第No.2000-299835(段落0058和0059,圖2)。
      不過,如果在這種具有冗余僅僅為1的HDD陣列單元中一個HDD出現(xiàn)故障,則剩余HDD必須用來執(zhí)行重建并且恢復(fù)出現(xiàn)故障的HDD的數(shù)據(jù),然而,在重建完成之前系統(tǒng)必須在沒有冗余(RAID級別0)的狀態(tài)下繼續(xù)運行,如果在此期間在另一個HDD中出現(xiàn)一個錯誤或響應(yīng)延遲,則在視頻或音頻流中出現(xiàn)噪聲,以及在最壞的情況下出現(xiàn)直播問題。
      為了使得無冗余的狀態(tài)盡可能的短,HDD必須被更換并且重建要盡可能迅速地完成。為此目的,采用了一種安排,其中,上述備用HDD被預(yù)先安裝并且緊接在HDD故障之后自動地開始重建。即便如此,隨著近年來HDD容量已經(jīng)增加,在某些情況下在系統(tǒng)運行期間要花費數(shù)日來重建。在使用這種盤陣列設(shè)備的AV服務(wù)器中,在用于修理HDD的維護(hù)期間和在恢復(fù)期間保持系統(tǒng)可靠性是很關(guān)鍵的。
      在維護(hù)中發(fā)生兩種費用,它們是更換HDD準(zhǔn)備的費用和由服務(wù)技術(shù)人員進(jìn)行現(xiàn)場服務(wù)的費用。由于HDD價格的穩(wěn)步下降,維護(hù)的費用大部分由技術(shù)人員現(xiàn)場服務(wù)的費用組成。該維護(hù)費用是用戶的重要負(fù)擔(dān),盤校準(zhǔn)設(shè)備(disk alignment equipment)的主要目標(biāo)是通過較少的維護(hù)會話(maintenancesession)降低現(xiàn)場服務(wù)費用。此外,對于HDD恢復(fù)自身的需求的發(fā)生意味著系統(tǒng)運行在RAID級別0上的降級的可靠性,因此存在對在恢復(fù)期間保持系統(tǒng)可靠性的強烈需求。

      發(fā)明內(nèi)容
      針對上述問題,本發(fā)明提供了一種數(shù)據(jù)存儲設(shè)備,包括多個安裝在諸如HDD陣列單元的單個單元中的多個數(shù)據(jù)存儲裝置,在該單元中,即使在一個存儲裝置中出現(xiàn)故障或者響應(yīng)延遲,也具有連續(xù)運行在保持冗余的狀態(tài)的能力,并且減小了用于更換出故障的存儲裝置的維護(hù)會話的次數(shù)。
      為了實現(xiàn)上述目的,根據(jù)本發(fā)明實施方式的一種數(shù)據(jù)存儲設(shè)備包括多個數(shù)據(jù)記錄裝置;多個錯誤校正記錄裝置;數(shù)據(jù)分配和錯誤校正代碼產(chǎn)生裝置,用于將輸入數(shù)據(jù)在所述數(shù)據(jù)記錄裝置中進(jìn)行分配和記錄,根據(jù)所述錯誤校正記錄裝置的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼從而將所述錯誤校正代碼記錄在所述錯誤校正記錄裝置中;以及數(shù)據(jù)恢復(fù)裝置,其利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù)。
      在該數(shù)據(jù)存儲設(shè)備中,將輸入數(shù)據(jù)分配到多個數(shù)據(jù)記錄裝置中進(jìn)行記錄,根據(jù)錯誤校正記錄裝置的數(shù)目從數(shù)據(jù)中產(chǎn)生的錯誤校正代碼被記錄到多個錯誤校正記錄裝置中。因此冗余等于錯誤校正記錄裝置的數(shù)目。
      當(dāng)在任何記錄裝置中發(fā)生了故障或響應(yīng)延遲時,利用從剩余的數(shù)據(jù)記錄裝置和錯誤糾正代碼記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)該記錄裝置內(nèi)部的數(shù)據(jù)。如上面解釋的那樣,因為冗余等于錯誤校正記錄裝置的數(shù)目,所以即使在比錯誤校正記錄裝置數(shù)目少1的多個記錄裝置中發(fā)生了故障或響應(yīng)延遲,在數(shù)據(jù)恢復(fù)期間仍然可以保持1或更大的冗余。
      通過這種方式,即使在一個記錄裝置中發(fā)生了故障或響應(yīng)延遲,操作仍然可以按照保證冗余的狀態(tài)繼續(xù)下去。
      此外,直到在與錯誤校正記錄裝置最大數(shù)目同樣的數(shù)目的記錄裝置中發(fā)生了故障,即使不更換有故障的記錄裝置也可以恢復(fù)數(shù)據(jù)。因此,可以減少用于更換有故障的記錄裝置的維護(hù)會話的數(shù)目。
      優(yōu)選地,該數(shù)據(jù)存儲設(shè)備的一個例子還包括請求輸出裝置,其輸出用于請求更換有故障的記錄裝置的信息,以及操作裝置,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目與所述錯誤校正記錄裝置的最大數(shù)目相等,其中,在所述操作裝置沒有選擇執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出裝置也停止輸出所述信息。
      因此,只要數(shù)目在錯誤校正記錄裝置的最大數(shù)目的范圍之內(nèi),用戶就可以任意地選擇是否進(jìn)行更換任何數(shù)目的有故障的記錄裝置的維護(hù)。
      此外,優(yōu)選地,該數(shù)據(jù)存儲設(shè)備的一個例子還包括至少一個備用記錄裝置,請求輸出裝置,其輸出用于請求更換有故障的記錄裝置的信息,以及操作裝置,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目至少與所述備用記錄裝置的數(shù)目相等,其中,在記錄裝置故障的數(shù)目在所述備用記錄裝置的數(shù)目的范圍之內(nèi)的情況下,所述數(shù)據(jù)恢復(fù)裝置在所述備用記錄裝置中記錄該恢復(fù)的數(shù)據(jù),以及在所述操作裝置選擇不執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出裝置也停止輸出所述信息。
      結(jié)果,一直到有故障的記錄裝置的數(shù)目與備用記錄裝置的數(shù)目,用戶可以任意地選擇是否進(jìn)行更換任意數(shù)目的有故障的記錄裝置的維護(hù),而同時保持冗余等于錯誤校正記錄裝置的數(shù)目。此外,在記錄裝置有故障而還有備用記錄裝置時,但恰好在進(jìn)行維護(hù)(服務(wù)技術(shù)人員在現(xiàn)場),則可以選擇更換,從而可以進(jìn)一步減小維護(hù)會話的總數(shù)。
      為了解決上述的技術(shù)問題,提供了一種類似于上述數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法。根據(jù)本發(fā)明實施方式該數(shù)據(jù)存儲方法包括數(shù)據(jù)分配和記錄步驟,將輸入數(shù)據(jù)在所述數(shù)據(jù)記錄裝置中進(jìn)行分配和記錄;錯誤校正代碼產(chǎn)生和記錄步驟,根據(jù)所述錯誤校正記錄裝置的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼,并將所述錯誤校正代碼記錄在所述錯誤校正記錄裝置中;以及數(shù)據(jù)恢復(fù)步驟,利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù)。
      此外,作為例子提出了一種應(yīng)用在包括多個數(shù)據(jù)記錄裝置、多個錯誤校正記錄裝置和至少一個備用記錄裝置的數(shù)據(jù)存儲設(shè)備中的數(shù)據(jù)存儲方法。該方法包括數(shù)據(jù)恢復(fù)步驟,利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù);請求輸出步驟,輸出用于請求更換有故障的記錄裝置的信息;操作步驟,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目至少與所述備用記錄裝置的數(shù)目相等;其中,在記錄裝置故障的數(shù)目在所述備用記錄裝置的數(shù)目的范圍之內(nèi)的情況下,在所述數(shù)據(jù)恢復(fù)步驟中在所述備用記錄裝置中記錄該恢復(fù)的數(shù)據(jù),以及在所述操作步驟沒有選擇執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,在所述請求輸出步驟中也停止輸出所述信息。
      通過上述方法可以獲得類似于上述數(shù)據(jù)存儲設(shè)備的操作。
      根據(jù)本發(fā)明的實施方式,有利的結(jié)果在于,在一個將多個數(shù)據(jù)記錄裝置安裝在單個單元中的數(shù)據(jù)存儲設(shè)備中,即使在一個記錄裝置中發(fā)生了故障或響應(yīng)延遲,操作仍然可以按照保證冗余的狀態(tài)繼續(xù)下去,并且可以減小用于更換有故障的存儲裝置的維護(hù)會話。
      有利的結(jié)果還在于,在錯誤校正記錄裝置的最大數(shù)目的范圍之內(nèi),用戶可以任意地選擇是否進(jìn)行更換任何數(shù)目有故障的記錄裝置的維護(hù)。
      另外,有利的結(jié)果還在于,直到有故障的記錄裝置的數(shù)目等于備用記錄裝置的數(shù)目,用戶可以任意地選擇是否進(jìn)行更換任何數(shù)目有故障的記錄裝置的維護(hù),而同時保持冗余等于錯誤校正記錄裝置的數(shù)目;有利的結(jié)果還在于,在記錄裝置有故障而還有備用記錄裝置時,恰好在進(jìn)行維護(hù),則通過選擇更換可以進(jìn)一步減小維護(hù)會話的總數(shù)目。


      圖1是示意地示出了應(yīng)用本發(fā)明的AV服務(wù)器配置的框圖;圖2是示出圖1中存儲單元中HDD陣列單元的配置的框圖;圖3是示出圖2的控制板的電路配置的框圖;圖4示出圖2的控制面板的外部視圖;以及圖5是示出在HDD出故障時由圖3的CPU執(zhí)行的處理的流程圖。
      具體實施例方式
      下面,利用附圖詳細(xì)地解釋將本發(fā)明應(yīng)用于用作廣播站中非線性編輯系統(tǒng)的AV服務(wù)器的實施方式。圖1是示意地示出應(yīng)用本發(fā)明的AV服務(wù)器配置的框圖。該AV服務(wù)器包括輸入/輸出處理器1和存儲單元。
      輸入/輸出處理器1具有多個(例如六個)輸入/輸出端口,并且按照SDI(串聯(lián)數(shù)字接口)或其它同步傳輸格式或者按照異步傳輸格式與外部設(shè)備進(jìn)行AV數(shù)據(jù)的輸入和輸出。
      輸入/輸出處理器1按照預(yù)定的編碼方法對從輸入/輸出端口輸入的AV數(shù)據(jù)進(jìn)行編碼(壓縮),并將數(shù)據(jù)通過光纖通道3傳輸?shù)酱鎯卧]斎?輸出處理器1還對通過光纖通道3從存儲單元傳輸?shù)臄?shù)據(jù)進(jìn)行解碼(擴展),并且從輸入/輸出端口輸出數(shù)據(jù)。
      注意到在典型AV服務(wù)器中的輸入/輸出處理器1的配置是公知的,而應(yīng)用本發(fā)明的AV服務(wù)器的輸入/輸出處理器的配置可以具有該典型的配置,因此省略了詳細(xì)的解釋。
      存儲單元具有多個HDD陣列單元。圖2是示出了存儲單元中的一個HDD陣列單元的配置的框圖。該HDD陣列單元包括15個HDD4(1)至4(15)、用于控制每個HDD4的控制板5、連接HDD4和控制板5的母板6、用于更換HDD4并管理HDD陣列單元的控制面板7、用于為這些單元的每個提供電源的兩個電源單元8、用于冷卻HDD4和控制板5等等的兩個風(fēng)扇9。
      在15個HDD4中,10個HDD4(1)至4(10)是用于數(shù)據(jù)的HDD,4個HDD4(11)至4(14)是用于錯誤校正的HDD,而剩余一個HDD4(15)是一個備用HDD。
      在HDD4(1)至4(14)中的一個出現(xiàn)故障并且該HDD的數(shù)據(jù)被恢復(fù)和記錄(重建)在HDD4(15)上的情況下,有故障的HDD(用于數(shù)據(jù)或用于錯誤校正的HDD)被移動到HDD4(15)的位置上。此外,在更換了HDD的情況下,備用HDD被移動到該HDD的位置。因此,在初始狀態(tài)下HDD4(1)至4(10)、HDD4(11)至4(14)、HDD4(15)分別是用于數(shù)據(jù)的HDD、用于錯誤校正的HDD、備用HDD;但是每當(dāng)執(zhí)行了重建和更換,數(shù)據(jù)HDD、錯誤校正HDD以及備用HDD的位置發(fā)生了改變。不過,如下面解釋的那樣,作為表示數(shù)據(jù)HDD、錯誤校正HDD以及備用HDD的符號,分別貫穿全文使用符號HDD4(1)至4(10)、HDD4(11)至4(14)以及HDD4(15)。
      也如圖1所示,控制板5由通過光纖通道3連接到輸入/輸出處理器1,并且控制板5還由Ethernet10連接到外部維護(hù)終端(個人計算機)11。
      圖3是表示控制板5的電路配置的框圖。控制板5包括光纖通道控制器12、分割(striping)和ECC單元13、存儲器(RAM)14、HDD控制器15、網(wǎng)絡(luò)接口16、CPU17。分割和ECC單元13具有一個FPGA,它是一個可編程LSI器件。
      通過光纖通道3從輸入/輸出處理器1(圖1)傳輸?shù)臄?shù)據(jù),通過光纖通道控制器12被送至分割和ECC單元13。分割和ECC單元13對數(shù)據(jù)進(jìn)行分割,從而送入10個通道,分別被記錄在數(shù)據(jù)HDD4(1)至4(10)中,而同時在存儲器14中緩沖數(shù)據(jù)。從在這10個通道中的數(shù)據(jù)產(chǎn)生出被記錄在4個錯誤校正HDD4(11)至4(14)中的李德-所羅門(Reed-Solomon)(14,10)代碼。
      由分割和ECC單元13對其進(jìn)行分割的數(shù)據(jù)通過HDD控制器15和母板6(圖2)被送至數(shù)據(jù)HDD4(1)至4(10),并且被記錄在HDD4(1)至4(10)中。
      在分割和ECC單元13中產(chǎn)生的李德-所羅門代碼通過HDD控制器15和母板6被送至錯誤校正HDD4(11)至4(14),并且被記錄在HDD4(11)至4(14)中。因此,HDD陣列單元具有等于4個HDD的冗余。
      在數(shù)據(jù)再現(xiàn)期間,從每個數(shù)據(jù)HDD4(1)至4(10)讀出的數(shù)據(jù)以及從每個錯誤校正HDD4(11)至4(14)讀出的李德-所羅門代碼,通過母板6、HDD控制器15以及分割和ECC單元13被送至存儲器14,并且在存儲器14中的緩沖之后,被送至分割和ECC單元13。分割和ECC單元13利用來自數(shù)據(jù)HDD4(1)至4(10)的數(shù)據(jù)以及來自錯誤校正HDD4(11)至4(14)的李德-所羅門代碼,執(zhí)行錯誤校正。按照這種方式再現(xiàn)的數(shù)據(jù)通過光纖通道3從光纖通道控制器12傳輸?shù)捷斎?輸出處理器1。
      基于連同數(shù)據(jù)一起從輸入/輸出處理器1傳輸?shù)拿?,CPU17控制HDD4(1)至4(15)。例如,如果在數(shù)據(jù)再現(xiàn)期間在數(shù)據(jù)HDD4(1)至4(10)的任何一個中發(fā)生了故障或響應(yīng)延遲,則在CPU17的控制之下,利用從剩余的數(shù)據(jù)HDD中讀出的數(shù)據(jù)和從錯誤校正HDD4(11)至4(14)中讀出的李德-所羅門代碼,恢復(fù)該HDD中的數(shù)據(jù)。
      如上面解釋的那樣,該HDD陣列單元具有等于HDD數(shù)目4的冗余,使得即使在HDD4(1)至4(10)中直到最多三個單元發(fā)生了故障或響應(yīng)延遲,則在保持1或更高的冗余的同時也可以進(jìn)行數(shù)據(jù)恢復(fù)。
      通過這種方式,即使在HDD4(1)至4(14)中的一個發(fā)生了故障或響應(yīng)延遲,AV服務(wù)器的操作可以按照保證冗余的狀態(tài)得到繼續(xù)。
      此外,對于直到最大4個有故障的HDD4(1)至4(14),即使不更換有故障的HDD也可以恢復(fù)數(shù)據(jù)。結(jié)果,可以減小用于更換有故障的HDD的維護(hù)會話,從而可以降低了維護(hù)費用。
      當(dāng)HDD4(1)至4(14)中的一個有故障時,CPU17執(zhí)行圖5中所示出的處理,下面基于控制面板7和維護(hù)終端上的操作針對有故障的HDD對其進(jìn)行解釋。
      圖4示出控制面板7(圖2)的外部視圖??刂泼姘?位于存儲單元外殼的表面上,并且配備了用于顯示各種菜單和狀態(tài)的LCD(液晶顯示器)、用于從顯示在LCD21上的菜單中進(jìn)行選擇的附加成形的搖臂鍵22、以及作為LED(發(fā)光二極管)燈23至25的指示器。
      LED燈23是系統(tǒng)燈,正常情況下點亮,而在HDD故障期間閃爍為桔黃色,以及在諸如導(dǎo)致不能進(jìn)行數(shù)據(jù)記錄的嚴(yán)重故障的情況下閃爍為紅色。LED燈24是電源燈,正常情況下點亮,而在兩個電源8(圖2)之一有故障期間閃爍為桔黃色。LED燈25是指示HDD訪問狀態(tài)的顯示燈,在訪問期間閃爍。
      顯示在LCD21上的菜單包括用來選擇是否更換HDD4(1)至4(14)中已經(jīng)有故障的HDD的菜單。盡管沒有示出,同樣的菜單也顯示在上述維護(hù)終端11(圖2)的顯示器上。
      圖5是示出在HDD4(1)至4(14)中任一個有故障時由控制板5上的CPU17(圖3)執(zhí)行的關(guān)于更換有故障的HDD的處理的流程圖。每當(dāng)HDD4(1)至4(14)的任一個有故障就啟動該處理;首先,將指示故障的狀態(tài)信息輸出到輸入/輸出處理器1(圖1),而將維護(hù)請求(請求更換有故障的HDD的信息)輸出到控制面板7和維護(hù)終端11(圖2)兩者(步驟S1)。
      響應(yīng)于該維護(hù)請求,在控制面板7上LED燈23(圖4)閃爍為桔黃色。盡管沒有示出,在維護(hù)終端11上響應(yīng)于該維護(hù)請求也在顯示器上顯示預(yù)定的報警。
      跟隨著步驟S1,判斷該故障是否是第一故障(S2)。如果“是”,則利用備用HDD4(15)開始自動重建。也就是說,從剩余的HDD4(1)至4(14)中讀出的數(shù)據(jù)中,利用李德-所羅門代碼恢復(fù)在HDD4(1)至4(14)中有故障的HDD中的數(shù)據(jù),并且將被恢復(fù)的數(shù)據(jù)記錄在備用HDD4(15)中(步驟S3)。
      隨后,正如上面解釋的那樣,將用來選擇是否更換有故障的HDD的菜單顯示在控制面板7的LCD21(圖4)上以及維護(hù)終端11的顯示器上(步驟S4)。然后,關(guān)于是否在控制面板7上或者在維護(hù)終端11上已經(jīng)執(zhí)行選擇不進(jìn)行更換的操作,做出判斷(步驟S5)。
      如果“是”,則將用于撤消步驟S1中的維護(hù)請求輸出的信息輸出給控制面板7和維護(hù)終端11(步驟S6)。然后結(jié)束處理。
      響應(yīng)于該撤銷信息,在控制面板7上LED燈23返回到正常點亮狀態(tài)。在維護(hù)終端11上也響應(yīng)于該維護(hù)請求的撤銷而撤銷上述報警的顯示。
      當(dāng)在步驟S5中回答是“否”(當(dāng)已經(jīng)執(zhí)行了選擇更換有故障的HDD的操作),進(jìn)入待機直到有故障的HDD更換完成(步驟S7)。在更換完成時,處理進(jìn)入到步驟S6。
      當(dāng)在步驟S2中回答是“否”(當(dāng)故障是在兩個或更多HDD中),類似于步驟S7,進(jìn)入待機直到有故障的HDD的更換完成(步驟S8)。
      當(dāng)更換完成時,開始重建。也就是說,例如如果在兩個HDD中有故障,則從HDD4(1)至4(15)中除了兩個有故障的HDD外的13個HDD讀出的數(shù)據(jù)中,利用李德-所羅門代碼恢復(fù)在有故障的HDD中的數(shù)據(jù),并且將被恢復(fù)的數(shù)據(jù)記錄在最新更換的數(shù)據(jù)HDD中(步驟S9)。然后,處理進(jìn)入到步驟S6。
      下面,解釋當(dāng)在HDD陣列單元中的HDD4(1)至4(14)中發(fā)生了故障時保證冗余的方式,以及減小用來更換有故障的HDD的維護(hù)會話的數(shù)目的方式。當(dāng)在HDD陣列單元中的一個HDD中發(fā)生了故障時,在輸出維護(hù)請求之后,數(shù)據(jù)被自動地恢復(fù)(重建)到備用HDD4(15)上(圖5中的步驟S1至S3)。
      如上所述,在過去具有RAID級別3或級別5配置的HDD陣列單元中,在重建期間系統(tǒng)的可靠性由于HDD冗余的損失而極大地減小。另一方面,在本實施方式的HDD陣列單元中,系統(tǒng)(AV服務(wù)器)的可靠性由于保證了3的最小HDD冗余而被維持。此外,即使一個HDD有故障也沒有必要立刻更換該HDD,因此用戶可以通過操作控制面板7或維護(hù)終端11撤銷維護(hù)請求(從而不進(jìn)行維護(hù))(圖5中的步驟S4至S6)。
      然而,當(dāng)單個HDD有故障時,如果其它維護(hù)恰好在進(jìn)行(如果服務(wù)技術(shù)人員在),則如果服務(wù)技術(shù)人員更換該有故障的HDD,則該維護(hù)請求被自動撤銷,并且所有HDD返回到正常的狀態(tài)(圖5中的步驟S5,S6,S7)。
      如果隨后兩個HDD有故障,則因為備用HDD已經(jīng)在使用,因此不自動地開始重建。在這種情況下,同樣在首次故障的HDD中的數(shù)據(jù)被自動地重建并記錄到備用HDD,從而保證了3的冗余。
      控制面板7和維護(hù)終端11被設(shè)計成,當(dāng)?shù)诙﨟DD有故障時維護(hù)請求不能被撤銷,因此要求有服務(wù)技術(shù)人員進(jìn)行的維護(hù),并且在更換HDD時數(shù)據(jù)被恢復(fù)(重建)到最新更換的HDD上,隨后維護(hù)請求被自動地撤銷(圖5中的步驟S1,S2,S8,S9,S6)。在第二HDD有故障的時刻,通過一次更換兩個直到該時刻有故障的HDD,與每次HDD故障時進(jìn)行更換的情況相比維護(hù)會話的數(shù)目減少了一半。
      另外,即使僅僅在一個HDD中有故障,如果恰好要進(jìn)行維護(hù)(服務(wù)技術(shù)人員在現(xiàn)場),則通過更換該HDD(圖5中的步驟S5,S7,S6),維護(hù)會話的總數(shù)目可以被進(jìn)一步減小。
      幾乎所有目前使用的HDD具有800,000小時或更多的MTBF(平均故障間隔時間),而對于HDD陣列單元的保修期(使用周期)例如是五年或更短。在連續(xù)使用AV服務(wù)器的情況下(一天24小時以及一年365天),在五年的周期中對于HDD的預(yù)期故障率從MTBF計算大約是5.3%;當(dāng)每個HDD陣列單元使用14個HDD時,預(yù)期在五年周期中一個HDD將出故障。因此,通過執(zhí)行在圖5中示出的處理可以實現(xiàn)有效的免維護(hù)操作。
      注意到,在上述例子中,僅僅當(dāng)故障發(fā)生在第一HDD(與現(xiàn)有的備用HDD同樣數(shù)目)時,才可以操作控制面板7或維護(hù)終端11撤銷維護(hù)請求,而不更換有故障的HDD。然而,作為另一個例子,可以將系統(tǒng)設(shè)計成,使得直到有故障的HDD的數(shù)目達(dá)到了三個單元(此時冗余是2)、四個單元(此時冗余是1)、或五個單元(此時沒有冗余)還可以撤銷維護(hù)請求。在這些情況下,分別可以將維護(hù)會話的數(shù)目減小至正常數(shù)目的1/3、1/4和1/5。
      此外,在上述實施方式中提供了單一的備用HDD;但是作為另一個例子,備用HDD的數(shù)目可以是兩個單元(伴以9個數(shù)據(jù)HDD和4個錯誤校正HDD),或者備用HDD的數(shù)目可以是三個單元(伴以8個數(shù)據(jù)HDD和4個錯誤校正HDD)。通過這種備用HDD的數(shù)目的增加,與單一有故障HDD的情況類似,當(dāng)兩個或三個HDD有故障時可以進(jìn)行自動的重建,使得可以進(jìn)一步減小維護(hù)會話的數(shù)目。不過,因為HDD配置經(jīng)常受到所要求的記錄容量(數(shù)據(jù)HDD的數(shù)目)和造價的影響,在實際中備用HDD的數(shù)目常常是1。
      此外,在上面的例子中安裝了15個HDD;不過,為了進(jìn)一步增加HDD冗余或者將備用HDD的數(shù)目增加到2或更大,可以安裝大于15的HDD數(shù)目。
      另外,在上面的例子中提供了10個數(shù)據(jù)HDD和4個錯誤校正HDD;然而,數(shù)據(jù)HDD和錯誤校正HDD的數(shù)目可以分別被設(shè)定為適當(dāng)?shù)膹?fù)數(shù)值。
      再者,在上面的例子中將本發(fā)明應(yīng)用到了作為AV服務(wù)器使用的HDD陣列單元;不過,也可以將本發(fā)明應(yīng)用到其它HDD陣列單元。
      此外,也可以將本發(fā)明應(yīng)用到不是HDD陣列單元的系統(tǒng)中,這些系統(tǒng)是數(shù)據(jù)存儲設(shè)備,并且其中在一個單一的單元中安裝了多個記錄介質(zhì)(例如,半導(dǎo)體存儲器器件或者光盤)。
      本領(lǐng)域的技術(shù)人員應(yīng)該理解,根據(jù)設(shè)計要求和其它因素可以進(jìn)行改動、組合、次組合以及變更,只要它們落入所附權(quán)利要求或其等價物的范圍之內(nèi)。
      權(quán)利要求
      1.一種數(shù)據(jù)存儲設(shè)備,包括多個數(shù)據(jù)記錄裝置;多個錯誤校正記錄裝置;數(shù)據(jù)分配和錯誤校正代碼產(chǎn)生裝置,其將輸入數(shù)據(jù)在所述數(shù)據(jù)記錄裝置中進(jìn)行分配和記錄,根據(jù)所述錯誤校正記錄裝置的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼,并將所述錯誤校正代碼記錄在所述錯誤校正記錄裝置中;以及數(shù)據(jù)恢復(fù)裝置,其利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù)。
      2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)存儲設(shè)備,還包括請求輸出裝置,其輸出用于請求更換有故障的記錄裝置的信息,以及操作裝置,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目與所述錯誤校正記錄裝置的最大數(shù)目相等,其中,在所述操作裝置選擇不執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出裝置也暫停輸出所述信息。
      3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)存儲設(shè)備,其中,所述操作裝置是所述數(shù)據(jù)存儲設(shè)備的控制面板或外部終端。
      4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)存儲設(shè)備,其中,所述控制面板包括顯示裝置,用于顯示用來選擇是否更換有故障的記錄裝置的菜單;系統(tǒng)燈,用于顯示所述記錄裝置的有故障的狀態(tài);電源燈;和顯示燈,用于顯示所述記錄裝置的訪問狀態(tài)。
      5.根據(jù)權(quán)利要求1所述的數(shù)據(jù)存儲設(shè)備,還包括至少一個備用記錄裝置,請求輸出裝置,其輸出用于請求更換有故障的記錄裝置的信息,以及操作裝置,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目至少與所述備用記錄裝置的數(shù)目相等,其中,在有故障記錄裝置的數(shù)目在所述備用記錄裝置的數(shù)目的范圍之內(nèi)的情況下,所述數(shù)據(jù)恢復(fù)裝置在所述備用記錄裝置中記錄所恢復(fù)的數(shù)據(jù),以及在所述操作裝置選擇不執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出裝置也停止輸出所述信息。
      6.根據(jù)權(quán)利要求5所述的數(shù)據(jù)存儲設(shè)備,其中,所述操作裝置是所述數(shù)據(jù)存儲設(shè)備的控制面板或外部終端。
      7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)存儲設(shè)備,其中,所述控制面板包括顯示裝置,用于顯示用來選擇是否更換有故障的記錄裝置的菜單;系統(tǒng)燈,用于顯示所述記錄裝置的有故障的狀態(tài);電源燈;和顯示燈,用于顯示所述記錄裝置的訪問狀態(tài)。
      8.一種數(shù)據(jù)存儲方法,應(yīng)用在包括多個數(shù)據(jù)記錄裝置和多個錯誤校正記錄裝置的數(shù)據(jù)存儲設(shè)備中,該方法包括數(shù)據(jù)分配和記錄步驟,將輸入數(shù)據(jù)分配并記錄到所述數(shù)據(jù)記錄裝置中;錯誤校正代碼產(chǎn)生和記錄步驟,根據(jù)所述錯誤校正記錄裝置的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼,并將所述錯誤校正代碼記錄在所述錯誤校正記錄裝置中;以及數(shù)據(jù)恢復(fù)步驟,利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和所述錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù)。
      9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,還包括請求輸出步驟,輸出用于請求更換有故障的記錄裝置的信息,以及操作步驟,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目與所述錯誤校正記錄裝置的最大數(shù)目相等,其中,在所述操作步驟沒有選擇執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出步驟也暫停輸出所述信息。
      10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述操作步驟是在所述數(shù)據(jù)存儲設(shè)備的控制面板或外部終端上進(jìn)行的操作。
      11.根據(jù)權(quán)利要求10所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述控制面板操作是對在該控制面板上的顯示裝置上菜單的操作,以便選擇是否更換所述有故障的記錄裝置。
      12.根據(jù)權(quán)利要求8所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中所述存儲設(shè)備還包括至少一個備用記錄裝置,該方法還包括請求輸出步驟,輸出用于請求更換有故障的記錄裝置的信息,以及操作步驟,選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目至少與所述備用記錄裝置的數(shù)目相等,其中,在有故障記錄裝置的數(shù)目在所述備用記錄裝置的數(shù)目的范圍之內(nèi)的情況下,在所述數(shù)據(jù)恢復(fù)步驟中將所恢復(fù)的數(shù)據(jù)記錄到所述備用記錄裝置,以及在所述操作步驟沒有選擇執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出步驟也停止輸出所述信息。
      13.根據(jù)權(quán)利要求12所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述操作步驟是所述數(shù)據(jù)存儲設(shè)備的控制面板或外部終端上進(jìn)行的操作。
      14.根據(jù)權(quán)利要求13所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述控制面板操作是對在該控制面板上的顯示裝置上菜單的操作,以便選擇是否更換所述有故障的記錄裝置。
      15.一種數(shù)據(jù)存儲方法,應(yīng)用在包括多個數(shù)據(jù)記錄裝置、多個錯誤校正記錄裝置和至少一個備用記錄裝置的數(shù)據(jù)存儲設(shè)備中,該方法包括數(shù)據(jù)恢復(fù)步驟,利用從剩余的記錄裝置中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄裝置和所述錯誤校正記錄裝置之中發(fā)生了故障或響應(yīng)延遲的記錄裝置中的數(shù)據(jù);請求輸出步驟,輸出用于請求更換有故障的記錄裝置的信息;操作步驟,用于選擇是否更換有故障的記錄裝置,直到有故障的記錄裝置的數(shù)目至少與所述備用記錄裝置的數(shù)目相等;其中,在有故障記錄裝置的數(shù)目在所述備用記錄裝置的數(shù)目的范圍之內(nèi)的情況下,在所述數(shù)據(jù)恢復(fù)步驟中將所恢復(fù)的數(shù)據(jù)記錄到所述備用記錄裝置,以及在所述操作步驟沒有選擇執(zhí)行更換的情況下,即使有故障的記錄裝置沒有得到更換,所述請求輸出步驟也停止輸出所述信息。
      16.根據(jù)權(quán)利要求15所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,在有故障記錄裝置的數(shù)目在超出所述備用記錄裝置的數(shù)目的范圍的情況下,在更換了所述有故障的記錄裝置之后,在所述數(shù)據(jù)恢復(fù)步驟中將所恢復(fù)的數(shù)據(jù)記錄到所更換的記錄裝置;以及在所述請求輸出步驟中在數(shù)據(jù)恢復(fù)之后停止所述信息的輸出。
      17.根據(jù)權(quán)利要求15所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述操作步驟是在所述數(shù)據(jù)存儲設(shè)備的控制面板或外部終端上進(jìn)行的操作。
      18.根據(jù)權(quán)利要求17所述的數(shù)據(jù)存儲設(shè)備的數(shù)據(jù)存儲方法,其中,所述控制面板操作是對在該控制面板的顯示裝置上菜單的操作,以便選擇是否更換所述有故障的記錄裝置。
      19.一種數(shù)據(jù)存儲設(shè)備,包括多個數(shù)據(jù)記錄單元;多個錯誤校正記錄單元;數(shù)據(jù)分配和錯誤校正代碼產(chǎn)生單元,其將輸入數(shù)據(jù)在所述數(shù)據(jù)記錄單元中進(jìn)行分配和記錄,根據(jù)所述錯誤校正記錄單元的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼,并將所述錯誤校正代碼記錄在所述錯誤校正記錄單元中;以及數(shù)據(jù)恢復(fù)單元,其利用從剩余的記錄單元中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在所述數(shù)據(jù)記錄單元和錯誤校正記錄單元之中發(fā)生了故障或響應(yīng)延遲的記錄單元中的數(shù)據(jù)。
      全文摘要
      本發(fā)明提供了一種能夠減小用于更換有故障的存儲裝置的維護(hù)會話的次數(shù)的數(shù)據(jù)存儲設(shè)備以及其數(shù)據(jù)存儲方法。該數(shù)據(jù)存儲設(shè)備包括多個數(shù)據(jù)HDD;多個錯誤校正HDD;數(shù)據(jù)分配和錯誤校正代碼產(chǎn)生裝置,其將輸入數(shù)據(jù)在所述數(shù)據(jù)HDD中進(jìn)行分配和記錄,根據(jù)所述錯誤校正HDD的數(shù)目從所述數(shù)據(jù)中產(chǎn)生錯誤校正代碼,并將所述錯誤校正代碼記錄在所述錯誤校正HDD中;以及數(shù)據(jù)恢復(fù)裝置,其利用從剩余的HDD中讀取的數(shù)據(jù)和錯誤校正代碼,恢復(fù)在其中發(fā)生了故障或響應(yīng)延遲的HDD中的數(shù)據(jù)。
      文檔編號G06F3/06GK1728101SQ20051008755
      公開日2006年2月1日 申請日期2005年7月27日 優(yōu)先權(quán)日2004年7月28日
      發(fā)明者粥川義明, 淺井稔也 申請人:索尼株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1