專利名稱::唯一對(duì)應(yīng)化合物結(jié)構(gòu)式的id符號(hào)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明系關(guān)于對(duì)應(yīng)化合物的化學(xué)結(jié)構(gòu)式將實(shí)質(zhì)性的唯一的固定長(zhǎng)或可變長(zhǎng)的字符串作為附加于該化合物或與其化合物相關(guān)信息的ID符號(hào)加以生成的方法?;衔锿ㄟ^表示其構(gòu)成的原子種類與原子間結(jié)合狀態(tài)的化學(xué)結(jié)構(gòu)式特定以唯一的意思。另外,在印刷、出版時(shí)也需要以語言、文字將化學(xué)結(jié)構(gòu)加以特定的方法。為此,很久以來一直有人在研究化合物命名法。作為化合物命名法,著名的有IUPAC方式和化學(xué)文摘方式,也有使用不屬于上述任何一種方式的命名法。例如,新化合物的發(fā)現(xiàn)者常使用任意命名的慣用名或天然化合物等。要想嚴(yán)格的運(yùn)用命名規(guī)則需要高度熟練地掌握,而使用命名法的一般的有機(jī)化學(xué)工作者多不精通命名規(guī)則。因此,很多時(shí)候由于使用者不同,起名也各異。在令計(jì)算機(jī)執(zhí)行IUPAC命名規(guī)則時(shí),也存在對(duì)巨大的復(fù)雜的化學(xué)結(jié)構(gòu)式難以命名及命名結(jié)果不合原意的問題。最終有可能一個(gè)化合物存在幾種名字或叫法。又,在以正確表述為目的的正式命名法中,化合物名難以起成固定長(zhǎng)的名字。據(jù)此,上述命名法不適合計(jì)算機(jī)管理。因而,近年來能夠不依照命名法、直接采用化學(xué)結(jié)構(gòu)式進(jìn)行檢索的化合物數(shù)據(jù)庫逐步形成主流。只要利用計(jì)算機(jī)軟件在計(jì)算機(jī)畫面上畫出化學(xué)結(jié)構(gòu)式,就能輸入原子的種類和原子間的結(jié)合關(guān)系。能將該化學(xué)結(jié)構(gòu)式作為檢索式進(jìn)行檢索。作為此種數(shù)據(jù)庫的形式及檢索方法,著名的有美國(guó)的MDL公司的ISIS。此方法因指定出原子的種類與原子間的聯(lián)系,能夠檢索包含其部分結(jié)構(gòu)的化學(xué)結(jié)構(gòu)式,所以很方便使用。但是,若此方法在其數(shù)據(jù)庫中沒有用作比較的化學(xué)結(jié)構(gòu)式數(shù)據(jù)就不能進(jìn)行比較,故還需要比較化學(xué)結(jié)構(gòu)式的專用軟件。因化學(xué)結(jié)構(gòu)式不是字符串?dāng)?shù)據(jù),所以不能用索引檢索用軟件根據(jù)化學(xué)結(jié)構(gòu)式進(jìn)行檢索。學(xué)述論文中發(fā)表的化合物及專利申請(qǐng)的化合物的數(shù)據(jù)庫-Chemica1Abstract是著名的基于命名法的化合物數(shù)據(jù)庫。又,市售化合物的數(shù)據(jù)庫—ACD是著名的基于化學(xué)結(jié)構(gòu)式的化合物數(shù)據(jù)庫。后者對(duì)應(yīng)化合物的數(shù)據(jù)記錄分別附以6~10位英數(shù)字組成的識(shí)別符(ID符號(hào))。但因這些ID符號(hào)的附加同結(jié)構(gòu)無關(guān),常有同一結(jié)構(gòu)附加不同ID符號(hào)的情況。所以通過ID符號(hào)無法像由結(jié)構(gòu)式或命名法得到的化合物名那樣來確定化學(xué)結(jié)構(gòu)式是否一致。若試行檢索某種化合物是否存在于現(xiàn)有的幾個(gè)數(shù)據(jù)庫中,或在出處不同的數(shù)據(jù)庫間檢索出是否包含著同一化合物這樣的龐大的工作,替代化合物結(jié)構(gòu)式,有能夠作為對(duì)照對(duì)象的ID符號(hào)是很方便的。為此,就必須開發(fā)出將所有化合物的結(jié)構(gòu)式附以唯一確定的特有的ID符號(hào)的方法。也就是說,本發(fā)明提供了一種依照構(gòu)成化合物的化學(xué)結(jié)構(gòu)式的各原子的種類及原子間的結(jié)合關(guān)系、對(duì)應(yīng)化學(xué)結(jié)構(gòu)式實(shí)質(zhì)性地生成唯一的固定長(zhǎng)或可變長(zhǎng)的字符串并將此字符串作為該化合物的ID符號(hào)的方法。本發(fā)明的理想狀態(tài)是能夠?qū)?yīng)構(gòu)成化學(xué)結(jié)構(gòu)式的各原子的原子序數(shù)及/或各原子的種類、同位素的種類、或由該原子生成的異構(gòu)體的種類對(duì)各原子進(jìn)行數(shù)值分配,將其作為數(shù)列的初項(xiàng),然后將根據(jù)該原子群的共價(jià)鍵關(guān)系確定的運(yùn)算規(guī)則漸變地進(jìn)行有限的重復(fù),得到數(shù)列,對(duì)應(yīng)此數(shù)列各項(xiàng)進(jìn)行大小比較后改變排列得到的該化學(xué)結(jié)構(gòu)式生成實(shí)質(zhì)性地唯一的數(shù)列,再在此數(shù)列的基礎(chǔ)上生成字符串。繼續(xù)上述方法的步驟,本發(fā)明還提供了包括用變換函數(shù)將上述步驟得到的字符串變?yōu)楦痰墓潭ㄩL(zhǎng)或可變長(zhǎng)字符串的步驟的方法。作為變換函數(shù)可以使用沖突困難混列函數(shù)及/或通用單向性混列函數(shù),作為該變換函數(shù)最好能從SHA、SHA1、MD-4、MD-5及RIPEMD等的信息摘要函數(shù)中選擇至少一種函數(shù)來用,而固定長(zhǎng)字符串最好是能夠生成由字母及/或阿拉伯?dāng)?shù)字組成的固定長(zhǎng)字符串。在由上述方法得到的字符串或字符串群中,也可以附加有關(guān)不能直接利用的信息的1或2個(gè)以上的字符串(如有關(guān)該ID符號(hào)生成法的種類及/或該ID符號(hào)對(duì)象物的屬類的信息的1或2個(gè)以上的字符串)。本發(fā)明的方法,最好能夠使用包括下列要素組成的裝置來完成。即(a)對(duì)應(yīng)構(gòu)成化學(xué)結(jié)構(gòu)式的各原子的種類對(duì)各原子進(jìn)行數(shù)值分配的手段;(b)存儲(chǔ)以這些數(shù)值為要素的向量的手段n;(c)輸入該原子間共價(jià)鍵關(guān)系的手段及/或?qū)⑵潢P(guān)系作為行列要素進(jìn)行存儲(chǔ)的存儲(chǔ)手段c;(d)將通過利用n和c的運(yùn)算式生成的數(shù)列進(jìn)行存儲(chǔ)的手段;該生成裝置及/或存儲(chǔ)用于其生成的運(yùn)算順序的載體;及(e)通過將上述數(shù)列按大小比較規(guī)則進(jìn)行替換排列,得到該化學(xué)結(jié)構(gòu)式固有的數(shù)列,再將該數(shù)列變換為字符串后的結(jié)果進(jìn)行存儲(chǔ)的載體、該變換的進(jìn)行裝置、及/或存儲(chǔ)其變換方法的載體。在其它的理想狀態(tài)中,使用下列各手段能夠執(zhí)行上述方法,即作為各原子的種類,對(duì)應(yīng)化學(xué)結(jié)構(gòu)式的各原子的原子序數(shù)、同位素的種類及由其原子生成的異構(gòu)體的種類,對(duì)各原子進(jìn)行數(shù)值分配再將這些數(shù)值作為要素排列的向量進(jìn)行存儲(chǔ)的存儲(chǔ)裝置n;存儲(chǔ)該原子間共價(jià)關(guān)系的存儲(chǔ)裝置c;存儲(chǔ)裝置n及/或存儲(chǔ)裝置n-1的各原子對(duì)于對(duì)應(yīng)的向量要素,該向量要素的一定倍數(shù)及/或結(jié)合價(jià)倍數(shù)及其原子通過存儲(chǔ)裝置c判定為共價(jià)鍵的原子將對(duì)應(yīng)的向量要素加上一定倍數(shù)及/或結(jié)合價(jià)倍數(shù)的值進(jìn)行存儲(chǔ)的存儲(chǔ)裝置n+1;將以漸變地返復(fù)地進(jìn)行這種運(yùn)算得到的所有的向量列的要素以要素或原子為單位排列的數(shù)列進(jìn)行存儲(chǔ)的載體;將其數(shù)列作為唯一對(duì)應(yīng)該化合物結(jié)構(gòu)式的字符串進(jìn)行輸出的裝置。從其它觀點(diǎn)來看,能夠提供一種唯一對(duì)應(yīng)由上述方法得到的化合物的化學(xué)結(jié)構(gòu)式的ID符號(hào)及存儲(chǔ)了該ID符號(hào)的存儲(chǔ)載體。此ID符號(hào)能夠用來進(jìn)行化合物的化學(xué)結(jié)構(gòu)的同一性或類似性的判定。例如能夠用于在1個(gè)化合物數(shù)據(jù)庫內(nèi)或2個(gè)以上的化合物數(shù)據(jù)庫間抽出有關(guān)同一或類似的化學(xué)結(jié)構(gòu)式的信息,也能用于化合物數(shù)據(jù)庫的管理。例如對(duì)有關(guān)化合物數(shù)據(jù)庫或含有化合物信息的數(shù)據(jù)庫中的各文件預(yù)加上述ID符號(hào)后,不使用化學(xué)結(jié)構(gòu)式信息而只比較ID符號(hào)便能進(jìn)行化合物信息的檢索或?qū)φ?。進(jìn)而,通過本發(fā)明能夠提供下列諸項(xiàng),即含有上述ID符號(hào)的文件、記錄、數(shù)據(jù)對(duì)象、文件名、文件路徑名、記錄名或檢索鍵;含有上述ID符號(hào)的檢索式和生成該檢索式的裝置;用于檢索含有上述ID符號(hào)的文件、記錄、數(shù)據(jù)對(duì)象、文件名、文件路徑名或記錄名的裝置;記錄了上述裝置作業(yè)順序的載體;用于進(jìn)行化合物間化學(xué)結(jié)構(gòu)式的同一性判定的上述ID符號(hào);不使用化合物化學(xué)結(jié)構(gòu)式的部分或全部而進(jìn)行的化合物間同一性或類似性判定用的上述ID符號(hào);通過使用上述ID符號(hào),不用直接比較該化合物的化學(xué)結(jié)構(gòu)式即可完成,因此保守該化學(xué)結(jié)構(gòu)式機(jī)密性的方法;為在2個(gè)以上的數(shù)據(jù)庫中使同一化合物所附的ID符號(hào)一致而采用的上述方法;為在2個(gè)以上的數(shù)據(jù)庫中以同一檢索式進(jìn)行檢索而使用的上述ID符號(hào)。無論文件還是記錄,在本發(fā)明中本質(zhì)上是相同的,在計(jì)算機(jī)中的信息記錄形式是一樣的。進(jìn)一步從其它觀點(diǎn)看,本發(fā)明可提供存儲(chǔ)著安裝了上述方法的計(jì)算機(jī)用程序的存儲(chǔ)載體,并能提供用于執(zhí)行上述方法的上述裝置和記錄著令該裝置運(yùn)行的程序的載體。作為存儲(chǔ)載體、存儲(chǔ)裝置、記錄載體及記錄裝置,可使用計(jì)算機(jī)能夠讀取的任何載體或裝置,理想的可使用存儲(chǔ)器、閃存器、軟盤、硬盤、CD-ROM、DVD、MO等。附圖的簡(jiǎn)單說明圖1所示為能夠?qū)⒁跃植縄D管理的記錄直接用化合物結(jié)構(gòu)式固有的ID作為檢索式進(jìn)行檢索的數(shù)據(jù)庫系統(tǒng)?!缸址怪缸帜?、阿拉伯?dāng)?shù)字、平假名、片假名、漢字、朝鮮字母等、將世界上使用的所有或部分字符符號(hào)代碼化的數(shù)據(jù)?!缸址怪笇?個(gè)以上的有限數(shù)量的文字順序排列后的數(shù)據(jù),通常該數(shù)據(jù)存儲(chǔ)在計(jì)算機(jī)能夠讀取的存儲(chǔ)裝置中,作為「字符串」還包括由字母數(shù)字字符及將其以ASCII碼變?yōu)槎M(jìn)制數(shù)列的數(shù)據(jù)組成的符號(hào)?!笖?shù)列」指將1個(gè)以上的有限數(shù)量的有理數(shù)順序排列后的數(shù)據(jù),通常將該數(shù)據(jù)存儲(chǔ)在計(jì)算機(jī)能夠讀取的存儲(chǔ)裝置中。由于可用二進(jìn)制表現(xiàn)的數(shù)據(jù)能以0和1來表示,所以解釋為字符串或數(shù)列都可以。作為存儲(chǔ)裝置,最好使用包括計(jì)算機(jī)存儲(chǔ)器在內(nèi)的能夠存儲(chǔ)二進(jìn)制數(shù)的裝置。在字符串中,最好將各種字符按字符代碼表變換為1~4位字節(jié)長(zhǎng)的二進(jìn)制數(shù)后進(jìn)行存儲(chǔ)。作為字符代碼表,最好是ASCII碼或UNICODE,但只要能一一對(duì)應(yīng)字符和數(shù)列,任何代碼都能用。又當(dāng)字符串中的多個(gè)字符群集中起來表示為十進(jìn)制或十六進(jìn)制等數(shù)值時(shí),也可將其值變換為二進(jìn)制后進(jìn)行存儲(chǔ),或?qū)⑵渥址鹨坏匕醋址a表變換為1~16位字節(jié)長(zhǎng)的二進(jìn)制數(shù)進(jìn)行存儲(chǔ)也可以。在數(shù)列中,最好將各有理數(shù)變換為1~8位字節(jié)長(zhǎng)的二進(jìn)制數(shù)后進(jìn)行存儲(chǔ)。其時(shí),也可將各有理數(shù)的值變換為二進(jìn)制數(shù)后進(jìn)行存儲(chǔ),或?qū)⑵渲底鳛?0進(jìn)制數(shù)或16進(jìn)制數(shù)以多個(gè)字符群來表示,以字符串相同的形式存儲(chǔ)也可以。以二進(jìn)制數(shù)形式表現(xiàn)字符串及數(shù)列的數(shù)據(jù),本說明書中有時(shí)稱為「bit列」或「二進(jìn)制數(shù)據(jù)」?!富衔锏幕瘜W(xué)結(jié)構(gòu)式」一詞,通常的意思是指化學(xué)工作者以唯一表現(xiàn)化合物為目的而記述的原子種類、結(jié)合關(guān)系、結(jié)合類型、異構(gòu)體的種類等的圖形,本說明書中作為更廣義的概念用來表示將化合物的結(jié)構(gòu)唯一確定的數(shù)據(jù)。「唯一的ID符號(hào)」(本說明書中有時(shí)也稱作「固有的ID符號(hào)」)指相同化合物的ID符號(hào)相一致,結(jié)構(gòu)式不同的化合物的ID符號(hào)在本質(zhì)上不同的性質(zhì)。本說明書中有時(shí)使用「固有」替代「唯一的」來表示上述性質(zhì)?!副举|(zhì)上的不一致」指雖并未在理論上證明不一致,但因一致的可能將極小,實(shí)際使用中完全不一致?!富衔铩篂橐怨矁r(jià)鍵相互結(jié)合了的原子團(tuán),除有機(jī)化合物外,還包括無機(jī)化合物。本發(fā)明的方法中,為將化合物的化學(xué)結(jié)構(gòu)式以一定意思的字符串來表現(xiàn)而進(jìn)行變換處理。將化學(xué)結(jié)構(gòu)式變換為一定意思的字符串的方法只要做到由相同化學(xué)結(jié)構(gòu)式必定生成相同字符串、且由不同的化學(xué)結(jié)構(gòu)式生成實(shí)質(zhì)上不同的字符串,其種類沒有特殊的限定。下面以甲醇(CH3OH)為例進(jìn)行具體地說明,當(dāng)然,可利用本發(fā)明的方法所做的變換處理不僅限于下述化合物?!缸址纳伞故紫?,準(zhǔn)備好存儲(chǔ)分配給各原子的數(shù)值的裝置。此裝置可以是寄存器、存儲(chǔ)器、磁記錄載體、或穿孔紙帶等任意裝置,但作為計(jì)算機(jī)可用的存儲(chǔ)裝置最好是存儲(chǔ)器。對(duì)于這些原子將相對(duì)于「原子種類」而定的數(shù)值進(jìn)行分配。作為分配的數(shù)值,可以是對(duì)應(yīng)各原子的原子序數(shù)、各原子的種類任意定義的數(shù)值,甚至區(qū)別同位素種類的不同數(shù)值。當(dāng)其原子是光學(xué)異構(gòu)體為基礎(chǔ)形成的手性中心的時(shí)候,或由幾何異性體為基礎(chǔ)形成的順式結(jié)合或反式結(jié)合的時(shí)候,能像區(qū)別根據(jù)其原子生成的異構(gòu)體種類那樣地將定義了的數(shù)值進(jìn)行分配也可以。最好是用計(jì)算機(jī)將表現(xiàn)化學(xué)結(jié)構(gòu)式的數(shù)據(jù)或與化學(xué)結(jié)構(gòu)式等同的信息—該化學(xué)結(jié)構(gòu)式的三維數(shù)據(jù)從文件系統(tǒng)等的輸入裝置進(jìn)行輸入,并對(duì)各原子自動(dòng)進(jìn)行上述數(shù)值的分配(以下說明中為簡(jiǎn)化啟見,將原子序數(shù)進(jìn)行了分配,但在變換處理時(shí),不一定非將原子序數(shù)進(jìn)行分配,也可將分配值通過數(shù)字變化按下列順序進(jìn)行。下圖中分配的值記在括號(hào)中。又,元素符號(hào)前的數(shù)字是為能區(qū)別各原子而附加的順序號(hào))。將數(shù)值作為初期值進(jìn)行分配的狀態(tài)稱為步驟1?;瘜W(xué)式(1)將步驟1中對(duì)各原子分配了的數(shù)值存儲(chǔ)在存儲(chǔ)裝置1中。存儲(chǔ)裝置1中存儲(chǔ)的數(shù)據(jù)由多個(gè)數(shù)值組成,各數(shù)值為各原子分配到的數(shù)值。當(dāng)原子的數(shù)為M個(gè)時(shí),可以將這些數(shù)值(數(shù)值1,數(shù)值2,,,數(shù)值M)集中起來當(dāng)做一個(gè)M維向量。本說明書中有時(shí)將該數(shù)據(jù)稱為「向量」,將向量中對(duì)各原子分配的數(shù)值稱為「要素」。尤其在步驟1中,將存儲(chǔ)裝置1中存儲(chǔ)的向量稱為「初項(xiàng)」。化學(xué)式(1)例中,以1H、2H、3H、4C、5O、6H的順序排列著的數(shù)值初項(xiàng)為(1,1,1,6,8,1),它們存儲(chǔ)在存儲(chǔ)裝置1中。又,將從表示由輸入裝置輸入的化學(xué)結(jié)構(gòu)式的數(shù)據(jù)得到的表示原子間共價(jià)鍵關(guān)系的信息存儲(chǔ)在存儲(chǔ)裝置c中。只要能夠根據(jù)存儲(chǔ)裝置c的數(shù)據(jù)判斷出有關(guān)任意原子及共價(jià)鍵結(jié)合著的對(duì)象原子,存儲(chǔ)裝置c的數(shù)據(jù)結(jié)構(gòu)不做特別限定。理想的是,返復(fù)進(jìn)行任意二個(gè)原子對(duì)共價(jià)鍵結(jié)合著為真、非共價(jià)鍵結(jié)合著為假這種判定,將原子群排成行與列,將存儲(chǔ)了對(duì)應(yīng)二個(gè)原子組的要素為真時(shí)的1、為假時(shí)的0的行列或2維配列(c[1,2,,M][1,2,,,M])存儲(chǔ)在電子存儲(chǔ)器中。化學(xué)式(1)例中,因第5號(hào)的50與第6號(hào)的6H結(jié)合著,所以c[5][6]=c[6][5]=1,因?yàn)榈?號(hào)的4C與第6號(hào)的6H沒有結(jié)合著,所以c[4][6]=c[6][4]=0。接著準(zhǔn)備好與存儲(chǔ)裝置1相同的存儲(chǔ)裝置2,作為以步驟1各原子的值為基礎(chǔ)進(jìn)行如下說明的運(yùn)算處理后的結(jié)果,把對(duì)各原子新分配的值存儲(chǔ)在存儲(chǔ)裝置2(稱之為步驟2)。進(jìn)一步漸變地返復(fù)地進(jìn)行同樣的處理,將每一步驟對(duì)原子分配的值存儲(chǔ)在存儲(chǔ)裝置n(n=1,2,,,,,)中(此步驟稱為「步驟n」)。首先,將步驟2的各原子的值按如下算法算出。將存儲(chǔ)裝置1的各原子的值擴(kuò)大一定倍數(shù)(最好為1倍)后的值存儲(chǔ)在存儲(chǔ)裝置2。接著,通過存儲(chǔ)裝置c能夠了解的各原子將共價(jià)鍵結(jié)合的對(duì)方原子的個(gè)數(shù)(H的對(duì)方為1個(gè),C為4個(gè),0的為2個(gè))擴(kuò)大一定倍數(shù)(最好為0倍)后,將與存儲(chǔ)裝置1的各原子的值相乘后的值加在該原子在存儲(chǔ)裝置2中的值上。接著,通過存儲(chǔ)裝置c能夠了解的各原子將結(jié)合的對(duì)方原子群的存儲(chǔ)裝置1中的值擴(kuò)大一定倍數(shù)(最好為1倍)后加到該原子在存儲(chǔ)裝置2中的值上。以理想的一定倍率運(yùn)算后的步驟2的存儲(chǔ)裝置2的各原子的值記錄如下。化學(xué)式(2)同樣,步驟n的各原子的值照如下算法算出。將存儲(chǔ)裝置k(但k為從滿足1≤k≤n的整數(shù)中任選的n個(gè)以下的整數(shù)群,最好只選用k=n的1個(gè)整數(shù))中的各原子的值擴(kuò)大一定倍(最好為1倍)后的值存儲(chǔ)在存儲(chǔ)裝置n+1中。接著,通過存儲(chǔ)裝置c能夠了解的各原子將共價(jià)鍵結(jié)合的對(duì)方原子的個(gè)數(shù)擴(kuò)大一定倍數(shù)(最好是n=1時(shí)為0,n>1時(shí)為-1倍)后,將與存儲(chǔ)裝置k(k為從滿足1≤k≤n的整數(shù)中選出的n-1個(gè)以下的整數(shù)群,最好只選用n>1時(shí)k=n-1的1個(gè)整數(shù))的各原子的值相乘后的值加在該原子的存儲(chǔ)裝置n+1的值上。接著,通過存儲(chǔ)裝置c能夠了解的各原子將結(jié)合的對(duì)方原子群的存儲(chǔ)裝置k(但k為從滿足1≤k≤n的整數(shù)中任選的n個(gè)以下的整數(shù)群,最好只選用k=n的1個(gè)整數(shù))中的值擴(kuò)大一定倍(最好為1倍)后加在該原子的存儲(chǔ)裝置n+1的值上。步驟數(shù)最好返復(fù)進(jìn)行任意有限次(最好為10次左右)。由此可生成對(duì)應(yīng)各步驟的向量列。在用計(jì)算機(jī)進(jìn)行處理時(shí),因上述運(yùn)算規(guī)則為漸變式的程序設(shè)計(jì),在此將其稱為漸變式。該漸變式根據(jù)存儲(chǔ)在存儲(chǔ)裝置c中的原子間的共價(jià)鍵關(guān)系信息加以定義。為簡(jiǎn)單易懂這里的說明只講到步驟2執(zhí)行結(jié)束,而本發(fā)明在實(shí)施中對(duì)步驟數(shù)無特別限制。步驟1和2中的向量如同上述化學(xué)式所示,存儲(chǔ)裝置1的向量為(1,1,1,6,8,1),存儲(chǔ)裝置2的向量為(7,7,7,17,15,9)。也就是說,將每個(gè)原子向量的要素排列后,形成下式?;瘜W(xué)式(3)接著,根據(jù)大小比較規(guī)則將這些要素進(jìn)行排列交替后生成數(shù)列。例如將各要素的值從小到大順序排列的后數(shù)列「1,1,1,1,7,7,7,9,15,17」作為「實(shí)質(zhì)性對(duì)應(yīng)化學(xué)結(jié)構(gòu)式的唯一的數(shù)列」加以生成。又,作為其他大小比較規(guī)則,也可將每種原子集中起來進(jìn)行比較排序。例如可以首先將每種原子的要素列在存儲(chǔ)裝置1中的值進(jìn)行比較后,按從小到大順序排列。若存儲(chǔ)裝置1中的值相等的話,再比較存儲(chǔ)裝置2中的值,進(jìn)而形成如下順序。(1,7),(1,7),(1,7)(1,9),(6,17),(8,15)→1,7,1,7,1,7,1,9,6,17,8,15。而將此數(shù)列作為字符代碼表或數(shù)值,可以生成二進(jìn)制化的按數(shù)列順序排列的bit列組成的字符串。在此方法中,步驟數(shù)越多字符串整體就越長(zhǎng),并能強(qiáng)化結(jié)構(gòu)特征。為達(dá)到本發(fā)明的目的進(jìn)行多少次步驟為好?通過對(duì)數(shù)萬種市售化合物進(jìn)行改變步驟數(shù)并生成字符串,再比較字符串沖突(由不同的結(jié)構(gòu)式生成相同的字符串)的頻率,可以推定出必要的最小限度的步驟數(shù)。運(yùn)用此方法進(jìn)行實(shí)際的數(shù)據(jù)處理并對(duì)字符串的沖突進(jìn)行檢查的結(jié)果證明,步驟數(shù)越多、計(jì)算得到的字符串越長(zhǎng),越能防止結(jié)構(gòu)不同的化合物間字符串的沖突。使用ACD(約25萬市售化合物的數(shù)據(jù)庫),對(duì)全部化合物用本方法生成數(shù)列后進(jìn)行字符串沖突的調(diào)查結(jié)果,計(jì)算至步驟6時(shí)就幾乎不發(fā)生沖突了??煽科鹨?,將步驟數(shù)進(jìn)行10次左右的話,足以處理現(xiàn)有的化合物。這樣生成的字符串是實(shí)質(zhì)性地對(duì)應(yīng)化學(xué)結(jié)構(gòu)式的唯一的可變長(zhǎng)字符串。以下稱作「結(jié)構(gòu)字符串」。結(jié)構(gòu)字符串由上述數(shù)列生成(有時(shí)將這樣的數(shù)列稱作「結(jié)構(gòu)數(shù)列」),因?qū)嵸|(zhì)性地與化學(xué)結(jié)構(gòu)一一對(duì)應(yīng),所以能用來判定化學(xué)結(jié)構(gòu)的一致或類似,也能作為ID符號(hào)來用。還能將數(shù)列中的各值用阿拉伯?dāng)?shù)字等作為字符串來表示,也能任意分割這些字符串或隔著空字符進(jìn)行連接后作為整體集合成一個(gè)字符串來用。以上說明中將原子序數(shù)作為初期數(shù)對(duì)各原子進(jìn)行了分配,其實(shí)不用原子序數(shù)而附以任意數(shù)值都可以。將若干種初期數(shù)值的分配方法以變化的條件執(zhí)行上述算法直到最后步驟,在排列數(shù)字列時(shí),將各自以初期數(shù)值得到的數(shù)字列集中起來加以排列也可以。對(duì)于結(jié)構(gòu)中具有局部特征的原子,可通過改變?cè)撛拥某跗跀?shù)值加以解決。例如可以將有關(guān)幾何異構(gòu)性、立體異構(gòu)性等不同原子的初期值通過異構(gòu)體各自的變化來反映結(jié)構(gòu)字符串的不同。從化合物的結(jié)構(gòu)式直接導(dǎo)出的結(jié)構(gòu)字符串雖有各種長(zhǎng)度,但因其是以化合物結(jié)構(gòu)式固有的且由結(jié)構(gòu)式僅有的信息生成的,所以得到的字符串若在適當(dāng)?shù)拈L(zhǎng)度范圍內(nèi)的話,將結(jié)構(gòu)字符串自身作為ID符號(hào)用來進(jìn)行化學(xué)結(jié)構(gòu)式的同一性或類似性的判定也無妨。進(jìn)一步,在將短字符串作為ID符號(hào)使用時(shí),最好經(jīng)過變換函數(shù)的處理。通過使用變換函數(shù),可以從上述得到的長(zhǎng)的不同結(jié)構(gòu)的字符串導(dǎo)出固定長(zhǎng)的ID符號(hào)的字符串,因此,包括此步驟的方法是本發(fā)明的理想狀態(tài)。例如像下面說明的那樣,能夠?qū)⒔Y(jié)構(gòu)字符串變換為bit列后保持在存儲(chǔ)裝置b、將變換為20字節(jié)左右的短的固定長(zhǎng)bit列的算法應(yīng)用于存儲(chǔ)裝置b、將變換后的bit列存儲(chǔ)在存儲(chǔ)裝置d。能夠?qū)⒋俗儞Q為字符串后由輸出裝置作為字符串的ID符號(hào)進(jìn)行輸出。這里,作為存儲(chǔ)裝置b和d,能夠使用可存儲(chǔ)二進(jìn)制數(shù)的任意裝置,最好能使用計(jì)算機(jī)的寄存器或存儲(chǔ)器。以下說明中,為便于理解,以適用于結(jié)構(gòu)字符串為例加以說明,而對(duì)結(jié)構(gòu)數(shù)列也同樣適用。作為經(jīng)變換函數(shù)處理后生成的ID符號(hào)的字符串,對(duì)結(jié)構(gòu)字符串是固有的,必須實(shí)質(zhì)性地滿足下列作為一一對(duì)應(yīng)映射函數(shù)的條件。即由同一結(jié)構(gòu)字符串生成同一ID符號(hào);由不同的結(jié)構(gòu)字符串生成不同的ID符號(hào);ID符號(hào)是固定長(zhǎng)或可變長(zhǎng)(最好為固定長(zhǎng))的短的字符串;生成方法簡(jiǎn)便。作為適用于本發(fā)明的方法的變換函數(shù),可舉混列函數(shù),更好的可舉沖突困難混列函數(shù)及通用單向性混列函數(shù)。作為用于本發(fā)明的方法中的變換函數(shù)不必在數(shù)學(xué)上嚴(yán)密地證明沖突困難性及單向性,實(shí)際上,只要是給出滿足上述特征的變換結(jié)果的函數(shù),用什么函數(shù)都可以。通用單向性混列函數(shù)(universalone-wayhashfunction)是由Naor和Yung導(dǎo)入的函數(shù),是當(dāng)給出函數(shù)h與其定義域的某值x時(shí)形成h(x)=h(y)樣的不好求y的一種函數(shù)。另一方面,沖突困難混列函數(shù)(collisionintractablehashfunction)是由Damgard導(dǎo)入的函數(shù),是當(dāng)給出函數(shù)h時(shí)形成h(x)=h(y)樣的不好求一對(duì)值(x,y)的一種函數(shù)。作為對(duì)函數(shù)的要求條件,沖突困難混列函數(shù)比通用單向性函數(shù)更高(關(guān)于混列函數(shù),作為綜述參照岡本龍明、山本博資著『系列/信息科學(xué)的數(shù)學(xué)現(xiàn)代暗號(hào)』產(chǎn)業(yè)圖書;岡本榮司著『暗號(hào)理論入門』共立出版有限公司等)。本說明書中,混列函數(shù)、尤其是沖突困難混列函數(shù)或通用單向性混列函數(shù)必須做最廣義地解釋,無論任何意思都不能做限定性解釋。在本發(fā)明的方法中,類屬于沖突困難混列函數(shù)或通用單向性混列函數(shù)的函數(shù)都可以使用。又,以具有沖突困難性為目標(biāo),同時(shí)注重實(shí)用性效率性而開發(fā)的混列函數(shù)有多項(xiàng)提案,因?yàn)镽ivest的MD-4,MD-5和以其為基礎(chǔ)的RIPEMD,SHA(securehashalgorithm)等被廣泛使用著(Menezes,A.J.,vanOorschot,P.andVanstone,S.A.HandbookofAppliedCryptography,CRCPress,1996),所以這種函數(shù)也可用于本發(fā)明的方法。將二種以上不同的變換函數(shù),如二種以上沖突困難混列函數(shù)、二種以上通用單向性混列函數(shù)組合起來用也可以。又如將一種或二種以上沖突困難混列函數(shù)與一種或二種以上通用單向性混列函數(shù)加以適當(dāng)組合后進(jìn)行處理也可以。本發(fā)明的方法中單獨(dú)使用SHA或SHA-1尤為理想,使用的函數(shù)及它們的組合可由當(dāng)事人做適當(dāng)?shù)剡x擇,以便充分降低生成的ID符號(hào)的沖突可能性。本說明書中有時(shí)將這些函數(shù)稱作信息摘要函數(shù)。以下,作為尤其能適用于本發(fā)明的方法的變換函數(shù),介紹SHA的算法,當(dāng)然可用于本發(fā)明的方法的變換函數(shù)不僅限于SHA。此例中,通過混列函數(shù)處理后生成的混列值—字符串,由小寫英文字母和數(shù)字組合來表現(xiàn),而字母不僅限于小寫英文字母。用于本發(fā)明的方法的字母無論大寫或小寫都可以,大寫字母與小寫字母不加區(qū)別地使用或?qū)⑺鼈儏^(qū)別使用都可以。又,以更高的沖突困難性、高速的混列法替代SHA用于本方法中也可以。例如使用SHA的改進(jìn)型SHA1也可以。*輸入數(shù)據(jù)不滿264bit的任意長(zhǎng)的bit編組「m」(將各化合物的結(jié)構(gòu)字符串?dāng)?shù)據(jù)變換為bit編組「m」的方法后述)。*輸出數(shù)據(jù)相對(duì)「m」生成160bit的混列值。被輸入的bit列「m」按下列順序形成512bit(16×32bit)的倍數(shù)進(jìn)行裝填。順序(1)將m的bit編組長(zhǎng)度按成為‘512N-64’的形式在「m」的最后附加bit配列100...0。順序(2)以64bit表現(xiàn)輸入編組的bit編組長(zhǎng)度,再附加于bit編組的后面。將得到的bit編組按每組512bit分割成N組后分別定為M1,M2,...MN。將bit補(bǔ)正后的編組分割成各512bit的字組將各字組作16等分(各32bit)對(duì)應(yīng)上述bit編組,使用下列常數(shù)和函數(shù)按下列順序進(jìn)行混列值計(jì)算。常數(shù))下列常數(shù)值以十六進(jìn)制數(shù)表示H0=67452301H1=EFCDAB89H2=98BADCFEH3=10325476H4=C3D2E1F0Kt=5A827999(0≤t≤19)Kt=6ED9EBA1(20≤t≤39)Kt=8F1BBCDC(40≤t≤59)Kt=CA62C1D6(60≤t≤79)函數(shù))ft(x,y,z)=(x∧y)∨(x∧z)(0≤t≤19)ft(x,y,z)=xyz(20≤t≤39)ft(x,y,z)=(x∧y)∨(x∧z)∨(y∧z)(40≤t≤59)ft(x,y,z)=xyz(60≤t≤79)注)∧邏輯積(AND)∨邏輯和(OR)排他的邏輯和(XOR)*處理i=從0到N按下列順序返復(fù)。(1)將Mj每32bit一組分割為16組,從左起為W0,W1,...,W15。(2)根據(jù)Wt=(Wt-3Wt-8Tt-14Wt-16)<<<1(僅在SHA-1時(shí))確定W16,...,W79(各32bit)。參考4)X<<<n的意思是相對(duì)X左邊n個(gè)bit進(jìn)行循環(huán)移位。循環(huán)移位將bit的數(shù)字編組向一定方向移動(dòng),端部的數(shù)字循環(huán)移動(dòng)到相反一端。(3)設(shè)定A=H0,B=H1,C=H2,D=H3,E=H4(各32bit)(4)按下列順序從t=0到79進(jìn)行返復(fù)。參考5)‘+’表示左右相加值的‘232’的剩余。TEMP=(A<<<5)+ft(B,C,D)+E+Wt+KtE=DD=CC=B<<<30B=AA=TEMP(5)H0=H0+A,H1=H1+B,H2=H2+C,H3=H3+D,H4=H4+E將最終得到的H0~H4的bit編組進(jìn)行連結(jié)后的共計(jì)160bit作為混列值。將結(jié)構(gòu)字符串變換為bit列的方法說明如下。通過ASCII碼形成按字符串順序?qū)⒏髯址儞Q為8bit且排列著的bit列。本說明書的實(shí)施例中采用了這種方法,而在將字符代碼變換為bit列時(shí),也可以使用ASCII碼以外的變換碼。bit列指排列了1bit的信息,1bit對(duì)應(yīng)二進(jìn)制數(shù)的1位,表示為0或1。使用ASCII碼時(shí),所謂不滿264bit的SHA的條件作為字符串則為約不滿2×1018,也能表現(xiàn)相當(dāng)高的步驟數(shù)的結(jié)構(gòu)字符串。要將由上述混列函數(shù)得到的160bit列作為ID使用時(shí),最好進(jìn)行必要的bit數(shù)分割,以便能用英數(shù)字表現(xiàn)此bit列。將160bit每5bit一組加以分解,并將各5bit用0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v32個(gè)字符表現(xiàn)為32進(jìn)制數(shù)。將下面的160bit列每5bit一組分割后,變換為分別對(duì)應(yīng)的32進(jìn)制數(shù)字符時(shí),10000110111101111110010000110111…101110001000011011110111111001000…|||||grru8這樣變換后,得到下列ID。“grru8dvqkmjvpoat3nebjqnat8rncpto”對(duì)于由本發(fā)明的方法生成的ID符號(hào),為了附加表示對(duì)應(yīng)數(shù)據(jù)的種類的信息(例如顯示用ID符號(hào)表示化合物的情報(bào))或表示ID符號(hào)的形成方法的種類的情報(bào)(例如表示利用了的混列函數(shù)的種類的信息)等,附加固定長(zhǎng)1或2以上的文字列,理想附加由英數(shù)字符組成的字符串作為新的ID符號(hào)。附加的字符串配置在運(yùn)用混列函數(shù)得到的字符串的頭部或末尾等任何部分都可以。最好在混列值得到的字符串的頭部附加1個(gè)字符串。本發(fā)明的ID符號(hào)可用來進(jìn)行化合物數(shù)據(jù)(包括化學(xué)結(jié)構(gòu)式數(shù)據(jù))的管理和對(duì)照。上述ID符號(hào)因是各化合物固有的、且沖突可能性極小,所以將多個(gè)化合物用本發(fā)明的方法進(jìn)行處理并生成ID符號(hào),通過比較其ID符號(hào)就能簡(jiǎn)便且高速地判定化合物的同一性。例如使用上述ID符號(hào)能夠?qū)⑴c特定的化合物相同的化學(xué)結(jié)構(gòu)式從化合物數(shù)據(jù)庫中進(jìn)行高速地檢索。又,使用上述ID符號(hào)能夠管理化合物數(shù)據(jù)庫。例如對(duì)于數(shù)據(jù)庫中的化合物生成上述ID符號(hào),可以檢測(cè)出化合物數(shù)據(jù)庫中重復(fù)存儲(chǔ)的化合物,或能在不同的化合物數(shù)據(jù)庫間簡(jiǎn)便且高速地檢測(cè)出重復(fù)登錄的化合物。又,在將新的化合物信息登錄到數(shù)據(jù)庫中時(shí),能夠簡(jiǎn)便地檢索該化合物是否已經(jīng)被登錄。進(jìn)而,為比較化合物,僅公開ID符號(hào),而不公開化合物數(shù)據(jù)本身,能夠保守化合物數(shù)據(jù)的機(jī)密性。本發(fā)明的方法用于檢索、對(duì)照基本上相同的化學(xué)結(jié)構(gòu)式是方便的,也能用于對(duì)衍生物等類似的化學(xué)結(jié)構(gòu)式進(jìn)行檢索、分類等。若按下列方法做的話,還能用于檢索類似結(jié)構(gòu)式的化合物。對(duì)于某化學(xué)結(jié)構(gòu)式,除結(jié)構(gòu)式本身的ID符號(hào)外,對(duì)于去掉置換基后的結(jié)構(gòu)(不限1個(gè))生成ID符號(hào)后一起保存下來為好。例如假如氯化物的C1置換為H后生成的ID符號(hào)與溴化物的Br置換為H后生成的ID符號(hào)一致的話,可以機(jī)械地判定為類緣化合物,即使更加復(fù)雜的結(jié)構(gòu)式的化合物群也能同樣操作。ID符號(hào)的數(shù)量不限,相對(duì)原來的結(jié)構(gòu)式按順序保存為好。若對(duì)數(shù)據(jù)庫中的全部化合物同樣生成并保存多個(gè)ID符號(hào)的話,就能高速地了解在出處不同的數(shù)據(jù)庫間是否存有某種衍生體系列的化合物、對(duì)于某一特定的化合物在化合物數(shù)據(jù)庫中是否存有其衍生物等情況。這樣的形態(tài)也全部包括在本發(fā)明的范圍內(nèi)是可想而知的。在數(shù)據(jù)庫系統(tǒng)內(nèi)對(duì)記錄附以ID并進(jìn)行內(nèi)部管理。記錄的ID(圖1中RecordID1,RecordID2等)因在此數(shù)據(jù)庫系統(tǒng)內(nèi)局部使用,故這里稱作局部ID。在數(shù)據(jù)庫系列內(nèi),有化合物結(jié)構(gòu)式固有的ID和局部ID的對(duì)應(yīng)表,此對(duì)應(yīng)關(guān)系可通過數(shù)據(jù)庫系統(tǒng)的管理者進(jìn)行變更、添加、刪除。又,在數(shù)據(jù)庫系統(tǒng)內(nèi)存有以局部ID管理記錄的局部數(shù)據(jù)庫,可以通過局部ID進(jìn)行記錄檢索。記錄檢索裝置、ID間的對(duì)應(yīng)表和局部數(shù)據(jù)庫即使物理性地存在于相互分離的場(chǎng)所也可以。其彼此間的通信可經(jīng)由互聯(lián)網(wǎng)或局域網(wǎng)來實(shí)現(xiàn)。又,ID間的對(duì)應(yīng)表的管理者與局部數(shù)據(jù)庫的管理者也可以不同。ID間的對(duì)應(yīng)表只要能通過固有ID檢索與其對(duì)應(yīng)的局部ID,使用任何裝置都可以。即使固有ID與局部ID的對(duì)應(yīng)為多對(duì)多也可以。檢索時(shí)的處理順序如下。處于數(shù)據(jù)庫系統(tǒng)外部的檢索者將至少包括1個(gè)化合物結(jié)構(gòu)式中固有的ID的檢索式輸入該數(shù)據(jù)庫系統(tǒng)的記錄裝置(圖1①)。記錄檢索裝置通過ID間的對(duì)應(yīng)表進(jìn)行對(duì)應(yīng)固有ID的局部ID的檢索(圖1②)。接著,記錄檢索裝置使用該局部ID從局部數(shù)據(jù)庫中檢索該局部ID附帶的記錄(圖1③)。最后,記錄檢索裝置將該記錄回送給檢索者。作為其它方法,若能利用關(guān)系數(shù)據(jù)庫的圖像生成功能將ID間的對(duì)應(yīng)表和局部數(shù)據(jù)庫的表相融合的話,也可以將②和③的檢索匯總起來進(jìn)行。此例中,檢索者只用化合物結(jié)構(gòu)式固有的ID就可進(jìn)行數(shù)據(jù)庫檢索,且在檢索進(jìn)行時(shí)通過「ID間的對(duì)應(yīng)表」可以進(jìn)行對(duì)應(yīng)的局部ID的記錄的檢索。數(shù)據(jù)庫系統(tǒng)管理者在將局部數(shù)據(jù)庫中的記錄進(jìn)行變更、添加、刪除后,由于固有ID和局部ID的對(duì)應(yīng)做了相應(yīng)的變更,能夠做到對(duì)應(yīng)檢索者要查的化合物結(jié)構(gòu)式始終回送相符的記錄。又,當(dāng)通過記錄的變更和刪除,固有ID所對(duì)應(yīng)的記錄不再存留于局部數(shù)據(jù)庫中時(shí),能夠做到以與其相關(guān)的修正信息替代記錄回送給檢索者。又,檢索者經(jīng)由互聯(lián)網(wǎng)或局域網(wǎng)對(duì)圖1所示的多個(gè)數(shù)據(jù)庫系統(tǒng)以相同的固有ID同時(shí)輸入,可以同時(shí)進(jìn)行多個(gè)數(shù)據(jù)庫檢索。又,作為主系統(tǒng)的記錄只限定于包含固有ID的文件,而使用市售的目錄檢索用程序則很方便。此時(shí),目錄檢索用程序?qū)⑽募?nèi)的固有ID作為關(guān)鍵詞加以自動(dòng)識(shí)別,將該ID與該文件的路徑的對(duì)應(yīng)關(guān)系(相當(dāng)于ID間的對(duì)應(yīng)表)自動(dòng)地制成。這樣,將固有ID作為檢索式直接送至目錄檢索用程序中,能夠檢索包含該固有ID的文件。產(chǎn)業(yè)應(yīng)用的可能性通過本方法,對(duì)任何結(jié)構(gòu)的化合物都能作為固定長(zhǎng)或可變長(zhǎng)且沖突率極低的字符串或字符串群生成對(duì)應(yīng)其化合物的化學(xué)結(jié)構(gòu)式的唯一的ID符號(hào)。此ID符號(hào)能夠由化合物的化學(xué)結(jié)構(gòu)式極快速且簡(jiǎn)便地生成。因ID符號(hào)是各有機(jī)化合物的化學(xué)結(jié)構(gòu)式所固有的,實(shí)際沖突的可能性幾乎沒有,所以只通過比較ID符號(hào)就能輕松地判定化學(xué)結(jié)構(gòu)的同一性或類似性。能夠用來管理數(shù)據(jù)庫,以免重復(fù)登錄,除能統(tǒng)一使用以不同標(biāo)準(zhǔn)形成的化合物數(shù)據(jù)庫外,還能對(duì)某種化合物或其衍生物是否存在于化合物數(shù)據(jù)庫中等進(jìn)行快速查詢。又,本發(fā)明的ID符號(hào)是通過軟件從化學(xué)結(jié)構(gòu)自身生成的,因此,只要配置該軟件,無論在世界任何地方都能對(duì)同樣的結(jié)構(gòu)給出用樣的ID符號(hào),并能取代化學(xué)結(jié)構(gòu)式用于數(shù)據(jù)庫檢索和對(duì)照。由于不必將化學(xué)結(jié)構(gòu)式自身作為檢索式進(jìn)行數(shù)據(jù)庫檢索,能夠防止通信檢索時(shí)泄漏機(jī)密。又,數(shù)據(jù)庫管理者因預(yù)先對(duì)數(shù)據(jù)庫中全部化合物進(jìn)行了附加,所以能避免重復(fù),并能用于出處不同的數(shù)據(jù)庫間的連接。進(jìn)一步,研究人員對(duì)已合成或打算合成的化合物化學(xué)結(jié)構(gòu)式也能通過同樣的軟件松地附加ID符號(hào),并能進(jìn)行數(shù)據(jù)庫的檢索和結(jié)構(gòu)對(duì)照。權(quán)利要求1.提供一種方法,其根據(jù)構(gòu)成化學(xué)結(jié)構(gòu)式的各原子的種類及該原子間的結(jié)合關(guān)系,對(duì)應(yīng)該化學(xué)結(jié)構(gòu)式生成實(shí)質(zhì)性的唯一的固定長(zhǎng)或可變長(zhǎng)的字符串并將此字符串作為該化學(xué)結(jié)構(gòu)式及/或該化學(xué)結(jié)構(gòu)式特定的化合物的ID符號(hào)。2.根據(jù)權(quán)利要求項(xiàng)1所述的方法,按下列順序生成字符串(1)將對(duì)應(yīng)構(gòu)成化學(xué)結(jié)構(gòu)式的各原子的元素的種類確定的數(shù)值作為各要素的向量作為初項(xiàng);(2)根據(jù)該化學(xué)結(jié)構(gòu)式中原子間的共價(jià)鍵關(guān)系確定漸變式;(3)根據(jù)該初項(xiàng)和該漸變式生成有限數(shù)量的向量列;(4)將全部向量?jī)?nèi)的全部要素通過大小比較規(guī)則改變排列,生成同一化學(xué)結(jié)構(gòu)式必然形成同一數(shù)列的“對(duì)應(yīng)化學(xué)結(jié)構(gòu)式的實(shí)質(zhì)性地唯一的數(shù)列”;(5)以該數(shù)列的順序號(hào)變換該數(shù)列的各項(xiàng)后生成字符串。3.根據(jù)權(quán)利要求項(xiàng)2所述的方法,將對(duì)應(yīng)構(gòu)成化學(xué)結(jié)構(gòu)式的各原子的元素種類及通過該原子對(duì)應(yīng)生成的異性體的種類而定的數(shù)值作為各要素的向量作為初項(xiàng)。4.提供一種方法,將由權(quán)利要求項(xiàng)1至3的任意一項(xiàng)所述的方法得到的字符串通過實(shí)質(zhì)性的一對(duì)一映射函數(shù)的變換函數(shù)變換為固定長(zhǎng)的字符串,并將此作為ID符號(hào)。5.根據(jù)權(quán)利要求項(xiàng)4所述的方法,作為實(shí)質(zhì)性一對(duì)一映射函數(shù)的變換函數(shù)使用沖突困難混列函數(shù)及/或通用單向性混列函數(shù)。6.根據(jù)權(quán)利要求項(xiàng)4或5所述的方法,作為實(shí)質(zhì)性一對(duì)一映射函數(shù)的變換函數(shù)使用信息摘要函數(shù)。7.根據(jù)權(quán)利要求項(xiàng)1至6的任意一項(xiàng)所述的方法,包括將有關(guān)該ID符號(hào)生成法的種類及/或該ID符號(hào)對(duì)象物的屬類的信息進(jìn)一步附加1個(gè)或2個(gè)以上的字符串的工序。8.根據(jù)權(quán)利要求項(xiàng)1至7的任意一項(xiàng)所述的方法,為了僅以ID符號(hào)的比較來進(jìn)行多個(gè)化學(xué)結(jié)構(gòu)式間的同一性判定而使用。9.根據(jù)權(quán)利要求項(xiàng)8所述的方法,通過使用權(quán)利要求項(xiàng)5或6中所述的ID符號(hào),來保持該化合物的化學(xué)結(jié)構(gòu)式的機(jī)密性。10.通過權(quán)利要求項(xiàng)1至7的任意一項(xiàng)所述的方法,記錄了生成的ID符號(hào)的載體及/或記錄了包括該ID符號(hào)的文件的載體。11.根據(jù)權(quán)利要求項(xiàng)1至7的任意一項(xiàng)所述的方法,用于使以上數(shù)據(jù)庫中對(duì)同一化合物所附的ID符號(hào)相一致。12.記錄了化學(xué)結(jié)構(gòu)式及/或以化學(xué)結(jié)構(gòu)式與特定的化合物相關(guān)信息的文件;記錄了與該化學(xué)結(jié)構(gòu)式的ID符號(hào)相對(duì)應(yīng)的數(shù)據(jù)的載體。13.一種檢索裝置,基于權(quán)利要求項(xiàng)12所述的對(duì)應(yīng)數(shù)據(jù),由ID符號(hào)檢索有對(duì)應(yīng)關(guān)系的文件。14.記錄了從化學(xué)結(jié)構(gòu)式或與此同等的數(shù)據(jù)通過權(quán)利要求項(xiàng)1至7的任意一項(xiàng)中所述的方法生成的該化學(xué)結(jié)構(gòu)式的ID符號(hào)的程序的載體及/或能經(jīng)網(wǎng)絡(luò)發(fā)送該程序的服務(wù)裝置。全文摘要根據(jù)構(gòu)成化合物的各原子的種類及原子間的結(jié)合關(guān)系及/或異性體的種類,對(duì)化學(xué)結(jié)構(gòu)式生成實(shí)質(zhì)性的唯一的固定長(zhǎng)或可變長(zhǎng)的字符串后將此字符串作為該化合物的ID符號(hào)的方法;以及將上述字符串用字符串變換函數(shù)變?yōu)閿?shù)據(jù)量更少的數(shù)據(jù)或字符串后將此作為該化合物的ID符號(hào)的方法。文檔編號(hào)G06F19/00GK1425159SQ00818519公開日2003年6月18日申請(qǐng)日期2000年11月16日優(yōu)先權(quán)日1999年11月19日發(fā)明者豐田哲郎,板井昭子申請(qǐng)人:株式會(huì)社醫(yī)藥分子設(shè)計(jì)研究所