專(zhuān)利名稱(chēng):生成語(yǔ)義網(wǎng)絡(luò)的分層可視化的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)處理技術(shù),特別涉及利用計(jì)算機(jī)對(duì)語(yǔ)義網(wǎng)絡(luò)進(jìn)行分層可視化處理的技術(shù)。
背景技術(shù):
語(yǔ)義網(wǎng)絡(luò)(semantic network)是在人工智能和知識(shí)工程中使用的一種重要知識(shí)表示方法,被廣泛地用來(lái)定義和描述領(lǐng)域知識(shí)。一般語(yǔ)義網(wǎng)絡(luò)由結(jié)點(diǎn)和弧(連接)組成,其中節(jié)點(diǎn)表示事件和概念,而弧表示節(jié)點(diǎn)之間的關(guān)系。圖1A示出了一個(gè)可視化的語(yǔ)義網(wǎng)絡(luò)的例子,在其中包括多個(gè)概念(由圖中的三角形、正方形、五邊形和多邊形等節(jié)點(diǎn)表示),以及概念之間的連接(由圖中的連線表示)。
語(yǔ)義網(wǎng)絡(luò)具有以下的優(yōu)點(diǎn)1,有較強(qiáng)的表達(dá)能力,它可以表示謂詞邏輯中的二元關(guān)系,并且如果將多元關(guān)系轉(zhuǎn)換為二元關(guān)系,也可以用語(yǔ)義網(wǎng)絡(luò)表示;2,語(yǔ)義網(wǎng)絡(luò)對(duì)于知識(shí)的表示具有直觀、清晰的特點(diǎn),而且程序可以對(duì)它的直接搜索、操縱其中的數(shù)據(jù)。目前,語(yǔ)義網(wǎng)絡(luò)已被廣泛用于基于知識(shí)的計(jì)算機(jī)系統(tǒng)中,例如,企業(yè)組織結(jié)構(gòu)管理、智能搜索引擎、和專(zhuān)家系統(tǒng)等。
但是,由于顯示器屏幕的限制,語(yǔ)義網(wǎng)絡(luò)中的內(nèi)容量可能會(huì)超過(guò)一個(gè)屏幕可以清晰顯示的范圍。以往通過(guò)將顯示的圖像、文字縮小到可以在一屏中容納下,然后再根據(jù)用戶的選擇區(qū)域進(jìn)行放大截取,來(lái)處理這種情況。但是,這樣在縮小顯示時(shí),由于無(wú)法看清顯示的文字,因此不便于操作。而且,由于對(duì)于重要的和不重要的概念或者關(guān)系,一起同比例的縮小,用戶很難挑選希望的內(nèi)容進(jìn)行逐級(jí)的和漸進(jìn)的瀏覽。
發(fā)明內(nèi)容
為了解決以上描述的現(xiàn)有技術(shù)中的問(wèn)題,根據(jù)本發(fā)明的一個(gè)方面,提供了一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)(hierarchy model)的方法,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,所述方法包括根據(jù)所述語(yǔ)義網(wǎng)絡(luò)中所述多個(gè)概念的連接關(guān)系,確定所述概念之間的相似性;以及將相似性高的概念逐一合并,從而形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種瀏覽語(yǔ)義網(wǎng)絡(luò)的方法,所述方法包括利用前面所述生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,生成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu);根據(jù)用戶的選擇,顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的相應(yīng)層次描述的內(nèi)容。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,所述裝置包括概念相似性計(jì)算單元,用于根據(jù)所述語(yǔ)義網(wǎng)絡(luò)中所述多個(gè)概念的連接關(guān)系,確定所述概念之間的相似性;概念合并單元,用于將相似性高的概念合并;層次形成單元,用于通過(guò)概念合并單元逐級(jí)地形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種語(yǔ)義網(wǎng)絡(luò)的瀏覽器,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,其特征在于,所述瀏覽器包括前面所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置;圖形轉(zhuǎn)換單元,用于將由所述生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置生成的可視化層次結(jié)構(gòu)轉(zhuǎn)換為圖形方式進(jìn)行顯示;層次切換單元,用于根據(jù)用戶的選擇,切換所述層次結(jié)構(gòu)的各個(gè)層次描述并控制所述圖形轉(zhuǎn)換單元進(jìn)行顯示。
相信通過(guò)以下結(jié)合附圖對(duì)本發(fā)明具體實(shí)施方式
的說(shuō)明,能夠使人們更好地了解本發(fā)明上述的特點(diǎn)、優(yōu)點(diǎn)和目的。
圖1A展示了一個(gè)可視化的語(yǔ)義網(wǎng)絡(luò)的例子,圖1B和1C展示了根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法生成的語(yǔ)義網(wǎng)絡(luò)可視化層次結(jié)構(gòu)(hierarchy model)各層次描述的例子;圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法的流程圖;圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例的瀏覽語(yǔ)義網(wǎng)絡(luò)的方法的流程圖;圖4是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置的方塊圖;以及圖5是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義網(wǎng)絡(luò)瀏覽器的方塊圖。
具體實(shí)施例方式
下面就結(jié)合附圖對(duì)本發(fā)明的各個(gè)優(yōu)選實(shí)施例進(jìn)行詳細(xì)的說(shuō)明。
生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法本發(fā)明提供了一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法。為了更好地理解本申請(qǐng),在描述本發(fā)明的實(shí)施例之前,首先對(duì)于其中用到的一些術(shù)語(yǔ)進(jìn)行說(shuō)明。
概念集合(concept set)是一個(gè)語(yǔ)義集合C={c1,...,cn},其中C中的每個(gè)元素是一個(gè)特定的語(yǔ)義對(duì)象,被稱(chēng)作概念或概念項(xiàng)目,例如,概念集合的元素可以是人名、地名等等。
關(guān)系集合(relation set)關(guān)系集合R={r1,...,rm}的每個(gè)元素是一個(gè)特定的謂詞(關(guān)系類(lèi)型)以確定兩個(gè)概念項(xiàng)目之間的語(yǔ)義連接,被稱(chēng)作關(guān)系項(xiàng)目或關(guān)系類(lèi)型,例如,關(guān)系集合的元素的例子可以是“上下級(jí)關(guān)系”、“夫妻關(guān)系”等等。
三元組(triple)一個(gè)三元組t=(subject,predicate,object,w),其中subject,object∈C,predicate∈R,可以被看作一個(gè)兩邊各有一個(gè)節(jié)點(diǎn)的有方向的鏈接,每一個(gè)由三元組體現(xiàn)的連接可以被看作是關(guān)系集合中相應(yīng)關(guān)系類(lèi)型的一個(gè)關(guān)系實(shí)例。其中,w是“定義權(quán)重”代表相應(yīng)三元組的重要性或者可靠性,是在建立語(yǔ)義網(wǎng)絡(luò)時(shí),由用戶輸入的或者通過(guò)計(jì)算得到的,在本實(shí)施例中,w取值為0到1之間。
語(yǔ)義網(wǎng)絡(luò)(semantic network)由三元組的集合構(gòu)成,S={t1,...,tk}。由于每個(gè)三元組可以被看作在兩端具有兩個(gè)節(jié)點(diǎn)的一個(gè)有向連接,并且多個(gè)三元組可以共用一個(gè)相同的概念項(xiàng)目,因此基于一個(gè)三元組集合,可以生成一個(gè)有向圖(directed graph),被稱(chēng)作語(yǔ)義網(wǎng)絡(luò)。
相鄰概念集合(Neighbor concept set)由語(yǔ)義網(wǎng)絡(luò)S中所有與c相關(guān)聯(lián)的概念組成的集合。對(duì)于一個(gè)給定的概念項(xiàng)目c,其相鄰概念集合為NC(c)={nc1,...,ncm|i≠j⇒nci≠ncj,∀nci⇒∃t∈S,]]>((subject(t)=nci∩object(t)=c)∪(subject(t)=c∩object(t)=nci)=true)}相鄰概念向量(neighbor concept vector)是表示一個(gè)概念c與所述語(yǔ)義網(wǎng)絡(luò)中的其它概念的連接關(guān)系的向量。如果概念集合中有N個(gè)概念項(xiàng)目,將概念集合中的每個(gè)概念項(xiàng)目作為N維向量空間中的一個(gè)分量,則根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以按照以下原則計(jì)算N維相鄰概念向量v(c)對(duì)于v(c)的一個(gè)分量,如果其對(duì)應(yīng)的概念項(xiàng)目與c具有連接,即,在這兩個(gè)概念之間存在一個(gè)三元組,則使用對(duì)應(yīng)的三元組的權(quán)重作為該維的值;如果在這兩個(gè)概念之間存在多個(gè)三元組,則取這些三元組中最大權(quán)重作為該維的值;如果在這兩個(gè)概念之間沒(méi)有三元組,則將該維的值設(shè)為0。進(jìn)而,當(dāng)三元組中沒(méi)有包含權(quán)重時(shí),也可以是,如果在這兩個(gè)概念之間存在三元組,則將該維的值設(shè)為1或者是三元組的個(gè)數(shù);如果在這兩個(gè)概念之間沒(méi)有三元組,則將該維的值設(shè)為0。
關(guān)系類(lèi)型特征向量(feature vector of relation type),是表示一個(gè)關(guān)系類(lèi)型r在一個(gè)語(yǔ)義網(wǎng)絡(luò)中的特征的向量。如果該語(yǔ)義網(wǎng)絡(luò)包含N個(gè)概念,則一個(gè)關(guān)系類(lèi)型特征向量v(r)是一個(gè)2*N維向量v(r)=[ws1,ws2,...,wsN,wo1,wo2,...woN]。前面N個(gè)分量與各個(gè)概念作為該關(guān)系類(lèi)型r的所有關(guān)系實(shí)例的主語(yǔ)(subject)的情況對(duì)應(yīng),后面N個(gè)分量與各個(gè)概念作為該關(guān)系類(lèi)型r的所有關(guān)系實(shí)例的賓語(yǔ)(object)的情況對(duì)應(yīng)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,每個(gè)分量的值可以利用詞頻(term-frequency)來(lái)計(jì)算,即,對(duì)應(yīng)的概念在語(yǔ)義網(wǎng)絡(luò)中作為關(guān)系類(lèi)型r的主語(yǔ)或賓語(yǔ)出現(xiàn)的次數(shù)。
圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法的流程圖。如圖2所示,首先步驟201,根據(jù)語(yǔ)義網(wǎng)絡(luò)中概念的連接關(guān)系確定概念之間的相似性。具體地,為每個(gè)概念計(jì)算相鄰概念向量v(c),并根據(jù)計(jì)算出的相鄰概念向量確定概念之間的相似性。
在本說(shuō)明書(shū)中后附的偽代碼片段1示例性地展示了根據(jù)兩個(gè)概念項(xiàng)目的相鄰概念向量v(c1)、v(c2)確定相似性的算法。該算法中,先判斷兩個(gè)概念項(xiàng)目是否相鄰,如果不相鄰則返回0,如果相鄰則返回兩個(gè)向量之間夾角的余弦,cos(wi,wj)=wi·wj|wi|×|wj|.]]>本發(fā)明并不限于代碼片段1的算法,也可以利用其他方式來(lái)表示兩個(gè)概念項(xiàng)目的相似性。
接著在步驟205,將相似性高的概念逐一合并直到一個(gè)預(yù)定數(shù)量,作為可視化層次結(jié)構(gòu)的一級(jí)。在本說(shuō)明書(shū)中后附的偽代碼片段2示例性地展示了根據(jù)相似性將概念項(xiàng)目逐一合并直到一個(gè)預(yù)定數(shù)量的算法。
該算法中,首先取出語(yǔ)義網(wǎng)絡(luò)中的全部三元組,然后利用前面計(jì)算相似性的方法找到相似性最高的概念對(duì)(a,b),其中a和b是屬于一個(gè)三元組的兩個(gè)概念項(xiàng)目,接著創(chuàng)建一個(gè)新概念項(xiàng)目c,將a和b合并為c,并且將所有包含a或b的三元組更新,將a、b換為c。循環(huán)執(zhí)行該合并過(guò)程,直到概念項(xiàng)目減少到一個(gè)預(yù)定的數(shù)量m。在此,預(yù)定數(shù)量m是層次結(jié)構(gòu)中該級(jí)中希望保留的概念的數(shù)量,可以由用戶指定或者由系統(tǒng)根據(jù)語(yǔ)義網(wǎng)絡(luò)中概念和關(guān)系實(shí)例(或者三元組的數(shù)量)計(jì)算出來(lái),后面將詳細(xì)描述可視化層次結(jié)構(gòu)的級(jí)數(shù)和每級(jí)合并時(shí)的預(yù)訂數(shù)量m的計(jì)算方式。
接著在步驟210,判斷是否需要進(jìn)行下一層的合并,如果需要?jiǎng)t以剛剛合并得到的一層作為基礎(chǔ),返回繼續(xù)進(jìn)行相似性確定和合并(步驟201和205);如果判斷為不需要進(jìn)行下一層合并,則進(jìn)行到步驟215,由通過(guò)合并得到的各級(jí)和原始語(yǔ)義網(wǎng)絡(luò)構(gòu)成可視化層次結(jié)構(gòu)。
在本實(shí)施例中,可視化層次結(jié)構(gòu)的級(jí)數(shù)和每個(gè)級(jí)中所包含的概念或者三元組(關(guān)系實(shí)例)的數(shù)量可以由用戶按照自己的喜好來(lái)設(shè)定,或者預(yù)先設(shè)定為不同的模式由用戶選擇,也可以根據(jù)顯示屏幕每屏可以顯示的實(shí)體(概念項(xiàng)目節(jié)點(diǎn)和關(guān)系連接)的數(shù)量以及語(yǔ)義網(wǎng)絡(luò)中概念項(xiàng)目和關(guān)系實(shí)例的數(shù)量自動(dòng)地計(jì)算得出。例如,假設(shè)語(yǔ)義網(wǎng)絡(luò)中包含N1個(gè)概念項(xiàng)目和N2個(gè)關(guān)系實(shí)例,并且一頁(yè)屏幕可以顯示M1個(gè)概念項(xiàng)目結(jié)點(diǎn)和M2個(gè)關(guān)系連接,則生成的可視化層次結(jié)構(gòu)的級(jí)數(shù)k可以通過(guò)以下的公式來(lái)計(jì)算層次k滿足M1+M12+···+M1k≤N1]]>M2+M22+···+M2k≤N2]]>即,k=max(logM1(N1+1)(M1-1)+M1M1+1,logM2(N2+1)(M2-1)+M2M2+1)]]>(式1)相應(yīng)地,每一級(jí)的概念項(xiàng)目數(shù)量可以為mi=max(M1i,M2i),(i=1···k)]]>(式2)當(dāng)然,也可以以其它任何本領(lǐng)域技術(shù)人員可以想到的方法來(lái)計(jì)算層次結(jié)構(gòu)的級(jí)數(shù)和各級(jí)包含的概念項(xiàng)目數(shù)量。
采用以上描述的本實(shí)施例的方法,可以根據(jù)語(yǔ)義網(wǎng)絡(luò)本身包含的特征信息為其生成可視化層次結(jié)構(gòu)。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例,在根據(jù)語(yǔ)義網(wǎng)絡(luò)中概念的連接關(guān)系確定概念之間的相似性的步驟(圖2的步驟201)之前,首先由用戶提供感興趣的關(guān)系類(lèi)型作為主關(guān)系類(lèi)型(primary relation type)。然后,根據(jù)語(yǔ)義網(wǎng)絡(luò)中的每個(gè)關(guān)系類(lèi)型與該主關(guān)系類(lèi)型的相似性,為每個(gè)關(guān)系類(lèi)型指定一個(gè)優(yōu)先系數(shù)(ranking value)。在本說(shuō)明書(shū)中后附的偽代碼片段3示例性地展示了根據(jù)兩個(gè)關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量v(r1)、v(r2)確定相似性的算法。
然后,在根據(jù)語(yǔ)義網(wǎng)絡(luò)中概念的連接關(guān)系確定概念之間的相似性的步驟中,更具體地,在為每個(gè)概念計(jì)算相鄰概念向量v(c)時(shí),將三元組的權(quán)重和優(yōu)先系數(shù)的乘積作為每個(gè)分量的值,例如,對(duì)于v(c)的一個(gè)分量,如果其對(duì)應(yīng)的概念項(xiàng)目與c具有連接,即,在這兩個(gè)概念之間存在一個(gè)三元組,則使用對(duì)應(yīng)的三元組的權(quán)重和該關(guān)系類(lèi)型的優(yōu)先系數(shù)的乘積作為該維的值;如果在這兩個(gè)概念之間存在多個(gè)三元組,則取這些三元組中最大權(quán)重和該關(guān)系類(lèi)型的優(yōu)先系數(shù)的乘積為該維的值;如果在這兩個(gè)概念之間沒(méi)有三元組,則將該維的值設(shè)為0。
可替代地,當(dāng)三元組中沒(méi)有記錄權(quán)重時(shí),也可以是,如果在這兩個(gè)概念之間存在三元組,則將該維的值設(shè)為相應(yīng)關(guān)系類(lèi)型的優(yōu)先系數(shù)或者是三元組的個(gè)數(shù)乘以相應(yīng)關(guān)系類(lèi)型的優(yōu)先系數(shù)(多個(gè)的情況);如果在這兩個(gè)概念之間沒(méi)有三元組,則將該維的值設(shè)為0。
瀏覽語(yǔ)義網(wǎng)絡(luò)的方法在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種瀏覽語(yǔ)義網(wǎng)絡(luò)的方法。圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例的瀏覽語(yǔ)義網(wǎng)絡(luò)的方法的流程圖。
如圖3所示,首先在步驟301,利用前面描述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法為要瀏覽的語(yǔ)義網(wǎng)絡(luò)生成可視化層次結(jié)構(gòu)。
然后在步驟305,確定現(xiàn)實(shí)的中央概念(節(jié)點(diǎn))。在用戶瀏覽語(yǔ)義網(wǎng)絡(luò)的過(guò)程中,用戶可以選擇一個(gè)希望瀏覽的節(jié)點(diǎn)或一個(gè)區(qū)域,然后進(jìn)行放大或縮小。本步驟可以根據(jù)用戶的選擇來(lái)確定中央概念(節(jié)點(diǎn)),也可以在用戶剛剛開(kāi)始瀏覽或者沒(méi)有選擇節(jié)點(diǎn)或區(qū)域時(shí),自動(dòng)地確定一個(gè)中央概念節(jié)點(diǎn)。在此,確定中央概念節(jié)點(diǎn)的方式,本發(fā)明沒(méi)有特別的限制,例如可以是語(yǔ)義網(wǎng)絡(luò)顯示的中央位置的節(jié)點(diǎn),或者可視化層次結(jié)構(gòu)中最簡(jiǎn)化一層的一個(gè)節(jié)點(diǎn)等。
接著在步驟310,判斷用戶是選擇放大(更詳細(xì))還是選擇縮小(更簡(jiǎn)化)。如果用戶選擇放大(更詳細(xì)),則進(jìn)行步驟315,切換顯示可視化層次結(jié)構(gòu)的更詳細(xì)的一級(jí)(下一級(jí));如果用戶選擇縮小(更簡(jiǎn)化),則進(jìn)行步驟320,切換顯示可視化層次結(jié)構(gòu)的更簡(jiǎn)化的一級(jí)(上一級(jí))。
在步驟315和320之后都進(jìn)行到步驟325,以前面確定的中央概念為中心進(jìn)行顯示。在切換顯示層次結(jié)構(gòu)時(shí),有可能會(huì)出現(xiàn)前面確定的中央概念在本級(jí)中沒(méi)有了,例如由于a、b被合并為節(jié)點(diǎn)c時(shí)。這種情況下,需要將相關(guān)的概念結(jié)點(diǎn)(a、b、c相關(guān))作為中心進(jìn)行顯示。另外,當(dāng)該級(jí)的內(nèi)容超出顯示范圍時(shí),還需要對(duì)超出部分進(jìn)行截取。
采用以上描述的本實(shí)施例的方法,可以利用語(yǔ)義網(wǎng)絡(luò)其本身的特征信息為生成可視化層次結(jié)構(gòu),從而克服較大規(guī)模的語(yǔ)義網(wǎng)絡(luò)在屏幕上瀏覽的困難。由于這種層次結(jié)構(gòu)是依據(jù)語(yǔ)義網(wǎng)絡(luò)本身的特征形成的,因此能夠保證真實(shí)的概括歸納原語(yǔ)義網(wǎng)絡(luò),而不需要用戶人工的操作。并且如果結(jié)合上用戶指定的主關(guān)系類(lèi)型,還可以是層次結(jié)構(gòu)更符合用戶的需求,更有針對(duì)性。
生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置。圖4是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置的方塊圖。
如圖4所示,生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置400,包括概念相似性計(jì)算單元401,用于根據(jù)語(yǔ)義網(wǎng)絡(luò)中概念的連接關(guān)系,確定概念之間的相似性;概念合并單元403,用于將相似性高的概念合并;層次形成單元406,用于通過(guò)概念合并單元逐級(jí)地形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
進(jìn)而,生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置400,還包括相鄰概念向量計(jì)算單元402,用于計(jì)算概念的相鄰概念向量,概念相似性計(jì)算單元401可以利用相鄰概念向量計(jì)算概念之間的相關(guān)性,關(guān)于相鄰概念向量和概念相似性計(jì)算的方法前面已經(jīng)進(jìn)行了說(shuō)明這里不再重復(fù)描述;層次計(jì)算單元405,用于根據(jù)原語(yǔ)義網(wǎng)絡(luò)中的概念及關(guān)系實(shí)例的量和屏幕的最大容量來(lái)計(jì)算將要生成的層次結(jié)構(gòu)的級(jí)數(shù)和每級(jí)中概念的數(shù)量,其計(jì)算方法前面也已經(jīng)進(jìn)行了說(shuō)明這里不再重復(fù)描述。
進(jìn)而,生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置400,還包括關(guān)系類(lèi)型相似性計(jì)算單元404,用于計(jì)算用戶指定的主關(guān)系類(lèi)型和語(yǔ)義網(wǎng)絡(luò)中的關(guān)系類(lèi)型的相似性,并且相鄰概念向量計(jì)算單元在計(jì)算相鄰概念向量時(shí)也將關(guān)系類(lèi)型相似性考慮在內(nèi);關(guān)系類(lèi)型特征向量計(jì)算單元407,用于計(jì)算所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量,該關(guān)系類(lèi)型特征向量中的每個(gè)分量是與所述語(yǔ)義網(wǎng)絡(luò)中每個(gè)概念對(duì)應(yīng)、根據(jù)與該概念相關(guān)聯(lián)的該關(guān)系類(lèi)型的連接實(shí)例計(jì)算出來(lái)的。關(guān)于關(guān)系類(lèi)型特征向量和計(jì)算相鄰概念向量時(shí)也將關(guān)系類(lèi)型相似性考慮在內(nèi)的方法前面已經(jīng)進(jìn)行了說(shuō)明在此不再重復(fù)。
采用本實(shí)施例的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置400可以實(shí)施前面描述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu),并且可以根據(jù)用戶指定的主關(guān)系類(lèi)型,有針對(duì)性地進(jìn)行概念合并。
語(yǔ)義網(wǎng)絡(luò)瀏覽器在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種語(yǔ)義網(wǎng)絡(luò)瀏覽器。圖5是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義網(wǎng)絡(luò)瀏覽器的方塊圖。
如圖5所示,語(yǔ)義網(wǎng)絡(luò)瀏覽器500包括前面實(shí)施例中描述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,在本實(shí)施例中簡(jiǎn)稱(chēng)為層次結(jié)構(gòu)生成裝置400;層次結(jié)構(gòu)緩存503,用于臨時(shí)保存由層次結(jié)構(gòu)生成裝置400生成的可視化層次結(jié)構(gòu);圖形轉(zhuǎn)換單元505,用于將由層次結(jié)構(gòu)生成裝置生成的可視化層次結(jié)構(gòu)以圖形方式顯示給用戶,具體地說(shuō),圖形轉(zhuǎn)換單元505接受后面描述的層次切換單元504和中心確定單元502的控制,將層次結(jié)構(gòu)的適當(dāng)層次和適當(dāng)位置顯示給用戶;層次切換單元504,用于根據(jù)用戶的選擇,切換層次結(jié)構(gòu)的各個(gè)級(jí)并控制所述圖形轉(zhuǎn)換單元進(jìn)行顯示;中心確定單元,用于確定切換所述層次結(jié)構(gòu)的級(jí)后將被顯示的中心概念節(jié)點(diǎn)。關(guān)于如何響應(yīng)用戶操作切換顯示層次結(jié)構(gòu)的各個(gè)層次和如何確定中心概念節(jié)點(diǎn),前面已經(jīng)進(jìn)行了描述在此不再重復(fù)。
采用本實(shí)施例的語(yǔ)義網(wǎng)絡(luò)瀏覽器500可以實(shí)施前面描述的瀏覽語(yǔ)義網(wǎng)絡(luò)的方法,生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu),利用語(yǔ)義網(wǎng)絡(luò)其本身的特征為生成可視化層次結(jié)構(gòu),從而克服較大規(guī)模的語(yǔ)義網(wǎng)絡(luò)在屏幕上瀏覽的困難。由于這種層次結(jié)構(gòu)是依據(jù)語(yǔ)義網(wǎng)絡(luò)本身的特征形成的,因此能夠保證真實(shí)的概括歸納原語(yǔ)義網(wǎng)絡(luò),而不需要用戶人工的操作。
本發(fā)明的上述生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置、語(yǔ)義網(wǎng)絡(luò)瀏覽器以及它們各自的組成部分可以以硬件和軟件方式實(shí)現(xiàn),并且根據(jù)需要可以和其他裝置結(jié)合,例如,可以實(shí)現(xiàn)在個(gè)人計(jì)算機(jī)、筆記本計(jì)算機(jī)、掌上型計(jì)算機(jī)、PDA、文字處理機(jī)等各種帶有計(jì)算功能的設(shè)備上。
以上雖然通過(guò)一些示例性的實(shí)施例對(duì)本發(fā)明的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法及裝置、瀏覽語(yǔ)義網(wǎng)絡(luò)的方法和語(yǔ)義網(wǎng)絡(luò)瀏覽器進(jìn)行了詳細(xì)的描述,但是以上這些實(shí)施例并不是窮舉的,本領(lǐng)域技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi)實(shí)現(xiàn)各種變化和修改。因此,本發(fā)明并不限于這些實(shí)施例,本發(fā)明的范圍僅由所附權(quán)利要求為準(zhǔn)。
偽代碼片段1Algorithm 1calculate the similarity between two concept items in semantic network.
(算法1計(jì)算語(yǔ)義網(wǎng)絡(luò)中兩個(gè)概念項(xiàng)目之間的相似性)Sim(c1,c2){NC2=NC(c2);If(c1not in NC2)return 0;return(cos(v(c1),v(c2));}偽代碼片段2Algorithm 2clustering on semantic network S,there are n concept elements in S,clusterthem into m nodes,where m<n(算法2對(duì)語(yǔ)義網(wǎng)絡(luò)進(jìn)行合并,在S中有n個(gè)概念,將它們合并到m個(gè)節(jié)點(diǎn),其中m<n)<pre listing-type="program-listing">Clustering(S,m){Get all triples in S; (取出S中的所用三元組;)Number=triple number;while(Number>m){calculate the similarity of subjects and objects of all triples;(計(jì)算全部三元組的主語(yǔ)和賓語(yǔ)的相似性;)find the most similar pair(a,b),where a and b are concept items of a specific triple;(找到最相似的概念對(duì)(a,b),其中a和b是屬于一個(gè)三元組的兩個(gè)概念項(xiàng)目;)create a new concept item c;//the name of c is the combination of the names of a andb(創(chuàng)建一個(gè)新的概念項(xiàng)目c;//c的名稱(chēng)是a和b名稱(chēng)的組合)merge nodes a,b to node c;(將節(jié)點(diǎn)a,b合并到節(jié)點(diǎn)c;)update those triples which contain a or b as one of their components(subject orobject);(更新那些包含a,b作為其組成部分(主語(yǔ)或賓語(yǔ))的三元組;)//replace a,b with c;(//用c替換a,b;)Number--;} }</pre>
偽代碼片段3Algorithm 3calculate the similarity between two relation types in semantic network.(算法3計(jì)算語(yǔ)義網(wǎng)絡(luò)中兩個(gè)關(guān)系類(lèi)型之間的相似性)Sim(r1,r2){return(cos(v(r1)),v(r2));}
權(quán)利要求
1.一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,其特征在于,所述方法包括根據(jù)所述語(yǔ)義網(wǎng)絡(luò)中所述多個(gè)概念的連接關(guān)系,確定所述概念之間的相似性;以及將相似性高的概念逐一合并,從而形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
2.根據(jù)權(quán)利要求1所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,確定所述概念之間的相似性的步驟包括計(jì)算每個(gè)所述概念的相鄰概念向量,該向量表示該概念與所述語(yǔ)義網(wǎng)絡(luò)中的其它概念的連接關(guān)系;以及根據(jù)兩個(gè)所述概念的相鄰概念向量之間的夾角,計(jì)算所述概念之間的相似性。
3.根據(jù)權(quán)利要求2所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,根據(jù)兩個(gè)所述概念的相鄰概念向量之間的夾角計(jì)算所述概念之間的相似性的步驟包括利用兩個(gè)所述概念的相鄰概念向量的點(diǎn)積,計(jì)算它們之間的夾角,夾角越小則兩個(gè)所述概念的相似性越大。
4.根據(jù)權(quán)利要求1所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,將相似性強(qiáng)的概念逐一合并從而形成所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的步驟,包括將由一個(gè)關(guān)系實(shí)例連接的相似性最大的兩個(gè)概念合并;以及重復(fù)上述將兩個(gè)概念合并的步驟,直到剩下一個(gè)預(yù)定數(shù)量的概念,形成所述可視化層次結(jié)構(gòu)的一層。
5.根據(jù)權(quán)利要求4所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,將相似性強(qiáng)的概念逐一合并從而形成所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的步驟,進(jìn)一步包括重復(fù)上述將兩個(gè)概念合并的步驟和形成所述可視化層次結(jié)構(gòu)的一級(jí)的步驟,從而形成多級(jí)的層次結(jié)構(gòu)。
6.根據(jù)權(quán)利要求4所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,所述將兩個(gè)概念合并的步驟,包括創(chuàng)建一個(gè)新的概念代替所述兩個(gè)概念;將所述兩個(gè)概念合并為所述新的概念;以及用所述新的概念更新與所述兩個(gè)概念相關(guān)聯(lián)的關(guān)系實(shí)例。
7.根據(jù)權(quán)利要求2所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,所述計(jì)算所述每個(gè)概念的相鄰概念向量的步驟包括以所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)概念作為一個(gè)維,如果與該被計(jì)算向量的概念之間有關(guān)系實(shí)例存在則分量為1,如果沒(méi)有則分量為0。
8.根據(jù)權(quán)利要求2所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,每個(gè)所述關(guān)系實(shí)例指定了連接的權(quán)重,所述計(jì)算所述每個(gè)概念的相鄰概念向量的步驟包括以所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)概念作為一個(gè)維,當(dāng)與被計(jì)算向量的該概念之間有關(guān)系實(shí)例存在時(shí)則根據(jù)該關(guān)系實(shí)例的權(quán)重計(jì)算分量,當(dāng)沒(méi)有關(guān)系實(shí)例存在時(shí)則分量為0。
9.根據(jù)權(quán)利要求2所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,由用戶指定了主關(guān)系類(lèi)型,所述計(jì)算所述每個(gè)概念的相鄰概念向量的步驟包括計(jì)算所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)關(guān)系類(lèi)型與所述用戶指定的主關(guān)系類(lèi)型的相似性;以所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)概念作為一個(gè)維,當(dāng)與該被計(jì)算向量的概念之間有關(guān)系實(shí)例存在時(shí)則根據(jù)該關(guān)系實(shí)例的權(quán)重和上述關(guān)系類(lèi)型的相似性計(jì)算分量,當(dāng)沒(méi)有關(guān)系實(shí)例存在時(shí)則分量為0。
10.根據(jù)權(quán)利要求8所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,其特征在于,計(jì)算所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)關(guān)系類(lèi)型與用戶指定的主關(guān)系類(lèi)型的相似性的步驟包括計(jì)算所述語(yǔ)義網(wǎng)絡(luò)中的該關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量,所述關(guān)系類(lèi)型特征向量中的每個(gè)分量是與所述語(yǔ)義網(wǎng)絡(luò)中每個(gè)概念對(duì)應(yīng)的、根據(jù)與該概念相關(guān)聯(lián)的該關(guān)系類(lèi)型的關(guān)系實(shí)例計(jì)算出來(lái)的;以及根據(jù)該關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量與所述用戶指定的主關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量之間的夾角,計(jì)算所述關(guān)系類(lèi)型與所述用戶指定的主關(guān)系類(lèi)型之間的相似性。
11.一種瀏覽語(yǔ)義網(wǎng)絡(luò)的方法,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,其特征在于,所述方法包括利用權(quán)利要求1~10所述生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,生成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu);以及根據(jù)用戶的選擇,顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的相應(yīng)層次描述的內(nèi)容。
12.根據(jù)權(quán)利要求11所述的瀏覽語(yǔ)義網(wǎng)絡(luò)的方法,其特征在于,所述顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的相應(yīng)級(jí)的內(nèi)容的步驟,包括確定顯示的中央概念;當(dāng)用戶選擇放大時(shí),顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的更詳細(xì)一級(jí)的內(nèi)容,并以上述確定的中央概念為中心;以及當(dāng)用戶選擇縮小時(shí),顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的更簡(jiǎn)單一級(jí)的內(nèi)容,并以上述確定的中央概念為中心。
13.根據(jù)權(quán)利要求12所述的瀏覽語(yǔ)義網(wǎng)絡(luò)的方法,其特征在于,所述顯示所述語(yǔ)義網(wǎng)絡(luò)的可視化的層次結(jié)構(gòu)的相應(yīng)級(jí)的內(nèi)容的步驟,還包括當(dāng)所述中央概念在將被顯示的級(jí)中不存在時(shí),以該中央概念的相關(guān)概念為中心進(jìn)行顯示。
14.一種生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,其特征在于,所述裝置包括概念相似性計(jì)算單元,用于根據(jù)所述語(yǔ)義網(wǎng)絡(luò)中所述多個(gè)概念的連接關(guān)系,確定所述概念之間的相似性;概念合并單元,用于將相似性高的概念合并;以及層次形成單元,用于通過(guò)概念合并單元逐級(jí)地形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
15.根據(jù)權(quán)利要求14所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,其特征在于,還包括相鄰概念向量計(jì)算單元,用于計(jì)算概念的相鄰概念向量,該相鄰概念向量表示該概念與所述語(yǔ)義網(wǎng)絡(luò)中的每個(gè)概念的連接關(guān)系;其中,所述概念相似性計(jì)算單元利用上述相鄰概念向量計(jì)算概念之間的相關(guān)性。
16.根據(jù)權(quán)利要求15所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,其特征在于,所述概念相似性計(jì)算單元,由兩個(gè)所述概念的相鄰概念向量的點(diǎn)積計(jì)算它們之間的夾角,夾角越小則兩個(gè)所述概念的相似性越大。
17.根據(jù)權(quán)利要求14所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,其特征在于,還包括層次計(jì)算單元,用于根據(jù)原語(yǔ)義網(wǎng)絡(luò)中的內(nèi)容量和屏幕的最大容量來(lái)計(jì)算將要生成的層次結(jié)構(gòu)的級(jí)數(shù)和每級(jí)中概念的數(shù)量。
18.根據(jù)權(quán)利要求14所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,其特征在于,還包括關(guān)系類(lèi)型相似性計(jì)算單元,用于計(jì)算用戶指定的主關(guān)系類(lèi)型和所述語(yǔ)義網(wǎng)絡(luò)中的關(guān)系類(lèi)型的相似性。
19.根據(jù)權(quán)利要求18所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置,其特征在于,還包括關(guān)系類(lèi)型特征向量計(jì)算單元,用于計(jì)算所述語(yǔ)義網(wǎng)絡(luò)中的關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量,該關(guān)系類(lèi)型特征向量中的每個(gè)分量是與所述語(yǔ)義網(wǎng)絡(luò)中每個(gè)概念對(duì)應(yīng)的、根據(jù)與該概念相關(guān)聯(lián)的該關(guān)系類(lèi)型的連接實(shí)例計(jì)算出來(lái)的;其中,所述關(guān)系類(lèi)型相似性計(jì)算單元,根據(jù)一個(gè)關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量與所述用戶指定的主關(guān)系類(lèi)型的關(guān)系類(lèi)型特征向量之間的夾角,計(jì)算所述關(guān)系類(lèi)型與用戶指定的關(guān)系類(lèi)型之間的相似性。
20.一種語(yǔ)義網(wǎng)絡(luò)的瀏覽器,所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,其特征在于,所述瀏覽器包括權(quán)利要求14~19所述的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置;圖形轉(zhuǎn)換單元,用于將由所述生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的裝置生成的可視化層次結(jié)構(gòu)轉(zhuǎn)換為圖形方式進(jìn)行顯示;以及層次切換單元,用于根據(jù)用戶的選擇,切換所述層次結(jié)構(gòu)的各個(gè)層次描述并控制所述圖形轉(zhuǎn)換單元進(jìn)行顯示。
21.根據(jù)權(quán)利要求20所述的語(yǔ)義網(wǎng)絡(luò)的瀏覽器,其特征在于,還包括中心確定單元,用于確定切換所述層次結(jié)構(gòu)的級(jí)后將被顯示的中心概念節(jié)點(diǎn)。
全文摘要
本發(fā)明提供了生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法和裝置、瀏覽語(yǔ)義網(wǎng)絡(luò)的方法以及語(yǔ)義網(wǎng)絡(luò)瀏覽器。所述語(yǔ)義網(wǎng)絡(luò)包括多個(gè)概念和多個(gè)用于連接兩個(gè)概念之間的關(guān)系實(shí)例,本發(fā)明的生成語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)的方法,包括根據(jù)所述語(yǔ)義網(wǎng)絡(luò)中所述多個(gè)概念的連接關(guān)系,確定所述概念之間的相似性;以及將相似性高的概念逐一合并,從而形成所述語(yǔ)義網(wǎng)絡(luò)的可視化層次結(jié)構(gòu)。
文檔編號(hào)G06F7/00GK1658234SQ200410004288
公開(kāi)日2005年8月24日 申請(qǐng)日期2004年2月18日 優(yōu)先權(quán)日2004年2月18日
發(fā)明者劉世霞, 蘇中, 潘越, 張俐 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司