国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于本體庫(kù)內(nèi)容的sparql查詢(xún)語(yǔ)句生成系統(tǒng)的制作方法

      文檔序號(hào):8258842閱讀:545來(lái)源:國(guó)知局
      一種基于本體庫(kù)內(nèi)容的sparql查詢(xún)語(yǔ)句生成系統(tǒng)的制作方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明屬于數(shù)據(jù)查詢(xún)技術(shù)領(lǐng)域,具體涉及一種基于本體庫(kù)內(nèi)容的SPARQL (Simple Protocol and RDF Query Language,RDF查詢(xún)語(yǔ)言協(xié)議)查詢(xún)語(yǔ)句生成系統(tǒng)。
      【背景技術(shù)】
      [0002] 隨著科學(xué)技術(shù)的發(fā)展,信息爆炸式的增長(zhǎng)使得按照傳統(tǒng)方式獲取所需知識(shí)變得異 常困難,用戶(hù)往往需要反復(fù)瀏覽重復(fù)的信息或者垃圾信息才能夠得到滿(mǎn)意的答案,語(yǔ)義網(wǎng) 絡(luò)作為一種描述概念與概念之間語(yǔ)義關(guān)聯(lián)的知識(shí)表現(xiàn)形式,能夠提供讓機(jī)器理解的語(yǔ)義關(guān) 聯(lián),從而使得機(jī)器能夠代替人工,進(jìn)行簡(jiǎn)單而繁復(fù)的知識(shí)提取以及便于理解的可視化展示。 當(dāng)前的語(yǔ)義網(wǎng)絡(luò)技術(shù)正在蓬勃發(fā)展,W3C(萬(wàn)維網(wǎng)聯(lián)盟)工作組已經(jīng)針對(duì)語(yǔ)義網(wǎng)絡(luò)技術(shù)制定 了大量的協(xié)議規(guī)范,其中就包括目前廣泛使用的RDF(Resource Description Framework, 資源描述框架)資源描述框架,以及針對(duì)RDF數(shù)據(jù)庫(kù)進(jìn)行規(guī)范化查詢(xún)的語(yǔ)法定義SPARQL。
      [0003] 目前,已經(jīng)有很多國(guó)外的開(kāi)發(fā)者社區(qū)、公司以及政府機(jī)構(gòu)構(gòu)建了大量基于RDF資 源描述框架的三元組知識(shí)庫(kù),比如基于維基百科半結(jié)構(gòu)化內(nèi)容構(gòu)建的DBpedia、基于眾包技 術(shù)構(gòu)建起來(lái)的大規(guī)模知識(shí)庫(kù)FreeBase以及通過(guò)權(quán)威手工編輯的Cyc知識(shí)庫(kù)等等,Linked of Data網(wǎng)站上匯聚了目前已經(jīng)公開(kāi)發(fā)布的數(shù)百個(gè)三元組知識(shí)庫(kù),這些知識(shí)庫(kù)都可以通過(guò) 統(tǒng)一的SPARQL接口進(jìn)行查詢(xún)?cè)L問(wèn)。然而,隨著新三元組的不斷增加,單個(gè)知識(shí)庫(kù)的內(nèi)容 日漸龐大,根據(jù)SPARQL語(yǔ)法的特性,用戶(hù)在查詢(xún)某一個(gè)知識(shí)點(diǎn)的時(shí)候不得不記住復(fù)雜的 URI (Uniform Resource Identifier,統(tǒng)一資源描述符)以及本體schema (公理系統(tǒng))來(lái)對(duì) 知識(shí)庫(kù)進(jìn)行查詢(xún),往往當(dāng)用戶(hù)拼寫(xiě)錯(cuò)誤一個(gè)URI符號(hào)時(shí),會(huì)直接導(dǎo)致獲取不到任何結(jié)果;另 外一方面,在當(dāng)前技術(shù)條件下,用戶(hù)若想查詢(xún)RDF數(shù)據(jù)庫(kù),也不得不首先要了解SPARQL語(yǔ)句 構(gòu)建的語(yǔ)法。因此如何方便用戶(hù)查詢(xún),使得用戶(hù)在使用規(guī)模巨大的知識(shí)庫(kù)時(shí)不必要記住大 量URI拼寫(xiě),同時(shí)也不用考慮本體屬性、類(lèi)型得設(shè)計(jì)而直接通過(guò)自然語(yǔ)言的關(guān)鍵詞來(lái)進(jìn)行 查詢(xún)就成了一項(xiàng)具有挑戰(zhàn)的工作。
      [0004] 傳統(tǒng)的搜索引擎檢索文檔的方案在一定程度上啟發(fā)了我們尋找解決上述問(wèn)題的 方案。如我們所知,傳統(tǒng)搜索引擎能夠高效地在億萬(wàn)級(jí)別數(shù)量規(guī)模的文檔集上進(jìn)行索引,同 時(shí)快速地響應(yīng)用戶(hù)提供的查詢(xún)?cè)~檢索,然而問(wèn)題在于搜索引擎的檢索過(guò)程同樣是基于字符 串的完全匹配,同時(shí)檢索的文檔具有大量的內(nèi)容,這一場(chǎng)景又區(qū)別于需要模糊字符串匹配 以及URI字符串大多短小的當(dāng)前困境。不過(guò)近年來(lái),搜索引擎技術(shù)的進(jìn)一步發(fā)展,推出了查 詢(xún)?cè)~推薦以及糾錯(cuò)這一用戶(hù)友好的關(guān)鍵技術(shù)。充分利用統(tǒng)計(jì)規(guī)律以及字符串改寫(xiě)技術(shù),加 上預(yù)先對(duì)本體schema的處理,以及d3. js (用于網(wǎng)頁(yè)作圖、生成互動(dòng)圖形的JavaScript函 數(shù)庫(kù))等可視化手段,使得構(gòu)建出一個(gè)對(duì)用戶(hù)友好、并能高效利用SPARQL查詢(xún)RDF知識(shí)庫(kù) 的系統(tǒng)成為可能。

      【發(fā)明內(nèi)容】

      [0005] 針對(duì)現(xiàn)有技術(shù)所存在的上述技術(shù)問(wèn)題,本發(fā)明提供了一種基于本體庫(kù)內(nèi)容的 SPARQL查詢(xún)語(yǔ)句生成系統(tǒng),能夠方便對(duì)本體庫(kù)的Schema不熟悉或者不了解SPARQL語(yǔ)法的 用戶(hù)對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)。
      [0006] -種基于本體庫(kù)內(nèi)容的SPARQL查詢(xún)語(yǔ)句生成系統(tǒng),包括在線模塊和離線模塊;其 中:
      [0007] 所述的在線模塊用于為用戶(hù)提供查詢(xún)編輯界面和結(jié)果展示界面,實(shí)時(shí)生成SPARQL 查詢(xún)語(yǔ)句,并展示最終的查詢(xún)結(jié)果;
      [0008] 所述的離線模塊用于更新服務(wù)內(nèi)容,對(duì)本體庫(kù)中的部分URI字符串進(jìn)行索引。
      [0009] 所述的離線模塊對(duì)本體庫(kù)中的部分URI字符串進(jìn)行索引的具體實(shí)現(xiàn)過(guò)程如下: [0010] 1. 1準(zhǔn)備好符合規(guī)范的RDF三元組數(shù)據(jù);
      [0011] 1. 2讀取所述的RDF三元組數(shù)據(jù),從中提取需要索引的URI字符串,對(duì)URI字符串 進(jìn)行數(shù)據(jù)清洗;
      [0012] 1. 3將步驟1. 1中的RDF三元組數(shù)據(jù)存儲(chǔ)到提供SPARQL查詢(xún)端點(diǎn)的圖數(shù)據(jù)庫(kù)中, 將步驟1. 2中清洗保留下來(lái)的URI字符串分類(lèi)別進(jìn)行切片截取以得到URI字符串切片后的 倒排索引,并進(jìn)一步為倒排索引的URI字符串提供檢索接口;
      [0013] 1. 4根據(jù)步驟1. 2中清洗保留下來(lái)的URI字符串創(chuàng)建字符串轉(zhuǎn)換規(guī)則庫(kù),進(jìn)一步提 供字符串轉(zhuǎn)換規(guī)則庫(kù)的自定義轉(zhuǎn)換接口。
      [0014] 所述的步驟1. 2中提取關(guān)于label、type、property、sameAs這四類(lèi)URI字符串, 并對(duì)這四類(lèi)URI字符串進(jìn)行數(shù)據(jù)清洗。
      [0015] 所述的步驟1. 3中切片截取的具體實(shí)現(xiàn)方式為:將清洗保留下來(lái)的URI字符串分 類(lèi)別按照n-gram滑動(dòng)窗口截取之后利用Trie樹(shù)數(shù)據(jù)結(jié)構(gòu)創(chuàng)建倒排索引。
      [0016] 所述的步驟1. 4中創(chuàng)建字符串轉(zhuǎn)換規(guī)則庫(kù)的具體實(shí)現(xiàn)方式為:利用步驟1. 2清洗 過(guò)程中得到的sameAs信息直接進(jìn)行哈希存儲(chǔ),另外利用所述的自定義轉(zhuǎn)換接口為開(kāi)發(fā)者 輸入特定的轉(zhuǎn)換規(guī)則。
      [0017] 所述的在線模塊為用戶(hù)提供查詢(xún)編輯界面,實(shí)時(shí)生成SPARQL查詢(xún)語(yǔ)句并展示最 終查詢(xún)結(jié)果的具體實(shí)現(xiàn)過(guò)程如下:
      [0018] 2. 1采用d3. js可視化控件創(chuàng)建用戶(hù)編輯的圖形化界面,該圖形化界面提供節(jié)點(diǎn) 編輯、連接節(jié)點(diǎn)的邊編輯以及對(duì)節(jié)點(diǎn)和邊加入自然語(yǔ)言標(biāo)簽的編輯;其中節(jié)點(diǎn)或邊的自然 語(yǔ)言標(biāo)簽有以下兩種模式,這兩種模式與SPARQL的兩種綁定對(duì)應(yīng)一致:
      [0019] a.查詢(xún)模式,代表要查詢(xún)節(jié)點(diǎn)的信息,對(duì)應(yīng)SPARQL的未知變量;
      [0020] b.綁定URI模式,用以描述節(jié)點(diǎn)或邊,對(duì)應(yīng)SPARQL查詢(xún)中的已知URI ;
      [0021] 2. 2后臺(tái)的檢索接口用于響應(yīng)b模式的字符串檢索;應(yīng)用所述的字符串轉(zhuǎn)換規(guī)則 庫(kù)的轉(zhuǎn)換規(guī)則,將用戶(hù)編輯的自然語(yǔ)言標(biāo)簽轉(zhuǎn)換成URI字符串,進(jìn)一步對(duì)自然語(yǔ)言標(biāo)簽及 其轉(zhuǎn)換后URI字符串的切片,利用所述的倒排索引進(jìn)行檢索,得到對(duì)應(yīng)的URI列表并進(jìn)行合 并,統(tǒng)計(jì)URI字符串的出現(xiàn)次數(shù),然后將在合并后列表中出現(xiàn)次數(shù)為top-K的URI字符串返 回給前臺(tái)圖形化界面以進(jìn)行展示,K為大于1的自然數(shù);
      [0022] 2. 3在前臺(tái)圖形化界面上用戶(hù)對(duì)于每一個(gè)b模式的自然語(yǔ)言標(biāo)簽從top-K中選擇 一個(gè)最為合適的URI字符串之后點(diǎn)擊查詢(xún),后臺(tái)響應(yīng)前臺(tái)傳輸?shù)挠脩?hù)編輯圖中的節(jié)點(diǎn)-邊 描述集合,通過(guò)結(jié)合部分filter信息,生成最終的SPARQL查詢(xún)語(yǔ)句,進(jìn)一步與圖數(shù)據(jù)庫(kù)交 互,查詢(xún)到結(jié)果返回。
      [0023] 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下有益技術(shù)效果:
      [0024] (1)本發(fā)明降低了 RDF數(shù)據(jù)庫(kù)查詢(xún)難度,用戶(hù)可以不必要了解具體的數(shù)據(jù)庫(kù)中具 體內(nèi)容,不必要知道原始數(shù)據(jù)的本體設(shè)計(jì),從而通過(guò)自然語(yǔ)言的標(biāo)簽來(lái)獲取具體的URI ;
      [0025] (2)本發(fā)明便于用戶(hù)描述查詢(xún)意圖以及方便用戶(hù)設(shè)計(jì)查詢(xún),用戶(hù)不需要了解具體 的查詢(xún)語(yǔ)句語(yǔ)法(適用于但不僅限于SPARQL),僅僅是通過(guò)編輯圖形,進(jìn)而查詢(xún)RDF數(shù)據(jù) 庫(kù);
      [0026] (3)本發(fā)明將圖數(shù)據(jù)庫(kù)的使用者與圖數(shù)據(jù)庫(kù)的建設(shè)者隔離,減少圖數(shù)據(jù)庫(kù)的建設(shè) 者在建設(shè)圖數(shù)據(jù)庫(kù)的過(guò)程中需要考慮的諸多因素;
      [0027] (4)本發(fā)明的B/S架構(gòu)設(shè)計(jì)可以作為進(jìn)一步設(shè)計(jì)分布式的應(yīng)用的基礎(chǔ),便于擴(kuò)展。
      【附圖說(shuō)明】
      [0028] 圖1為本發(fā)明SPARQL查詢(xún)語(yǔ)句生成系統(tǒng)的系統(tǒng)架構(gòu)圖。
      [0029] 圖2為本發(fā)明SPARQL查詢(xún)語(yǔ)句生成系統(tǒng)的工作流程示意圖。
      【具體實(shí)施方式】
      [0030] 為了更為具體地描述本發(fā)明,下面結(jié)合附圖及【具體實(shí)施方式】對(duì)本發(fā)明的技術(shù)方案 進(jìn)行詳細(xì)說(shuō)明。
      [0031] 如圖1所示,本發(fā)明基于本體庫(kù)內(nèi)容的SPARQL查詢(xún)語(yǔ)句生成的系統(tǒng),包括在線 響應(yīng)模塊和離線預(yù)處理模塊,其中在線模塊由客戶(hù)端使用界面和服務(wù)器分析、生成查詢(xún)接 口組成,離線預(yù)處理模塊主要有數(shù)據(jù)清洗組件和字符串檢索組件;客戶(hù)端是采用d3. js可 視化展示技術(shù)構(gòu)建的編輯界面,服務(wù)端采用JavaServlet技術(shù),包括了字符串轉(zhuǎn)換模塊, Top-K相似字符串檢索模塊,以及結(jié)合用戶(hù)最終的選擇,將相應(yīng)的圖的節(jié)點(diǎn)-邊字符串描 述,
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1