国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      使用從文檔提取的信息來標(biāo)識(shí)關(guān)系的制作方法

      文檔序號(hào):12364022閱讀:224來源:國知局
      使用從文檔提取的信息來標(biāo)識(shí)關(guān)系的制作方法與工藝

      本申請(qǐng)涉及使用從文檔提取的信息來標(biāo)識(shí)關(guān)系。



      背景技術(shù):

      在其中許多人從事不同項(xiàng)目的大公司內(nèi),公司內(nèi)的人員可以期望標(biāo)識(shí)特定類型的關(guān)系。例如,公司內(nèi)的人員可能期望確定與雇員相關(guān)聯(lián)的角色、項(xiàng)目、客戶、技術(shù)等。舉例而言,當(dāng)技術(shù)公司正在創(chuàng)造需要對(duì)技術(shù)X、Y和Z(例如,機(jī)器學(xué)習(xí)、關(guān)系數(shù)據(jù)庫以及近場(chǎng)通信)的詳細(xì)知悉的產(chǎn)品時(shí),產(chǎn)品經(jīng)理可能期望標(biāo)識(shí)該公司內(nèi)熟悉技術(shù)X、Y和Z的那些雇員。通常,為了查明誰正從事什么技術(shù),產(chǎn)品經(jīng)理可以向公司的至少一部分發(fā)送電子郵件來詢問熟悉技術(shù)X、Y和Z的雇員的姓名。產(chǎn)品經(jīng)理可以隨后查閱對(duì)該電子郵件請(qǐng)求的答復(fù)以標(biāo)識(shí)用于加入該產(chǎn)品團(tuán)隊(duì)的人員。然而,這樣的過程對(duì)于詢問有關(guān)雇員和技術(shù)之間關(guān)系的更多信息的人員以及回復(fù)此類郵件請(qǐng)求的人員兩者都是耗時(shí)的。此外,一些雇員可能不回復(fù)郵件請(qǐng)求,從而導(dǎo)致請(qǐng)求者基于不完備的信息確定關(guān)系。



      技術(shù)實(shí)現(xiàn)要素:

      提供本發(fā)明內(nèi)容以便以簡(jiǎn)化形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念的選集。本發(fā)明內(nèi)容并不旨在標(biāo)識(shí)出所要求保護(hù)的主題的關(guān)鍵特征或必要特征;也不旨在用于確定或限制所要求保護(hù)的主題的范圍。

      一些實(shí)現(xiàn)提供了從各文檔中挖掘關(guān)系信息的技術(shù)和裝置。例如,在一些實(shí)現(xiàn)中,可以接收包括表格的結(jié)構(gòu)化數(shù)據(jù)。可以作出表格的第一欄包括第一類型的數(shù)據(jù)且表格的第二欄包括第二類型的數(shù)據(jù)的確定。表格的第一欄的第一內(nèi)容與表格的第二欄的第二內(nèi)容之間的關(guān)系可以被確定。對(duì)于表格中的單個(gè)行,可以存儲(chǔ)表格的第一部分的第一內(nèi)容和表格的第二部分的第二內(nèi)容之間的關(guān)系以創(chuàng)建所存儲(chǔ)的關(guān)系??梢曰谝粋€(gè)或多個(gè)搜索項(xiàng)來搜索所存儲(chǔ)的關(guān)系??梢? 顯示基于對(duì)所存儲(chǔ)的關(guān)系進(jìn)行搜索的搜索結(jié)果。搜索結(jié)果可以標(biāo)識(shí)哪些項(xiàng)目是特定的人或特定組人易于從事的。

      附圖說明

      參考附圖闡述具體實(shí)施方式。在附圖中,附圖標(biāo)記最左邊的數(shù)字標(biāo)識(shí)該附圖標(biāo)記首次出現(xiàn)的附圖。在不同附圖中使用同一附圖標(biāo)記指示相似或相同的項(xiàng)或特征。

      圖1示出根據(jù)一些實(shí)現(xiàn)的用于挖掘關(guān)系的示例框架。

      圖2是根據(jù)一些實(shí)施例的包括處理結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的示例過程的流程圖。

      圖3是根據(jù)一些實(shí)施例的從結(jié)構(gòu)化數(shù)據(jù)提取關(guān)系的示例過程的流程圖。

      圖4是根據(jù)一些實(shí)施例的包括接收結(jié)構(gòu)化數(shù)據(jù)和一個(gè)或多個(gè)字典的示例過程的流程圖。

      圖5是根據(jù)一些實(shí)施例的包括接收包括表格的結(jié)構(gòu)化數(shù)據(jù)的示例過程的流程圖。

      圖6是根據(jù)一些實(shí)施例的包括接收從文檔提取的結(jié)構(gòu)化數(shù)據(jù)的示例過程的流程圖。

      圖7是根據(jù)一些實(shí)現(xiàn)的示例計(jì)算設(shè)備和環(huán)境的框圖。

      具體實(shí)施方式

      本文中所述的系統(tǒng)和技術(shù)可以被用來從文檔儲(chǔ)存庫提取關(guān)系信息。許多公司使用多個(gè)雇員能訪問的文檔儲(chǔ)存庫以使得文檔能夠(i)被共享,(ii)被修改以供重新使用或改作他用,(iii)被存檔,等等。文檔儲(chǔ)存庫可以被存儲(chǔ)在本地服務(wù)器上、遠(yuǎn)程服務(wù)器上(諸如基于云的存儲(chǔ)設(shè)施)或二者的組合上(例如,具有云備份的本地存儲(chǔ))。文檔儲(chǔ)存庫可以提供各種特征,諸如版本控制、多用戶實(shí)時(shí)協(xié)作、安全控制(例如,基于用戶許可、文檔許可或這二者來選擇訪問),等等。

      存儲(chǔ)在儲(chǔ)存庫中的文檔可以包括多種類型的文檔,諸如,舉例而言,純文本、可兼容文檔、可兼容文檔、可兼容文檔、其他類型的可兼容文檔(例如,富文本格式(RTF)等)、可移植文檔格式(PDF)可兼容文檔、超文本標(biāo)記語言(HTML)文檔、擴(kuò)展標(biāo)記語言(XML)文檔、按另一類文檔格式的文檔,或其任意組合。

      使用數(shù)據(jù)庫或一類協(xié)作文檔管理系統(tǒng)(諸如Collaboration Solutions(協(xié)作解決)或)可以實(shí)現(xiàn)文檔儲(chǔ)存庫。例如,文檔儲(chǔ)存庫可以集成內(nèi)聯(lián)網(wǎng)、內(nèi)容管理和文檔管理。文檔儲(chǔ)存庫可以包括使用與產(chǎn)品套件(諸如Office)緊密集成的共同技術(shù)基礎(chǔ)架構(gòu)的技術(shù)的多目的的集合。除了系統(tǒng)集成、處理集成和工作流自動(dòng)能力以外,文檔儲(chǔ)存庫還可以提供內(nèi)聯(lián)網(wǎng)門戶、文檔和文件管理、協(xié)作、社交網(wǎng)絡(luò)、外聯(lián)網(wǎng)、網(wǎng)站、企業(yè)搜索以及業(yè)務(wù)智能。在一些情況下,文檔儲(chǔ)存庫可以與企業(yè)應(yīng)用軟件(諸如,企業(yè)資源規(guī)劃(EPR)和客戶關(guān)系管理(CRM)軟件)集成。

      每類文檔可以具有對(duì)應(yīng)的解析器。例如,第一解析器可以解析第一類文檔(例如,HTML),第二解析器可以解析第二類文檔(XML)等。每個(gè)解析器可以解析文檔以標(biāo)識(shí)和提取數(shù)據(jù),針對(duì)該數(shù)據(jù)的關(guān)系要被標(biāo)識(shí)。例如,在標(biāo)識(shí)與公司的雇員相關(guān)聯(lián)的項(xiàng)目的情況下,解析器可以查找和提取標(biāo)識(shí)雇員名字的信息和標(biāo)識(shí)雇員正在從事的項(xiàng)目、與雇員相關(guān)聯(lián)的角色(例如,軟件設(shè)計(jì)師、團(tuán)隊(duì)領(lǐng)導(dǎo)、經(jīng)理等等)等的信息。

      在一些情況下,爬行器可以標(biāo)識(shí)儲(chǔ)存庫中新的或經(jīng)修改的文檔,標(biāo)識(shí)每個(gè)該文檔的類型,并向?qū)?yīng)的解析器發(fā)送每個(gè)新的或經(jīng)修改的文檔。爬行器可以是軟件應(yīng)用,其自動(dòng)地(例如,無需人類交互)且周期性地(例如,按預(yù)定間隔)掃描儲(chǔ)存庫中所存儲(chǔ)的文檔并標(biāo)識(shí)出新的、經(jīng)修改的或作標(biāo)記的文檔以供包括。

      文檔可以包括一個(gè)或多個(gè)結(jié)構(gòu)化數(shù)據(jù)(例如,表格)、半結(jié)構(gòu)化數(shù)據(jù)(例如,XML、電子郵件報(bào)頭、JavaScript對(duì)象記法(JSON)元數(shù)據(jù)等),或非結(jié)構(gòu)化數(shù)據(jù)(例如,電子郵件正文等)。解析器可以提取與特定類型的關(guān)系(例如,雇員正在從事哪些項(xiàng)目)相關(guān)的信息并將其轉(zhuǎn)換成特定類型的數(shù)據(jù)結(jié)構(gòu)(例如,表格)。所提取的數(shù)據(jù)可以被各種軟件模塊分析以標(biāo)識(shí)與特定類型的關(guān)系相關(guān)聯(lián)的信息、對(duì)該關(guān)系分類、濾除噪聲(例如,不相關(guān)信息等),對(duì)該關(guān)系 排名,以及存儲(chǔ)該關(guān)系(例如,在數(shù)據(jù)庫中)。一個(gè)或多個(gè)軟件模塊可以包括機(jī)器學(xué)習(xí)算法,諸如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò),等等。機(jī)器學(xué)習(xí)算法可以被用來標(biāo)識(shí)表格中包括關(guān)系相關(guān)信息(例如,項(xiàng)目信息)的列。

      因此,解析器可以被用來從儲(chǔ)存庫中的文檔提取信息。所提取的信息可以與標(biāo)識(shí)特定類型的關(guān)系(例如,雇員及該雇員正從事的一個(gè)或多個(gè)項(xiàng)目之間的關(guān)系)有關(guān)。各種模塊可以被用來標(biāo)識(shí)關(guān)系、濾除任何噪聲、對(duì)關(guān)系排名,并在數(shù)據(jù)庫中存儲(chǔ)關(guān)系。因此,例如公司可以使用數(shù)據(jù)庫來標(biāo)識(shí)哪些雇員專長于特定技術(shù),有關(guān)于特定客戶的經(jīng)驗(yàn)或者其他相關(guān)工作經(jīng)驗(yàn)。例如,軟件公司可以標(biāo)識(shí)專長于機(jī)器學(xué)習(xí)或電信協(xié)議的軟件設(shè)計(jì)師。作為另一示例,專注于知識(shí)產(chǎn)權(quán)的法律事務(wù)所可以找到正對(duì)特定技術(shù)領(lǐng)域進(jìn)行研究的客戶,并且可能期望標(biāo)識(shí)具有撰寫該特定技術(shù)領(lǐng)域(例如,電信軟件、基于云的服務(wù)、半導(dǎo)體、處理器、存儲(chǔ)器存儲(chǔ)等)申請(qǐng)的經(jīng)驗(yàn)的專利代理人??梢詸z索此類信息而無需訴諸于向多個(gè)雇員發(fā)電子郵件來詢問他們哪些雇員具有特定的專長。

      用于挖掘關(guān)系的框架

      圖1示出根據(jù)一些實(shí)現(xiàn)的用于挖掘關(guān)系的示例框架100??蚣?00可以由一個(gè)或多個(gè)計(jì)算設(shè)備或配置有特定的處理器可執(zhí)行指令的其他機(jī)器來執(zhí)行。以下使用如何挖掘公司文檔(例如,企業(yè)文檔)以標(biāo)識(shí)出回答“雇員ABC現(xiàn)在正在從事什么?”這一問題的特定類型的關(guān)系的示例(例如,該雇員正在從事的項(xiàng)目名稱或該雇員正在充當(dāng)?shù)漠?dāng)前角色)來描述框架100。然而,應(yīng)當(dāng)理解框架100還可以被應(yīng)用于挖掘其他類型的關(guān)系信息。關(guān)系信息可以包括在雇員從事項(xiàng)目時(shí)間的期間與該雇員相關(guān)聯(lián)的項(xiàng)目名稱、項(xiàng)目中涉及的技術(shù)、一個(gè)或多個(gè)角色(例如,經(jīng)理、設(shè)計(jì)師、首席開發(fā)者、技術(shù)作者、軟件工程師等)以及與該雇員和項(xiàng)目之間的關(guān)系有關(guān)的其它信息。框架100可以提取關(guān)系信息并且在使用戶能夠執(zhí)行各種操作(包括搜索、檢索以及存儲(chǔ)關(guān)系信息)的數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)中存儲(chǔ)關(guān)系信息。

      圖1中所示的諸模塊和數(shù)據(jù)流示出了示例性實(shí)施例。然而,其他實(shí)施例可以在保持從各文檔中挖掘關(guān)系的功能性的同時(shí)省略諸模塊中的一個(gè)或多個(gè)模塊,組合多個(gè)模塊的功能,將特定模塊分成兩個(gè)或更多個(gè)附加的模塊,改變數(shù) 據(jù)流,作出對(duì)圖1中諸模塊或數(shù)據(jù)流的其他變動(dòng),或者對(duì)其進(jìn)行組合。

      框架100可以包括文檔儲(chǔ)存庫102、一個(gè)或多個(gè)解析器104和關(guān)系挖掘模塊106。使用數(shù)據(jù)庫或一類協(xié)作文檔管理系統(tǒng)(諸如Collaboration Solutions(協(xié)作解決)或)可以實(shí)現(xiàn)文檔儲(chǔ)存庫102。文檔儲(chǔ)存庫102可以包括使用與產(chǎn)品套件(諸如Office)集成的共同技術(shù)基礎(chǔ)架構(gòu)的多目的技術(shù)集合。文檔儲(chǔ)存庫可以提供文檔和文件管理、協(xié)作以及其他功能。文檔儲(chǔ)存庫102可以包括文檔108、地址簿110和爬行器112。儲(chǔ)存在文檔儲(chǔ)存庫102中的文檔108可以包括多種類型的文檔,諸如,純文本、可兼容文檔(例如,RTF等)、PDF可兼容文檔、HTML文檔、XML文檔、按另一類文檔格式的文檔,或其任意組合。在一些情況下,文檔108可包括電子郵件。然而,在其他情況下,由于隱私顧慮,文檔108可以不包括電子郵件。在本文中技術(shù)和系統(tǒng)被描述為用于挖掘不包括電子郵件的文檔的技術(shù)和系統(tǒng)。然而,各實(shí)施例包括針對(duì)關(guān)系信息挖掘包括電子郵件的文檔的技術(shù)和系統(tǒng)。地址簿110可以包括聯(lián)系信息,諸如雇員名稱、雇員別名(例如,昵稱)、雇員職位、雇員地址(例如,電子郵件地址、電話號(hào)碼、即時(shí)消息地址等)、其他雇員相關(guān)信息或其任意組合。爬行器112可以是自動(dòng)地且周期性地掃描文檔108以標(biāo)識(shí)針對(duì)關(guān)系信息要被挖掘的文檔108(諸如新的、經(jīng)修改的或作標(biāo)記的文檔)的軟件應(yīng)用。例如,用戶可以將文檔標(biāo)記為將被包括進(jìn)或排除出關(guān)系挖掘。爬行器112可以為關(guān)系挖掘選擇各文檔108中已經(jīng)被標(biāo)記用于包括的文檔同時(shí)排除已經(jīng)被標(biāo)記用于排除出關(guān)系挖掘的另一文檔。在一些情況下,可以由文檔儲(chǔ)存庫102的創(chuàng)建者提供爬行器112來創(chuàng)建文檔儲(chǔ)存庫102中文檔的搜索索引。在此情況下,可以修改爬行器112向解析器104發(fā)送新的和經(jīng)修改的文檔。

      爬行器112可以向解析器104發(fā)送文檔108的至少一部分。解析器104可以包括第一解析器114到第N解析器116(其中N>1)。解析器104中的每一個(gè)可以處理特定類型的文檔。例如,第一解析器114可以解析可兼容文檔,第二解析器可以解析可兼容文檔,第三解析器可以解析可兼容文檔,第四解析器可以解析PDF可兼容文檔,第五解析器可以解析HTML文檔,等等。解析器104可以提取輸入數(shù)據(jù)116,該輸入數(shù)據(jù) 116用作使用關(guān)系挖掘模塊106來挖掘關(guān)系的輸入。所提取的數(shù)據(jù)120可以包括結(jié)構(gòu)化數(shù)據(jù)(例如,表格)、半結(jié)構(gòu)化數(shù)據(jù)(例如,列表、XML、JSON等)、非結(jié)構(gòu)化數(shù)據(jù)(例如,不具有預(yù)定數(shù)據(jù)模型的數(shù)據(jù)或者不以預(yù)定方式整理的數(shù)據(jù))或其任意組合。在一些情況下,可以發(fā)現(xiàn)特定類型的關(guān)系主要在特定類型的數(shù)據(jù)中,并且解析器104可以標(biāo)識(shí)特定類型的數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù))同時(shí)忽略其他類型的數(shù)據(jù)(例如,非結(jié)構(gòu)化數(shù)據(jù))。例如,可以發(fā)現(xiàn)雇員當(dāng)前正在從事的項(xiàng)目主要在結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)中。在此示例中,解析器104可以被配置成忽略非結(jié)構(gòu)化數(shù)據(jù)。所提取的數(shù)據(jù)120可以包括表格、列表、元數(shù)據(jù)(例如,諸如作者、標(biāo)題、修改日期等與文檔相關(guān)聯(lián)的屬性),以及基于數(shù)據(jù)序列的上下文信息。作為上下文信息的示例,演示的第一頁可以包括演示的標(biāo)題、演示的一個(gè)或多個(gè)作者、作者的職位等。在一些情況下,解析器104可以查找特殊的格式化字符來標(biāo)識(shí)結(jié)構(gòu)化數(shù)據(jù),諸如縮進(jìn)水平、特殊格式化指令等。在一些情況下,解析器104可以將半結(jié)構(gòu)化數(shù)據(jù)(例如,列表和其他類似數(shù)據(jù)結(jié)構(gòu))轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)(例如,表格)。

      解析器104可以首先從地址簿110提取各種字典,諸如第一字典122到第M字典124(其中M>1,M不必等于N)。字典122到124可以包括公司中的人名以及他們對(duì)應(yīng)的角色??梢栽诮馕銎?04提取結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)之前基于地址簿110來確定字典122到124。例如,可以使用活動(dòng)目錄數(shù)據(jù)來編譯人名的字典,而可能的項(xiàng)目名稱的字典可以通過從文檔108提取首字母縮寫詞的單獨(dú)算法來填充。字典122到124可以包括人員字典(例如,雇員名字)、項(xiàng)目名稱字典以及角色字典(例如,諸如軟件設(shè)計(jì)師、技術(shù)作者等與單個(gè)雇員相關(guān)聯(lián)的當(dāng)前角色)。字典122到124可被提取來自地址簿110中的信息。例如,地址簿110可以包括雇員名字和他們的當(dāng)前職位(例如,角色)。所提取的數(shù)據(jù)120和所提取的字典114到116可被用作輸入到關(guān)系挖掘模塊106的輸入數(shù)據(jù)118。

      特征提取模塊126可以從輸入數(shù)據(jù)118提取特征。例如,由特征提取模塊126提取的特征可以包括綱要名稱、特定表格中空單元格與非空單元格之比、特定表格中有差異的單元格和無差異的(indistinct)單元格之比(例如,確定一列中的各值是相同還是不同,例如,如果一列中所有的單元格是有差異的, 則比值為1(最大值)而如果一列中所有的單元格是相同的,則比值為1/n(n為行號(hào),這是最小值))、特定表格中每個(gè)單元格中的行號(hào)、列索引、數(shù)位與字符比(例如主要具有數(shù)位的單元格可以包括日期、價(jià)格或其他數(shù)值量)、

      以大寫字母開頭的文字與以小寫字母開頭的文字之比(例如,項(xiàng)目名稱可以被大寫)、文字與數(shù)字比(例如,具有數(shù)字的單元格可以包括日期、價(jià)格或其他并非名稱、角色、項(xiàng)目名稱的數(shù)值量等)、首字母縮寫詞與非首字母縮寫詞之比(例如,首字母縮寫詞常被用來縮略雇員正在從事的項(xiàng)目)、

      統(tǒng)一資源標(biāo)識(shí)(URI)與非URI之比(例如,URL可以標(biāo)識(shí)項(xiàng)目組的內(nèi)聯(lián)網(wǎng)頁面的位置)、單元格的內(nèi)容是否被包括在字典122到124之一中

      (例如,包括在人員字典中發(fā)現(xiàn)的名稱的表格的列可以指示該列包括雇員名稱,而包括在角色字典中發(fā)現(xiàn)的角色的表格的列可以指示該列包括雇員角色)、標(biāo)題(例如,表格標(biāo)題、節(jié)標(biāo)題、章標(biāo)題等)、非用詞(stopwords)(例如,“and(和)”、“the(該)”等)、其他類型的特征,或其任意組合。當(dāng)然,非用詞可能是取決于語言的,例如對(duì)于一種語言(例如,英語)而言的非用詞可能不同于對(duì)于不同語言(例如,俄語)而言的非用詞。

      由特征提取模塊126提取的特征可以被用作對(duì)一個(gè)或多個(gè)分類器128的輸入以確定(例如,預(yù)測(cè))列是否包括項(xiàng)目名稱、角色、人名等。例如,分類器128可以分類表格的列是否包括雇員名字、角色名稱、項(xiàng)目名稱、日期、描述,等等。分類器128可以使用機(jī)器學(xué)習(xí)算法,諸如邏輯回歸(LR)、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)或其他機(jī)器學(xué)習(xí)算法。分類器128可以在離線訓(xùn)練130期間被訓(xùn)練并隨后執(zhí)行實(shí)時(shí)分類。

      在離線訓(xùn)練130期間,訓(xùn)練數(shù)據(jù)132(例如,先前已經(jīng)被標(biāo)記的數(shù)據(jù))可以被用來執(zhí)行訓(xùn)練134。例如,在一些實(shí)現(xiàn)中,訓(xùn)練134可以包括邏輯回歸(LR)訓(xùn)練。在LR訓(xùn)練中,使用邏輯函數(shù)將描述可能結(jié)果的概率建模成解釋(預(yù)測(cè))變量的函數(shù)。通過估計(jì)概率,邏輯回歸測(cè)量取決于類別的變量和一個(gè)或多個(gè)獨(dú)立變量之間的關(guān)系,該一個(gè)或多個(gè)獨(dú)立變量通常(但非必須)是連續(xù)的。例如,在一個(gè)表格中,一列可以包括項(xiàng)目名稱而多個(gè)其他列可以包括其他信息(例如,團(tuán)隊(duì)成員名、團(tuán)隊(duì)成員的角色、團(tuán)隊(duì)成員的聯(lián)系信箱等)。因此,在五列或六列中可能存在感興趣的一列。因此,分類器128可以包括成本敏感LR分類器, 在該成本敏感LR分類器中錯(cuò)誤預(yù)測(cè)的正結(jié)果可以被給予更大的罰分。當(dāng)然,在其他實(shí)現(xiàn)中,訓(xùn)練134可以包括其他類型的訓(xùn)練而非LR訓(xùn)練。使用訓(xùn)練數(shù)據(jù)132的訓(xùn)練134的結(jié)果可以是創(chuàng)建一個(gè)或多個(gè)模型,諸如已命名實(shí)體識(shí)別(NER)模型136。NER模型136僅用作一類模式的示例。取決于實(shí)現(xiàn),可以使用其他類型的模型而非NER模型136。

      一個(gè)或多個(gè)過濾器138可以從由分類器128分類的特征中濾除噪聲。例如,過濾器138可以包括基于規(guī)則的過濾器并且包括使用黑名單(例如,排除特定數(shù)據(jù))、白名單(例如,包括在白名單中指出的數(shù)據(jù)同時(shí)排除在白名單中沒有包括的其他數(shù)據(jù))或其他類型的基于規(guī)則的過濾器。用于過濾噪聲的規(guī)則的示例可以包括:(i)移除包括日期信息或時(shí)間信息的任何關(guān)系的規(guī)則;以及(ii)如果單元格中的文字被包括在黑名單中,則移除該文字(例如,單元格僅包括黑名單文字)。

      對(duì)于可包括歧義的特定類型的數(shù)據(jù),消歧模塊140可以消除歧義。例如,大公司內(nèi)的雇員名字可能包括具有相似名字的雇員。例如,相似可能是由使用昵稱或縮短名字引起的,其中昵稱或縮短的名字與另一雇員名稱相似或相同。作為另一個(gè)示例,文檔的作者可能在標(biāo)識(shí)雇員正從事特定項(xiàng)目的表格或列表中誤拼寫另一雇員的名字,其中誤拼寫與另一雇員名稱相似或相同。消歧模塊140可以通過查看一個(gè)或多個(gè)關(guān)系來消除歧義,諸如另一雇員(例如,經(jīng)理/主管、同事等)與歧義雇員名稱的關(guān)系、與歧義雇員名稱相關(guān)聯(lián)的角色、與歧義雇員名稱相關(guān)聯(lián)的項(xiàng)目,等等。例如,通過標(biāo)識(shí)與每個(gè)歧義名稱相關(guān)聯(lián)的項(xiàng)目可以消除名稱歧義。舉例而言,John Smith可以被標(biāo)識(shí)為正從事搜索引擎項(xiàng)目,而Jon Smith可以被標(biāo)識(shí)為正從事產(chǎn)品套裝項(xiàng)目。作為另一個(gè)示例,通過標(biāo)識(shí)與每個(gè)歧義名稱相關(guān)聯(lián)的經(jīng)理(或主管)可以消除名稱歧義。舉例而言,John Smith可以被標(biāo)識(shí)為有經(jīng)理Chris Jones,而Jon Smith可以被標(biāo)識(shí)為有經(jīng)理Steve Wilson。作為又一個(gè)示例,通過標(biāo)識(shí)與每個(gè)歧義名稱相關(guān)聯(lián)的同事(例如,同組成員)可以消除名稱歧義。舉例而言,Robert Smith可以被標(biāo)識(shí)為有在相同部門工作的同事Sam Adams,而Rob Smith可以被標(biāo)識(shí)為有同事Dinesh Patel。作為另一個(gè)示例,通過標(biāo)識(shí)與每個(gè)歧義名稱相關(guān)聯(lián)的角色可以消除名稱歧義。舉例而言,John Smith可以被標(biāo)識(shí)為有軟件設(shè)計(jì)師的角色而Jon Smith可以被 標(biāo)識(shí)為有技術(shù)作者的角色。因此,消歧模塊140可以使用各種技術(shù)來標(biāo)識(shí)歧義名稱的身份并消除歧義。類似技術(shù)可以被用來消除針對(duì)正被挖掘的其他類型的關(guān)系的歧義。

      排名模塊142可以排名已經(jīng)基于一個(gè)或多個(gè)準(zhǔn)則標(biāo)識(shí)的關(guān)系。排名模塊142可以被實(shí)現(xiàn)為聚集算法,該聚集算法從一組項(xiàng)目名稱候選(例如,潛在的項(xiàng)目名稱)中選擇項(xiàng)目名稱。可以在執(zhí)行排名之前從文檔108提取該組項(xiàng)目名稱候選。排名模塊142可以被實(shí)現(xiàn)為映射/減少(map/reduce)算法。例如,雇員可以被標(biāo)識(shí)為具有與多個(gè)項(xiàng)目的關(guān)系。可以基于日期來排名關(guān)系,其中更近的關(guān)系導(dǎo)致更高的排名(例如,指示相對(duì)近的項(xiàng)目);而基于雇員在多久之前從事該項(xiàng)目,具有在過去的日期的關(guān)系可以具有較低的排名。例如,可以基于文檔的創(chuàng)建日期、文檔的最后修改日期、與從其提取雇員和項(xiàng)目之間關(guān)系的文檔相關(guān)的其他日期或其任意組合來確定與雇員和該雇員正從事的項(xiàng)目之間關(guān)系相關(guān)聯(lián)的日期。

      經(jīng)排名的關(guān)系144可以被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中,諸如數(shù)據(jù)庫或其他類型的數(shù)據(jù)整理器。數(shù)據(jù)存儲(chǔ)146可以使關(guān)系144被搜索、分類等。例如,召集團(tuán)隊(duì)從事新項(xiàng)目的經(jīng)理可以搜索數(shù)據(jù)存儲(chǔ)146以標(biāo)識(shí)專長于特定技術(shù)領(lǐng)域的雇員,并且可以使用排名來標(biāo)識(shí)在特定技術(shù)領(lǐng)域具有最近經(jīng)驗(yàn)的雇員。

      因此,爬行器112可以在文檔儲(chǔ)存庫102中標(biāo)識(shí)新的且經(jīng)修改的文檔??梢曰诿總€(gè)文檔的類型來解析所標(biāo)識(shí)的文檔,從而產(chǎn)生要被用于關(guān)系挖掘的結(jié)構(gòu)化數(shù)據(jù)。在一些情況下,解析器104可以將半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)??梢詮慕Y(jié)構(gòu)化數(shù)據(jù)提取特征(例如,關(guān)系)并使用分類器128對(duì)特征分類。可以過濾特征以移除噪聲。數(shù)據(jù)的歧義部分可以被消歧。可以基于指定的準(zhǔn)則來對(duì)關(guān)系進(jìn)行排名,并隨后將其存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中。以此方式,可以從文檔中的數(shù)據(jù)挖掘不同實(shí)體間的關(guān)系。例如,可以挖掘企業(yè)文檔以標(biāo)識(shí)哪些項(xiàng)目是雇員已經(jīng)從事的,包括過去的項(xiàng)目和當(dāng)前的項(xiàng)目。

      示例性過程

      在圖2、3、4、5和6的流程圖中,每一個(gè)框表示可以用硬件、軟件或其組合實(shí)現(xiàn)的一個(gè)或多個(gè)操作。在軟件的上下文中,各個(gè)框表示在由一個(gè)或多個(gè) 處理器執(zhí)行時(shí)使處理器執(zhí)行既定操作的計(jì)算機(jī)可執(zhí)行指令。一般而言,計(jì)算機(jī)可執(zhí)行指令包括執(zhí)行特定功能或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、模塊、組件、數(shù)據(jù)結(jié)構(gòu)等。描述各個(gè)框的次序并不旨在被解釋為限制,并且任何數(shù)量的所述操作可以按任何次序和/或并行地組合以實(shí)現(xiàn)各過程。出于討論目的,參考如上所述的架構(gòu)100來描述過程200、300、400、500和600,但其他模型、框架、系統(tǒng)和環(huán)境也可以實(shí)現(xiàn)這些過程。

      文檔處理

      圖2是根據(jù)一些實(shí)現(xiàn)的包括處理結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的示例過程200的流程圖。例如,過程200可以由解析器104執(zhí)行,可以由關(guān)系挖掘模塊106中的各模塊執(zhí)行,或者由這兩者執(zhí)行。因?yàn)樵诙鄶?shù)文檔中,關(guān)系信息的大多數(shù)可以被包括在元數(shù)據(jù)中、半結(jié)構(gòu)化數(shù)據(jù)中以及結(jié)構(gòu)化數(shù)據(jù)中,故而過程200從元數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)提取關(guān)系信息。元數(shù)據(jù)可以包括與文檔相關(guān)聯(lián)的屬性,諸如作者名稱、創(chuàng)建日期、最后修改日期、文檔標(biāo)題等。元數(shù)據(jù)還可以包括演示的第一頁,其包括演示的標(biāo)題和作者。盡管元數(shù)據(jù)是一種形式的機(jī)構(gòu)化數(shù)據(jù),但是通常在文檔正文中找不到元數(shù)據(jù)。元數(shù)據(jù)通常被包括在文檔的屬性(或其他嵌入數(shù)據(jù))內(nèi)或文檔的標(biāo)題頁內(nèi),并因此可以與在文檔的正文中發(fā)現(xiàn)的結(jié)構(gòu)化數(shù)據(jù)被不同地處理。

      在202,可接收一個(gè)或多個(gè)文檔。在204,可處理與文檔相關(guān)聯(lián)的元數(shù)據(jù)。元數(shù)據(jù)可以包括:(i)與文檔相關(guān)聯(lián)的屬性,(ii)演示的第一張幻燈片;以及(iii)包括與文檔相關(guān)聯(lián)的信息的其他位置(location),諸如文檔的標(biāo)題、文檔的作者、文檔的創(chuàng)建日期、文檔的最后修改日期、與文檔相關(guān)聯(lián)的其他信息或其任意組合。例如,可以通過從元數(shù)據(jù)提取文檔的作者和文檔的標(biāo)題來處理元數(shù)據(jù)以標(biāo)識(shí)作者和文檔的標(biāo)題之間的關(guān)系。

      在206,文檔可以被解析以標(biāo)識(shí)半結(jié)構(gòu)化數(shù)據(jù)(例如,列表)和結(jié)構(gòu)化數(shù)據(jù)(例如,表格)。半結(jié)構(gòu)化數(shù)據(jù)可以包括列表,諸如分配列表。例如,針對(duì)一項(xiàng)目的電子郵件分配列表可以標(biāo)識(shí)項(xiàng)目的名稱、項(xiàng)目的成員、項(xiàng)目中每個(gè)成員的角色、其他項(xiàng)目相關(guān)信息或者其任意組合。半結(jié)構(gòu)化數(shù)據(jù)可以行進(jìn)至208,在此半結(jié)構(gòu)化數(shù)據(jù)被轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。例如,列表可以被轉(zhuǎn)換成表格或其他 結(jié)構(gòu)化數(shù)據(jù)。在206所標(biāo)識(shí)的結(jié)構(gòu)化數(shù)據(jù)可以行進(jìn)至210。例如,在圖1中,解析器104可以接收存儲(chǔ)在文檔儲(chǔ)存庫102中的文檔108并解析文檔108以標(biāo)識(shí)并提取元數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)。解析器104可以將半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。舉例而言,在收到文檔之后,第一解析器可以在204處解析文檔以標(biāo)識(shí)元數(shù)據(jù)(例如,文檔的屬性和文檔的第一頁)并提取作者名稱、文檔標(biāo)題和其他信息?;旧吓c204同時(shí),第二解析器可以解析文檔以標(biāo)識(shí)半結(jié)構(gòu)化數(shù)據(jù)(例如,列表等)和結(jié)構(gòu)化數(shù)據(jù)(例如,表格等)。第二解析器可以將半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。

      在210,結(jié)構(gòu)化數(shù)據(jù)(例如,從206到208)被處理以挖掘(例如,標(biāo)識(shí)和提取)關(guān)系信息。在圖3中更詳細(xì)地描述了從結(jié)構(gòu)化數(shù)據(jù)挖掘關(guān)系信息的過程。例如,在圖1中,特征提取模塊126可以提取特征(例如,表格的每個(gè)單元中的文字與數(shù)字比)并且分類器128可以使用特征作為輸入來確定哪一列被預(yù)測(cè)包括項(xiàng)目名稱,哪一列被預(yù)測(cè)包括人名,哪一列被預(yù)測(cè)包括角色名稱,等等。

      在212,從結(jié)構(gòu)化數(shù)據(jù)(例如,從210)和元數(shù)據(jù)(例如,從204)提取的關(guān)系信息可以被過濾以移除噪聲。在214,可存儲(chǔ)關(guān)系。例如,在圖1中,過濾器138可以被用來過濾所標(biāo)識(shí)的關(guān)系以移除噪聲并且經(jīng)過濾的關(guān)系被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中。

      因此,解析器可以從文檔標(biāo)識(shí)并提取元數(shù)據(jù)、半結(jié)構(gòu)化數(shù)和結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)可以被轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以被處理(例如,通過標(biāo)識(shí)和分類關(guān)系)以提取關(guān)系信息。從元數(shù)據(jù)和從結(jié)構(gòu)化數(shù)據(jù)提取的關(guān)系信息可以被過濾并且被存儲(chǔ)以便關(guān)系信息能夠被搜索、存儲(chǔ)等。

      處理結(jié)構(gòu)化數(shù)據(jù)

      圖3是根據(jù)一些實(shí)施例的從結(jié)構(gòu)化數(shù)據(jù)提取關(guān)系的示例過程300的流程圖。過程300可以由關(guān)系挖掘模塊106中的各模塊執(zhí)行,諸如舉例而言,由特征提取模塊126、分類器128或由這兩者。

      在302,可以接收結(jié)構(gòu)化數(shù)據(jù)(例如,表格)。在304,作出結(jié)構(gòu)化數(shù)據(jù)是否基于模板的確定。例如,在項(xiàng)目組內(nèi),雇員可以使用相同的表格模板(例 如,相同的結(jié)構(gòu)化數(shù)據(jù)模板)。基于相同綱要(例如,布局)的表格可以被標(biāo)識(shí)為使用相同的模板。例如,如果一表格遵循與三個(gè)其他表格相同的綱要,則該表格很可能基于與三個(gè)其他表格相同的模板。如果三個(gè)其他表格的綱要先前已經(jīng)被確定,則該綱要可以標(biāo)識(shí)該表格中的哪一列包括雇員名稱且該表格中的哪一列包括項(xiàng)目名稱、角色或其他關(guān)系信息。用于結(jié)構(gòu)化數(shù)據(jù)的模板的綱要可以被標(biāo)識(shí)(例如,通過圖1的解析器104)并被存儲(chǔ)在模板字典306(例如,字典122到124之一)中。

      如果在304使用模板字典306作出結(jié)構(gòu)化數(shù)據(jù)302基于模板的(例如,該模板可以被用來創(chuàng)建結(jié)構(gòu)化數(shù)據(jù)302的結(jié)構(gòu))的確定,則在308處處理基于模板的結(jié)構(gòu)化數(shù)據(jù),并且關(guān)系可以被存儲(chǔ)在214。當(dāng)然,在一些情況下,在存儲(chǔ)關(guān)系之前,可以濾除關(guān)系并執(zhí)行各項(xiàng)(例如,適當(dāng)?shù)拿Q)的消歧。例如,如果結(jié)構(gòu)化數(shù)據(jù)302的綱要與先前提取的綱要匹配,則可以確定已經(jīng)基于模板創(chuàng)建了結(jié)構(gòu)化數(shù)據(jù)302。在這種情況下,因?yàn)榫V要是已知的,可以從結(jié)構(gòu)化數(shù)據(jù)302的行和列提取數(shù)據(jù)而不使用分類器。例如,結(jié)構(gòu)化數(shù)據(jù)302的綱要可以對(duì)應(yīng)于先前提取的綱要,在該先前提取的綱要中第一列包括人名,第二列包括角色名稱且第三列包括項(xiàng)目名稱??梢苑謩e從結(jié)構(gòu)化數(shù)據(jù)302的第一列、第二列和第三列提取人名及其對(duì)應(yīng)的角色和項(xiàng)目,并且存儲(chǔ)關(guān)系“<人名>具有<角色名稱>的角色”及“<人名>從事過<項(xiàng)目名稱>的項(xiàng)目”。

      如果在304作出結(jié)構(gòu)化數(shù)據(jù)302不基于模板的確定,則使用人名字典312作出結(jié)構(gòu)化數(shù)據(jù)是否包括人名的確定。人名字典312可以由解析器104基于對(duì)地址簿110的解析來創(chuàng)建。例如,表格的單元格的內(nèi)容可以與人名字典312的內(nèi)容作比較。如果表格的單元格中的內(nèi)容包括在人名字典312中包括的名字,則該表格包括該單元格的列可以包括人名(例如,雇員)。以此方式,可以使用人名字典312來確定表格中包括人名的列。類似的原理適用于標(biāo)識(shí)其他類型的關(guān)系。例如,為了標(biāo)識(shí)X和Y之間的關(guān)系,可以作出結(jié)構(gòu)化數(shù)據(jù)302是否包括X的確定。如果結(jié)構(gòu)化數(shù)據(jù)302包括X,則可以掃描(例如,解析)結(jié)構(gòu)化數(shù)據(jù)302的剩余部分以確定該結(jié)構(gòu)化數(shù)據(jù)是否包括Y。

      如果結(jié)構(gòu)化數(shù)據(jù)302不包括人名,則過程300可以結(jié)束。如果結(jié)構(gòu)化數(shù)據(jù)302包括人名,則結(jié)構(gòu)化數(shù)據(jù)302可以包括關(guān)系信息,諸如人員的角色或該人 員正從事的項(xiàng)目。

      如果在310作出結(jié)構(gòu)化數(shù)據(jù)包括人名的確定,則過程300行進(jìn)至314,在此使用角色字典316作出結(jié)構(gòu)化數(shù)據(jù)302是否包括人員的角色的確定。例如,在圖1中,解析器104可以從地址簿110提取角色字典。表格的單元格的內(nèi)容可以與角色字典的內(nèi)容作比較以確定該單元格是否包括角色名稱。如果在314作出結(jié)構(gòu)化數(shù)據(jù)302包括人員的角色名稱的確定(例如,通過確定表格的單元格的內(nèi)容被包括在角色字典中),則過程300行進(jìn)至318,在此包括角色的結(jié)構(gòu)化數(shù)據(jù)被處理,并且所產(chǎn)生的關(guān)系信息被存儲(chǔ)在214。例如,雇員和雇員角色之間的關(guān)系(例如,Sam Smith是首席軟件開發(fā)者)可以描述該雇員正在從事什么,從而產(chǎn)生關(guān)系被標(biāo)識(shí)和存儲(chǔ)。在一些實(shí)現(xiàn)中,314可以被省略,例如,響應(yīng)于在310處確定結(jié)構(gòu)化數(shù)據(jù)302包括人名,過程300可以行進(jìn)至320以確定結(jié)構(gòu)化數(shù)據(jù)302是否包括項(xiàng)目名稱。

      如果在314作出結(jié)構(gòu)化數(shù)據(jù)不包括人員角色的確定,則過程300行進(jìn)至320,在此作出結(jié)構(gòu)化數(shù)據(jù)302是否包括項(xiàng)目名稱的確定。例如,可以從表格的每個(gè)單元格提取特征,并且特征(例如,首字母縮寫詞和非首字母縮寫詞之比、文字與數(shù)字比等)可以被用作對(duì)分類器的輸入,該分類器已經(jīng)被訓(xùn)練以預(yù)測(cè)表格中的哪一列(或行)包括項(xiàng)目名稱。舉例而言,分類器可以基于特征來確定(例如,預(yù)測(cè))特定的列(或行)包括項(xiàng)目名稱,例如該列包括的首字母縮略詞多于非首字母縮寫詞,該列包括的字母多于數(shù)字,等等。當(dāng)特征識(shí)別每個(gè)單元格包括的數(shù)字(例如,項(xiàng)目里程碑的日期)多于字母等時(shí),分類器可以確定(例如,預(yù)測(cè))特定的列(或行)不包括項(xiàng)目名稱。如果在320處作出結(jié)構(gòu)化數(shù)據(jù)包括項(xiàng)目名稱的確定,則過程300行進(jìn)至322,在此處理包括人名和項(xiàng)目名稱的結(jié)構(gòu)化數(shù)據(jù)302,并且所產(chǎn)生的關(guān)系信息被存儲(chǔ)在214。例如,雇員和項(xiàng)目之間的關(guān)系(例如,Sam Smith是從事基于圖像的搜索引擎項(xiàng)目的團(tuán)隊(duì)成員)可以描述該雇員正在從事什么,從而產(chǎn)生關(guān)系被標(biāo)識(shí)和存儲(chǔ)。例如,如果在310處表格的單元格的內(nèi)容被包括在人員字典312中,則內(nèi)容被確定為人員的名稱。在320處,作出表格中的其他單元格是否包括項(xiàng)目名稱的確定。如果分類器預(yù)測(cè)表格中的其他單元格包括項(xiàng)目名稱,則人名和項(xiàng)目名稱之間的關(guān)系“<人名>從事<項(xiàng)目名稱>項(xiàng)目”被存儲(chǔ)。如果在320處作出結(jié)構(gòu)化數(shù)據(jù)不 包括項(xiàng)目名稱的確定,則過程300結(jié)束。

      使用人員字典312(從圖1中的地址簿110提取),使得特征提取模塊126和分類器128能夠相對(duì)快速且方便地在結(jié)構(gòu)化數(shù)據(jù)302中標(biāo)識(shí)人員的名稱。在320標(biāo)識(shí)項(xiàng)目名稱可能比較地困難。為了標(biāo)識(shí)結(jié)構(gòu)化數(shù)據(jù)中的哪些部分包括項(xiàng)目名稱,確定結(jié)構(gòu)樹數(shù)據(jù)的綱要可能是有用的。例如,表格的第一列通常標(biāo)識(shí)表格的綱要,因?yàn)榈谝涣锌梢园枋雒恳涣袃?nèi)容的報(bào)頭。因此,綱要可以被用來標(biāo)識(shí)表格中的哪些列包括人名,哪些列包括角色,以及哪些列包括項(xiàng)目名稱。

      由特征提取模塊126提取的用以確定結(jié)構(gòu)化數(shù)據(jù)302是否包括項(xiàng)目名稱(或其他項(xiàng)目相關(guān)信息)的特征可以包括:綱要、綱要名稱、特定表格中空單元格與非空單元格之比、特定表格中有差異的單元格和無差異的單元格之比、

      特定表格中每個(gè)單元格中的行號(hào)、列索引、數(shù)位與字符比(例如主要具有數(shù)位的單元格可以包括日期、價(jià)格或其他數(shù)值量)、以大寫字母開頭的文字與以小寫字母開頭的文字之比(例如,項(xiàng)目名稱可以被大寫)、文字與數(shù)字比(例如,具有數(shù)字的單元格可以包括日期、價(jià)格或其他并非名稱、角色、項(xiàng)目名稱的數(shù)值量等)、首字母縮寫詞與非首字母縮寫詞之比(例如,首字母縮寫詞常被用來縮略雇員正在從事的項(xiàng)目)、統(tǒng)一資源標(biāo)識(shí)(URI)與非URI之比(例如,URL可以標(biāo)識(shí)項(xiàng)目組的內(nèi)聯(lián)網(wǎng)頁面的位置)、單元格中的內(nèi)容是否被包括在字典122到124之一中(例如,包括在人員字典中發(fā)現(xiàn)的名稱的表格的列可以指示該列包括雇員名稱,而包括在角色字典中發(fā)現(xiàn)的角色的表格的列可以指示該列包括雇員角色)、標(biāo)題(例如,表格標(biāo)題、節(jié)標(biāo)題、章標(biāo)題等)、非用詞(例如,“and(和)”、“the(該)”等)、其他類型的特征,或其任何組合。

      過程300示出圖1中的關(guān)系挖掘模塊106如何標(biāo)識(shí)特定關(guān)系,諸如與雇員相關(guān)聯(lián)的角色或者與雇員相關(guān)聯(lián)的項(xiàng)目。當(dāng)然,過程300可以被應(yīng)用以標(biāo)識(shí)其他類型的關(guān)系,諸如X(例如,雇員)和Y(例如,角色)之間的關(guān)系或X(例如,雇員)和Z(例如,項(xiàng)目)之間的關(guān)系。例如,在310,可以作出結(jié)構(gòu)化數(shù)據(jù)302是否包括X的確定。如果結(jié)構(gòu)化數(shù)據(jù)包括X,則在314,可以作出結(jié)構(gòu)化數(shù)據(jù)302是否包括Y的確定。如果結(jié)構(gòu)化數(shù)據(jù)302包括X和Y,則X和 Y之間的關(guān)系可以被存儲(chǔ)。如果結(jié)構(gòu)化數(shù)據(jù)包括X,則在320,可以作出結(jié)構(gòu)化數(shù)據(jù)302是否包括Z的確定。如果結(jié)構(gòu)化數(shù)據(jù)302包括X和Z,則X和Z之間的關(guān)系可以被存儲(chǔ)。

      因此,通過從結(jié)構(gòu)化數(shù)據(jù)提取特征并使用一個(gè)或多個(gè)分類器對(duì)特征分類可以分析文檔以標(biāo)識(shí)關(guān)系。半結(jié)構(gòu)化數(shù)據(jù)在被處理之前可以被轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。解析器可以創(chuàng)建用來標(biāo)識(shí)結(jié)構(gòu)化數(shù)據(jù)的哪些部分包括特定類型信息的多個(gè)字典。所標(biāo)識(shí)的關(guān)系可以被存儲(chǔ)要被搜索、存儲(chǔ)的消息等。標(biāo)識(shí)公司中諸雇員中的每個(gè)雇員正從事的項(xiàng)目是可以從文檔儲(chǔ)存庫中的文檔挖掘的關(guān)系類型的示例。當(dāng)然,使用本文中所述的技術(shù)和系統(tǒng)可以挖掘其他類型的關(guān)系。

      圖4是根據(jù)一些實(shí)施例的包括接收結(jié)構(gòu)化數(shù)據(jù)和一個(gè)或多個(gè)字典的示例過程400的流程圖。例如,過程400可以由圖1中的關(guān)系挖掘模塊106執(zhí)行。

      在402,可接收結(jié)構(gòu)化數(shù)據(jù)和一個(gè)或多個(gè)字典。結(jié)構(gòu)化數(shù)據(jù)和一個(gè)或多個(gè)字典可以提取自一個(gè)或多個(gè)文檔。例如,在圖1中,關(guān)系挖掘模塊106可以接收包括所提取的數(shù)據(jù)120(例如,結(jié)構(gòu)化數(shù)據(jù))和字典122到124的輸入數(shù)據(jù)118。

      在404,作出結(jié)構(gòu)化數(shù)據(jù)是否包括具有第一數(shù)據(jù)類型的第一數(shù)據(jù)的確定。如果在404處作出結(jié)構(gòu)化數(shù)據(jù)不包括第一數(shù)據(jù)類型的確定,則過程結(jié)束。如果在404處作出結(jié)構(gòu)化數(shù)據(jù)包括第一數(shù)據(jù)類型的確定,則過程行進(jìn)至406。在406,作出結(jié)構(gòu)化數(shù)據(jù)是否包括具有第二數(shù)據(jù)類型的第二數(shù)據(jù)的確定。如果在406處作出結(jié)構(gòu)化數(shù)據(jù)不包括第二數(shù)據(jù)類型的確定,則過程結(jié)束。如果在406處作出結(jié)構(gòu)化數(shù)據(jù)包括第二數(shù)據(jù)類型的確定,則過程行進(jìn)至408。在408,確定第一數(shù)據(jù)和第二數(shù)據(jù)之間的關(guān)系。例如,在圖1中,特征提取模塊126可以確定表格的第一列包括人名(例如,通過比較表格的單元格的內(nèi)容與人員字典中的名稱)以及表格的第二列包括人員正從事的項(xiàng)目名稱(例如,分類器可以使用從表格的單元格提取的特征來預(yù)測(cè)第二列包括項(xiàng)目名稱),由此確定關(guān)系,例如名為X(例如,John Smith)的人員正從事名為Y(例如,針對(duì)圖像的搜索引擎)的項(xiàng)目。

      在410,執(zhí)行第一數(shù)據(jù)或第二數(shù)據(jù)中至少一個(gè)的消歧。例如,在圖1中,消歧模塊140可以被用來在結(jié)構(gòu)化數(shù)據(jù)中類似或相同的人名之間進(jìn)行區(qū)分。舉 例而言,可以使用消歧在人名“John Smith”、“Jon Smith”和“Johnny Smith”之間進(jìn)行區(qū)別。

      在412,基于關(guān)系何時(shí)產(chǎn)生將排名與關(guān)系相關(guān)聯(lián)。例如,在圖1中,排名模塊142可以被用來基于每個(gè)關(guān)系何時(shí)產(chǎn)生來排名各關(guān)系。舉例而言,當(dāng)前的關(guān)系比早前的關(guān)系更加相關(guān)并因此當(dāng)前關(guān)系被排名高于先前關(guān)系。例如,在1到10的排名中,當(dāng)前關(guān)系可以具有為10的排名,一年之久的關(guān)系可以具有為9的排名,諸如此類,其中9年或更多年之久的關(guān)系具有為1的排名。

      在414,關(guān)系可以被存儲(chǔ)在包括附加關(guān)系的數(shù)據(jù)庫中。例如,在圖1中,關(guān)系144可以被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中。

      在416,使用一個(gè)或多個(gè)搜索項(xiàng)來執(zhí)行數(shù)據(jù)庫搜索。在418,顯示搜索結(jié)果。例如,在圖7中,搜索引擎720可以被用來搜索關(guān)系144并顯示搜索結(jié)果722。

      因此,解析器可以提取結(jié)構(gòu)化數(shù)據(jù),并將半結(jié)構(gòu)化數(shù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),并將結(jié)構(gòu)化數(shù)據(jù)發(fā)送到關(guān)系挖掘模塊??梢允褂梅诸惼鱽硖崛『头诸愄卣?。例如,表格的每個(gè)單元格的內(nèi)容的特征可以被分類,以標(biāo)識(shí)哪一列包括人名而哪一列包括項(xiàng)目名稱(或角色名稱)。哪些人員正在從事哪些項(xiàng)目的關(guān)系可以被確定。關(guān)系可以被過濾,對(duì)有可能有歧義的數(shù)據(jù)類型執(zhí)行消歧,根據(jù)每個(gè)關(guān)系何時(shí)產(chǎn)生來排名,以及存儲(chǔ)在可搜索的數(shù)據(jù)庫中。

      圖5是根據(jù)一些實(shí)施例的包括接收包括表格的結(jié)構(gòu)化數(shù)據(jù)的示例過程500的流程圖。例如,過程500可以由圖1中的關(guān)系挖掘模塊106執(zhí)行。過程500假設(shè)表格被布置成使得各列被分類,并且處于相同行中意味著某種關(guān)系。然而,應(yīng)當(dāng)理解,在過程500中通過將“行”變成“列”以及將“列”變成“行”過程500可以被應(yīng)用于其中行標(biāo)識(shí)類別而列指示關(guān)系的表格。

      在502,可以從一個(gè)或多個(gè)文檔解析器接收包括表格的結(jié)構(gòu)化數(shù)據(jù)。例如,在圖1中,關(guān)系挖掘模塊106可以接收包括所提取的數(shù)據(jù)120(例如,結(jié)構(gòu)化數(shù)據(jù))和字典122到124的輸入數(shù)據(jù)118。

      在504,作出表格的第一列是否包括第一類型的數(shù)據(jù)的確定。如果在404處作出結(jié)構(gòu)化數(shù)據(jù)不包括第一類型數(shù)據(jù)的確定,則過程結(jié)束。如果在404處作出結(jié)構(gòu)化數(shù)據(jù)包括第一類型數(shù)據(jù)的確定,則過程行進(jìn)至506。在506,作出表 格的第二列是否包括第二類型的數(shù)據(jù)的確定。如果在506處作出結(jié)構(gòu)化數(shù)據(jù)不包括第二類型數(shù)據(jù)的確定,則過程結(jié)束。如果在506處作出結(jié)構(gòu)化數(shù)據(jù)包括第二類型數(shù)據(jù)的確定,則過程行進(jìn)至508。在508,表格的第一欄的第一內(nèi)容與表格的第二欄的第二內(nèi)容之間的關(guān)系被確定。例如,在圖1中,特征提取模塊126和分類器128可以確定表格的第一列包括人名(例如,通過確定單元格的內(nèi)容包括人員字典中所包括的名稱)以及表格的第二列包括人員正從事的項(xiàng)目名稱(例如,分類器基于從表格的單元格提取的特征來預(yù)測(cè)該列包括項(xiàng)目名稱),由此確定名為X(例如,John Smith)的人員和該人員正從事的名為Y(例如,針對(duì)圖像的搜索引擎)的項(xiàng)目之間的關(guān)系,例如關(guān)系“X正在從事Y”。

      在510,對(duì)于表格中的單個(gè)行,可以在數(shù)據(jù)庫中存儲(chǔ)第一列的第一內(nèi)容和第二列的第二內(nèi)容之間的關(guān)系。例如,在圖1中,關(guān)系144可以被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中。

      在512,使用一個(gè)或多個(gè)搜索項(xiàng)來執(zhí)行數(shù)據(jù)庫搜索。在514,顯示搜索結(jié)果。例如,在圖7中,搜索引擎720可以被用來搜索關(guān)系144并顯示搜索結(jié)果722。

      因此,解析器可以提取結(jié)構(gòu)化數(shù)據(jù),并將半結(jié)構(gòu)化數(shù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),并將結(jié)構(gòu)化數(shù)據(jù)發(fā)送到關(guān)系挖掘模塊??梢允褂梅诸惼鱽硖崛『头诸愄卣?。例如,表格的每個(gè)單元格的內(nèi)容的特征可以被分類以標(biāo)識(shí)哪一列包括人名而哪一列包括項(xiàng)目名稱(或角色名稱)。哪些人員正在從事哪些項(xiàng)目的關(guān)系可以被確定。關(guān)系可以被過濾對(duì)有可能有歧義的數(shù)據(jù)類型執(zhí)行消歧,根據(jù)每個(gè)關(guān)系何時(shí)產(chǎn)生來排名,以及存儲(chǔ)在可搜索的數(shù)據(jù)庫中。

      圖6是根據(jù)一些實(shí)施例的包括接收從文檔提取的結(jié)構(gòu)化數(shù)據(jù)的示例過程500的流程圖。例如,過程600可以由圖1中的關(guān)系挖掘模塊106執(zhí)行。

      在602,可以接收從存儲(chǔ)在共享的文檔儲(chǔ)存庫中的文檔提取的結(jié)構(gòu)化數(shù)據(jù)。例如,在圖1中,關(guān)系挖掘模塊106可以接收包括所提取的數(shù)據(jù)120(例如,結(jié)構(gòu)化數(shù)據(jù))和字典122到124的輸入數(shù)據(jù)118。輸入數(shù)據(jù)118可以由解析器104從文檔儲(chǔ)存庫102中的文檔108提取。

      在604,作出結(jié)構(gòu)化數(shù)據(jù)的第一部分是否包括第一數(shù)據(jù)的確定。如果在604處作出結(jié)構(gòu)化數(shù)據(jù)的第一部分不包括第一數(shù)據(jù)的確定,則過程結(jié)束。如果在604 處作出結(jié)構(gòu)化數(shù)據(jù)的第一部分包括第一數(shù)據(jù)的確定,則過程行進(jìn)至606。在606,作出結(jié)構(gòu)化數(shù)據(jù)的第二部分是否包括第二數(shù)據(jù)的確定。如果在606處作出結(jié)構(gòu)化數(shù)據(jù)的第二部分不包括第二數(shù)據(jù)的確定,則過程結(jié)束。如果在606處作出結(jié)構(gòu)化數(shù)據(jù)的第二部分包括第二數(shù)據(jù)的確定,則過程行進(jìn)至608。在608,確定第一數(shù)據(jù)和第二數(shù)據(jù)之間的多個(gè)關(guān)系。例如,在圖1中,特征提取模塊126和分類器128可以確定表格的第一列包括人名(例如,通過確定單元格的內(nèi)容包括人員字典中所包括的名稱)以及表格的第二列包括人員正從事的項(xiàng)目名稱(例如,分類器基于從表格的單元格提取的特征來預(yù)測(cè)該列包括項(xiàng)目名稱),由此確定關(guān)系,例如,名為X(例如,John Smith)的人員正從事的名為Y(例如,針對(duì)圖像的搜索引擎)的項(xiàng)目。

      在610,通過移除噪聲來過濾多個(gè)關(guān)系以創(chuàng)建經(jīng)過濾的關(guān)系。例如,在圖1中,過濾器138可以被用來從經(jīng)分類的特征中移除噪聲(例如,預(yù)測(cè)表格中的哪一列包括項(xiàng)目名稱)。

      在612,基于與經(jīng)過濾的關(guān)系的單個(gè)關(guān)系相關(guān)聯(lián)的日期來排名經(jīng)過濾的關(guān)系。例如,在圖1中,排名模塊142可以被用來基于每個(gè)關(guān)系何時(shí)產(chǎn)生來排名各關(guān)系。舉例而言,當(dāng)前的關(guān)系比早前的關(guān)系更加相關(guān)并因此當(dāng)前關(guān)系被排名高于先前關(guān)系。

      在614,經(jīng)過濾和排名的關(guān)系可以被存儲(chǔ)在數(shù)據(jù)庫中。例如,在圖1中,關(guān)系144可以以圖表索引的形式被存儲(chǔ)在數(shù)據(jù)存儲(chǔ)146中,該圖表索引包括將人名與從其提取關(guān)系的文檔相關(guān)聯(lián)的信息。

      在616,使用一個(gè)或多個(gè)搜索項(xiàng)來執(zhí)行數(shù)據(jù)庫搜索。在616,顯示搜索結(jié)果。例如,在圖7中,搜索引擎720可以被用來搜索關(guān)系144并顯示搜索結(jié)果722。在一些實(shí)現(xiàn)中,所提取的關(guān)系信息可以被顯示在用戶界面(UI)中以使得單個(gè)雇員能夠確認(rèn)一組關(guān)系(例如,該雇員已經(jīng)牽涉的項(xiàng)目)將要與雇員的名稱項(xiàng)目相關(guān)聯(lián)。在一些情況下,經(jīng)理或其他雇員可以使用專長領(lǐng)域的標(biāo)準(zhǔn)化集合來選擇針對(duì)單個(gè)雇員的專長領(lǐng)域。例如,軟件公司可以將已撰寫過軟件代碼的所有雇員的專長領(lǐng)域標(biāo)準(zhǔn)化為“軟件設(shè)計(jì)師”,以啟用一致搜索結(jié)果。沒有標(biāo)準(zhǔn)化,針對(duì)“軟件設(shè)計(jì)師”項(xiàng)的搜索結(jié)果可能不包括“軟件工程師”、“計(jì)算機(jī)程序員”、“軟件開發(fā)者”等等。

      因此,解析器可以提取結(jié)構(gòu)化數(shù)據(jù)并將半結(jié)構(gòu)化數(shù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)并將結(jié)構(gòu)化數(shù)據(jù)發(fā)送到關(guān)系挖掘模塊??梢允褂梅诸惼鱽硖崛『头诸愄卣?。例如,表格的每個(gè)單元格的內(nèi)容的特征可以被分類以標(biāo)識(shí)哪一列包括人名而哪一列包括項(xiàng)目名稱(或角色名稱)。哪些人員正在從事哪些項(xiàng)目的關(guān)系可以被確定。關(guān)系可以被過濾對(duì)有可能有歧義的數(shù)據(jù)類型執(zhí)行消歧,根據(jù)每個(gè)關(guān)系何時(shí)產(chǎn)生來排名,以及存儲(chǔ)在可搜索的數(shù)據(jù)庫中。

      示例計(jì)算設(shè)備和環(huán)境

      圖7示出了可用于實(shí)現(xiàn)此處所描述的模塊和功能的計(jì)算設(shè)備700和環(huán)境的示例配置。計(jì)算設(shè)備700可包括至少一個(gè)處理器702、存儲(chǔ)器704、通信接口706、顯示設(shè)備708、其他輸入/輸出(I/O)設(shè)備710、以及一個(gè)或多個(gè)大容量存儲(chǔ)設(shè)備712,它們能夠諸如經(jīng)由系統(tǒng)總線714或其他合適的連接彼此通信。

      處理器702可以是單個(gè)處理單元或數(shù)個(gè)處理單元,它們都可包括單個(gè)或多個(gè)計(jì)算單元或多個(gè)核。處理器702可被實(shí)現(xiàn)為一個(gè)或多個(gè)微處理器、微型計(jì)算機(jī)、微控制器、數(shù)字信號(hào)處理器、中央處理單元、狀態(tài)機(jī)、邏輯電路、和/或基于操作指令來操縱信號(hào)的任何器件。除其他能力之外,處理器702可被配置成取出并執(zhí)行存儲(chǔ)在存儲(chǔ)器704、大容量存儲(chǔ)設(shè)備712或其他計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)可讀指令。

      存儲(chǔ)器704和大容量存儲(chǔ)設(shè)備712是用于存儲(chǔ)由處理器702執(zhí)行來執(zhí)行上述各種功能的指令的計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例。例如,存儲(chǔ)器704一般包括易失性存儲(chǔ)器和非易失性存儲(chǔ)器(例如,RAM、ROM等)。此外,大容量存儲(chǔ)設(shè)備712一般可包括硬盤驅(qū)動(dòng)器、固態(tài)驅(qū)動(dòng)器、包括外部和可移動(dòng)驅(qū)動(dòng)器在內(nèi)的可移動(dòng)介質(zhì)、存儲(chǔ)卡、閃存、軟盤、光盤(例如,CD、DVD)、存儲(chǔ)陣列、網(wǎng)絡(luò)附連存儲(chǔ)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)等等。存儲(chǔ)器704和大容量存儲(chǔ)設(shè)備712在本文中統(tǒng)稱為存儲(chǔ)器或計(jì)算機(jī)存儲(chǔ)介質(zhì),并且可以是能夠存儲(chǔ)計(jì)算機(jī)可讀、處理器可執(zhí)行程序指令作為計(jì)算機(jī)程序代碼的介質(zhì),計(jì)算機(jī)程序代碼可由作為被配置成執(zhí)行在本文中的實(shí)現(xiàn)中描述的操作和功能的特定機(jī)器的處理器702執(zhí)行。

      計(jì)算設(shè)備700還可包括用于諸如經(jīng)由網(wǎng)絡(luò)、直接連接等與其他設(shè)備交換數(shù)據(jù)的一個(gè)或多個(gè)通信接口706,如以上所討論的。通信接口706可便于各種各 樣網(wǎng)絡(luò)和協(xié)議類型內(nèi)的通信,包括有線網(wǎng)絡(luò)(例如,LAN、電纜等)和無線網(wǎng)絡(luò)(例如,WLAN、蜂窩、衛(wèi)星等)、因特網(wǎng)等等。通信接口706也可提供與諸如存儲(chǔ)陣列、網(wǎng)絡(luò)附連存儲(chǔ)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)等中的外部存儲(chǔ)(未示出)的通信。

      諸如監(jiān)視器等顯示設(shè)備708可被包括在一些實(shí)現(xiàn)中以便向用戶顯示信息和圖像。其他I/O設(shè)備710可以是從用戶接收各種輸入并向用戶提供各種輸出的設(shè)備,并且可包括鍵盤、遙控器、鼠標(biāo)、打印機(jī)、音頻輸入/輸出設(shè)備等等。

      存儲(chǔ)器704可包括根據(jù)本文實(shí)現(xiàn)的基于上下文對(duì)象檢索的模塊和組件。在所圖示是示例中,存儲(chǔ)區(qū)704包括文檔儲(chǔ)存庫102,該文檔儲(chǔ)存庫102包括被解析器104解析的文檔108。由解析器104提取的元數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)可以被關(guān)系挖掘模塊106處理以標(biāo)識(shí)關(guān)系144。

      .存儲(chǔ)器704還可包括一個(gè)或多個(gè)其他模塊716,如操作系統(tǒng)、驅(qū)動(dòng)程序、通信軟件等等。存儲(chǔ)器704還可包括其他數(shù)據(jù)718,如在執(zhí)行上述功能的同時(shí)存儲(chǔ)的數(shù)據(jù)以及其他模塊716所使用的數(shù)據(jù)。存儲(chǔ)區(qū)704可以包括搜索引擎720,該搜索引擎720可以被用來輸入搜索項(xiàng)以搜索所存儲(chǔ)的關(guān)系144并提供搜索結(jié)果722。

      本文所描述的示例系統(tǒng)和計(jì)算設(shè)備僅是適用于某些實(shí)現(xiàn)的示例,并且不旨在對(duì)可實(shí)現(xiàn)本文所描述的過程、組件和特征的環(huán)境、架構(gòu)和框架的使用范圍或功能性范圍提出任何限制。因此,本文的實(shí)現(xiàn)可用于眾多環(huán)境或架構(gòu),并且可以在通用或?qū)S糜?jì)算系統(tǒng)或具有處理能力的其他設(shè)備中實(shí)現(xiàn)。一般而言,參考附圖描述的任何功能都可使用軟件、硬件(例如,固定邏輯電路)或這些實(shí)現(xiàn)的組合來實(shí)現(xiàn)。本文所使用的術(shù)語“模塊”、“機(jī)制”、或“組件”一般表示可被配置成實(shí)現(xiàn)規(guī)定功能的軟件、硬件或軟件和硬件的組合。例如,在軟件實(shí)現(xiàn)的情況下,術(shù)語“模塊”、“機(jī)制”或“組件”可表示當(dāng)在一個(gè)或多個(gè)處理設(shè)備(例如,CPU或處理器)上執(zhí)行時(shí)執(zhí)行指定任務(wù)或操作的程序代碼(和/或聲明型指令)。程序代碼可被存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)器設(shè)備或其他計(jì)算機(jī)存儲(chǔ)設(shè)備中。由此,本文所描述的過程、組件和模塊可由計(jì)算機(jī)程序產(chǎn)品來實(shí)現(xiàn)。

      雖然在圖7中被示為存儲(chǔ)在計(jì)算設(shè)備700的存儲(chǔ)器704中,但文檔儲(chǔ)存庫102、解析器104、關(guān)系挖掘模塊106和關(guān)系144或其各部分可以使用可由計(jì)算 設(shè)備700訪問的任何形式的計(jì)算機(jī)可讀介質(zhì)來實(shí)現(xiàn)。如本文所使用的,“計(jì)算機(jī)可讀介質(zhì)”包括至少兩種類型的計(jì)算機(jī)可讀介質(zhì),即計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì)。

      計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以存儲(chǔ)如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)等信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動(dòng)和不可移動(dòng)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于:RAM、ROM、EEPROM、閃存或其他存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其他光存儲(chǔ)、磁帶盒、磁帶、磁盤存儲(chǔ)或其他磁存儲(chǔ)設(shè)備,或者可用于存儲(chǔ)信息以供計(jì)算設(shè)備訪問的任何其他非傳輸介質(zhì)。

      相反,通信介質(zhì)可在諸如載波之類的已調(diào)制數(shù)據(jù)信號(hào)或其他傳輸機(jī)制中體現(xiàn)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)。如本文所定義的,計(jì)算機(jī)存儲(chǔ)介質(zhì)不包括通信介質(zhì)。

      此外,本公開提供了如在附圖中描述和例示出的各種示例實(shí)現(xiàn)。然而,本公開并不局限于此處所描述和示出的實(shí)現(xiàn),如本領(lǐng)域的技術(shù)人員所知道的那樣,可延伸至其它實(shí)現(xiàn)。在說明書中所引用的“一個(gè)實(shí)現(xiàn)”、“這個(gè)實(shí)現(xiàn)”、“這些實(shí)現(xiàn)”或“一些實(shí)現(xiàn)”意味著所描述的特定特征、結(jié)構(gòu)或特性被包括在至少一個(gè)實(shí)現(xiàn)中,且在說明書中的各個(gè)位置中的這些短語的出現(xiàn)并不需要全部都引用同一實(shí)現(xiàn)。

      結(jié)語

      盡管用結(jié)構(gòu)特征和/或方法動(dòng)作專用的語言描述了該主題,但所附權(quán)利要求書中定義的主題不限于上述具體特征或動(dòng)作。相反,上述具體特征和動(dòng)作是作為實(shí)現(xiàn)權(quán)利要求的示例形式公開的。本公開旨在覆蓋所公開的實(shí)現(xiàn)的任一和所有改編或變型,并且所附權(quán)利要求書不應(yīng)被解釋為限于說明書中所公開的具體實(shí)現(xiàn)。相反,本文檔的范圍完全由所附權(quán)利要求書以及這些權(quán)利要求所擁有的等效技術(shù)方案的完整范圍來確定。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1