專利名稱:用于導(dǎo)航電子文本的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本公開涉及用于電子文本導(dǎo)航的系統(tǒng)和方法。
背景技術(shù):
電子書,或者電子-書,為文本和基于圖片的出版物,在其上以數(shù)字形式制作,以數(shù)字形式出版,且在電腦或者其它電子設(shè)備上可讀。電子-書通常在專用的硬件設(shè)備上閱讀,如電子-書閱讀器或者電子-書設(shè)備。個人電腦,移動設(shè)備,如智能手機(jī),和其它合適的也能被用于電子-書閱讀的設(shè)備。
通常,當(dāng)在一本電書中讀很長或者很復(fù)雜的電子文本時,用戶可能失去前面故事情節(jié)元素的蹤跡或者可能忘記角色或者對象。該問題對于跨越系列小說的長篇故事可能會更糟糕,因?yàn)閬碜韵盗兄兄跋盗袟l目的故事情節(jié)元素和實(shí)體能頻繁影響接下來小說的發(fā)展。至少對于該原因,有必要提供用于輔助使用者在導(dǎo)航電子文本時的系統(tǒng)和方法。
發(fā)明內(nèi)容
該發(fā)明內(nèi)容被提供以簡明的形式介紹`概念的選擇其在下面將進(jìn)一步詳細(xì)描述。該摘要并不旨在區(qū)分所主張的主題物的關(guān)鍵特征或者基本特征,也不打算用它來限定所要求主體物的范圍。本發(fā)明公開為用于導(dǎo)航電子文本的系統(tǒng)和方法。根據(jù)本發(fā)明的一個方面,可能包括在電子文本內(nèi)確定文本子群的一種方法。該方法可以同樣包括在所述文本子群內(nèi)選擇文本種子。進(jìn)一步的,該方法可以包括在所述文本種子以及不包括所述選擇的文本種子的相鄰的一或多個文本子群中確定一相似關(guān)系(例如,一語義關(guān)系)。該方法可以同樣包括將所述文本種子與基于所述相似關(guān)系的相鄰一或多文本子群結(jié)合以創(chuàng)造一文本集群。根據(jù)本發(fā)明的另一方面,可能包括接收用于搜索一電子文本的搜索條件的一方法。進(jìn)一步的,該方法可以包括在所述電子文本內(nèi)確定文本子群。該方法同樣可以包括確定,對于每個文本子群,在所述搜索條件與所述文本子群之間一相似關(guān)系。進(jìn)一步的,該方法可以包括呈現(xiàn),對于每個文本子群,在所述文本子群與所述搜索條件之間的代表所述相似關(guān)系的一圖片。根據(jù)本發(fā)明另一方面,可能包括在電子文本內(nèi)的文本子群之間確定一使用者非線性導(dǎo)航。該方法可以同樣包括鏈接所述文本子群響應(yīng)以確定所述使用者非線性導(dǎo)航在所述文本子群之間。根據(jù)本發(fā)明另一方面,包括在一電子文本內(nèi)確定一當(dāng)前用戶位置的一方法。所述方法也可以包括確定對應(yīng)于所述當(dāng)前使用者位置的一當(dāng)前文本子群。進(jìn)一步的,該方法可以包括在第一顯示區(qū)顯示,對應(yīng)于所述當(dāng)前文本子群的所述電子文本的一部分。該方法同樣包括在第二顯示區(qū)顯示,置于所述當(dāng)前文本子群之前的一或多個相關(guān)文本子群被定位。進(jìn)一步的,該方法可以包括在第三顯示區(qū)顯示,置于所述當(dāng)前文本子群之后的一或多個相關(guān)文本子群被定位。根據(jù)本發(fā)明另一方面,可以包括接收用于搜索一電子文本的搜索條件。進(jìn)一步的,該方法可以包括在所述電子文本內(nèi)確定文本子群。該方法同樣可以包括確定,為每個文本子群,在所述搜索條件和所述文本子群之間的一相似關(guān)系。進(jìn)一步的,該方法可以包括呈現(xiàn),為每個文本子群,在所述文本子群和所述搜索條件之間的代表所述相似關(guān)系的一圖片。根據(jù)本發(fā)明另一方面,可以包括在一電子文本內(nèi)確定文本子群的一方法。該方法可以同樣包括在所述文本子群的一個內(nèi)選擇一文本種子。進(jìn)一步的,該方法可以包括在所述文本種子以及不包括所述選擇的文本種子的相鄰文本子群的一或多個之間確定一相似關(guān)系(例如,一詞義關(guān)系)。該方法可以同樣包括將所述文本種子與基于所述相似關(guān)系的相鄰文本子群的一或多個結(jié)合以創(chuàng)造一文本集群。根據(jù)本發(fā)明另一方面,可以包括基于每個文本子群內(nèi)內(nèi)容的一相似關(guān)系(例如,一詞義關(guān)系)在一電子文本內(nèi)確定文本子集的一方法。該方法同樣也包括確定,為每個文本子群,在所述文本子群內(nèi)容和一或多個其它文本子集內(nèi)容之間另一相似關(guān)系。進(jìn)一步的,所述方法可以包括鏈接,為每個文本子群,所述文本子群到基于所述其它相似關(guān)系的其它一或多個文本子群。根據(jù)本發(fā)明另一方面,該方法可以包括在電子文本內(nèi)的文本子群之間確定一用戶非線性導(dǎo)航。所述方法也包括鏈接所述文本子群響應(yīng)以確定所述文本子群之間的所述用戶非線性導(dǎo)航。根據(jù)本發(fā)明另一方面,可以包括在一電子文本內(nèi)確定一當(dāng)前用戶位置的一方法。所述方法可以同樣包括確定對應(yīng)于所述當(dāng)前用戶位置的一當(dāng)前文本子群。進(jìn)一步的,所述方法可以包括在第一區(qū)域顯示,對應(yīng)于所述當(dāng)前文本子群的所述電子文本的一部分。所述方法可以同樣包括在第二區(qū)域顯示,置于所述當(dāng)前文本子群之前的一或多個相關(guān)文本子群。進(jìn)一步的,所述方法可·以包括在第三區(qū)域顯示,置于所述當(dāng)前文本子群之后的一或多個相關(guān)文本子群。
上述總結(jié),包括接下來優(yōu)選實(shí)施例的詳細(xì)描述,當(dāng)和所述附圖一起閱讀時能夠更好的理解。對于說明書的目的,示于所述附圖示范實(shí)施例中;盡管如此,該公開并不限于公開的具體方法和工具。在附圖中:
圖1A是根據(jù)本發(fā)明實(shí)施例的包括多個電子-書閱讀器和一電子-書服務(wù)器的一系統(tǒng)的不意 圖1B是根據(jù)本發(fā)明實(shí)施例的包括一電子-書閱讀器和一電子-書服務(wù)器的一系統(tǒng)的示意 圖2是根據(jù)本發(fā)明實(shí)施例的通過其顯示器顯示一電子書的內(nèi)容的電子-書閱讀器的前視 圖3是根據(jù)本發(fā)明實(shí)施例的為導(dǎo)航一電子文本提供一鏈接的示例性方法的流程 圖4是根據(jù)本發(fā)明實(shí)施例的用于在一電子文本內(nèi)鏈接文本子群的用以導(dǎo)航所述電子文本的示例性方法的流程 圖5是根據(jù)本發(fā)明實(shí)施例的示出的用于圖解展示一電子文本內(nèi)的文本子群之間的相似關(guān)系的示例性方法的流程 圖6是根據(jù)本發(fā)明實(shí)施例的出的分析所述電子文本內(nèi)鏈接文本子群的一電子文本的用戶導(dǎo)航的示例性方法的流程 圖7是根據(jù)本發(fā)明實(shí)施例的示出的控制一用戶界面以顯示與在一電子文本內(nèi)一用戶的一當(dāng)前位置相關(guān)的文本子群的示例性方法的流程 圖8是根據(jù)本發(fā)明實(shí)施例的示出的一電子-書閱讀器在一顯示區(qū)域內(nèi)顯示一電子文本的一部分的一前視 圖9是根據(jù)本發(fā)明實(shí)施例的示出的在相鄰句子之間基于一相似關(guān)系的一電子文本內(nèi)的集群文本一示例性方法的流程 圖10是根據(jù)本發(fā)明實(shí)施例的描述了用于一電子文本的集群過程的一圖表;
圖11是根據(jù)本發(fā)明實(shí)施示出的用于分配一電子文本的每個文本集群的向前鏈接和向后鏈接的示例性方法的流程 圖12是根據(jù)本發(fā)明實(shí)施示于圖10中的用于鏈接一文本集群被實(shí)現(xiàn)的一過程的圖表;圖13是根據(jù)本發(fā)明實(shí)施示于圖10和12中的用于已經(jīng)被完成的所有文本集群的所有鏈接的圖表;
圖14是根據(jù)本發(fā)明實(shí)施示于的描述一電子-書的一熱圖的圖表;
圖15是根據(jù)本發(fā)明實(shí)施描述的用于一電子-書的分級導(dǎo)航的熱表;
圖16是根據(jù)本發(fā)明實(shí)施示出的示于圖1中的所述系統(tǒng)的一示例性操作的一信息流程圖表;
圖17是根據(jù)本發(fā)明實(shí)施示出的示于圖1中的所述電子閱讀器的一框 圖18是根據(jù)本發(fā)明實(shí)施示出的示于圖1中的所述電子服務(wù)器的一框圖。詳細(xì)說明
此處公開的發(fā)明被描述為具有專一性是為了滿足法定要求。盡管如此,該描述本身并不旨在限制本專利的范圍。更確切說,本發(fā)明人考慮過的所要求保護(hù)的發(fā)明也可以用其它的方式來實(shí)現(xiàn),以包含于本發(fā)明描述的相似的不同步驟或者元素,與其它現(xiàn)有技術(shù)或者將來技術(shù)結(jié)合。除此之外,盡管術(shù)語“步驟”在本文中以隱含采用方法的不同的方面,但是該術(shù)語不能被解釋為在本發(fā)明公開的各種步驟中或者之間采用任何特定的順序,除非且除了當(dāng)準(zhǔn)確的描述了各個步驟的順序之外。本文所公開的實(shí)施例使一電子設(shè)備成為可能,如一電子-書閱讀器,以在一電子文本內(nèi)確定文本子群,以在所述文本子群的一個內(nèi)選擇一文本種子,以在所述文本種子和不包括所述特定文本種子的相鄰文本子群的一或多個之間確定一相似關(guān)系(比如,一語義關(guān)系),以將所述文本種子和基于所述相似關(guān)系的所述相鄰文本子群的一或多個結(jié)合以創(chuàng)造一文本集群,以及在所述電子文本內(nèi)基于所述文本集群和所述文本子群的其它一個之間一相似關(guān)系以鏈接 所述文本集群到所述文本子群的另一個。例如,文本子群可以包括,但是并不局限于,文章,段落,句子,以及類似物。進(jìn)一步的,例如,一文本種子可以包括一或多個單詞以及類似物。所述文本種子可以基于分配于所述電子文本的單詞的一相關(guān)或相似關(guān)系得分被選擇。所述文本種子和相鄰文本子群之間的相似關(guān)系可以被確定,例如,但不限制于,執(zhí)行語義分析,執(zhí)行自然語言處理,使用方法例如標(biāo)記化,斷句,部分的詞性標(biāo)注,命名實(shí)體識別,詞干,詞形歸并,共同參與分辨率,解析,關(guān)系抽取,向量空間模型,潛在語義分析之類的,識別所述文本種子和所述文本子群之間的因果關(guān)系,確定基于本體的語義相似性,使用一語義索引以比較語義相似度,確定一統(tǒng)計相似性,等,以及它們的組合。相似或者相關(guān)的文本子群可以被結(jié)合以形成相似內(nèi)容的文本集群。隨后,相似文本集群之后可以被鏈接一起,例如,通過導(dǎo)航鏈接。采用該方法和在此進(jìn)一步詳細(xì)描述的,所述電子文本的語義相關(guān)的部分可以被鏈接結(jié)合這樣一用戶可以選擇所述電子文本的一部分且開始被定位到一或多個語義相關(guān)的部分。在本文公開的其它實(shí)施例中,一電子設(shè)備基于每個文本子群內(nèi)的所述內(nèi)容的一相似關(guān)系使在一電子文本內(nèi)確定文本子群成為可能。進(jìn)一步的,對于每個文本段,所述電子設(shè)備可以在所述文本子群內(nèi)容和一個或多個其它文本子群的內(nèi)容之間確定另外相似關(guān)系,且基于其它相似關(guān)系鏈接所述文本子群到一或多個其它文本子群。本發(fā)明公開的其它實(shí)施例中,一電子設(shè)備使用接收于搜索一電子文本的搜索條件成為可能,以及在電子文本內(nèi)確定文本子群。進(jìn)一步的,對于每個文本子群,所述電子設(shè)備可以在所述搜索條件和所述文本子群之間確定一相似關(guān)系,以及呈現(xiàn)表示代表所述文本子群和所述搜索條件之間的所述相似關(guān)系的一圖片。例如,一用戶可以選擇電子文本的一或多個段且/或一或多個關(guān)鍵詞用以呈現(xiàn)表示所述段(多段)和/或關(guān)鍵詞(多個關(guān)鍵詞)以及所述電子文本的其它部分之間的一關(guān)系的一圖片,且用以直接導(dǎo)航到所述電子文本的一或多個其它相關(guān)部分。在本公開的其它實(shí)施例中,一電子設(shè)備使在一電子文本內(nèi)的文本子群之間的一用戶非線性導(dǎo)航的確定成為可能,且使鏈接所述文本子群響應(yīng)以在所述文本子群之間確定所述用戶非線性導(dǎo)航成為可能。在本公開的其它實(shí)施例中,一電子設(shè)備使一電子文本內(nèi)的當(dāng)前用戶位置的確定成為可能,使對應(yīng)于所述當(dāng)前用戶位置的一當(dāng)前文本子群的確定成為可能,使對應(yīng)于所述當(dāng)前文本子群的所述電子文本的一部分在一第一顯示區(qū)域顯示成為可能,使一或多個相關(guān)文本子群或鏈接到所述相關(guān)文本子群的導(dǎo)航在一第二顯示區(qū)域顯示成為可能。在另一實(shí)施例中,所述相關(guān)文本子群可以被分出兩個子集基于所述相關(guān)文本子群手否被置于所述當(dāng)前文本之前或之后,且所述設(shè)備使置于所述當(dāng)前文本子群之前的一或多個相關(guān)文本子群在一第二顯示區(qū)域顯示成為可能,以及使置于所述當(dāng)前文本子群之后的一或多個相關(guān)文本子群在一第三顯示區(qū)域顯示成為可能。如本文所述,所述術(shù)語(電子設(shè)備)應(yīng)該被廣泛地解釋。它可以包括任何能顯示電子文本給一用戶的任何類型設(shè)備。例如,所述電子設(shè)備可以是被配置以向一用戶呈現(xiàn)一電子-書的一電子-書閱讀器。例如電子-書閱讀器包括,但是不限于此,為KINDLE〈 (R) >和N00K〈(R)>電子-書 閱讀器。在另一個例子中,一電子設(shè)備可以是一移動設(shè)備如,例如,但不限于此,一智能手機(jī),一移動電話,一尋呼機(jī),一個人數(shù)字助理(PDA,例如,帶有GPRS網(wǎng)卡),帶有一智能電話客戶端的一移動電腦,或者類似物。一電子設(shè)備同樣可包括任何類型的常規(guī)電腦,例如,一臺式電腦或者一筆記本電腦。一典型的移動設(shè)備是一種無線數(shù)據(jù)接入功能的設(shè)備(例如,一蘋果智能手機(jī),一藍(lán)莓智能手機(jī),一 NEXUS ONE 智能手機(jī),一 iPAD設(shè)備,或者能使用協(xié)議如互聯(lián)網(wǎng)協(xié)議,或者IP,以及所述無線應(yīng)用協(xié)議,或者WAP以一種無線方式發(fā)出和接入數(shù)據(jù)的類似物。這使用戶能夠通過無線設(shè)備訪問信息,如智能手機(jī),移動電話,尋呼機(jī),雙向無線電,通信設(shè)備,以及類似物。無線數(shù)據(jù)接入通過多種無線網(wǎng)絡(luò)支持,包括,但不限于,CDPD,CDMA,GSM,PDC,PHS,TDMA,F(xiàn)LES, ReFLEX, iDEN, TETRA, DECT, DataTAC,Mobitex, EDGE以及其他2G,3G, 4G和LTE技術(shù),且它和許多手持設(shè)備操作系統(tǒng)一起運(yùn)轉(zhuǎn),如 PalmOS, EPOC, Windows CE, FLEXOS, OS/9, JavaOS, iOS 和 Android。通常情況下,這些設(shè)備使用圖形顯示且能接入Internet (或者其它通信網(wǎng)絡(luò))因此被稱為小型或微型瀏覽器,其為帶有能容納無線網(wǎng)絡(luò)的所述減少內(nèi)存限制的小文件大小的Web瀏覽器。在一代表性的實(shí)施例中,所述移動設(shè)備是能通過GPRS (通用分組無線服務(wù))操作的一移動手機(jī)或者智能手機(jī),其是用于GSM網(wǎng)絡(luò)的一數(shù)據(jù)技術(shù)。除了常規(guī)的語音通信,一給定的移動設(shè)備可以與其它類似設(shè)備通過許多不同類型的信息交換技術(shù)通信,包括SMS (短信息服務(wù)),增強(qiáng)SMS (EMS),多媒體消息(麗S),電子郵件WAP,尋呼,或者其它已知的或者以后開發(fā)的無線數(shù)據(jù)格式。盡管在此提供的許多例子通過一電子-書閱讀器上實(shí)現(xiàn),所述例子可以相應(yīng)在任適合的電子設(shè)備上實(shí)現(xiàn),如一電腦或者智能手機(jī)。正如本文所述,術(shù)語“電子書”應(yīng)該被廣義的解釋。例如,能駐留在一電子設(shè)備上的一電子文本。例如文本可以以書頁的形式被顯示和存儲且可以使用一電子設(shè)備被瀏覽。所述文本可以以任何適合的格式被存儲,例如,但不限于此,可移植文檔格式(HF),超文本標(biāo)記語言(HTML),可擴(kuò)展標(biāo)記語言(XML),EPUB,或者任何適合的電子-書或者文字處理格式。
如本文所述,一“用戶界面(UI)通常是一系統(tǒng)通過該系統(tǒng)用戶與一電子設(shè)備交互。一界面可以包括用于允許用戶操縱一電子設(shè)備的輸入,可以包括用于允許所述系統(tǒng)呈現(xiàn)信息(如,電子-書內(nèi)容)和/或數(shù)據(jù)的輸出,表示所述用戶的操縱的影響,等。在一電子設(shè)備上的一界面的一例子包括允許用戶以除打字外更多方式與程序交互的一圖形用戶界面(GUI)。一 GUI通常能提供顯示對象,以及可視化指標(biāo),而不是基于文本的界面,輸入的命令標(biāo)簽或者文本導(dǎo)航以向一用戶呈現(xiàn)信息和操作。例如,一界面可以是一顯示窗口或者顯示對象,其是可以被用于交互的一移動設(shè)備的一用戶選擇的。所述顯示對象能在一電子設(shè)備的一顯示屏上被顯示出且能被選擇以及通過一用戶使用所述界面能被交互。在一例子中,所述電子設(shè)備的所述顯示可以是一觸摸屏,其能顯示所述顯示圖標(biāo)。所述用戶能按下所述顯示屏的所述區(qū)域在其中用于選擇所述顯示圖標(biāo)的所述顯示圖標(biāo)被顯示。在另一個例子中,所述用戶能使用一移動設(shè)備的任何其它適合的界面,如一鍵盤,以選擇所述顯示圖標(biāo)或者顯示對象。例如,所述用戶能使用一軌跡球或者箭頭鍵用于移動一光標(biāo)以高顯示和選擇所述顯示對象。本公開實(shí)施例的操作環(huán)境可以被實(shí)現(xiàn)也是眾所周知的。在一代表性實(shí)施例中,一移動電子設(shè)備,如一電子-書閱讀器,是可連接(例如,通過WAP)到一傳輸功能根據(jù)實(shí)施例而變化。因此,例如,其中操作環(huán)境是一廣泛區(qū)域無線網(wǎng)絡(luò)(例如,一 2.5G網(wǎng)絡(luò),一 3G網(wǎng)絡(luò),或者一 4G網(wǎng)絡(luò)),所述傳輸功能包括一或多個類似的一移動交換中心(MSC)(用于移動用戶的呼叫處理的一增強(qiáng)ISDN交換機(jī))的部件,一訪問用戶定位寄存器(VLR)(存儲在需要通過與所述VLR注冊的移動設(shè)備以處理呼叫建立或者接入的一臨時基礎(chǔ)數(shù)據(jù)上的一智能數(shù)據(jù)庫),一或多基站(其通過手機(jī)提供無線電覆蓋),一基站控制器(BSC)(作為交量的一定位集中器的一開關(guān)且提供定位開關(guān)以在基站之間實(shí)現(xiàn)切換),以及一分組控制單元(PCT)(分離來自一移動設(shè)備的數(shù)據(jù)交量的一設(shè)備)。所述HLR還控制與來電相關(guān)聯(lián)的一定服務(wù)。當(dāng)然,根據(jù)本公開的實(shí)施例也可以以其它以及下一代移動網(wǎng)絡(luò)和設(shè)備被實(shí)現(xiàn)。所述移動設(shè)備是由所述終端用于使用的物理設(shè)備,通常是所述無線網(wǎng)絡(luò)的一用戶。典型的,一移動設(shè)備是包括一用戶身份模塊(SIM)的一 2.5G-兼容設(shè)備,3G-兼容設(shè)備,或者4G-兼容設(shè)備,其是進(jìn)行用戶-專用信息的一智能卡,移動設(shè)備(例如,無線電和相關(guān)信號處理設(shè)備),一用戶界面(或者一人-機(jī)界面(麗I)),和到外部設(shè)備的一或多個界面(例如,電腦,PDAs,和類似物)。所述電子設(shè)備同樣可以包括一存儲器或者數(shù)據(jù)存儲。
本公開主體現(xiàn)在被更詳細(xì)的描述。例如,根據(jù)本公開的實(shí)施例的圖1A示出了包括電子-書閱讀器102和104以及一電子-書服務(wù)器106的一系統(tǒng)100的示意圖。例如圖1A,所述電子-書閱讀器102和104可以是能呈現(xiàn)一電子文本的任何類型電子設(shè)備,如一電子-書,到一用戶。所述電子-書閱讀器102和104包括一些功能部件。所述電子閱讀器102和104的該代表意味著說明和描述的方便,且它不應(yīng)該被視為限制本公開范圍因?yàn)橐换蚨鄠€功能可以被結(jié)合。典型的,這些部件在軟件(如一組程序可執(zhí)行計算機(jī)指令,相關(guān)數(shù)據(jù)結(jié)構(gòu),以及類似物)中實(shí)現(xiàn)。一或多個功能可以被結(jié)合或者以任何適合方式被實(shí)現(xiàn)(例如,以硬件,固件,硬件和軟件結(jié)合的方式,或者類似物)。所述電子-書閱讀器102和104各自可以包括一電子文本管理器108以管理一或多個電子文本的在各自的數(shù)據(jù)存儲110中的存儲且用于控制一電子文本到一用戶的顯示。所述電子-書閱讀器102和104各自包括能接受用戶輸入和向一用戶呈現(xiàn)一電子文本的一用戶界面112。例如,所述用戶界面112可以包括能顯示一電子-書給一用戶的顯示器。所述數(shù)據(jù)存儲110可以是一合適的存儲設(shè)備。所述電子-書閱讀器102和104也可以彼此通信,也可以和所述電子-書服務(wù)器106,和其它設(shè)備通信。例如,所述電子-書閱讀器102和104各自可以包括通過一網(wǎng)絡(luò)116能和所述電子-書服務(wù)器106 通信的一網(wǎng)絡(luò)界面114,如所述因特網(wǎng),如一無線網(wǎng)絡(luò),局域網(wǎng)絡(luò)(LAN),或者任何其它合適的網(wǎng)絡(luò)。在另一例子中,所述電子-書閱讀器102和104可以是能訪問因特網(wǎng)的且能使用因特網(wǎng)互聯(lián)網(wǎng)協(xié)議如HTTP,HTTPS,以及類似物與所述電子-書服務(wù)器106交互。所述電子-書閱讀器102的所述操縱可以通過以下例子被描述。如圖1A所示,所述電子-書閱讀器102包括各種功能部件和所述數(shù)據(jù)存儲110以促進(jìn)所述操縱。所述公開方法的所述操縱可以使用除了如圖1A所示的部件所實(shí)現(xiàn)。在一可替換實(shí)施例中,該例子操作可以通過任何其它合適的電子設(shè)備被合適的實(shí)施,例如,但不限于此,一服務(wù)器或者其它具有至少一處理器和一存儲器的電子設(shè)備。在一例子中,所述電子-書閱讀器102的一用戶可以使用一應(yīng)用程序(通常被稱作一“應(yīng)用程序”)駐留在所述電子-書閱讀器102中以和存儲于所述數(shù)據(jù)存儲器110的一電子-書118交互。所述應(yīng)用程序可以駐留在所述電子-書閱讀器102中且可以是所述電子文本管理器108的一部分。所述用戶可以,例如,輸入命令到所述用戶界面112中用以打開所述電子-書118和交互所述電子-書118。所述應(yīng)用程序可以通過所述用戶界面112的一顯示器呈現(xiàn)所述電子-書118的文本和/或圖片給所述用戶。例如,根據(jù)本公開實(shí)施例圖2示出了一電子-書閱讀器102通過其顯示器200顯示一電子-書的內(nèi)容的前視圖。在該例子中,所述顯示器200是一觸摸屏。所述用戶可以和所述電子-書閱讀器102合適的交互以控制所述電子-書的內(nèi)容的不同部分的顯示。例如,所述用戶可以觸摸所述顯示器200,如在所述顯示器200的所述表面上通過使用一“刷”動作,以控制所述電子文本管理器108以“翻”所述電子-書的頁也將是被理解的。所述用戶通過任何其它合適的技術(shù)可以翻或者選擇頁用以顯示也將是被理解的。如本文進(jìn)一步被描述的,所述電子-書的所述內(nèi)容的一部分的選擇,如通過觸摸由所述電子-書顯示的文本的一部分,可以被解釋為用于語義導(dǎo)航到根據(jù)本發(fā)明公開的實(shí)施例所述電子-書的一相關(guān)部分的輸入。根據(jù)本公開的實(shí)施例,所述電子-書閱讀器102的所述用戶可以與所述顯示器200交互以選擇用于啟動基于所述選擇部件語義導(dǎo)航的所述電子書的顯示的內(nèi)容的一或多個部分。在一例子中,所述用戶可以交互所述顯示器200以選擇一顯示的短語202。所述短語202的選擇可以通過任何合適的技術(shù)如在所述短語202中通過突出顯示或者保持所述字母或者其它字符由用戶進(jìn)行驗(yàn)證。所述用戶可以通過觸摸或者刷顯示于所述用戶的所述電子-書的一需要部分選擇所述電子-書的一部分。例如,所述用戶可以觸摸或者刷一個單詞,一或多個段落,或者一顯示頁的全部用以選擇所述顯示器的那個部分。所述電子文本管理器108可以接收所述選擇部分的識別且,響應(yīng),導(dǎo)航到如本文進(jìn)一步詳細(xì)描述所述電子_書內(nèi)一相關(guān)部分。根據(jù)本文所公開的實(shí)施例,圖3示出了提供用以導(dǎo)航一電子文本的一鏈接的一個示例性方法的一流程圖。圖3的所述方法相對于圖1和圖2中示出的所述示例電子-書閱讀器102被描述,盡管所述方法可以通過任何適合的系統(tǒng)或者電子設(shè)備被實(shí)現(xiàn)。圖3的所述步驟可以被整體實(shí)現(xiàn),或者部分實(shí)現(xiàn),通過駐留在所述電子-書閱讀器102上的如圖1A所示的所述電子文本管理器108。所述電子文本管理器108可以通過軟件、固件,或者它們的結(jié)合被實(shí)現(xiàn)。參考圖3,所述方法包括在一電子文本(步驟300)內(nèi)確定文本子群。例如,所述電子文本管理器108可以訪問所述電子-書118的所述文本和/或元數(shù)據(jù)且可以識別基于所述文本和/或元數(shù)據(jù)的所述文本內(nèi)的文本子群。例如,所述電子文本管理器108可以識別所述電子-書118內(nèi)的章節(jié),段落,和句子。所述電子文本管理器108可以基于在所述電子-書118的文本內(nèi)的標(biāo)點(diǎn)符號,標(biāo)題,`和其它指示符或者通過使用自然語言處理方法適當(dāng)?shù)淖R別這些文本子群。在另一例子中,可以識別所述電子-書內(nèi)的每章的標(biāo)題和結(jié)尾。圖3的所述方法包括在所述文本子群(步驟302)的一個內(nèi)選擇一文本種子。一文本子群內(nèi)的一文本種子可以基于其確定的相關(guān)性被選擇。例如,所述電子文本管理器108可以確定用于所述電子-書118內(nèi)的每個單詞的一相關(guān)得分。所述電子文本管理器108可以確定所述單詞頻率,或者術(shù)語頻率,對于每個單詞。對于每個單詞,所述電子文本管理器108可以通過所述術(shù)語頻率除以所述“倒排文檔頻率”確定一單詞權(quán)重,其可以通過一個單詞出現(xiàn)在多個文檔內(nèi)的次數(shù)以及每個單詞出現(xiàn)在其中出現(xiàn)過的文檔的次數(shù)來計算。在一實(shí)施例中,而不是,或者伴隨,所述倒排文檔頻率,一“逆段頻率”可以被使用,其可以通過計算段的數(shù)量被確定,如在所述當(dāng)前文檔內(nèi)的章節(jié)或者段落,單詞在其中出現(xiàn)。對應(yīng)于所述電子-書內(nèi)的人物,地點(diǎn),或者故事發(fā)生的單詞可以被給予額外權(quán)重。用于所述單詞的一相關(guān)性得分可以被基于用于所述單詞的所述單詞權(quán)重被分配。所述電子文本管理器108可以選擇基于所述相關(guān)性得分的所述文本種子。在另一實(shí)施例中,所述文本種子可以同樣基于其在所述文本內(nèi)的位置被選擇,或者隨機(jī),例如如果有多個文本種子具有相似的基于單詞權(quán)重的相關(guān)性得分。在這個例子中,所述選擇的文本種子可以是所述多個單詞中的一個具有最高相關(guān)性得分的一個。圖3的所述方法包括在所述文本種子和相鄰的不包括所述選擇的文本種子(步驟304)的文本子群的一或多個之間確定一相似關(guān)系。該步驟可以啟動一個進(jìn)程在此被稱作“聚集”通過該步驟相似的文字子群彼此被關(guān)聯(lián)以創(chuàng)造一“文本集群”。一文本集群可以包括一組單詞,句子,段落,文章,以及已經(jīng)被視為相關(guān)的且在所述電子文本內(nèi)被置于相鄰或者靠近彼此的類似物。多個文本種子可在所述電子文本內(nèi)被選擇以創(chuàng)造如本文所述的多文本集群。在使用一文本種子以創(chuàng)造一文本集群的例子中,所述電子文本管理器108可以在一文本種子和緊接所述文本種子之前或者緊隨所述文本種子之后的句子(或者所述電子文本的其它部分)之間確定一相似性得分。如果所述文本種子從一句子中被分離,通過,例如,一段落分段或者章節(jié)分章,所述相似性得分可以通過一預(yù)定的值被懲罰或者降低。如此懲罰可以被應(yīng)用于整個中斷,因?yàn)轭}材可能會在整個章節(jié)和段落中改變。圖3的所述方法包括將所述文本種子與所述相鄰的基于所述相似性關(guān)系的文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群(步驟306)。例如,一文本種子可以與所述相鄰的具有所述高相似性得分的文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群。所述文本集群之后可以與緊接所述文本集群之前或者緊隨所述文本集群之后的所述電子文本的其它部分相比較。所述電子文本管理器108可以在所述文本集群與緊接所述文本集群之前或者緊隨所述文本集群之后的句子(或者所述電子文本的其它部分)之間確定一相似性得分。如果所述文本集群從所述電子文本的一部分分離出,例如,通過一段落分段或者文章分節(jié),所述相似性得分可以通過一預(yù)定的值被懲罰或者被降低。所述相似性得分可以同樣被懲罰如果所述生成的文本群集的尺寸是非常大的,例如,如果它跨越了一定尺寸的閥值。所述句子具有所述高相似性得分可以被加入到所述文本子群以形成一修改的文本集群。多個文本集群可以通過該方式被加入直到所述電子文本內(nèi)的所有文本子群已經(jīng)被加入到一文本集群中。圖3的所述方法包括基于所述文本集群和所述文本子群的其它一個之間的一相似性關(guān)系鏈接所述文本集群到所述電子文本內(nèi)的所述文本子群的另一個。例如,所述電子文本管理器108可以在所述文本集群和所述電子文本內(nèi)的其它文本子群之間確定一相似性得分。值得注意的是所述集群可以包括一或多個文本子群。所述電子文本管理器108可以在所述確定的相似性得分·之間確定一高相似性得分。隨后,所述電子文本管理器108可以鏈接所述文本集群到具有所述高相似性得分的所述文本子群(或者其它文本集群)上。當(dāng)所述電子文本用于向一用戶呈現(xiàn)而被打開時,例如,一電子-書閱讀器的一用戶界面可以呈現(xiàn)一導(dǎo)航鏈接以鏈接所述文本集群到所鏈接到的文本子群上。通過這個方法,當(dāng)所述文本群集的一部分被呈現(xiàn)給一用戶時,所述用戶可以選擇用于導(dǎo)航到所述相關(guān)的,鏈接到文本子群的所述導(dǎo)航鏈接。在一些實(shí)施例中,由集群算法產(chǎn)生的所述文本集群可能與其之前和之后的文本集群部分重疊。這不同于本文中文本分割的其它方法,其特征在于段不會重疊因?yàn)樗鼈兏髯源硪蛔又黝},主題或者一子主題本身的一討論。盡管如此,圖3所描述的上述增量集群文本子群的方法,例如句子,通過與一種種子文本相比較進(jìn)入到文本集群里可能會導(dǎo)致重疊集群。可能會出現(xiàn)這種情況,例如在一文章內(nèi)當(dāng)多個相關(guān)的題目或者主題被討論時,且前面的文章的所述主題的僅有一子集在隨后所述文章持續(xù)談?wù)?。這里,所述相鄰集群的文本集群重疊將包括與兩種文本集群共同的標(biāo)題或者主題。注意,盡管如此,在文本集群內(nèi)的所述重疊可以單純用于所述組織的目的以及所述導(dǎo)航鏈接的產(chǎn)生,其不會反應(yīng)在所述用戶界面中,也就是說,它不會導(dǎo)致文本相對于用戶的重復(fù)顯示。在一實(shí)施例中,所述基于種子的集群算法可以被遞歸應(yīng)用于其已生成的所述文本集群,因此進(jìn)一步在每個文本集群內(nèi)生成文本子-集群。每個文本子-集群可以包括在一文本集群里一或多個文本子群。例如,與所述更大文本集群內(nèi)的次主題的一不同子集相關(guān)的一文本-集群里的子群的每個子集可以聚集形成一文本子-集群。這些遞歸生成的子-集群可以具有一分層結(jié)構(gòu),且因此可以作為分層記錄被存儲以及可以使分層導(dǎo)航或者基于不同描述水平的導(dǎo)航成為可能。例如,當(dāng)一用戶從一當(dāng)前文本集群選擇導(dǎo)航,一高水平相關(guān)的文本集群可以基于語義和與所述當(dāng)前高-水平文本集群的上下文匹配被發(fā)現(xiàn),且一更具體的相關(guān)文本子-集群或者個別文本集群通過進(jìn)一步語義和在所述當(dāng)前高-水平文本集群內(nèi)所述子-集群的上下文匹配可以在所述高-水平文本內(nèi)被發(fā)現(xiàn),在此所述用戶被定位,或者由所述用戶選擇的在所述當(dāng)前文本集群內(nèi)的所述具體文本被定位。根據(jù)本發(fā)明公開的實(shí)施例圖1B示出了包括一電子閱讀器102和一電子-書服務(wù)器134的一系統(tǒng)132的示意圖。參考圖1B,所述電子-書服務(wù)器134可以包括一電子文本管理器108其被配置以在一電子文本內(nèi)確定文本子群,在所述文本子群的一個內(nèi)選擇一個文本種子,在所述文本種子和相鄰的不包括所述選擇的文本種子的一或多個文本子群之間確定一相似性關(guān)系,以及將所述文本種子與基于所述相似性關(guān)系的相鄰文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群根據(jù)本發(fā) 明公開的實(shí)施例。進(jìn)一步的,所述電子文本管理器108同樣可以鏈接所述文本集群到所述文本集群的另一個,在所述電子文本內(nèi)基于在所述文本集群和所述文本子集的其它一個之間的相似性關(guān)系。在一實(shí)施例中,所述電子-書閱讀器102可以包括用于促進(jìn)與所述電子-書服務(wù)器134交互的一客戶應(yīng)用程序136。所述客戶應(yīng)用程序136可以通過軟件,硬件,固件,或者它們的結(jié)合來實(shí)現(xiàn)。根據(jù)本發(fā)明公開的實(shí)施例所述電子-書閱讀器102的一用戶可以為導(dǎo)航的所述電子書118的選擇啟動所述客服應(yīng)用程序136。響應(yīng)于所述選擇,所述電子-書118的所有或者一部分可以通信到所述電子-書服務(wù)器134以在所述電子-書118內(nèi)確定文本子群,在所述文本子群內(nèi)選擇一文本種子,在所述文本種子與相鄰的不包括所述選擇的文本中的一或多個文本子群之間確定一相似性關(guān)系,以及將所述文本種子與相鄰的基于所述相似性關(guān)系的一或多個文本子群關(guān)聯(lián)以創(chuàng)建一文本集群。進(jìn)一步的,所述電子-書服務(wù)器134可以鏈接所述文本集群到所述電子書118內(nèi)的所述文本集群的另一個上,基于所述文本集群和所述文本子群的其它一個之間的相似性關(guān)系。文本子群信息,相似性關(guān)系,文本集群,和/或鏈接關(guān)系可以通過所述電子-書服務(wù)器134通信到所述電子-書閱讀器102。根據(jù)本發(fā)明公開的實(shí)施例該信息可以通過用于所述電子-書閱讀器102的所述電子文本管理器被使用以輔助所述用戶導(dǎo)航所述電子-書118的所述文本。例如,當(dāng)呈現(xiàn)給所述用戶的所述電子-書118被打開時,所述用戶界面112可以呈現(xiàn)鏈接一文本集群到所述連接的文本子群上的一或多個導(dǎo)航鏈接。根據(jù)本發(fā)明公開的實(shí)施例,所述電子-書服務(wù)器134可以單獨(dú)或者和所述電子-書閱讀器102 —起實(shí)現(xiàn)該功能。所述電子-書服務(wù)器134同樣可以被配置以合適實(shí)現(xiàn)其他本法公開的方法,過程,或者功能。例如,所述電子-書服務(wù)器134,單獨(dú)或者和所述電子-書閱讀器102結(jié)合,可以被配合以實(shí)現(xiàn)圖4-7,圖9,和圖11的所述例子方法。
根據(jù)本發(fā)明公開的實(shí)施例,圖4示出了用于在一電子文本內(nèi)的鏈接文本子群的用以導(dǎo)航所述電子文本一示例性方法的流程圖。圖4的所述方法與示于圖1和圖2的所述例子電子-書閱讀器102 —起被描述,盡管所述方法可以通過任何合適的系統(tǒng)或者電子設(shè)備被實(shí)現(xiàn)。圖4的所述步驟可以被整體,或者部分實(shí)現(xiàn),通過駐留在示于圖1A中的所述電子-書閱讀器102上的所述電子文本管理器108。在另一例子中,圖4的所述步驟可以被整體,或者部分的實(shí)現(xiàn),通過駐留在示于圖1B中的所述電子-書服務(wù)器134。所述電子文本管理器108可以通過軟件,硬件,固件,或者它們的結(jié)合被實(shí)現(xiàn)。參考圖4,所述方法包括在基于每個電子子群(400)內(nèi)內(nèi)容的一相似性關(guān)系在一電子文本內(nèi)確定文本子群。例如,所述電子文本管理器108可以選擇在所述電子-書118內(nèi)彼此定位接近且包含相似的內(nèi)容單詞,句子,和/或段以創(chuàng)建一個文本集群。多個文本集群和所述電子-書118被定義。用于關(guān)聯(lián)所述選擇的單詞,句子,和/或段的作為一文本集群的信息可以在所述數(shù)據(jù)存儲110內(nèi)被存儲。在一個實(shí)施例中,子群可以基于段或者文章邊界被簡單創(chuàng)建。圖4的所述方法包括確定,為每個文本子群,在所述文本子群的內(nèi)容和其它文本子群(步驟402)的一或多個之間的內(nèi)容之間另一相似性關(guān)系。繼續(xù)步驟400的上述例子,所述電子文本管理器108可以在所述文本集群和在所述電子文本的其它文本集群之間確定一相似性得分。值得注意的是集群可以包括一或多個文本子群。所述電子文本管理器108可以在所述確定的相似性得分之間確定一高相似性得分。圖4的所述方法包括鏈接,圖4的所述方法包括鏈接,為每個文本集群,所述文本子群到的一或多個其它文本子群基于所述其它相似性關(guān)系(步驟404)。繼續(xù)步驟400和402的上述例子,所述電子文本管理器108可以鏈接所述電子集群到具有所述高相似性的所述文本子群(或者其它文本集群)上。在另一個例子中,所述電子文本管理器108可以在一文本子群和在所述電子-書118內(nèi)被前置于所述文本子群的每個其它文本子群之間確定一相似性關(guān)系。在該例子中,所述電子文本管理器108可以鏈接所述文本子群到具有所述高相似性關(guān)系的所述前置 的文本子群。在另一個例子中,所述電子文本管理器108可以應(yīng)用一相似技術(shù)到被后置的文本子群上以將其鏈接到具有所述高相似性關(guān)系的所述后置的文本子群。進(jìn)一步的,例如,所述電子文本管理器108可以在所述電子文本的元數(shù)據(jù)內(nèi)存儲一助航以指示所述文本子群關(guān)聯(lián)到所述鏈接的文本子群(多個子群)上。圖4的所述方法包括呈現(xiàn)一導(dǎo)航鏈接(步驟406)。例如,所述電子文本管理器108可以控制所述用戶界面112以呈現(xiàn)對應(yīng)于一顯示文本的導(dǎo)航鏈接,該顯示文本可能被所述用戶選擇以導(dǎo)航到與所述顯示文本子群鏈接的另一文本子群。下文是圖4的步驟400,402和404的一實(shí)施例的詳細(xì)描述。在該例子中,所述電子-書118的所述文本可以被分詞以生成代表每個單詞的標(biāo)記。其它適合的分詞技術(shù)也可以被用于分離所述電子-書118的所述文本成句子或者句子的組。值得注意的是分詞可以是用于分離所述文本內(nèi)容成集群(步驟400 )的一部分,一結(jié)果,或者一先決條件。下述步驟之后可以在一個時間在一文本段被執(zhí)行或者所述電子-書118的內(nèi)容作為一個整體被執(zhí)行。值得注意的是所述術(shù)語“段”在此被使用以表示一文本子群或者一文本集群。隨后,自然語言編程(NLP)技術(shù)可以被應(yīng)用于文本段內(nèi)的所述單詞,如部分語音終端(POS)標(biāo)記以識別作為一名字,動詞,形容詞,副詞,等等的每個單子;命名實(shí)體識別(NER)以識別哪個單詞是命名實(shí)體,且它們是否代表一人物,地點(diǎn),事情,組織,等等;解析以生成語義圖和樹,如依賴關(guān)系樹,從句子;關(guān)系提取以識別單詞和實(shí)體之間的關(guān)系,如“是一”,“具有一”,“中”,等等;以及類似物?;谒龇椒ǖ妮敵鋈鏟OS標(biāo)記和NER,用于所述電子-書118的所述文本的一詞匯表被生成,其是發(fā)生在所述文本內(nèi)的所述獨(dú)特單詞的集合。帶有不同POS標(biāo)記的所述相同單詞(如“希望”其可以作為名詞也可以作為動詞)可以被視為所述電子-書118的所述詞匯表里的單獨(dú)的單詞。出現(xiàn)在“停止-單詞”(即,可能頻繁出現(xiàn)但是提供很少語義值的單詞)的預(yù)定列表內(nèi)的單詞可以從所述詞匯表中過濾這樣以保持僅有的所說更多語義相關(guān)單詞。進(jìn)一步的,如詞干分析和詞形歸并方法可以被用以檢測所述相同單詞的多個形式。本體論(如來自本體論數(shù)據(jù)庫,例如,維基百科)也可以被用以尋找在術(shù)語或者對于一給定單詞的相關(guān)術(shù)語之間的相互關(guān)系。一分類詞匯匯編數(shù)據(jù)庫可以被用以進(jìn)一步消除歧義單詞或者映射單詞的各種形式或者同義詞到規(guī)范版本。例如,表示相同事物的許多單詞的僅有一個可以被選擇以表示所有其他基于此述的意思,所述形式并不常用,或者所述形式按字母排在第一位或者最后一位,等等。索引也可以被用以識別相關(guān)單詞和詞義給定一當(dāng)前內(nèi)容(如鄰接單詞)基于單詞在彼此相鄰出現(xiàn)的頻率;基于單詞在彼此一定距離內(nèi)出現(xiàn)的頻率;單詞在語法上被關(guān)聯(lián)的頻率,等等。這些例子技術(shù)可以在減少語義獨(dú)特以及更相關(guān)的單詞的所述詞匯表的大小起輔助作用,其可以增加精確度以及減少需要的所述處理資源。其它合適先進(jìn)的技術(shù)也可以被使用,如共同引用分辨率,其能識別所述名詞,專有名詞或者命名實(shí)體其中可以參閱代詞,和指代取消,其是前面提到的實(shí)體的共同引用。這些方法可以被執(zhí)行以更精確的識別出現(xiàn)在文本段的詞,且因此對于每個術(shù)語的參考產(chǎn)生一更精確的計數(shù),其可以導(dǎo)致更有意義的術(shù)語頻率和逆文件頻率。術(shù)語產(chǎn)生的所得計數(shù)可以用以替代,或者一起,沒有共同引用下出現(xiàn)的檢測的計數(shù)。在一實(shí)施例中,當(dāng)被直接引用時分配給解決共同引用的權(quán)重可以低于分配給所述相同術(shù)語的權(quán)重。這可能是因?yàn)楣餐媒鉀Q可以產(chǎn)生錯誤的結(jié)果以及因此誤解所述結(jié)果。此外,共同引用解決可以是一昂貴的方法,且當(dāng)前方法使用更簡單的度量的如術(shù)語頻率-逆文本頻率執(zhí)行的更充分。在此使用的一些其他NLP方法甚至可以被設(shè)計以在沒有共`同引用解決下工作,且因此它們的結(jié)果可能因?yàn)樗龉餐媒鉀Q的使用被影響。盡管如此,在一些實(shí)施例中,共同引用解決可以被用以進(jìn)一步微調(diào)所述結(jié)果和避免錯誤的鏈接更少相關(guān)的段。所述詞匯表可以被用以生成術(shù)語的一索引也可以包含每個術(shù)語發(fā)生的所述電子-書118的文本內(nèi)的位置列表,也包括所述術(shù)語出現(xiàn)在其中的所述子群。該索引可以被用以迅速查找所述位置以及包含每個重要術(shù)語的所述子群。接著,為所述詞匯表里的每個單詞確定所述術(shù)語頻率-逆文本頻率(TF.1DF)得分。在該實(shí)施例中,盡管如此,因?yàn)樗鲭娮?書118是僅有的文本,所述文本頻率(DF)實(shí)際上是由所述文本段頻率所代表,即是一術(shù)語出現(xiàn)的文本段的所述計數(shù),而不是文本的所述計數(shù)。因此,在一實(shí)施例中,一段被用于代替一文本作為文本的單元,因?yàn)樗邢嚓P(guān)文本可以被包含在一單一文件內(nèi)(電子-書118),或者一系列相互關(guān)聯(lián)的文本。因此,所述逆文本頻率實(shí)際是所述逆段頻率(ISF)。另外注意,一實(shí)際IDF得分也可以和一 ISF —起被使用,基于DF的從多個文件的文集提取的通過標(biāo)準(zhǔn)方法在本領(lǐng)域是已知的。在一實(shí)施例中,一向量空間模型(VSM)被使用以在段之間確定關(guān)系。在一 VSM中,一詞匯表內(nèi)的術(shù)語在向量中作為權(quán)重計數(shù),其中所述權(quán)重基于術(shù)語的頻率,發(fā)生的次數(shù),TF.1DF,等等被確定。術(shù)語向量可以用于段被生成類似于本領(lǐng)域用于整個文本向量的創(chuàng)建。每段的一術(shù)語向量是通過創(chuàng)建代表每個術(shù)語的得分向量被創(chuàng)建以使所述詞匯表內(nèi)的每個術(shù)語帶有一元素。如上所述,不太相關(guān)的術(shù)語被過濾,使用如停止-單詞的方法或者分選和過濾所述低權(quán)重或者最低頻率單詞的方法。對于用于每段的在所述詞匯表內(nèi)的每個術(shù)語,該術(shù)語在所述段出現(xiàn)的計數(shù)被分配到向量中的所述元素對應(yīng)于該術(shù)語在所述詞匯表中。
在所述向量內(nèi)的每個元素可以進(jìn)一步基于不同的標(biāo)準(zhǔn)被權(quán)重。權(quán)重可以被分配到基于他們詞性(P0S標(biāo)記,如名詞,動詞,副詞)的詞匯表內(nèi),單詞頻率和頻率分布,命名實(shí)體類型(任務(wù),地點(diǎn),組織)如果所述單詞被確定為一命名的實(shí)體或者類似物。在一實(shí)施例中,命名實(shí)體被權(quán)重的更重因?yàn)樗鼈兛梢允菙⑹聝?nèi)容的強(qiáng)有力指示。例如,人物的命名實(shí)體可以被分配最高的權(quán)重,而地點(diǎn)的命名實(shí)體可以是次權(quán)重,等等。向量中的元素可以通過將所述先前分配值(如TF.1DF)以及所述分配權(quán)重相乘進(jìn)行加權(quán)。在一個實(shí)施例中,所述“開始-單詞”的概念,與“停止-單詞”相反,被引進(jìn)和應(yīng)用。開始-單詞是單詞的預(yù)定的組其對于所述敘事或者文本可能是重要的,特別是對于不同類型的文本。對于它們更相關(guān)的文本開始-單詞可以被加權(quán)的更重。例如,對于懸疑小說,開始-單詞可以包括“殺,” “跟蹤”,“神秘”,“謀殺”,“發(fā)現(xiàn)”,“調(diào)查”,“驚喜”,“震驚”,等等,或者它們的各種形式。對于動作小說,開始-單詞可以包括“拍”,“爆炸”,“打架”,及類似物。對于技術(shù)文本,開始-單詞可以包括與所述文本相關(guān)的特定技術(shù)領(lǐng)域的技術(shù)術(shù)語。需要注意的是開始-單詞可以被用于識別,描述和分類所述文本的具體重要部分,如時間,重要情節(jié)發(fā)展,曲折,其它敘事結(jié)果,在一數(shù)學(xué)證明的內(nèi)的主要結(jié)果,等等。開始-單詞甚至可能是特定的坐著,流派,等等,或者基于讀者的愛好動態(tài)的選擇。開始-單詞可以由人的輸入提供,例如由一作者,出版者,編輯,或者讀者。開始-單詞也可以自動生成使用方法如術(shù)語提取,關(guān)鍵字檢測 ,等等,或者它們的結(jié)合。例如,開始-單詞可以由一單一文本,一相關(guān)文件的語料庫,一不相關(guān)文件的語料庫,或者它們的結(jié)合自動生成。人工與自動方法的結(jié)合可以被用于生成開始-單詞。接著,對于每段,在所述語義向量中對于所述各段,相關(guān)段通過關(guān)聯(lián)單詞得分(TF.1DF,單詞頻率,加權(quán)的TF.1DF,以及類似物)被發(fā)現(xiàn)。在一實(shí)施例中,所述余弦距離度量被使用。每對向量的余弦被確定以表示所述語義相關(guān)得分,且兩個文本段的向量的余弦距離越高,可能所述段越相關(guān)。應(yīng)用該方法到所有向量對產(chǎn)生一余弦距離的方形矩陣,其中每個元素所述排和列對應(yīng)于一相應(yīng)文本段,且所述元素自身代表所述語義或者那些對應(yīng)文本段之間的相似性關(guān)系。因?yàn)樗鲇嘞揖嚯x是可交換的,因此該矩陣在對角線是可對稱的,且只要計算每個唯一的對的余弦距離而不管順序。值得注意的是其它方法和度量也可以被用以確定語義相關(guān)性。取決于所述被使用的矩陣是否是可交換的,所述矩陣可以或者可以不是對稱的。在一實(shí)施例中,每段內(nèi)的每個術(shù)語與其它段內(nèi)的每個術(shù)語以文本方式對比以確定相似性或者語義相關(guān)性。在另一實(shí)施例中,一段的每個單詞可以被索引形成一哈希表,且在段之間的語義相關(guān)性可以通過比較所述索引的重疊或者在所述哈希表內(nèi)術(shù)語的哈希值來確定。在一實(shí)施例中,置于電子-書118的所述文本內(nèi)的段的段或者向量是彼此至少一閥值距離可以被考慮用于確定彼此的相關(guān)性。這個可以被使用以避免相鄰段的不必要的比較和鏈接其會具有一更大的較高相似性關(guān)系的可能性僅僅憑借具有包含所述相同子-主題或者子-情節(jié)的談話的一較大可能性,且其可以不再強(qiáng)調(diào)所述相似性關(guān)系到更遠(yuǎn)但相關(guān)的段。此外,在生成語義連接到彼此相鄰或者非常接近的文本段可能有限定值,因?yàn)樗鲇脩敉ǔ?梢栽谕粫捴虚喿x這些段且因此可以不需要重復(fù)閱讀,或者能更快的通過導(dǎo)航(換頁)而不是通過語義導(dǎo)航導(dǎo)航到附近會話。在另一實(shí)施例中,潛在語義分析(LSA)可以被使用。對應(yīng)于段的列和對應(yīng)術(shù)語的排之間的單詞得分的矩陣可以被生成。該矩陣的尺寸會因此通過在所述詞匯表內(nèi)的段的所述計數(shù)和術(shù)語的計數(shù)被確定。奇異值分解(SVD)之后可以在所述矩陣上被執(zhí)行,且所得到的矩陣可以被用以確定所述最相關(guān)術(shù)語通過減少所述尺寸以包含數(shù)值最大元素。SVD在過濾噪音術(shù)語上是有用的且在段內(nèi)返回最相關(guān)的屬于和相關(guān)性。在另一實(shí)施例中,更多復(fù)雜的方法如解析,信息提取,相關(guān)性提取,自然語言理解,一階邏輯,話語語義,話語表示,等等也可以被使用。例如,所述POS標(biāo)記和NER處理標(biāo)志可以被“分塊”以將它們分離形成句子,且所述句子可以被提供給一語法分析程序以生成一個樹或者圖結(jié)構(gòu)含有每個單詞和在所述句子內(nèi)它與其它單詞的語法或予以關(guān)系。該樹結(jié)果可以被遍歷以識別類似實(shí)體的屬性和特性的事物,以及類似物。相關(guān)抽取也可以被執(zhí)行以識別實(shí)體之間的關(guān)系,例如,所述句子“約翰是費(fèi)城的一名會計”可以被處理以確定“約翰”,一個人,和“會計”,一名詞或職業(yè),具有一“是一”關(guān)系,其中“約翰”和“費(fèi)城”,一地點(diǎn),具有一“(定位)在”關(guān)系。這些相關(guān)性可以被進(jìn)一步使用以識別在一段內(nèi)的內(nèi)容和查找相關(guān)段。例如,如果來自一文本段(如,“約翰于1997年離開費(fèi)城)的一句子內(nèi)的一相關(guān)性被識別,相關(guān)段將包括相同關(guān)系已經(jīng)在其中被引用(如,在前面的句子,“約翰于1990年搬到費(fèi)城”)的句子。此夕卜,這些關(guān)系可以被用以識別與 其中只有所述關(guān)系的一部分被提及的那些關(guān)系有關(guān)的潛在的或者推斷的實(shí)體引用。對于上述例子,一文本內(nèi)所述單詞“所述會計”被提及,所述系統(tǒng)可以推斷出它是指所述人“約翰”。為了使查找相關(guān)段更高效,這些關(guān)系可以被索引且和所述段關(guān)聯(lián)其中所述關(guān)系被提及,以提供所述相關(guān)段的快速查找。用于后續(xù)或者相鄰句子的解析樹通過一時間順序“緊接”關(guān)系可以被隱式鏈接進(jìn)入一段,或者通過在所述句子內(nèi)描述的所述發(fā)生的一順序或者時間順序的時間表內(nèi)的一索弓I。在所述句子內(nèi)的暫時引用可以在所述順序/時間表(例如,包括一數(shù)據(jù)的一句子可以將所述時間定位到所述時間表的該句子內(nèi)在該數(shù)據(jù)處)內(nèi)反映樹的所述方位。另外的基于段的方法可以被用以進(jìn)一步識別在非相鄰段(如,LexRank方法可以被用以收集重要的句子)之間的強(qiáng)語義,相似性,因果或者其它關(guān)系。在另一實(shí)施例中,向量空間方法(如VSM),SVD,統(tǒng)計方法(如基于頻率的術(shù)語)和先進(jìn)方法(如解析和基于相關(guān)性提取的方法)可以被用以確定相關(guān)的段。當(dāng)所述相關(guān)段已經(jīng)被確定后,用于每段的所述相關(guān)段組可以被排名和過濾以識別最相關(guān)的相關(guān)段??紤]最相關(guān)的段的所述計數(shù)可以限制以保持建議段的相關(guān)性,且以避免生成不必要的眾多相關(guān)段以及鏈接它們的導(dǎo)航,其可以導(dǎo)致不適當(dāng)?shù)念~外處理和帶有相關(guān)收益減少的用于界面的聚集。相關(guān)段可以基于它們的如通過所述VSM,余弦距離或者SVD方法確定的關(guān)系得分被排名。與一當(dāng)前段直接相鄰,或者距離所述當(dāng)前段(以單詞,句子,文章等的長度的形式)的距離在一確定的閥值內(nèi)的相關(guān)段可能被排除前提是它們對用戶來說是已經(jīng)直接或者容易查看的;所述用戶可能最近已經(jīng)閱讀它們因此不會要求重新閱讀;且通過直接導(dǎo)航(翻頁)而不是語義導(dǎo)航它們更容易被獲取。如上所述,該優(yōu)化可以在所述程序中被提早使用以減少比較向量的數(shù)目,因此減少需要的處理資源。進(jìn)一步的,基于所述讀者最后閱讀該段的時間一些相關(guān)段可以被排名低些且過濾出或者排名高些。例如,如果一顯著的時間量已經(jīng)過去了因?yàn)橐挥脩粢呀?jīng)閱讀一相關(guān)文本段,有所述用戶已經(jīng)忘記它的可能性較高,且因此不妨重新閱讀它,而不是所述讀者在最近已經(jīng)閱讀的一文本段。在另一實(shí)施例中,一些相關(guān)的段可以基于其它用戶的歷史瀏覽行為被排名,或者與當(dāng)前用戶的配置文件相類似的用戶。例如,如果有一特別段許多用戶經(jīng)常翻轉(zhuǎn)以從一或多個隨后段重復(fù)閱讀,這樣該特別段被識別作為一特別的高相關(guān)段且被排名較高。相關(guān)段計數(shù)的限制可以是一固定計數(shù),在每個方向(S卩,之前或之后)的一固定計數(shù),所述結(jié)果的一預(yù)先確定或者動態(tài)選擇的部分,基于一向量內(nèi)的得分的分布的一動態(tài)計數(shù)對于一給定的段等。在一實(shí)施例中,對于一段的所述相關(guān)段可以基于它們之間的所述相似性關(guān)系得分而被分類,且之后所有相關(guān)段急劇下降,也就是說,大于10%的差異,在相鄰的分類的相關(guān)段之間的所述相似性關(guān)系得分內(nèi)可以被過濾掉。接著,所述方法可以發(fā)現(xiàn)與每對相關(guān)段最相關(guān)的術(shù)語。這些術(shù)語在突出每段和所述相關(guān)段內(nèi)的單詞非常有用,這些單詞和所述相關(guān)段在所述兩個段之間提供所述語義和相關(guān)性關(guān)系。這可以使用所述用于所述向量內(nèi)對應(yīng)于每段的相應(yīng)的術(shù)語的得分來完成。一例子方法包括分段乘積在每段術(shù)語向量內(nèi)對應(yīng)于每段的所述得分以生成一段間術(shù)語重要向量(ISTSV),其表示對應(yīng)于所述兩個文本段的所述詞匯表內(nèi)的每個術(shù)語的所述相關(guān)性。未出現(xiàn)在一或任何段內(nèi)的任何術(shù)語可以具有一零或者非常低的得分,且因此它在ISTSV的得分也將會是零或者非常低。相反,在兩段內(nèi)突出或者出現(xiàn)頻繁的一術(shù)語在ISTSV內(nèi)將會具有一較高的得分。在ISTSV內(nèi)對應(yīng)于所述最高得分的術(shù)語被選擇作為與每對相關(guān)段最相關(guān)的單詞。所述相關(guān)術(shù)語也可以被下調(diào),例如,使用它們的ISTSV得分,只保留最相關(guān)的。值得注意的是所述詞匯表可以包含已經(jīng)被截斷的,Iemmatized或者其它處理的單詞,因此最相關(guān)術(shù)語的組可能需要被映射到所述段內(nèi)出現(xiàn)的所述原始單詞。每個單詞的所述POS類型(名詞,動詞,形容詞及其相似物)和命名實(shí)體類型(名字,地點(diǎn),事情及其類似物)也可以被確定和與相關(guān)術(shù)語聯(lián)系。接著,聯(lián)系所述兩個文本段的一得分被創(chuàng)建,其可以是包含所述兩段之間的所述相關(guān)性得分的一數(shù)據(jù)結(jié)構(gòu),所述最相關(guān)術(shù)語關(guān)聯(lián)兩段,它們對應(yīng)ISTSV得分,及其類似物。對于每段的所述得分可以被聯(lián)系于每段的所述得分和數(shù)據(jù)結(jié)構(gòu)。相關(guān)段可以通過沒相關(guān)術(shù)語被索引以提高查找和讀取速度。所述得分可以在所述電子-書閱讀器設(shè)備102的所述數(shù)據(jù)存儲HO內(nèi)被存儲。最后,基于語義或相似性關(guān)系的用于相關(guān)段,每段以及與所述段最相關(guān)段之間的導(dǎo)航鏈接的所述得分可以被生成。在另一實(shí)施例中,一基于直接啟發(fā)引用的鏈接技術(shù)可以被用于生成導(dǎo)航鏈接和生成或者排名額外相關(guān)段。例如,所述電子文本管理器108可以查找特定章,節(jié)或者段的直接引用且插入導(dǎo)航鏈接到所述引用的章,節(jié)或者段上。作為一例子,電子-書118的所述文本內(nèi)的“第二章”的 每個提及可以被隱含的導(dǎo)航鏈接于所述電子-書118內(nèi)的所述第二章的所述開頭。同樣,在電子-書118內(nèi)的所述文本內(nèi)的“節(jié)5.1”的每個提及可以被隱含的導(dǎo)航鏈接于節(jié)5.1的所述開頭。相關(guān)章和節(jié)通過所述文本內(nèi)相應(yīng)的章或者節(jié)開頭可以被是被,例如,使用與所述電子-書118—起的可獲得的元數(shù)據(jù)或者標(biāo)記信息。進(jìn)一步的,所述電子文本管理器108可以使用所述文本內(nèi)的所述上下文信息圍繞引用的更精確的所述直接章或節(jié),在所述章或節(jié)內(nèi)指定所述特定相關(guān)的位置或者段。例如,當(dāng)一句子說“我們在第五章看到毛毛蟲如何變成蝴蝶”,所述導(dǎo)航鏈接可以直接指向第五章內(nèi)的所述特定的談?wù)撁x變成蝴蝶的文本子群,或者包含有所述術(shù)語“毛毛蟲”,“變成”,“蝴蝶”的文本子群,或者它們的結(jié)合和它們的變形形式。值得指出的是該方法也可以適用于向前引用,例如,類似句子如“我們將在第五章看到毛毛蟲如何變成蝴蝶”。相同的,例如,在文本書或者技術(shù)文本內(nèi),所述體統(tǒng)可以識別直接引用如表,數(shù)字,圖標(biāo),公式或者方程式,且插入導(dǎo)航鏈接到所述相應(yīng)的表,數(shù)字等等,在它們被提及的地方插入。根據(jù)本文所述公開的,圖5示出了以電子文本內(nèi)在文本子群之間用于圖形表示相似性關(guān)系的一實(shí)施例方法的一流程圖。圖5的所述方法相對于圖1和圖2示出的所述例子電子-書閱讀器102被描述,盡管所述方法可以通過任何合適的系統(tǒng)或者電子設(shè)備被實(shí)現(xiàn)。圖5的所述步驟可以被整個,或部分的實(shí)現(xiàn),通過圖1A所示的駐留在所述電子-書閱讀器102上的所述電子文本管理器108。所述電子文本管理器108可以通過軟件,硬件,固件,或者它們的結(jié)合被實(shí)現(xiàn)。參考圖5,所述方法包括接收用于搜索一電子文本(步驟500)的搜索條件。例如,所述電子-書閱讀器102的一用戶可以與所述用戶界面112相交互用于接入搜索條件如,但是不限于此,一任務(wù),地點(diǎn),事情,及其類似物的,或者它們的結(jié)合的識別。例如,所述用戶界面112可以包括用于可以輸入搜索條件的一鍵盤。另一例子,所述用戶可以從所述電子-書118的所述文本選擇單詞,該單詞顯示于所述用于界面112上被用作所述搜索條件,如通過一鼠標(biāo)突出或者通過使用觸摸手勢。所述搜索條件可以通過用戶被輸入用于搜索所述電子-書文本118通過與所述搜索條件性格的內(nèi)容。
`
圖5的所述方法包括確定在所述電子文本(步驟502)內(nèi)的文本子群。例如,所述電子文本管理器108可以選擇在所述電子-書118內(nèi)彼此接近的位置的單詞,句子,和/或段且包含相似的內(nèi)容以創(chuàng)建一文本子群。對于所述電子-文本118多個文本子群可以被定義.用于關(guān)聯(lián)所述選擇的單詞,句子,和/或段作為一文本集群的信息可以被存儲在所述數(shù)據(jù)存儲110內(nèi)。在另一例子中,文本子群可以根據(jù)章,段,句子,及其類似物,以及它們的結(jié)合被定義。圖5的所述方法包括確定,對于每個文本子群,在所述搜索條件和所述文本子群(步驟504)之間一相似性關(guān)系。例如,所述電子文本管理器108可以在所述搜索條件和所述電子書118的每個所述文本集群之間確定一相似性得分。所述電子文本管理器108可以使用生成的所述術(shù)語向量用于每個文本集群或者子群以確定一相似性得分,例如,通過一術(shù)語向量代表所述搜索條件術(shù)語以及使用VSM方法以確定所述最相關(guān)子群和每個子群的所述相似性關(guān)系。在一實(shí)施例中,所述使用所述詞匯表創(chuàng)建的索引可以被用于快速識別所述子群以及在所述搜索條件內(nèi)術(shù)語的定位。值得注意的是與所述搜索條件一起,所述電子文本管理器108也可以包括來自所述文本集群或者子群的屬于在所述用戶的當(dāng)前閱讀位置,如此所述內(nèi)容可以被使用以進(jìn)一步的縮小所述用戶可能搜索的東西。圖5的所述方法包括表示,對于每個文本子群,代表在所述文本子群和所述搜索條件(步驟506)之間的所述相似性關(guān)系的一圖片。例如,所述電子文本管理器108可以控制所述用戶界面112的一顯示器以顯示用于表示一所述電子-書118的一文本子群和用戶進(jìn)入搜索條件之間的所述相似性關(guān)系的一圖片。在一例子中,所述顯示器的一部分可以表示所述文本子群。所述文本子群可以通過數(shù)個顯示的圖標(biāo)或者其它標(biāo)記被定義。所述圖標(biāo)或者其它標(biāo)記可以被標(biāo)記不同的顏色以表明對應(yīng)于所述搜索條件的所述相關(guān)文本子群的一相關(guān)性。例如,所述紅顏色可以表明所述文本子群與所述搜索條件的高度相關(guān)性,所述黃顏色可以表明所述文本子群與所述搜索條件的中等相關(guān)性,以及所述藍(lán)色看可以表明所述文本子群與所述搜索條件具有低水平相關(guān)性。在一例子中,圖2示出的所述電子-書閱讀器102的所述顯示器200被電子文本管理器所控制以顯示代表所述電子-書的文本集群的一相關(guān)性的圖片204。在該例子中,所述段202被選擇且所述圖片204用顏色部分206表示,與所述搜索條件,等,所述段202相關(guān)的所述文本集群。所述圖片204可以是一時間表或者進(jìn)度條用以作為所述電子文本的一或多個相關(guān)部分的代表且突出所述相關(guān)部分。所述用戶可以與所述電子-書閱讀器102的所述用戶界面相交互以交互所述圖形204用以導(dǎo)航到所述相關(guān)部分的一或多個上。圖5的所述方法包括接收用戶輸入通過選擇所述圖形(步驟508)的一個。例如,圖2所示的所述圖形204的所述顏色部分206可以適合的被用戶所選擇。圖5的所述方法包括控制一用戶界面以呈現(xiàn)關(guān)聯(lián)與所述選擇的段(步驟510)的所述文本子群的內(nèi)容。例如,所述用戶可以選擇圖2所示的所述部分206的一個。響應(yīng)于所述顏色部分206的選擇,所述電子文本管理器108可以控制所述用戶界面112的所述顯示器以呈現(xiàn)關(guān)聯(lián)于所述選擇部分206的所述文本集群的內(nèi)容。根據(jù)本文所空開的實(shí)施例,一電子-書閱讀器或者其它電子設(shè)備根據(jù)一電子文本的章和/或段可以定義文本子群。一電子文本管理器,如圖1A示出的所述電子文本管理器108,可以控制關(guān)聯(lián)于所述章和/或段的一或多個圖形的一顯示器。例如,一或多個標(biāo)記可以被顯示且每個表示一電子-書的一章或段。接著,一用戶可以合適的與所述圖形的一個交互以選擇所述圖形。所·述電子文本管理器可以接收所述用戶的輸入通過選擇所述圖形。響應(yīng)與所述用戶輸入的接收,所述電子文本管理器可以呈現(xiàn)表示與用戶輸入搜索條件想關(guān)聯(lián)的關(guān)系的圖形。例如,為了響應(yīng)以接收用戶的數(shù)據(jù)選擇關(guān)聯(lián)一電子-書的一章,所述電子文本管理器可以控制一顯示器以呈現(xiàn)代表用戶輸入搜索條件和所述章內(nèi)段之間的相關(guān)性的圖形。在另一例子中,選擇關(guān)聯(lián)一電子-書的一段的一圖形以響應(yīng)于接收用戶的輸入,所述電子文本管理器可以控制一顯示器以呈現(xiàn)代表所述用戶輸入搜索條件和所述段內(nèi)句子之間的圖形。進(jìn)一步的,例如,所述呈現(xiàn)的圖形可以是所述搜索條件和所述電子文本的對應(yīng)部分(例如,段,句子,及其類似物)之間的一相似性得分的一指示器。根據(jù)本發(fā)明公開的實(shí)施例,鏈接可以基于用戶導(dǎo)航行為而生成。所述用戶導(dǎo)航行為可以從一電子文本的一或多個用戶中被選擇。所述用戶導(dǎo)航行為可以被單獨(dú)使用或者和其它本發(fā)明公開的如集群或鏈接生成一起使用。更特別的,用戶導(dǎo)航行為可以匯總和分析以識別潛在相關(guān)的文本子群或者文本集群。以及以生成它們之間的鏈接。在一實(shí)施例中,用戶導(dǎo)航行為可以參考一用戶與一電子文本交互的方法和/或順序,如含有技術(shù)信息的一電子-文本。例如,用戶導(dǎo)航行為可以通過跟蹤一或多個被發(fā)現(xiàn):在一電子文本(例如,一篇,章,段,句子,在一個頁面便宜,在一電子文本內(nèi)的一位置處的類似物)內(nèi)一用戶的一當(dāng)前位置;在一電子文本(例如,在一位置處所述時間花費(fèi)可以被比較于在所述電子文本的一相似尺寸部分處的一用戶花費(fèi)的所述平均時間)內(nèi)的一位置處的一用戶的時間花費(fèi));來自一電子文本(例如,在一電子文本的部分之間“翻轉(zhuǎn)”或“滾動”)內(nèi)的一當(dāng)前位置的一用戶的一非線性導(dǎo)航;確定或者發(fā)現(xiàn)以用戶在一電子文本的新的部分花費(fèi)的一預(yù)定值;以及確定或者發(fā)現(xiàn)以用戶在翻轉(zhuǎn)到所述電子文本的一當(dāng)前位置之前的花費(fèi)的時間的電子文本的部分。一電子文本管理器,例如,可以通過用戶推斷在電子文本內(nèi)的各種部分之間的導(dǎo)航和/或時間花費(fèi)意味著在那些部分有一相似性或語義關(guān)系。所述電子文本管理器可以使用該信息用以識別哪些部分應(yīng)該通過被集群起來通過分析所述用戶在此連續(xù)部分花費(fèi)的時間。所述電子文本管理器可以使用該信息以生成在所述部分或者文本子群之間的鏈接。所述鏈接可以被定位以使所述用戶導(dǎo)航所述部分。根據(jù)本文所空開的實(shí)施例,圖6示出了分析用于在所述電子文本內(nèi)用于鏈接文本子群的一電子文本的用戶導(dǎo)航。圖6的方法對應(yīng)于圖1和圖2是示出的所述例子電子-書閱讀器102被描述,盡管所述方法可以通過任何合適的系統(tǒng)或者電子設(shè)備被實(shí)現(xiàn)。圖6的所述步驟可以被整個,或者部分實(shí)現(xiàn),通過圖1A所示駐留于所述電子-書閱讀器102上的所述電子文本管理器 。所述電子文本管理器108可以通過軟件,硬件,固件或者它們的結(jié)合被實(shí)現(xiàn)。參考圖6,所述方法包括確定在電子文本(步驟600)內(nèi)的文本子群之間的一用戶非線性導(dǎo)航。例如,圖1A示出的所述電子-書閱讀器102的所述電子文本管理器監(jiān)視一用戶的輸入以關(guān)聯(lián)所述電子-書118.例如,所述電子文本管理器108可以確定所述用戶通過在所述電子-書118的章或者其它部分(例如,文本子群)的非線性移動與所述電子-書118關(guān)聯(lián)。所述電子文本管理器108也可以確定在不同部分處花費(fèi)的時間。本文公開的該信息和其它信息可以通過所述電子文本管理器108用以確定所述用戶在所述電子-書118的文本子群之間具有非線性導(dǎo)航。在一例子中,用戶導(dǎo)航行為信息可以由多個用戶聚集且分析以識別導(dǎo)航趨勢,如,但不限于此,在一電子文本的文章子群之間的非線性導(dǎo)航。所述信息可以被用于確定哪個文本子群是所述用戶在之間頻繁,非線性導(dǎo)航的?;谠撔畔?,一電子文本管理器可以鏈接本文所公開的所述文本子群。在另一例子中,聚集用戶導(dǎo)航行為信息的聚集可以通過具有多個電子文本設(shè)備被實(shí)現(xiàn),如,所述電子-書閱讀器102和104如圖1A所示,跟蹤它們各自用戶的所述導(dǎo)航行為。該信息可以被報告給所述電子-書服務(wù)器106。例如,所述電子-書閱讀器102和104通過網(wǎng)絡(luò)116可以報告關(guān)于一特定電子-書到所述電子-書服務(wù)器的各自導(dǎo)航行為信息。在該例子中,所述電子-書服務(wù)器106可以分析所述聚集信息以確定本發(fā)公開的文本子群之間的鏈接。所述電子-書服務(wù)器106可以接著報告所述鏈接信息給所述電子-書閱讀器102和104用以幫助一用戶在本文所公開的文本子群之間的導(dǎo)航。進(jìn)一步的,例如,穿過多個電子設(shè)備趨勢信息可以被用于識別相關(guān)集群以及生成本發(fā)明公開的鏈接。進(jìn)一步的,該用戶行為信息可以被用于自動生成的鏈接的加權(quán)和優(yōu)先級。所述鏈接信息可以通過用戶的需要被單獨(dú)提供給給電子設(shè)備,或通過電子設(shè)備集體下載。圖6的所述方法包括鏈接所述文本子群響應(yīng)以確定在所述文本子群(步驟602)之間的所述用戶非線性導(dǎo)航。例如,所述電子文本管理器108可以鏈接所述文本子群到一起。進(jìn)一步的,例如,所述電子文本管理器108可以在所述電子文本的元數(shù)據(jù)內(nèi)一存儲導(dǎo)航輔助表示所述文本子群的關(guān)聯(lián)。圖6的所述方法包括呈現(xiàn)鏈接所述文本子群到另一個(步驟604)的一導(dǎo)航鏈接。例如,所述電子文本管理器108可以控制所述用戶界面112以呈現(xiàn)對應(yīng)于一顯示的文本子群的一導(dǎo)航鏈接,所述顯示的文本子群可以由用戶選擇以導(dǎo)航到與所述顯示的文本子群鏈接的另一文本子群。根據(jù)本文所公開的實(shí)施例,一電子設(shè)備的一用戶界面可以被控制以顯示在一電子文本內(nèi)的與一用戶的一當(dāng)前位置相關(guān)的的文本子群。例如,圖7是保護(hù)了控制一用戶界面到顯示在一電子文本內(nèi)與一用戶的一當(dāng)前位置相關(guān)的文本子群的一示例方法的一流程圖。圖7的所述方法對應(yīng)于圖1和圖2所述例子電子-書閱讀器102被描述,盡管所述方法可以由任何合適的系統(tǒng)或者電子設(shè)備被實(shí)現(xiàn)。圖7的所述步驟可以被整體實(shí)現(xiàn),或者部分實(shí)現(xiàn),,通過駐留在圖1A所述的電子-書閱讀器102上的所述電子文本管理器108.所述電子文本管理器108可以通過軟件,硬件,固件,或者它們的結(jié)合被實(shí)現(xiàn)。參考圖7,所述方法包括在一電子文本(步驟700)內(nèi)確定一當(dāng)前用戶位置。例如,圖1A所示的所述電子-書閱讀器的所述電子文本管理器108可以確定一頁號,章節(jié)號,段識別符,句子識別符,在一頁面的偏移量,以及在一電子文本內(nèi)一用戶的位置的類似物。所述當(dāng)前用戶的位置可以對應(yīng)于所述頁,章,以及當(dāng)前顯示給所述用戶的類似物。例如,圖8示出了在一顯示區(qū)域800內(nèi)一電子文本的一部分的一電子-書閱讀器102的一前視圖。圖8示出的所述顯示區(qū)域8 00內(nèi)的所述文本對應(yīng)于在所述電子文本內(nèi)的所述當(dāng)前用戶位置。圖7的所述方法包括確定對應(yīng)于所述當(dāng)前用戶位置(步驟702)的一當(dāng)前文本子群。繼續(xù)步驟700的所述例子,圖1A示出的所述電子文本管理器108可以確定對應(yīng)于在所述電子文本內(nèi)的所述當(dāng)前用戶位置的一當(dāng)前文本子群。例如,在圖8示出的所述顯示區(qū)域800內(nèi)的所述當(dāng)前顯示文本可以對應(yīng)于本發(fā)明空開的一文本子群。所述當(dāng)前顯示的文本可以包括所述文本子群的所述內(nèi)容的整體或者一部分。所述電子文本管理器108可以確定所述當(dāng)前顯示的文本在所述顯示區(qū)域800內(nèi)對應(yīng)于一之前定義的文本子群,其可以被稱作一當(dāng)前翁主子群因?yàn)槠湓诋?dāng)前被整體或部分顯示。圖7的所述方法包括在第一顯示區(qū)域顯示,對應(yīng)于所述當(dāng)前文本子群(步驟704)的所述電子文本的一部分。例如,所述電子文本管理器108可以控制示于圖8的所述顯示器200以顯示在所述顯示區(qū)域800內(nèi),所述文本對應(yīng)于所述當(dāng)前文本子群。圖7的所述方法包括顯示在第二顯示區(qū)域,置于當(dāng)前文本子群(步驟706)前的一或多個相關(guān)的文本子群。接著上述例子,所述電子文本管理器108可以控制圖8所示的所述顯示器200以顯示在一顯示區(qū)域802內(nèi),置于所述當(dāng)前文本子群前的一或多個文本子群的內(nèi)容。在所述顯示區(qū)域802內(nèi),所述顯示器800可以顯示一文本子群的文本,該文本被置于所述當(dāng)前文本子群之前且與本文所公開的所述當(dāng)前文本子群具有一相似性關(guān)系。顯示在所述顯示區(qū)域802內(nèi)的文本可以包括所述對應(yīng)的文本子群的所述內(nèi)容的整體或一部分。圖7的所述方法包括在一第三顯示區(qū)域顯示,置于所述當(dāng)前文本子群(步驟708)之后的一或多個相關(guān)的文本子群。接著上述例子,所述電子文本管理器108可以控制圖8所示的所述顯示器200以顯示在一顯示區(qū)域804內(nèi),置于所述當(dāng)前文本子群之后的一或多個文本子群的內(nèi)容。在所述顯示區(qū)域804內(nèi),所述顯示器800可以顯示置于所述當(dāng)前文本子群之后的一文本子群的文本且具與本文所公開的所述當(dāng)前文本子群具有一相似性關(guān)系。在所述顯示區(qū)域804內(nèi)顯示的所述文本包括所述相應(yīng)的文本子群的所述內(nèi)容的所述整體或一部分。值得注意的是步驟708,和所述顯示區(qū)域804 —起且其中所包含的所述文本,是可以可選擇的。例如,當(dāng)閱讀一小說,所述讀者可能不希望他或她還沒有閱讀的即將到來的文本被顯示出,因?yàn)檫@可能泄露劇情元素且?guī)硭鲩喿x體驗(yàn)的負(fù)面影響。盡管如此,所述顯示區(qū)域804可以被顯示如果所述相應(yīng)的文本子群被置于已經(jīng)被所述用戶所閱讀的所述當(dāng)前顯示的文本子群的后面,例如,當(dāng)所述用戶已經(jīng)暫停導(dǎo)航到置于所述當(dāng)前文本子群的前面的一文本。在一實(shí)施例中,所述電子文本管理器108可以排序在所述顯示區(qū)域802和804內(nèi)顯示的所述相關(guān)的文本子群通過每個相應(yīng)文本子群和所述當(dāng)前文本子群之間的一相似性得分。例如,所述電子文本管理器108可以在所述當(dāng)前文本子群和置于所述當(dāng)前文本子群之前和/或之后的每個文本子群之間確定一相似性得分。所述電子文本管理器108可以排序或者排名基于所述相似性得分的所述文本子群。例如,前置于所述當(dāng)前文本子群的所述文本子群可以從最高到最低相似性得分被排序。進(jìn)一步的,例如,置于所述當(dāng)前文本子群后的所述文本子群可以從最高到最低相似性得分被排序。在一例子中,具有最高相似性等分的一或多個文本子群的所述內(nèi)容的全部或一部分可以在所述顯示區(qū)域802或804內(nèi)被顯示。進(jìn)一步的,例如,對于每個顯示的文本子群,所述電子文本管理器108可以控制所述顯示器800以顯示在一區(qū)域內(nèi)作為相似性指標(biāo)的一圖形,該區(qū)域鄰接用于每個相應(yīng)的文本子群所述顯示區(qū)域。在一實(shí)施例中,所述圖形可以是所述相似性得分的一值或用于指示所述相似性的在此公開的一顏色。文本子群可以基于一些標(biāo)準(zhǔn)被排序或排名包括,但不限于此,一定水平的語義關(guān)系,相似關(guān)鍵字的發(fā)生,類似實(shí)體的存在,及其類似物或者它們的結(jié)合。顯示區(qū)域806通過合適用戶輸入是可選擇的,且對于操作,控制,和/或精煉的用戶導(dǎo)航選擇是可用的。 在一實(shí)施例中,所述電子文本管理器108可以顯示一導(dǎo)航以導(dǎo)航鏈接到所對應(yīng)的文本子群而不是在顯示區(qū)域802和804內(nèi)的子群的一部分或者所有內(nèi)容。在另一實(shí)施例中,所述顯示區(qū)域802和804可以和所述相應(yīng)的文本一起顯示,但是例外,以部分或整體形式,可以作為一導(dǎo)航鏈接本身。所述用戶可以與所述顯示區(qū)域802和804相交互盡管,例如,一觸摸屏顯示器200,以直接導(dǎo)航到所述電子-書118內(nèi)的所述相應(yīng)文本子群的所述位置。所述顯示區(qū)域802也可以顯示關(guān)于所述相關(guān)的文本子群的其他信息,如所述相關(guān)得分的圖形指標(biāo)或者數(shù)字代表,在顯示區(qū)域800內(nèi)所述當(dāng)前文本子群常見的所述最相關(guān)的術(shù)語以及相關(guān)子群,所述常見相關(guān)術(shù)語的段間術(shù)語重要性向量得分,所述相關(guān)的文本子群的相關(guān)的活絕度的定位,等等。在一實(shí)施例中,一顯示區(qū)域806可以在所述顯示器200上被顯示。該區(qū)域可以提供控制通過該控制一用戶可以改進(jìn)或者操作所述選擇且導(dǎo)航到所相關(guān)的子群。例如,如圖8所示,所述顯示器區(qū)域806可以包括用戶界面(UI)控制以允許所述用戶來操作相關(guān)段的所述選擇在選擇相關(guān)子群中通過調(diào)整分配到多種單詞類型的所述重要性。在該實(shí)施例中,所述控制會顯示為一“標(biāo)簽云”,允許所述用戶以調(diào)整對于人物,地點(diǎn)和事情的重要性。因此,如果一用戶尋找基于所述當(dāng)前文本子群內(nèi)的所述字符引用的相關(guān)子群,他可以分配更多重要性到所述“人物”標(biāo)簽。調(diào)整所述標(biāo)簽云可以調(diào)整對于所述常見相關(guān)的與每對子群和所述相關(guān)子群的所述得分相關(guān)聯(lián)的術(shù)語的不同權(quán)重,其也可以與它們的POS單詞類型也稱作命名實(shí)體類型相關(guān)聯(lián)。這些調(diào)整的權(quán)重之后可以被用以確定所述子群之間的更新的語義關(guān)系得分,且調(diào)整所述排序,當(dāng)前的相關(guān)子群的過濾和選擇。值得注意的是減少需要的處理資源,如CPU和內(nèi)層,只有最靠近所述當(dāng)前文本子群的所述文本子群的一部分和它們對應(yīng)相關(guān)的子群得分可以被訪問和加載到內(nèi)存中,無論是提前或者按需。在顯示區(qū)域800內(nèi)的文本的所述顯示部分與可能的導(dǎo)航相關(guān)范圍一起可以成為可能,如在相關(guān)常見術(shù)語內(nèi)通過嵌入可訪問的超級鏈接,或者呈現(xiàn)n元素如按鈕,或者帶有導(dǎo)航相關(guān)的訪問(如觸摸屏設(shè)備)的一文本部分的所述顯示部分上關(guān)聯(lián)的觸摸手勢。這些元素可以是不可見的或非突出顯示的直到一用戶在所述顯示的文本段上執(zhí)行一訪問,例如通過在它上面執(zhí)行鼠標(biāo),或者觸摸它。當(dāng)該用戶的訪問被接收時,所述電子文本管理器108之后可以呈現(xiàn)用于對應(yīng)于所述文本段的所述文本子群的可用的所述導(dǎo)航選擇。在一實(shí)施例中,所述電子文本管理器108可以突出包含在所述顯示區(qū)域800的所述當(dāng)前子群,例如,通過改變所述文本的所述顏色,或者所述文本段的所述背景顏色,以向用戶指示與所述當(dāng)前文本段對應(yīng)的可能被找到的相應(yīng)相關(guān)段。這可能有助于向所述用戶提供視覺反饋所述當(dāng)前閱讀內(nèi)容關(guān)于所述電子文本管理器108考慮什么。在一實(shí)施例中,一用戶通過縮小或者擴(kuò)大能操作所述選擇的文本子群的所述邊界,其也可以影響相關(guān)子群的所述范圍。所述用戶也能選擇部分,或者全部其它的,相鄰子群以擴(kuò)大相關(guān)子群的所述范圍。在該例子中,候選相關(guān)段的所述計數(shù)是自動變大。因此,這些所述最相關(guān)的可以通過選擇需求或者提前進(jìn)行選擇,通過將所述選擇的用戶的段視為一單獨(dú)文本子群以及使用上述方法查找相關(guān)子群。所述電子文本管理器108之后可以確定所述可用的到港選擇。如之前所述,所述電子文本管理器108檢索,排序和過濾基于文本的所述子群的所述相關(guān)子群所述文本是所述用戶當(dāng)前位置所在,或者當(dāng)前已執(zhí)行的一訪問(如一鼠標(biāo),鍵盤,手勢事件,及其類似物)等。如果所述用戶明確已經(jīng)選擇或者突出在所述當(dāng)前文本子群的一些單詞,所述電子文本管理器108使用那些以動態(tài)過濾和排序所述相關(guān)段。相關(guān)段可以通過每個相關(guān)的屬于被所以以提高查找和讀取速度。另外,所述電子文本管理器108也可以嘗試猜測所述用戶想要什么且僅呈現(xiàn)(或者自動執(zhí)行)最有可能的訪問,例如,通過其他用戶之前在所述文本的所述同樣段的訪問,或者文本的相似段的訪問。在一實(shí)施例中,所述電子文本管理器108可以僅顯示導(dǎo)航選擇鏈接到在所述當(dāng)前段之間出現(xiàn)的相關(guān)段。這是因?yàn)橛脩敉ǔ?赡軆H需要重新閱讀之前閱讀部分,且因?yàn)樘崆伴喿x可能對所述閱讀體驗(yàn)產(chǎn)生負(fù)面影響,例如,通過劇情透露。因此,即使能鏈接到可得到的隨后子群,最好不呈現(xiàn)它們因?yàn)橐馔鈱?dǎo)航所述用戶可以取得超越自己且潛在的破壞所述閱讀體驗(yàn)。在一實(shí)施例中,向前導(dǎo)航選擇可以不是最初呈現(xiàn)的,但是如果用戶特別要求也可以被呈現(xiàn),例如通過點(diǎn)擊鼠標(biāo)右鍵,或者使用另一種手勢,及其類似物。如果所述導(dǎo)航到所述當(dāng)期用戶已經(jīng)至少閱讀一次的段上向前導(dǎo)航選擇也可以自動呈現(xiàn)。如果所述用戶不是相同的,或者關(guān)于用戶身份有疑問的,向前導(dǎo)航選擇可能最好是隱藏。所述電子文本管理器108之后可以呈現(xiàn)所述可用的導(dǎo)航選擇。所述電子文本管理器108可以在一單獨(dú)的 導(dǎo)航區(qū)域內(nèi)安排鏈接,如802和804,基于所述得分或排序和距離所述當(dāng)前文本子群的距離。值得注意的是這構(gòu)成一“就地”顯示模式,其中所述子群選擇可以被呈現(xiàn)在所述顯示器的一固定部分,且所述導(dǎo)航可以被包含在所述顯示器的那部分,所述當(dāng)前文本子群對于所述用戶通常是可見的。例如,在圖8中,所述導(dǎo)航可以被包含于所述部分802或者804或者兩個。在另一實(shí)施例中,如上所述,所述相關(guān)段內(nèi)容可以作為一重疊或者彈出被顯示,做好被不顯眼的放置。盡管如此,在另一實(shí)施例中,所述電子文本管理器108可以提供一基于導(dǎo)航的模型,其中所述用戶實(shí)際上導(dǎo)航到所述文本內(nèi)的所述相關(guān)子群的所述位置。接下三個方法可和一就地顯示模式結(jié)合或者和一基于導(dǎo)航的模型結(jié)合。在一實(shí)施例中,所述導(dǎo)航選擇可以作為離散n元素被呈現(xiàn),如超級鏈接或按鈕通過描述文本識別所述相關(guān)子群以及對應(yīng)元素?fù)?jù),包括如對應(yīng)頁號,相關(guān)關(guān)鍵字,語義關(guān)系得分,及其類似物的信息。在另一實(shí)施例中,所述鏈接可以被嵌入到所述當(dāng)前子群的所述文本內(nèi),例如,通過轉(zhuǎn)換在所述文本內(nèi)相關(guān)常用術(shù)語的一或多個到可訪問的超練級。所述超鏈接可以指向所述最相關(guān)段的開頭;直接指向所述最相關(guān)段的所述文本內(nèi)所述相關(guān)單詞的一出現(xiàn)處;或者被點(diǎn)擊,可以顯示相關(guān)段的一列表,通過已經(jīng)被點(diǎn)擊的所述單詞被潛在的過濾和排序。在又一實(shí)施例中,導(dǎo)航到相關(guān)子群的所述選擇可以在單獨(dú)顯示區(qū)域內(nèi)和所述對應(yīng)的文本一起被顯示,如圖8內(nèi)802和804。來自相應(yīng)候選相關(guān)子群的所述文本可以被縮小或者縮短當(dāng)被呈現(xiàn)以便節(jié)省顯示空間,特別是如果里多個候選子群時。在一實(shí)施例中,所述相關(guān)子群的所述文本內(nèi)容可以在一固定單詞或字符長度之后通過截斷簡單的縮小,優(yōu)選在一單詞的邊界,和追加省略號(“…”)。在另一實(shí)施例中,先進(jìn)方法如摘要可以被使用以生成關(guān)于相關(guān)子群的一摘要。查詢偏置的摘要方法可以通過對所述當(dāng)前的且相關(guān)的子群常見的所述相關(guān)術(shù)語,和/或選擇的用戶文本被使用,因?yàn)樗霾樵冃g(shù)語偏置所述摘要,這樣所述最相關(guān)的句子被顯示。所述文本,如果被縮小,如果所述用戶如此要求的話可以被擴(kuò)大,通過點(diǎn)擊或者手勢。所述電子文本管理器108可以突出對于所述當(dāng)前和/或相關(guān)子群常見的相關(guān)術(shù)語以視覺的指示給所述用戶所述單詞,所述單詞在所述兩個文本段之間提供所述語義關(guān)系的所述偏置。`隨著鏈接到相關(guān)的段,所述系統(tǒng)也可以呈現(xiàn)一當(dāng)前相關(guān)性得分;最相關(guān)或者常見術(shù)語的一列表;所述相關(guān)段的所述相關(guān)的或者絕對的位置的一圖形或者其它指示;及其類似物。所述電子文本管理器108之后在所述呈現(xiàn)的導(dǎo)航選擇上可以檢測用戶訪問。所述電子文本管理器108可以檢測對于所述n方法的特定的訪問,例如,在觸摸屏設(shè)備的導(dǎo)航手勢或者在瀏覽器上的鼠標(biāo)事件。通過一鏈接接收一用戶訪問,所述電子文本管理器108之后可以控制所述W200以導(dǎo)航到所述選擇的相關(guān)的子群上。如之前所述,使用一鏈接可以導(dǎo)航到所述相關(guān)段的所述開頭;或者所述相關(guān)段的所述最相關(guān)部分,即是,最相關(guān)單詞大部分出現(xiàn)在所述部分中?;蛘撸鎸?dǎo)航到所述相關(guān)子群,所述顯示區(qū)域的一部分如802可以被更新以顯示所述相關(guān)子群的所述文本。導(dǎo)航到一相關(guān)段上,所述電子文本管理器108可以突出所述確切相關(guān)的子群,如通過改變文本的顏色或者所述段的背景顏色等等,以準(zhǔn)確的識別給用戶關(guān)于所述最相關(guān)文本在哪里。所述顯示器可以被呈現(xiàn)這樣所述相關(guān)子群位于所述顯示屏的中興,或者交替的位于頂部,以瞬間捕獲所述用戶的注意。所述電子文本管理器108可以在所述相關(guān)子群內(nèi)突出所述相關(guān)的常見術(shù)語僅在所述用戶導(dǎo)航所述術(shù)語之后。當(dāng)一用戶導(dǎo)航通過所述相關(guān)段,所述電子文本管理器108可以保持所述用戶已經(jīng)導(dǎo)航通過的子群的一鏈接列表作為一“面包削”序列。所述面包削序列幫助所述電子文本管理器108接收用戶導(dǎo)航命令且通過沿所述列表的來回遍歷準(zhǔn)確的導(dǎo)航。值得注意的是所述面包削列表可以是一圖,特別是一數(shù),對于遍歷所述相同相關(guān)段多次的復(fù)雜導(dǎo)航序列。值得注意的面包削可以是一純粹的內(nèi)部管理數(shù)據(jù)結(jié)構(gòu),以及描述所述用戶的導(dǎo)航歷史一 n元素,如在許多互聯(lián)網(wǎng)上看到的。所述電子文本管理器108也可以提供一快速“跳回”導(dǎo)航選擇,其可以是一容易訪問的鏈接,按鈕或者手勢以導(dǎo)航返回到面包削的軌跡內(nèi)的所述之前段,或者直接導(dǎo)航到所述面包削軌跡的所述開頭,即是,所述用戶停止線性進(jìn)程以及開始非線性導(dǎo)航的所述當(dāng)前文本子群。當(dāng)所述用戶跳回或者其它方式恢復(fù)線性進(jìn)程,所述面包削記錄可以由內(nèi)存刪除。盡管如此,在刪除之前,在所述面包削內(nèi)的所述導(dǎo)航細(xì)節(jié)可以被加載到所述服務(wù)器106作為非線性導(dǎo)航的一例子用于分析和聚集,如隨后更詳細(xì)的描述。根據(jù)本發(fā)明公開的實(shí)施例,一電子文本的語義導(dǎo)航通過遍歷實(shí)體之間關(guān)系的語義圖或原因/結(jié)果圖可以實(shí)現(xiàn),該實(shí)體如,但不限于此,字符,地點(diǎn),對象,各種劇情元素,及其類似物。一語義圖可以被靜態(tài)(例如,通過人工輸入)或者動態(tài)(例如,通過語義或者靜態(tài)分析)生成。一語義圖可以被生成,例如,手動的通過人工輸入形式如注釋,標(biāo)記,以及由一作者,編輯,或者編輯人員提供的類似物。在另一實(shí)施例中,一語義圖可以被協(xié)作生成如通過閱讀者的共享。在另一例子中,一語義圖可以通過一合適的技術(shù)被自動生成如,但不限于此,語義分析;自然語言處理;標(biāo)記化技術(shù)如,部分詞性標(biāo)注,命名實(shí)體識別,詞干,Iemmatization,分析,關(guān)系提取,潛在語義分析,向量空間模型,以及奇異值分解。在一電子文本(例如,一文本種子和一文本子群)的部分之間的因果關(guān)系的識別;基于本體的語義相似性;用于比較語義相關(guān)性的一語義索引;以及一統(tǒng)計相似性;和用戶在一電子文本上的被動觀察(例如,當(dāng)注意到一用戶一反常態(tài)的從某個位置翻轉(zhuǎn),且注意到他或他從哪里翻轉(zhuǎn)到哪里)。在子群之間的一語義相關(guān)性可以基于這些例子和其它本文所公開的被確定。在一實(shí)施例中,·導(dǎo)航鏈接可以操作以使所述相關(guān)內(nèi)容過的“就地”顯示成為可能。所述用戶可以點(diǎn)擊,觸摸,或者其它方式選擇一可用的導(dǎo)航鏈接,且代替所述n改變所述用戶相對于所述導(dǎo)航鏈接指向的所述相關(guān)文本子群的在所述文本內(nèi)的位置,所述n可以顯示所述相關(guān)的內(nèi)容,例如,在一彈出或一疊加層,或如圖8示出的所述顯示器的一第二區(qū)域內(nèi)。特別的,如果所述相關(guān)子群包含數(shù)字或者圖表,所述導(dǎo)航可能涉及簡單得顯示所述相關(guān)的數(shù)字或者圖表與所述當(dāng)前顯示的文本子群一起,例如,作為一非侵入式的彈出或疊加層。這樣,當(dāng)一文本子群頭論一具體的數(shù)字,當(dāng)閱讀所述相關(guān)文本時所述讀者可以不必從所述數(shù)字中來回導(dǎo)航。該行為基于所述數(shù)字距離所述相應(yīng)文本的距離可以動態(tài)切換,例如,如果所述數(shù)字在所述相同頁內(nèi)或者在一閥值距離內(nèi),該方法可能不能被使用。例如,在多個專利文本中所述數(shù)字靠近所述文本的開始處,但所述相關(guān)描述性文本可能非常遠(yuǎn)在所述文本的主題內(nèi)。來回導(dǎo)航可能迅速變成惱人的,特別是如果所述數(shù)字以復(fù)雜的配置具有許多不同元素需要在所述文本描述的那些元素和所述圖表之間恒定翻轉(zhuǎn)。在一實(shí)施例中,所述電子文本管理器108可以識別所述引用數(shù)字且在一非侵?jǐn)_位置覆蓋它,且可以在所述用戶已經(jīng)選擇的或者當(dāng)前閱讀的一元素上集中或者放大。另外,所述電子文本管理器108可以導(dǎo)航到所述數(shù)字上且在所述用戶已經(jīng)選擇的或者當(dāng)前閱讀的一元素上集中或放大。注意到所述相同方法的可以被施加到文本段上。根據(jù)本文所公開的實(shí)施例,一電子文本的元素?fù)?jù)或者與一電子文本相關(guān)的其它數(shù)據(jù)可以包括本文公開的各種定義的文本子群,文本集群,和/或?qū)Ш芥溄有畔?。該信息可以被定義或協(xié)同生成通過所述電子文本的讀者,所述電子文本的作者,所述電子文本的編輯,和/或其他人。所述信息可以被生成且在這些用戶之間分享。例如,參考圖1A,電子-書閱讀器102和104可以與所述電子-書服務(wù)器106通過網(wǎng)絡(luò)116可以通信通過和該信息一起檢索所述電子-書。此外,根據(jù)本發(fā)明公開的電子-書閱讀器102和104可以生成這種信息且通過所述網(wǎng)絡(luò)116傳遞所述信息到所述電子-書服務(wù)器106。該信息通過所述電子-書服務(wù)器106可以被存儲在一數(shù)據(jù)存儲120內(nèi),其可以存儲不同電子-書122的一伙多個以及相關(guān)的元數(shù)據(jù)124。所述電子-書服務(wù)器106可以包括構(gòu)造以實(shí)施本發(fā)明公開的功能的一處理器126。例如,所述處理 器126可以被構(gòu)造以收集定義文本子群,文本集群,和/本發(fā)明公開的導(dǎo)航鏈接的信息。進(jìn)一步的,所述電子-書服務(wù)器126可以包括構(gòu)造一網(wǎng)絡(luò)界面128以和所述網(wǎng)絡(luò)116或者用于與所述電子-書閱讀器102和104,服務(wù)器,或者任何其它電子設(shè)備交換信息和數(shù)據(jù)另一通信網(wǎng)絡(luò)相通信。所述電子-書服務(wù)器106的所述數(shù)據(jù)存儲120可以存儲包括所述電子-書閱讀器102和104以及其他電子設(shè)備的所述用戶相關(guān)信息的用戶賬戶信息130。在一例子中,所述電子-書閱讀器102的一用戶可以通過所述電子-書服務(wù)器106注冊一個賬戶。所述用戶通過與所述用戶界面112交互可以進(jìn)入他或她的信息,且所述電子-書閱讀器102可以通過網(wǎng)絡(luò)界面114傳遞該信息給所述電子-書服務(wù)器106。所述信息可以在所述用戶賬戶130內(nèi)被存儲。進(jìn)一步的,例如,所述用戶通過所述網(wǎng)絡(luò)116可以與所述用戶界面112交互以查詢來自所述電子-書服務(wù)器106的所述下載。所述電子-書通過所述網(wǎng)絡(luò)116可以被下載到所述電子-書閱讀器102上通過一購買交易的實(shí)現(xiàn)。除了所述電子-書,所述電子-書閱讀器102可以接收與所述電子-書關(guān)聯(lián)的元數(shù)據(jù)。對于所述電子-書一未注冊的用戶可能接收錯誤的元素?fù)?jù)。一注冊的用戶可以對保持在會話之間的所述元素?fù)?jù)進(jìn)行更改,且可以有助于編輯存儲在所述電子-書服務(wù)器106內(nèi)的元數(shù)據(jù)。所述電子-書服務(wù)器106可以接收來自電子-書閱讀器信息以在確定文本子群,文本集群,和/或根據(jù)本文所公開的導(dǎo)航鏈接內(nèi)使用。根據(jù)本文所公開的實(shí)施例,圖9示出了基于近鄰句子之間的一相似性關(guān)系一電子文本內(nèi)的集群文本的一示例方法的流程圖。圖9的所述方法可以通過所述電子-書服務(wù)器106或者所述電子-書閱讀器102和104的一個被實(shí)現(xiàn)。參考圖9,所述方法包括獲得用以分析(步驟900)的文本。例如,所述電子-書服務(wù)器106可以獲得一電子-書的文本。圖9的所述方法包括分析所述文本以及確定每個獨(dú)立單詞(步驟902)的權(quán)重。例如,所述服務(wù)器106分析所述文本以確定每個出現(xiàn)在所述電子-書(例如,確定“術(shù)語頻率”)內(nèi)的每個單詞的所述單詞頻率。對于所述文本內(nèi)出現(xiàn)的每個單詞,所述服務(wù)區(qū)106通過所述術(shù)語頻率與所述逆文本頻率的乘積給出一 TF.1DF測量以確定單詞權(quán)重。在一實(shí)施例中,TF.1DF的其它種類可以被使用,如通過所述術(shù)語頻率與所述逆文本頻率的所述對數(shù)的乘積。所述逆文本頻率可以通過一單詞出現(xiàn)在大量文本內(nèi)的次數(shù)的計算被確定。這些頻率可以通過不同的具體領(lǐng)域或類型(例如,懸疑小說與愛情小說相比可以具有不同重要術(shù)語,或者關(guān)于無線處理的技術(shù)文件與關(guān)羽考古的書籍相比可以具有非常不同重要性術(shù)語)被單獨(dú)確定。以標(biāo)記或者元數(shù)據(jù)形式的人工輸入,或者合適的自動技術(shù),可以被用于檢測所述一文本的內(nèi)容所屬的領(lǐng)域,且可以為它確定所述合適的重要性術(shù)語。例如常見單詞包括,但不限于此,所述單詞the (這),of (…的),to (到),in (在…內(nèi)),a (一),is (是),that(那),be (是),it (它),by (通過…),are (是),for (關(guān)于),was (是),as (如),he (他),with (和),on (在…上),his (他的),at (在…處),which (哪一個),but(但是),from (從),has (具有),this (這個),will (將),one (一個),have (具有),not (不),were (是),or (或者),all (所有),their (它們的),an (一個),I (我),there (這里),been (是),many (許多),more (更多),so (因此),when (當(dāng)),had (具有),may (可以),today (今天),who (誰),would (將要),time (時間),we (我們),about (大約),after (在…之后),dollars (美元),if (如果),my (我的),other (其他的),some (一些),them (他們),being (是),its (它的),no (不),only (僅),over (超過),very (非常),you (你),into (進(jìn)入),most (大部分),than (比…),they (他們),day (白天),even (甚至),made (制作),out (出),first (第一),great(強(qiáng)大),must (必須),these (這些),can (能),days (白天),every (每),found (發(fā)現(xiàn)),general (一般),her (她的),here (這里),last (最后),new (新的),now (現(xiàn)在),people (人們),public (公開),said (說),since (自從),still (直到),such(如此),through (通過),under (在…下),up (在…上),war (戰(zhàn)爭),well (好),where (哪里),while (當(dāng)),years (年),before (在…之前),between (在…之間),country (國家),debts (債),good (好的),him (他),interest (興趣),large (大的),like (喜歡),make (制作),our (我們的),take (帶),upon (在…上),以及what (什么)。這樣的常見單詞,也被稱為“停止”,當(dāng)試圖識別時可能被給予非常低的重要性如果兩個單詞片段時是相關(guān)的。對應(yīng)于出現(xiàn)在一電子-書的所述文本內(nèi)的人物,地點(diǎn),或者事物可以被給予額外的權(quán)重。例如,當(dāng)試圖識別兩個單詞片段是否相關(guān)時在一故事內(nèi)的所述字符的所述名詞可以被給予重要性。如之前所述,這些單詞可以使用如命名實(shí)體識別的方法被識別,和基于所述文本的探索方法一起,如通過假設(shè)單詞在被命名為實(shí)體的所述文本中持續(xù)以大寫字母寫。 另外,其它之前所述方法也可以被使用,如標(biāo)記化,POS標(biāo)記,詞干分析,共同參與分辨率,及類似物。圖9的所述方法包括獲得集群參數(shù)(步驟904)。例如,所述服務(wù)器106可以獲得包括變量等集群參數(shù)如,但不限于此,最小集群尺寸,字符,地點(diǎn)和事物的命名,對于程序和章節(jié)之間的集群的懲罰權(quán)重,及類似物。圖9的所述方法包括隨機(jī)選擇句子以作為文本種子(或集群種子)(步驟906)。例如,所述服務(wù)器106可以通過從所述電子-書的所述文本隨機(jī)選擇句子確定初始文本種子。在另一實(shí)施例中,一語義相關(guān)得分可以被分配到句子上,且所述種子句子可以基于該得分被選擇。在一實(shí)施例中,一句子基于其再所述電子-書的所述文本內(nèi)的位置可以被選擇作為一文本種子。值得注意的是所述生成的文本集群可以通過所述文本種子的所述選擇被影響。圖9的所述方法包括獲得一文本子群(步驟908)。例如,一文本種子可以被獲得以作為初始文本子群的功能。隨后,圖9的所述方法包括在所述文本子群和緊隨或緊接所述子群(910)的一句子之間確定一相似性得分。例如,所述服務(wù)器106可以在所述文本子群和緊隨或緊接所述子群的一句子之間確定一相似性得分或者其它語義關(guān)系。圖9的所述方法包括懲罰所述相似性得分如果所述文本子群已經(jīng)生長太大,鏈接跨越段落,或者鏈接跨越章節(jié)(步驟912)。圖9的所述方法也包括確實(shí)所述文本是否包括更多子群(步驟914)。例如,所述服務(wù)器106可以確定是否有另一文本子群需要分析。如果有另一文本子群,所述方法可以繼續(xù)執(zhí)行到以申請步驟910和912申請的其它文本子群的步驟908。這些步驟可以被重復(fù)直到?jīng)]有需要分析的額外文本子群。圖9的所述方法包括一個接一個的合并所述文本子群通過前一個或后一個具有所述最高相似性得分的句子以形成一修改的文本子群(步驟916)。例如,所述服務(wù)器106可以確定,對于一給定的下一個子群,與其相鄰的哪一個句子具有所述最高相似性得分。具有所述最高相似性得分所述句子被合并到所述文本子群以形成所述修改的文本集群。在一實(shí)施例中,如果兩個句子具有超過一閥值水平的一相似性得分,兩個句子可以與所述文本子群合并以形成一修改的文本子群。相反,如果所述句子的一或兩個具有低于一閥值水平的一相似性得分,任何句子都不可以被合并到所述文本子群。在一例子中,圖10示出了描述用于根據(jù)本發(fā)明所公開的一電子文本的一集群過程的一圖。參考圖10,所述電子文本的所述內(nèi)容在一結(jié)尾1000作為開頭被呈現(xiàn)以及在一相反結(jié)尾1002作為結(jié)尾。作為被垂直線1004劃分的文本子群被示出。在該例子中,文本子群1006和前置與所述文本子群1006的所述文本子群1008之間的一相似性得分被確定。同樣,所述文本子群1006和后置與所述文本子群1006的所述文本子群1010之間的一相似性得分被確定。所述文本子群1006 與具有最高相似性得分的所述文本子群1008或1010結(jié)合以形成一修改的文本集群。圖9的所述方法包括確定所述句子上紅否已經(jīng)被分配到至少一個集群上(步驟918)。為了響應(yīng)確定所有句子還沒有被分配到一集群上,所述方法執(zhí)行到步驟908直到所有的句子已經(jīng)和一文本子集群一起合并。響應(yīng)到確定所有的句子已經(jīng)被分配到一集群上,所述方法可以停止(步驟920)。如果仍然還存在沒有分配的句子,所述方法可以重復(fù)。在一實(shí)施例中,用于隨后迭代的所述下一個文本種子可以從所述剩下的沒有分配的句子中選擇通過選擇:一相鄰的未分配的句子;一具有所述高語義相關(guān)得分的未分配的句子;一位于一組連續(xù)的未分配句子內(nèi)中心處的未分配句子;一距離之前選擇的所述文本種子的一或多個的距離在一閥值范圍內(nèi)的未分配的句子;一與之前選擇的所述文本種子的一或多個在一閥值范圍內(nèi)具有不同語義或者相關(guān)性的未分配文本;或者它們的結(jié)合。值得注意的是聚酯可以通常不被排除到一單獨(dú)文本集群之外,且因此一些句子對于兩個相鄰的文本集群可以能常見。進(jìn)一步的,如之前所述,圖9的所述方法可以被遞歸應(yīng)用到文本集群上以生成文本子集群以使,例如,分層組織和導(dǎo)航成為可能。接著通過一文本集群關(guān)聯(lián)所述電子文本的所有部分,向前和向后的鏈接可以被分配給每個文本集群。根據(jù)本發(fā)明所公開的實(shí)施例,圖11示出了為一電子文本的每個文本集群分配向前和向后鏈接的一示例性方法的一流程圖。圖11的所述方法可以通過所述電子-書服務(wù)器106或者所述電子-書閱讀器102和104的一個被實(shí)現(xiàn)。參考圖11,所述方法包括獲得一文本集群(步驟1100)。例如,所述文本-書服務(wù)器106可以獲得用圖9的方法生成的所述文本集群的一個。圖11的所述方法包括在所述當(dāng)前文本集群和每個其它文本子群(步驟1102)之間確定一相似性度量。使用之前描述的任何所述方法一相似性度量可以被確定,如標(biāo)記化,POS標(biāo)記,命名實(shí)體識別,詞干分析,加權(quán),向量空間模型,潛在語義分析,解析,關(guān)系提取,及類似物。這些相似性度量與所述每對文本集群之間的所述相應(yīng)連接相關(guān)聯(lián)。接著,根據(jù)方向和相似性度量(步驟1104)所述鏈接被存儲。例如,對于每個文本集群,向前鏈接根據(jù)所述相似性度量或得分和方向被存儲。另外每個文本集群,例如,向后鏈接根據(jù)所述相似性度量或得分或方向被存儲。進(jìn)一步的,所述排序鏈接和其它各自相似性度量被存儲(步驟1106)。如之前所述,對于所述相關(guān)文本集群的常見的所述最相關(guān)的術(shù)語,與它們相應(yīng)的POS類型,命名實(shí)體類型和ISTSV得分,通過所述鏈接同樣可以被存儲。根據(jù)本發(fā)明公開的實(shí)施例圖12示出了圖10內(nèi)示出的所述圖其中用于鏈接所述文本集群1006的一程序被實(shí)現(xiàn)。參考圖12,所述文本子群1006,在該例子中其被定義為一文本集群,與所有其他文本集群通過所述最高相似性,或最低距離相比較以確定所述向后前或向后鏈接。在一實(shí)施例中,相鄰的或在每個其它的一閥值距離內(nèi)的文本集群沒有被比較,以避免生成鏈接到附近文本集群如之前所述的原因。圖11的所述方法包括確定是否有更多文本集群(步驟1108)。如果有更多的文本集群,所述方法持續(xù)到步驟1100以獲得另外的文本集群。因此,所述步驟1102,1103,以及1106在所述電子文本內(nèi)對于所有文本集群被實(shí)現(xiàn)。如果這里沒有更多的文本集群,所述方法停止(步驟1110 )。在一例子中,用于每個文本子群的該鏈接信息可以作為元素?fù)?jù)在所述數(shù)據(jù)存儲120內(nèi)被存儲。根據(jù)本文所工卡的實(shí)施例圖13示出了圖10和12內(nèi)示出的圖其中用于所述文本集群的所有鏈接已經(jīng)被完成。參考圖13,所述箭頭1300表明從一文本集群到具有所述最高相似性得分的所述向前文本集群的所述向前鏈接。所述箭頭1302表明從一文本集群到具有所述最高相似性得分的所述向后文本集群的所述向后鏈接。值得注意的相似于圖13內(nèi)的所述的文本集群之間的關(guān)系的一圖形代表可以使用電腦圖形的方法被動態(tài)生成且呈現(xiàn)給一用戶以說明所述文本的各段之間的所述相互關(guān)系。根據(jù)本發(fā)明公開的實(shí)施例,圖14示出描述一電子-書的一熱圖的一圖。所述圖可以通過一電子-書閱讀器的一顯示器或者另一合適的電子設(shè)備被顯示。參考圖14,所述圖描述所述電子-書的章1400和由一用戶用于選擇的搜索標(biāo)準(zhǔn)1402。所述用戶可以與所述電子-書閱讀器的一用戶界面相交互用以選擇對應(yīng)于人物的箱子1404,對應(yīng)于地點(diǎn)的箱子1406,對應(yīng)于事務(wù)的箱子1408。在箱子1404,1406和1408內(nèi)呈現(xiàn)的所述候選搜索條件可以通過人工輸入,如通過一作者,編輯,出版者或者用戶被輸入,或者可以自動生成使用方法如命名實(shí)體識別。所顯示的熱圖能基于所述箱子1404,1406和1408被改變。值得注意的是所述方法可以自動過濾候選搜索條件它們的選擇可以在所述熱圖上具有限制的或更少的有意義影響。例如,在一小說內(nèi)的所述主角,他可以在每章內(nèi)被參考哦啊,可以不是一游泳的搜索條件,因?yàn)檫x擇該條件可能會均勻的影響所述整個顯示的熱圖且不會在隔離相關(guān)章節(jié)上輔助一用戶。對應(yīng)于所述選擇的箱子的所述搜索條件被用于確定每章1400的一相似性。例如,對于每章的一相似性得分可以被生成。進(jìn)一步的,基于各自的相似性得分每章可以被著色。用該方法,一用戶可以瀏覽所述章1400的所述顏色以確定所選擇的搜索條件與所述章的一相關(guān)性。另外,所述用戶可以與所述顯示圖相交互以選擇一章。對于于所述章的選擇,所述電子-書閱讀器可以顯示所述選擇的章的內(nèi)容。根據(jù)本發(fā)明所公開的實(shí)施例,一分層搜索或者導(dǎo)航方法可以被實(shí)現(xiàn)以允許一用戶可視化識別基于一或多個搜索條件的部分相關(guān)文本。一用戶可以指定搜索條件,例如通過鍵盤輸入,選擇部分顯示的文本,或者從搜索天劍的一預(yù)定列表里選擇。為了指定所述搜索條件,相關(guān)章,段,以及句子的一視覺只是可以在圖15的圖表1500,1502,以及1504內(nèi)被呈現(xiàn)出,其示出了用于一電子-書的分層導(dǎo)航的熱圖的圖表。每個圖標(biāo)1500,1502,以及1504的所述部分可以被著不同顏色以可視化指示所述電子-書的那個特別部分的一相關(guān)物。在該例子中,所述用戶可以選擇一章1506以進(jìn)一步的確定示于所述圖表內(nèi)的相關(guān)段1502。進(jìn)一步的,所述用戶可以選擇一段1508以進(jìn)一步確定所述圖表內(nèi)示出的相關(guān)句子1504。在一實(shí)施例中,該分層導(dǎo)航或搜索結(jié)構(gòu)可以通過所述集群方法的遞歸應(yīng)用被確定。在另一實(shí)施例中,所述分層導(dǎo)航或搜索結(jié)構(gòu)可以通過所述搜索條件的遞歸確定語義關(guān)系被確定以縮小包含于一選擇的文本集群內(nèi)的文本子群。根據(jù)本發(fā)明公開的實(shí)施例,一用戶可以通過本文公開的一電子設(shè)備與一用戶界面相交互以利用導(dǎo)航鏈接以訪問與當(dāng)前顯示的內(nèi)容相關(guān)的一電子文本內(nèi)的內(nèi)容。例如,一用戶可以與圖2示出的所述顯示器200相交互以選擇所述段202用于顯示于所述段202具有一語義關(guān)系的內(nèi)容。在一例子中,所述段202和它的周圍區(qū)域可能與其它顯示文本出現(xiàn)相似直到所述段202被“點(diǎn)擊時”或“鼠標(biāo)滑過”。因此,在該例子中,與所述段202關(guān)聯(lián)的所述導(dǎo)航鏈接保持不可見直到通過用戶輸入產(chǎn)生互動。所述電子文本的所述鏈接到部分可以被“放大”或者突出以將其從所述電子文本的其它部分區(qū)分。如本發(fā)明公開的實(shí)施例,一用戶可以通過與一導(dǎo)航鏈接相關(guān)的文本進(jìn)行導(dǎo)航通過在一顯示器上來回翻轉(zhuǎn)運(yùn)動。例如,所述用戶可以觸摸圖2示出的所述顯示器200以在所述短語202上制作翻轉(zhuǎn)運(yùn)動以通過與所述段202相關(guān)的文本來回導(dǎo)航。用戶導(dǎo)航的提到觸摸手勢可以包括,例如,用于導(dǎo)航的`一逆時針圓或者半圓,或者跳回到向后鏈接,到最相關(guān)的段或者在所述當(dāng)前顯示段之前的所接近相關(guān)段;用于向前導(dǎo)航的一逆時針圓或者半圓,或者跳到向前鏈接,到所述當(dāng)前顯示段之后的所述最相關(guān)段或者所述接近相關(guān)段;等等。這些手勢可以被反向,或者選擇更直觀的,如日語,中文,阿拉伯語文本及類似物。所述設(shè)備同樣可以被提供,或者所述用戶也可以被配置,用于特定導(dǎo)航的特定手勢。例如,所述用戶可以通過與所述顯示器200合適的交互返回所述原始文本如通過,例如,一單擊,點(diǎn)選,或者在所述顯示器200上的觸摸屏手勢。使用本文所公開的一電子設(shè)備中,一用戶可以閱讀駐留在一電子-書閱讀如圖1A所示的所述電子-書閱讀器102器內(nèi)的一電子-書。在閱讀中,所述用戶會因?yàn)樗龉适碌奈⒚罡星樽兊美Щ?。所述用戶可以選擇一段解釋,例如,所述編造所述故事的所述相互矛盾的規(guī)則。在每句處,所述用戶可以與所述用戶界面112相交互以選擇一或多個單詞。所述電子文本管理器108可以接收所述選擇的單詞且,響應(yīng)所述單詞的收到,其可以控制所述用戶界面以顯示視為與所述選擇單詞相關(guān)的段的一時間表。當(dāng)用戶選擇額外單詞和/或短語時,所述時間表可以被更新以顯示新的相關(guān)段。進(jìn)一步的,例如,所述用戶可以與所述電子-書閱讀器102的所述顯示器相交互以指示他或她需要與所述選擇的單詞相關(guān)的一“語義回復(fù)”。在回應(yīng)中,所述電子-書閱讀器102可以,對于每個選擇的單詞或短語,導(dǎo)航到一之前段以說明該規(guī)則是如何影響另一字符的。使用本文所公開的一電子設(shè)備的另一例子中,一用戶可以閱讀駐留在如圖1A示出的所述電子-書閱讀器102的一電子-書閱讀器的一電子-書。在該例子中,所述用戶可以對所述故事內(nèi)的之前起到的一字符感興趣。在所述故事的結(jié)尾,所述字符在此被提及。這次,所述用戶可能已經(jīng)大約忘記所述字符的一細(xì)節(jié)。因此,所述用戶可以與所述顯示器的一部分相交互包括關(guān)于所述字符的文本(例如,“輕叩”在所述顯示器上在提及所述字符的一代詞處)。為了響應(yīng)接受所述用戶輸入,所述電子文本管理器108可以控制所述顯示器以導(dǎo)航到所述故事內(nèi)所述字符的所述介紹。所述用戶之后可以與所述顯示器交互(例如,通過雙擊所述顯示器的一部分)以返回到所述故事內(nèi)的所述之前的位置。根據(jù)本發(fā)明公開的一單子設(shè)備使用的另一實(shí)施例,一用戶可以閱讀駐留在一電子-書閱讀器如圖1A所述電子-書閱讀器102上的一電子-書。在該例子中,所述用戶感興趣于查找在一電子-書內(nèi)的其中具有對話的一特定的字符的所述例子。所述用戶可以選擇用于選擇所有所述字符的對話的一圖表。為了響應(yīng)所述選擇,所述電子文本管理器108可以控制所述電子-書閱讀器102的一顯示器以顯示由所述電子-書出版者提供的對話元素?fù)?jù)以識別歸屬于所述選擇的字符的所有對話。另外,所述電子文本管理器108可以控制所述顯示器以顯示一導(dǎo)航控制圖表包括一動態(tài)語義時間表其中所述字符的對話出現(xiàn)在所述電子-書內(nèi)。所述用戶可以與所述控制圖表相交互以導(dǎo)航到特定對話出現(xiàn)在其中的第所述書的一部分。根據(jù)本發(fā)明公開的實(shí)施例圖16示出了圖1A示出的所述系統(tǒng)的一實(shí)施例操作的一信息流程圖。參考圖16,對于一電子-書(步驟1600)的一請求所述電子-書閱讀器102可以通信到所述電子-書服務(wù)器106。例如,所述電子-書閱讀器102的一用戶可以瀏覽從所述電子-書服務(wù)器106可獲得的電子-書的一顯示的列表。所述用戶可以與所述用戶界面112相交互以選擇所述電子-書的一個。為了響應(yīng)所述選擇,所述電子-書閱讀器102可以生成包括所述電子-書的一標(biāo)識符一信息且可以通過所述網(wǎng)絡(luò)116將所述信息通信到所述電子-書服務(wù)器106。所述信息也可以包括所述用戶的賬戶信息。所述電子-書服務(wù)器106可以在步驟1600接收所述通信的信息。為了響應(yīng)接收所述信息,所述電子-書服務(wù)器106可以驗(yàn)證用戶賬戶信息以選擇所述識別的電子-書。所述用戶賬戶信息可能與存儲于用戶賬戶130內(nèi)的數(shù)據(jù)比較。在一例子中,所述賬戶信息可以被用于管理所述識別的電子-書的一收購交易。為了響應(yīng)驗(yàn)證所述用戶賬戶信息,所述電子-書服務(wù)器106可以通過所述網(wǎng)絡(luò)116 (步驟1602)下載所述電子-書到所述電子-書閱讀器。所述電子-書閱讀器102可以接收所述電子-書。接著接收所述電子-書,所述電子-書可以被存儲于所述數(shù)據(jù)存儲110內(nèi)。進(jìn)一步的,所述用戶可以與所述用戶界面112相交互以打開用于閱讀的所述電子-書。所述電子文本管理器108可以顯示所述電子-書的內(nèi)容。所述用戶可以通過使用所述用戶界面112 (步驟1604)與所述電子-書交互。例如,根據(jù)本發(fā)明所公開的所述電子文本所述交互可以包括文本子群之間的非線性導(dǎo)航。通過所述電子-書該交互的數(shù)據(jù)可以被存儲于所述數(shù)據(jù)存儲110內(nèi)。進(jìn)一步的,所述電子文本管理器108可以通信所述用戶交互數(shù)據(jù)到所述電子-書服務(wù)器106 (步驟1606)。為了響應(yīng)所述用戶交互信息 的接收,所述電子-書服務(wù)器106可以推斷之間的語義關(guān)系且鏈接根據(jù)本發(fā)明公開的所述電子-書的文本子群。對于所述電子-書所述鏈接數(shù)據(jù)可以以元數(shù)據(jù)124被存儲于所述數(shù)據(jù)存儲120內(nèi)以分配給奮發(fā)么公開的其它電子-書閱讀器。所述鏈接數(shù)據(jù)也可以被提供因?yàn)樗簧捎诳赡芤呀?jīng)包含所述相同電子-書的預(yù)分布頁的設(shè)備其它104。如本文所公開的一些或多個所述實(shí)施例,如用于集群文本子群和用于創(chuàng)建基于相似性關(guān)系的文本子群之間的導(dǎo)航鏈接,歷史用戶導(dǎo)航行為和基于引用的啟發(fā)式直接鏈接,及類似物,跨越多個文本和相關(guān)電子-書也是可應(yīng)用的。例如,它可以被用于含有屬于相同系列的所述文本的方案內(nèi),或者彼此之間密切相關(guān)的(例如,所述哈利波特系列)。在一實(shí)施例中,為了達(dá)到這個,每個文本的所述文本和其它內(nèi)容可以以適當(dāng)?shù)捻樞虮蛔芳右孕纬梢淮笪谋荆胰缟纤龅乃黾汉玩溄臃椒梢员挥糜谧鳛橐徽w的所述結(jié)合的文本。產(chǎn)生的文本集群,文本組,文本子群和它們之間的導(dǎo)航鏈接可以被標(biāo)記以是識別它們在其中出現(xiàn)的對應(yīng)文本,且所述電子文本管理器108可以和元素?fù)?jù)一起存儲該信息,如一標(biāo)記語言的形式,表明每個組成的文件的所述邊界,如當(dāng)程序以電子-書時,只有當(dāng)前正在被使用的所述電子-書的所述內(nèi)容被呈現(xiàn)給所述用戶。盡管如果,當(dāng)所述用戶希望導(dǎo)航到定位于另一文本內(nèi)的一相關(guān)的 文本子群時,所述電子文本管理器108可以使用該信息以訪問所述相關(guān)文件且呈現(xiàn)所述用戶已經(jīng)導(dǎo)航的所述文本子群。當(dāng)應(yīng)用集群到所述結(jié)合的文本時,對于穿過組成文件邊界形成的集群可能是不理想的,因?yàn)榈湫偷乃鼋Y(jié)合的文件將不會被呈現(xiàn)給所述用戶。在一實(shí)施例中,從穿過組成文件邊界形成的集群可以被阻止,例如,通過施加一非常大的懲罰給穿過文本邊界。在另一實(shí)施例中,集群可以被允許在穿過文件便見形成,且這些集群可以被用以創(chuàng)建導(dǎo)航鏈接的目的,但是當(dāng)呈現(xiàn)所述單獨(dú)組成文件時任何這些集群在這些邊界處可能被分離。結(jié)合多個文本且作為一個單獨(dú)文本處理,盡管如此,可以導(dǎo)致異常,如,例如,章節(jié)號在所述結(jié)合的文本內(nèi)被重復(fù)。這可以導(dǎo)致出現(xiàn)錯誤,例如,當(dāng)執(zhí)行基于索引的分層直接鏈接時。如例子,如果在一系列的第三本書里一句子被稱作“第二章”,它很有可能被稱作第三本書的第二章,但是當(dāng)處理所述結(jié)合的文本時,所述電子文本管理器108對所述系列的第一本書內(nèi)和第二本書內(nèi)的所述第二章參考可能會困惑。為了解決這個問題,在一實(shí)施例中,在所述組成文本結(jié)合進(jìn)入所述結(jié)合文本之前,所述電子文本管理器108可以識別任何章節(jié)號,段號,數(shù)字號,抬頭,標(biāo)題或者其它在每個文本內(nèi)如此直接能索引的材料,用所述文件的所述標(biāo)示符在它們出現(xiàn)的地方標(biāo)識它們,且當(dāng)處理所述結(jié)合的文本時使用所述標(biāo)記的能索引的的材料。標(biāo)記可以被實(shí)現(xiàn),例如,使用標(biāo)記方法。如果所述能索引的材料已經(jīng)被標(biāo)記,所述存在的標(biāo)記可以被更新以包括所述文件識別符。因此,當(dāng)所述電子文本管理器108施加任何所述之前討論的方法到所述結(jié)合的文本,它可以是指所述文件識別標(biāo)記且注意所述對應(yīng)的文件其中任何給定的所述文本部分屬于該文件,且因此能正確的解析索引。在一實(shí)施例中,當(dāng)處理所述結(jié)合的文本時,所述電子文本管理器108保持跟蹤所述組成文件到屬于該組成文件的一當(dāng)前文本段,例如,通過比較所述文本段的所述定位和在所述結(jié)合的文本內(nèi)的所述組成文件的所述邊界定位。隨后,如果被處理的一當(dāng)前文本段包含一直接索引,所述電子文本管理器108可以假定所述索引在所述文件的所述內(nèi)容內(nèi)其中所述當(dāng)前文本段術(shù)語該文件,且因此當(dāng)創(chuàng)建一導(dǎo)航鏈接時,它鏈接到被所述當(dāng)前文件的標(biāo)示符標(biāo)記的所述對應(yīng)的能直接索引的材料。值得注意的是所述結(jié)合和所述標(biāo)記主要是為了所述電子文本管理器108的而執(zhí)行,且可能不被呈現(xiàn)給所述用戶,特別的因?yàn)樗鼋Y(jié)合文件在會呈現(xiàn)給所述第一位置的所述用戶。在一實(shí)施例中,當(dāng)在所述結(jié)合的文本內(nèi)處理索引時,所述電子文本管理器108也可以檢測所述直接索引文本是否具有可以進(jìn)一步使它索引的所述能索引的段的合格的任何內(nèi)容(例如,章節(jié)號,段號或者數(shù)字號),且可以使用所述合格信息以更準(zhǔn)確的解析所述索引。如以例子,如果一索引文本僅僅說“第二章”,所述電子文本管理器108可以假定它索引到同樣文件內(nèi)的第二章,但是如果所述索引文本進(jìn)一步使它合格,如說“第二卷的第二章”,它使用所述合格信息“卷[Pi]的”以更準(zhǔn)確識別所述索引在另一文件(在該例子內(nèi),“第二卷”)內(nèi)的一章節(jié)的所述索引。在另一實(shí)施例中,所述電子文本管理器108也可以使用所述文本內(nèi)圍繞所述直接引用的上下文信息以更準(zhǔn)確的解析所述結(jié)合的文本內(nèi)的所述索引。例如,如果所述直接索引為“第二章”,對應(yīng)于內(nèi)容“毛毛蟲變成蝴蝶”,所述電子文本管理器108檢查所述結(jié)合的文本的每個組成文件的所述第二章以檢測一相似性關(guān)系,如每個第二章是否含有關(guān)于毛毛蟲變成蝴蝶的文本,且因此可以創(chuàng)建一鏈接到有所述最強(qiáng)相似性關(guān)系的所述章節(jié)。值得注意的是作為一單一結(jié)合的文本處理多個文本可以在穿過兩個或多個文件的文本子群之間創(chuàng)建導(dǎo)航鏈接,其中一些對于所述用戶(例如,對于還沒有購買一系列內(nèi)一特定電子-書的一用戶)可能無法使用。因此,所述電子文本管理器108可以具有訪問到所述用戶擁有的指定的所述書的所有權(quán)信息,或者可以具有訪問到(如通過從一朋友的加載)。因此,所述電子文本管理器108也可以注意所述用戶沒有具有訪問權(quán)的所述書,但是注意到從所述書訪問到所述用戶觀點(diǎn)的一些導(dǎo)航鏈接。當(dāng)呈現(xiàn)語義導(dǎo)航鏈接時,所述電子文本管理器108可以因此過濾在指向所述用戶不具有訪問的所述書內(nèi)的文本子群所述鏈接。在另一實(shí)施例中,所述電子文本管理器108可以確定該導(dǎo)航鏈接,呈現(xiàn)它們給所述用戶且拒絕所述用戶使用它們用以導(dǎo)航,但是可以提供信息如所述標(biāo)題,作者,覆蓋劇情,以及關(guān)于這些鏈接指向的所述相關(guān)文件所述類似物。在一實(shí)施例中,所述電子文本管理器108也可以提供一界面以購買或者訪問包含所述鏈接指向的所述文本子群的所述相關(guān)文件。購買包含所述鏈接·的文本子群所述文件的一示范例界面可以包括一鏈接到一或多個具有所述文件的在線電子-書存儲。另一示范例界面可以包括一用戶界面(UI)元素,如以按鈕,以通過一或多個預(yù)先確定的在線電子-書存儲的所述用戶的證明直接的購買所述文件,例如,通過使用Amazon, com, Inc.’s I _CLICK〈 (R) >購買系統(tǒng)。關(guān)于其他訪問所述鏈接的文件的其它方法的一示范例界面,如通過借用,可以包括擁有所述鏈接的文件的一復(fù)印件且能下載它的一社交網(wǎng)絡(luò)內(nèi)的所述用戶的朋友的一列表。所述用戶能購買,借用或者其它方式訪問所述文件的整個文本或者含有所述鏈接的文本子群的所述文件的僅有的一部分。隨著界面的購買,借用或者其它方式訪問所述鏈接的文件,所述電子文本管理器也可以包括來自所述文件的內(nèi)容如文本預(yù)覽,摘要和元素?fù)?jù)如用戶評論。所述用戶通過一購買,借用或者其它方式訪問電子的或者電子-書形式的,或者作為一硬盤拷貝的所述文件的選擇被呈現(xiàn)。值得注意的在外部文件內(nèi)的所述文本子群通過所述語義導(dǎo)航鏈接指向反過來包含包含指向所述用戶可能不能訪問的其它文件內(nèi)的其他文本子群的其他語義導(dǎo)航鏈接。所述電子文本管理器108可以確定所述用戶也可以選擇遍歷這些鏈接,例如,基于所述對應(yīng)文本子群之間的一非常長的相似性關(guān)系或者語義相關(guān),或者可選地,基于其它用戶的歷史語義導(dǎo)航模式。在該例子中,所述語義導(dǎo)航鏈接可以基于相似性關(guān)系和/或歷史導(dǎo)航行為的被遞歸遍歷和遞歸鏈,且對應(yīng)文件的所述結(jié)果表可以通過購買,借用或者其它訪問方式呈現(xiàn)給所述用戶,且所述用戶可以選擇訪問所述表的所有或者僅僅一子集。圖17是根據(jù)本發(fā)明公開的實(shí)施例圖1A示出的所述電子-書閱讀器102的一框圖。參考圖17,所述電子-書閱讀器102可以包括連接到所述數(shù)據(jù)存儲110的一控制器1700,所述電子文本管理器108,所述用戶界面112,以及通過一總線1702的所述網(wǎng)絡(luò)界面114或者相似機(jī)構(gòu)。所述數(shù)據(jù)存儲110可以存儲一電子-書如所述電子-書118。所述控制器1700可以是一微型處理器,數(shù)字ASIC,F(xiàn)PGA,或者類似物。在該例子中,所述控制器1700以軟件被實(shí)現(xiàn)且可以在一合適內(nèi)存或者數(shù)據(jù)存儲內(nèi)被存儲。所述網(wǎng)絡(luò)界面114可以是一局域無線界面如一套IEEE 802.11標(biāo)準(zhǔn)的一個以無線界面操作,一移動通信界面,或者類似物。所述用戶界面112可以包括,例如,一觸摸屏,一顯示器,一或多個用戶輸入部件(例如,一小鍵盤),一話筒,或者類似物,或者任何它們的結(jié)合。圖18是根據(jù)本發(fā)明公開的實(shí)施例的圖1A示出的所述電子-書服務(wù)器106的一框圖。參考圖18,所述服務(wù)器106可以包括所述處理器126,其被鏈接到所述數(shù)據(jù)存儲120和通過一總線1800的所述網(wǎng)絡(luò)界面128以及類似機(jī)構(gòu)。所述數(shù)據(jù)存儲120可以包括所述電子-書122,所述元數(shù)據(jù)124,以及所述用戶賬戶130。所述處理器126可以被實(shí)現(xiàn)通過合適的存儲在存儲內(nèi)且可以由一處理器執(zhí)行的軟件。所述處理器126可以被配置以實(shí)現(xiàn)本文所述的一或多個功能。所述處理器可以是一微型處理器,數(shù)字ASIC,F(xiàn)PGA,或類似物。在該例子中,所述處理器是一微型處理器。所述網(wǎng)絡(luò)界面128可以是一局域無線界面如根據(jù)IEEE 802.11標(biāo)準(zhǔn)套的一個的一無線界面操作,一移動通信界面,或者類似物。 如之前所述,施加這些方法到一電子文本導(dǎo)致元數(shù)據(jù)指定文本子群和語義導(dǎo)航鏈接。在一實(shí)施例中,該元數(shù)據(jù)可以在所述電子文本內(nèi)被提供,例如以一標(biāo)記語言的形式。在一實(shí)施例中,該元數(shù)據(jù)可以從所述文本分離被單獨(dú)提供,例如,如在一分離的元數(shù)據(jù)文檔內(nèi)的記錄,其可以使所述元數(shù)據(jù)從所述電子文本分離單獨(dú)存儲??商鎿Q的,例如,所述元素?fù)?jù)可以在所述電子文本內(nèi)被部分提供且和所述電子文本部分分離。一電子-書提供者,如以在線電子-書存儲器,可以選擇有條件的提供這些用于一電子-書的元數(shù)據(jù),例如,以更高的價格。在一實(shí)施例中,用于一電子-書的指定文本子群和語義導(dǎo)航鏈接所述元素?fù)?jù)可以通過人工輸入被創(chuàng)建替代,或者除了,上述所述自動方法。該人工輸入可以被提供,例如,通過所述電子-書,所述作者,所述出版者和/或所述編輯的所述創(chuàng)建者。交互的,基于GUI的軟件工具可以被用于輔助人工輸入,如指定一電子文本內(nèi)的文本子群邊界,和通過指定它們鏈接的所述文本集群或者子群創(chuàng)建語義導(dǎo)航鏈接,與每個鏈接的排序信息和重要相關(guān)術(shù)語一起。在一實(shí)施例中,通過施加所述自動的方法所創(chuàng)建的所述元素?fù)?jù)可以通過人工輸入被評閱和編輯。在另一實(shí)施例中,由人工輸入創(chuàng)建的所述元數(shù)據(jù)可以被用以補(bǔ)充通過所述自動方法創(chuàng)建的所述元數(shù)據(jù)。在另一實(shí)施例中,通過人工輸入創(chuàng)建的所述元數(shù)據(jù)可以被用于影響所述自動方法 ,且因此,它們創(chuàng)建了元數(shù)據(jù)。如一例子,在所述文本集群方法中,在集群過程中被施加的懲罰可以基于所述文本子群是否出現(xiàn)在以所述人工創(chuàng)建的元素?fù)?jù)的所述集群的所述邊界被調(diào)整。如另一例子,通過所述鏈接方法被創(chuàng)建的同樣出現(xiàn)在所述人工創(chuàng)建的元數(shù)據(jù)內(nèi)語義導(dǎo)航鏈接可以被分配給比其他鏈接一更高的排序,即使所述自動確定相似性關(guān)系指標(biāo)另有指不。本文所述的各技術(shù)通過硬件或者軟件被實(shí)現(xiàn),或者,在適當(dāng)?shù)那闆r下,通過它們的結(jié)合。因此,所公開的實(shí)施例的所述方法和裝置,或者其中某些方面或部分,可以是程序代碼的形式嵌入在有形的媒介中(例如,指示),如軟盤,CD-ROMs,硬盤驅(qū)動器,或者任何其它及其可讀的存儲介質(zhì),其中,當(dāng)所訴程序代碼被加載進(jìn)去且通過一及其被執(zhí)行,如一電腦,所述機(jī)器成為實(shí)施本發(fā)明公開的一裝置。程序代碼在可編程的計算機(jī)上執(zhí)行的例子中,所述電腦將會生成包括一處理器,通過所述處理器(包括易擦除式和不易擦除式存儲和/或存儲元素)可讀的一存儲媒介,至少一個輸入設(shè)備基于至少一個輸出設(shè)備。一或多個程序被優(yōu)選在一較高水平的程序的,功能的或者面向?qū)ο蟮某绦蛘Z言中實(shí)現(xiàn)以和一電腦系統(tǒng)通信。盡管如此,所述程序能以匯編語言或機(jī)器語言實(shí)現(xiàn),如果需要的話。在任何情況下,所述語言可以是一編譯的或解釋語言,且和硬件裝置相結(jié)合。所述方法和裝置也可以以程序代碼的形式被嵌入即通過一些傳輸媒介傳輸,如通過電線或電纜,通過光纖或通過任何其它形式的傳輸,其中,當(dāng)所述呈現(xiàn)代碼被接收且加載進(jìn)入以及通過一及其執(zhí)行,如一 EPR0M,一門陣列,一可編輯的邏輯設(shè)備(PLD),一客戶計算機(jī),一錄像機(jī)或者類似物,所述電腦變成用于實(shí)踐本公開發(fā)明的一裝置。當(dāng)在一通用處理器上實(shí)現(xiàn)時,所述程序代碼和所述處理器結(jié)合以提供一獨(dú)特的設(shè)備其操作以執(zhí)行本發(fā)明所公開的所述程序。雖然所述實(shí)施例已經(jīng)和各圖的所述優(yōu)選實(shí)施例相連接,值得理解的是其它類似實(shí)施例也可以使用或者修改且添加物也可加入到所描述的實(shí)施例上以在沒有違背下執(zhí)行所述相同的功能。因此,所述公開的實(shí)施例不應(yīng)該被限制于任何單獨(dú)實(shí)施例,而是應(yīng)該根據(jù)本發(fā)明所附權(quán)利要求的廣 度和范圍被解釋。
權(quán)利要求
1.一方法包括:在一電子文本內(nèi)確定文本子群;在所述文本子群的一個內(nèi)選擇一文本種子;在所述文本種子和不包括所述選擇的文本種子的一或多個相鄰文本子群之間確定一相似性關(guān)系;以及將所述文本種子與所述一或多個相鄰文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群。
2.如權(quán)利要求1所述方法,其特征在于:確定所述文本子群包括根據(jù)所述電子文本的章,段以及句子定義所述文本子群。
3.如權(quán)利要求1所述方法,其特征在于:所述文本種子包括一或多個單詞。
4.如權(quán)利要求3所述方法,其特征在于:選擇所述文本種子包括:基于所述單詞的一頻率為所述一或多個單詞的每一個確定一相關(guān)性得分。
5.如權(quán)利要求4所述方法,包括選擇多個文本種子,每個文本種子距離任何其它文本種子一最小單詞距離。
6.如權(quán)利要求1所述方法,其特征在于:選擇所述種子文本包括基于用戶輸入選擇所述文本種子。
7.如權(quán)利 要求1所述方法,進(jìn)一步包括在所述電子文本內(nèi)基于所述文本集群和所述文本子群的另一個之間的一相似性關(guān)系鏈接所述文本集群到所述文本子群的另一個。
8.如權(quán)利要求7所述方法,進(jìn)一步包括呈現(xiàn)至少一個導(dǎo)航鏈接以鏈接所述文本集群到所述文本子群的另一個。
9.如權(quán)利要求8所述方法,其特征在于:鏈接所述文本集群到所述文本子群的另一個包括:在所述電子文本內(nèi)的所述集群和一第一文本子群之間確定一第一相似性關(guān)系;和在所述電子文本內(nèi)的所述集群和一第二文本子群之間確定一第二相似性關(guān)系;其中所述方法進(jìn)一步包括在所述第一和第二相似性得分之間確定一最高相似性得分,且其中呈現(xiàn)所述至少一個導(dǎo)航鏈接包括為所述集群以及具有所述最高相似性得分的所述第一和第二文本子群中的一個呈現(xiàn)一導(dǎo)航鏈接。
10.如權(quán)利要求1所述方法,進(jìn)一步包括:在所述文本子群的所述一個內(nèi)選擇一或多個其它文本種子;且為其它文本種子的每一個:在所述文本種子和不包括所述其它文本種子之間確定一相似性關(guān)系;以及基于所述相似性關(guān)系將所述其它文本種子與所述文本集群的至少一個相關(guān)聯(lián)。
11.如權(quán)利要求1所述方法,其特征在于:確定所述相似性關(guān)系包括執(zhí)行語義分析,執(zhí)行自然語言處理,在所述文本種子和所述文本子群之間識別因果關(guān)系,基于本體論確定語義相關(guān)性,使用一語義索引以比較語義相似性,以及確定一統(tǒng)計相似性。
12.如權(quán)利要求1所述方法,其特征在于:確定所述相似性關(guān)系包括:使用一語義圖表在單詞之間呈現(xiàn)關(guān)系以比較所述文本種子和所述一或多個相鄰文本子群的每一個內(nèi)的一或多個單詞;以及使用所述比較以使所述文本種子和所述一或多個相鄰文本子群相關(guān)聯(lián)。
13.如權(quán)利要求12所述方法,進(jìn)一步的包括使用所述電子文本的預(yù)生成總結(jié),所述電子文本的元素?fù)?jù),所述電子文本的語義分析,語義索引,自然語言處理(NLP),以及統(tǒng)計技術(shù)中至少一個生成所述語義圖標(biāo)。
14.如權(quán)利要求1所述方法,進(jìn)一步包括在所述電子文本的元素?fù)?jù)內(nèi)存儲以導(dǎo)航輔助以識別所述文本集群與所述文本子群的另一個的鏈接。
15.如權(quán)利要求1所述方法,進(jìn)一步包括:在所述電子文本內(nèi)基于所述文本集群和所述文本子群的另一個之間的一相似性關(guān)系鏈接所述文本集群到所述文本子群的另一個;以及呈現(xiàn)鏈接所述文本集群到所述文本子群的另一個的一導(dǎo)航鏈接一鏈接。
16.如權(quán)利要求15所述方法,進(jìn)一步包括:為選擇所述導(dǎo)航鏈接接收用戶輸入;以及響應(yīng)接收的所述用戶輸入,控制一用戶界面以呈現(xiàn)所述文本子群的另一個的內(nèi)容。
17.如權(quán)利要求1所述方法,進(jìn)一步包括:在所述電子文本內(nèi)基于所述文本集群和所述文本子群的另一個之間的一相似性關(guān)系鏈接所述文本集群到所述文本子群的另一個;為選擇所述文本集群接收用戶輸入;以及響應(yīng)接收的所述用戶輸入,控制一用戶界面以呈現(xiàn)所述文本子群的另一個的內(nèi)容。
18.如權(quán)利要求1所述方法,進(jìn)一步包括:在所述電子文本內(nèi)基于所述文本集群和所述文本子群的另一個之間的一相似性關(guān)系鏈接所述文本集群到所述文本子群的另一個;其中確定所述相似性關(guān)系包括在所述一或多個相鄰文本子群內(nèi)確定所述文本種子和句子的相似性得分,以及其中所述方法進(jìn)一步包括為懲罰所述相似性得分施加預(yù)定條件。
19.如權(quán)利要求18所述方法,其特征在于:施加預(yù)定條件包括:確定在所述一或多個相鄰文本子群內(nèi)的所述文本種子和所述句子是否被所述電子文本內(nèi)的一中斷所打斷;以及響應(yīng)以確定在所述一或多個相鄰文本子群內(nèi)的所述文本種子和所述句子是否被所述電子文本內(nèi)的一中斷所打斷,降低與所述文本種子和一或多個相鄰文本子群相關(guān)的所述相似性得分。
20.如權(quán)利要求19所述方法,其特征在于:所述中斷包括一句子中斷,一段中斷,一章中斷,以及一卷中斷中一個。
21.如權(quán)利要求1所述方法,進(jìn)一步包括在所述電子文本內(nèi)基于所述文本集群和所述文本子群的另一個之間的一相似性關(guān)系鏈接所述文本集群到所述文本子群的另一個,其中每個所述文本種子和每個所述一或多個相鄰文本子群包括一句子,其中確定所述相似性關(guān)系包括確定所述文本種子的所述句子和所述一或多個相鄰文本子群之間的相似性得分,以及其中將所述文本種子與所述相鄰文本子群關(guān)聯(lián)包括合并所述文本種子和包括具有所述最高相似性得分的所述句子的 相鄰文本子群以創(chuàng)建所述文本集群。
22.如權(quán)利要求21所述方法,其特征在于:所述文本集群是一當(dāng)前文本集群,且其中所述方法進(jìn)一步包括:在所述當(dāng)前文本集群和緊接和緊隨所述當(dāng)前文本集群的所述句子之間確定相似性得分;以及合并所述當(dāng)前文本集群和緊接和緊隨所述當(dāng)前文本集群的具有所述最高相似性得分的所述句子以生成一更新的包括所述當(dāng)前文本集群和具有所述最高相似性得分的所述句子的當(dāng)前文本集群。
23.如權(quán)利要求21所述方法,進(jìn)一步包括重復(fù)實(shí)施確定相似性得分以及合并所述當(dāng)前文本集群和句子的所述步驟直到所述電子文本內(nèi)的所有句子已經(jīng)通過至少一個文本集群被合并。
24.如權(quán)利要求22所述方法,進(jìn)一步包括:確定與所述當(dāng)前文本集群具有一最高相似性關(guān)系的所述電子文本的一部分;以及呈現(xiàn)至少一個導(dǎo)航鏈接以鏈接所述當(dāng)前文本集群到具有所述最高相似性關(guān)系的所述電子文本的所述部分。
25.—電子設(shè)備包括:一電子文件管理器配置為:在一電子文本內(nèi)確定文本子群;在所述文本子群內(nèi)選擇一文本種子;在所述文本種子和不包括所述選擇的文本種子的一或多個相鄰文本子群之間確定一相似性關(guān)系;以及基于所述相似性關(guān)系將所述文本種子和所述一或多個相鄰文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群。
26.一非臨時性電腦可讀的存儲介質(zhì)具有存儲于其上的可執(zhí)行指令以執(zhí)行下述步驟:在一電子文本內(nèi)確定文本子群;在所述文本子群的一個內(nèi)選擇一文本種子;在所述文本種子和不包括所述選擇的文本種子的一或多個相鄰文本子群之間確定一相似性關(guān)系;以及基于所述相似性關(guān)系將所述文本種子和所述一或多個相鄰文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群。
27.一方法包括:為搜索一電子文本接收搜索條件;在所述電子文本內(nèi)確定文本子群;以及為每個文本子群:在所述搜索條件和所述文本子群之間確定一相似性關(guān)系;以及呈現(xiàn)所述文本子群和所述搜索條件之間所述相似性關(guān)系的一圖表。
28.如權(quán)利要求27的所述方法,其特征在于:接收所述搜索條件包括接收一人物,地點(diǎn)和事情的一個的識別。
29.如權(quán)利要求27的所述方法,其特征在于:接收所述搜索條件包括接收一或多個單o
30.如權(quán)利要求27的所述方法,其特征在于:接收所述搜索條件包括接收指示所述搜索條件的用戶輸入。
31.如權(quán)利要求27的所述方法,其特征在于:確定所述文本子群包括基于包含于每個文本子群內(nèi)的內(nèi)容的一相似性關(guān)系確定所述文本子群。
32.如權(quán)利要求27的所述方法,進(jìn)一步包括:將所述圖表與所述文本子群的一個相關(guān)聯(lián);為選擇所述圖表接收用戶輸入;以及響應(yīng)接收的所述用戶輸入,控制一用戶界面以呈現(xiàn)與所述選擇的圖標(biāo)相關(guān)的所述文本子群的內(nèi)容。
33.如權(quán)利要求27的·所述方法,其特征在于:確定所述文本子群包括根據(jù)所述電子文的章,段,以及句子的一個定義所述文本子群。
34.如權(quán)利要求27的所述方法,其特征在于:確定所述文本子群包括根據(jù)所述電子文本的章或段定義所述文本子群,其中所述方法進(jìn)一步包括:為選擇與一章或段的相關(guān)的一圖表接收用戶輸入;響應(yīng)接收的用戶輸入選擇與所述章相關(guān)的所述圖表,呈現(xiàn)所述章內(nèi)代表所述搜索條件和段之間的關(guān)系的圖表;以及響應(yīng)接收用戶輸入選擇與所述段相關(guān)的所述圖表,呈現(xiàn)所述段內(nèi)代表所述搜索條件與句子之間的關(guān)系的圖表。
35.如權(quán)利要求27的所述方法,其特征在于:確定所述相似性關(guān)系包括確定所述搜索條件和所述文本子群之間的一相似性得分,其中呈現(xiàn)所述圖表包括呈現(xiàn)作為所述相似性得分的一指示的所述圖表。
36.如權(quán)利要求35的所述方法,其特征在于:所述圖表包括指示所述相似性得分的一預(yù)定顏色。
37.如權(quán)利要求27的所述方法,其特征在于:確定所述相似性關(guān)系包括執(zhí)行語義分析,執(zhí)行自然語言處理,識別所述文本種子和所述文本子群之間的因果關(guān)系,基于本體論確定語義相似性,使用一語義索引以比較語義相似性,以及確定一統(tǒng)計相似性中的一個。
38.如權(quán)利要求27的所述方法,其特征在于:確定所述相似性關(guān)系包括:使用一語義圖表代表單詞之間的關(guān)系以比較所述搜索條件和一或多個相鄰文本子群的每一本內(nèi)的一或多個單詞;以及使用所述比較以將所述搜索條件和所述一或多個相鄰文本子群相關(guān)聯(lián)。
39.如權(quán)利要求38的所述方法,進(jìn)一步包括使用所述電子文本的總結(jié),所述電子文本的元素?fù)?jù),所述電子文本的語義分析,語義索引,自然語言處理(NLP),以及統(tǒng)計技術(shù)中的至少一個生成所述語義圖表。
40.如權(quán)利要求27的所述方法,進(jìn)一步包括在所述電子文本的元數(shù)據(jù)內(nèi)存儲以導(dǎo)航復(fù)制以指示所述搜索條件和所述文本子群之間的相似性關(guān)系。
41.一電子設(shè)備包括:一電子文件管理器配置為:為搜索一電子文本接收搜索條件;確定所述電子文本內(nèi)的文本子群;以及為每個文本子群,在所述搜索條件和所述文本子群之間確定一相似性關(guān)系;以及一用戶界面被配置以呈現(xiàn)代表所述文本子群和所述搜索條件之間所述相似性關(guān)系的一圖表。
42.如權(quán)利要求41所述電子設(shè)備,其特征在于:所述電子文本管理器被配置以接收一人物,地點(diǎn)以及事情中一個的識別。
43.如權(quán)利要求41所述電子設(shè)備,其特征在于:所述電子文本管理器被配置以基于包含于每個文本子群內(nèi)的內(nèi)容的一相似性關(guān)系確定所述文本子群。
44.如權(quán)利要求41所述電子設(shè)備,其特征在于:所述電子文本管理器被配置以:將所述圖標(biāo)與所述文本子群的一個相關(guān)聯(lián);為選擇所述圖表接收用戶輸入;以及控制所述用戶界面以呈現(xiàn)與所述選擇的圖表相關(guān)的所述文本子群的內(nèi)容響應(yīng)接收的所述用戶輸入。
45.如權(quán)利要求41所述電子設(shè)備,其特征在于:所述電子文件管理器進(jìn)一步被配置以根據(jù)所述電子文本的章,段,以及句子中一個定義所述文本子群。
46.一非臨時性電腦可讀的存儲介質(zhì)具有存儲于其中的計算機(jī)可執(zhí)行指令以執(zhí)行下述步驟:為搜索一電子文本接收搜索條件;在所述電子文本內(nèi)確定文本子群;以及為每個文本子群:在所述搜索條件和所述文本子群之間確定一相似性關(guān)系;以及呈現(xiàn)代表所述文本子群和所述搜索條件之間的所述相似性關(guān)系的一圖表。
47.一方法包括:在電子文本內(nèi)的文本子群之間確定一用戶非線性導(dǎo)航;以及響應(yīng)確定所述用戶非線性導(dǎo)航在所述文本子群之間,鏈接所述文本子群。
48.如權(quán)利要求47的所述方法,其特征在于:所述文本子群根據(jù)所述電子文本內(nèi)的章,段,以及句子的一個被定義。
49.如權(quán)利要求47的所述方法,其特征在于:鏈接所述文本子群包括在所述電子文本的元素?fù)?jù)內(nèi)存儲一導(dǎo)航輔助以指示所述文本子群的結(jié)合。
50.如權(quán)利要求48的所述方法,進(jìn)一步包括呈現(xiàn)鏈接所述文本子群到另一個的一導(dǎo)航鏈接。
51.如權(quán)利要求47的所述方法,進(jìn)一步包括呈現(xiàn)對應(yīng)于所述鏈接的子群的至少一個導(dǎo)航鏈接。
52.一方法包括:在一電子文本內(nèi)確定一當(dāng)前用戶位置;確定對應(yīng)于所述當(dāng)前用戶位置的一當(dāng)前文本子群;顯示在一第一顯示區(qū)域內(nèi),對應(yīng)于所述當(dāng)前文本子群的電子文本的一部分;以及顯示在一第二顯示區(qū)域內(nèi),一或多個相關(guān)的文本子群。
53.如權(quán)利要求52的所述方法啊,其特征在于:所述一或多個文本子群通過每個對應(yīng)的文本子群和所述當(dāng)前文本子群之間的相似性得分被分類。
54.如權(quán)利要求52的所述方法,包括為每個對應(yīng)的相關(guān)文本子群在與所述顯示區(qū)域相鄰的區(qū)域內(nèi)顯示作為相似性的一指示的一圖表。
55.如權(quán)利要求52的所述方法,其特征在于在所述第二顯示區(qū)域內(nèi)顯示包括在所述第二顯示區(qū)域內(nèi)顯示,前置于所述當(dāng)前文本子群的一或多個相關(guān)文本子群。
56.如權(quán)利要求52的所述方法,其特征在于在所述第二顯示區(qū)域顯示包括在所述第二區(qū)域顯示,后置于所述當(dāng)前文本子群的一或多個相關(guān)文本子群。
57.如權(quán)利要求52的所述方法,其特征在于確定與對應(yīng)于所述當(dāng)前用戶位置的所述當(dāng)前文本子群相關(guān)的文本子群包括執(zhí)行語義分析的一個,執(zhí)行自然語言程序,識別所述文本種子和所述文本子群之間的因果關(guān)系,基于本體論確定語義相似性,使用一語義索引以比較語義相似性,以及確定一統(tǒng)計相似性。
58.一方法包括:在一電子文本內(nèi)確定文本子群;以及為每個文本子群:在所述文本子群和一或多個其它文本子群的內(nèi)容之間確定一相似性關(guān)系;以及基于所述相似性關(guān)系鏈接所述文本子群到所述一或多個其它文本子群。
59.如權(quán)利要求58的所述方法,其特征在于:確定文本子群包括在所述電子文本內(nèi)基于每個文本子群內(nèi)的內(nèi)容的另一相似性關(guān)系確定文本子群。
60.如權(quán)利要求58的所述方法,其特征在于:確定文本子群包括基于所述電子文本的章,段,以及句子的一個確定文本子群。
61.如權(quán)利要求58的所述方法,其特征在于:鏈接所述文本子群到所述一或多個其它文本子群包括在所述電子文本的元素?fù)?jù)內(nèi)存儲一導(dǎo)航輔助以指示所述文本子群與所述一或多個其它文本子群的結(jié)合。
62.如權(quán)利要求58的所述方法,進(jìn)一步包括呈現(xiàn),為每個文本自子群,鏈接所述文本子群到所述一或多個其它文本子群的一導(dǎo)航鏈接。
63.如權(quán)利要求58的所述方法,其特征在于:確定所述相似性關(guān)系包括在所述文本子群和在所述電子文本 內(nèi)前置于所述文本子群的每個其它文本子群之間確定一相似性關(guān)系,且其中鏈接所述文本子群到一或多個其它文本子群包括鏈接所述文本子群到具有所述高相似性關(guān)系的所述其它前置的文本子群。
64.如權(quán)利要求58的所述方法,其特征在于:確定所述相似性關(guān)系包括在所述文本子群和在所述電子文本內(nèi)前置于所述文本子群的每個其它文本子群之間確定一相似性關(guān)系,其中鏈接所述文本子群到具有所述最高相似性關(guān)系的另一個后置的文本子群。
65.如權(quán)利要求58的所述方法,其特征在于:確定所述相似性關(guān)系包括:使用一語義圖表代表單詞之間的關(guān)系以比較所述文本子群的單詞和在所述一或多個其它文本子群的單詞;以及使用所述比較以鏈接所述文本子群和所述一或多個其它文本子群。
66.如權(quán)利要求65的所述方法,進(jìn)一步包括使用所述電子文本的預(yù)生成總結(jié),所述電子文本的元素?fù)?jù),所述電子文本的語義分析,語義索引,自然語言處理(NLP),以及統(tǒng)計技術(shù)中的的至少一個生成所述語義圖表。
67.一電子設(shè)備包括:一電子文本管理器配置為:在電子文本內(nèi)的文本子群之間確定一用戶非線性導(dǎo)航;以及鏈接所述文本子群響應(yīng)確定所述文本子群之間的所述用戶非線性導(dǎo)航。
68.如權(quán)利要求67的所述電子設(shè)備,其特征在于:所述文本子群根據(jù)所述電子文本的章,段,以及句子的一個被定義。
69.如權(quán)利要求67的所述電子設(shè)備,其特征在于:所述電子文本管理器被配置以在所述電子文本的元素?fù)?jù)內(nèi)存儲一導(dǎo)航輔助以指示所述文本子群的結(jié)合。
70.一電子設(shè)備包括:一電子文本管理器配置為:在一電子文本內(nèi)確定一當(dāng)前用戶位置;以及確定對應(yīng)于所述當(dāng)前用戶位置的一當(dāng)前文本子群;以及一用戶界面配置為:顯示一第一顯示區(qū)域,對應(yīng)于所述當(dāng)前文本子群的所述電子文本的一部分;以及在一第二區(qū)域顯示,一或多個相關(guān)文本子群。
71.如權(quán)利要求70的所述電子設(shè)備,其特征在于:所述一或多個文本子群通過每個對應(yīng)文本子群和所述當(dāng)前文本子群之間的相似性得分被分類。
72.如權(quán)利要求70的所述電子設(shè)備,進(jìn)一步包括一用戶界面配置為為每個對應(yīng)的相關(guān)文本子群在與所述顯示區(qū)域相鄰的一區(qū)域內(nèi)顯示作為相似性的一指示的一圖表。
73.如權(quán)利要求70的所述電子設(shè)備,其特征在于:所述電子文本管理器被配置以確定與對應(yīng)于所述當(dāng)前用戶位置的所述當(dāng)前文本子群相關(guān)的文本子群通過執(zhí)行語義分析,執(zhí)行自然語言程序,識別在所述文本種子和所述文本子群之間的因果關(guān)系,基于本體論確定語義相似性,使用一語義索引以比較語義相似性,以及確定一統(tǒng)計相似性中一個。
74.—電子設(shè)備包括:一電子文件管理器配置為:在一電子文本內(nèi)確定文本子群;以及為每個文本子群:在所述文本子群和一或多個其它文本子群的內(nèi)容之間確定一相似性關(guān)系;以及基于其它相似性關(guān)系鏈接所述文本子群到所述一或多個其它文本子群。
75.一非臨時性電腦可讀的存儲介質(zhì)具有存儲于其中的計算機(jī)可執(zhí)行指令以執(zhí)行如下步驟:在電子文本內(nèi)的文本子群之間確定一用戶非線性導(dǎo)航;以及響應(yīng)確定所述用戶非線性導(dǎo)航在所述文本子群之間,鏈接所述文本子群。
76.一非臨時性電腦可讀的存儲媒介具有存儲于其中的電腦可執(zhí)行指令以執(zhí)行如下步驟:在一電子文本內(nèi)確定一當(dāng)前用戶位置;確定對應(yīng)于所述當(dāng)前用戶位置的一當(dāng)前文本子群;在一第一顯示區(qū)域顯示,對應(yīng)于所述當(dāng)前文本子群的所述電子文本的一部分;以及在第二顯示區(qū)域顯示,一或多個相關(guān)的文本子群。
77.一非臨時性電腦可讀的存儲媒介具有存儲于其中的電腦可執(zhí)行指令以執(zhí)行如下步驟:在一電子文本內(nèi)確定文本子群;以及為每個文本子群:在所述文本子群和一或多個其它文本子群的內(nèi)容之間確定一相似性關(guān)系;以及基于其它相似性關(guān)系鏈接搜索文本子群到所述一或多個其它文本子群。
全文摘要
本發(fā)明公開用于導(dǎo)航電子文本的系統(tǒng)和方法。根據(jù)一方面,可以包括一電子文本內(nèi)的文本子群的一方法。所述方法也可以包括在所述文本子群的一個內(nèi)選擇一文本種子。進(jìn)一步的,所述方法可以包括在所述文本種子和不包括所述選擇的文本種子的一或多個相鄰文本子群之間確定一相似性關(guān)系。所述方法也包括基于所述相似性關(guān)系將所述文本種子和所述一或多個相鄰文本子群相關(guān)聯(lián)以創(chuàng)建一文本集群。
文檔編號G06F17/30GK103250175SQ201180051383
公開日2013年8月14日 申請日期2011年9月28日 優(yōu)先權(quán)日2010年9月29日
發(fā)明者庫娜·K, 斯科特·C, 休·S 申請人:朗達(dá)實(shí)業(yè)公司