国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      信息處理終端和方法,以及信息管理設(shè)備和方法

      文檔序號(hào):6532680閱讀:188來(lái)源:國(guó)知局
      信息處理終端和方法,以及信息管理設(shè)備和方法【專利摘要】根據(jù)一個(gè)實(shí)施例,信息處理終端包括生成器、獲取單元、和輸出單元。生成器分析電子文檔以生成包括該電子文檔中的文本信息和關(guān)于該電子文檔的結(jié)構(gòu)信息的元數(shù)據(jù)項(xiàng)。獲取單元將該元數(shù)據(jù)項(xiàng)傳送至信息管理設(shè)備,使得信息管理設(shè)備估算類似于該元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng)并獲取對(duì)應(yīng)于該相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)。輸出單元輸出與電子文檔相關(guān)的注解信息項(xiàng)?!緦@f(shuō)明】信息處理終端和方法,以及信息管理設(shè)備和方法[0001]相關(guān)申請(qǐng)的交叉引用[0002]此申請(qǐng)基于2012年3月27日提交的2012-072517號(hào)日本專利申請(qǐng)并要求其優(yōu)先權(quán)的利益,其全部?jī)?nèi)容通過引用被合并到本文中。【
      技術(shù)領(lǐng)域
      】[0003]在這里描述的實(shí)施例涉及信息處理終端和方法,以及信息管理設(shè)備和方法?!?br>背景技術(shù)
      】[0004]有用于管理通過網(wǎng)絡(luò)可訪問的內(nèi)容站點(diǎn)以搜索內(nèi)容信息的信息管理設(shè)備,例如活動(dòng)圖像或電子詞典。這些設(shè)備包括其中由多個(gè)用戶加到特定的內(nèi)容的注解信息在用戶之間被共享的設(shè)備。[0005]為在內(nèi)容站點(diǎn)上使對(duì)于內(nèi)容的注解信息能夠在用戶之間共享,信息管理設(shè)備必須在數(shù)據(jù)庫(kù)中存儲(chǔ)互相相關(guān)的內(nèi)容和注解信息。[0006]然而,因?yàn)槭沟脙?nèi)容項(xiàng)對(duì)應(yīng)于各個(gè)注解信息項(xiàng),所以存在互相相關(guān)的多個(gè)內(nèi)容項(xiàng)(例如,不同版本的相同內(nèi)容項(xiàng)或者由不同的發(fā)表者發(fā)表的那些)存在于數(shù)據(jù)庫(kù)的情況。在這種情況下,注解信息可能不能夠在相關(guān)的內(nèi)容項(xiàng)之間共享。此外,當(dāng)用戶在他們各自的本地環(huán)境中以不同的格式或形式從版權(quán)中獨(dú)立地存放文檔數(shù)據(jù)時(shí),難以共享注解信息,因?yàn)閿?shù)據(jù)庫(kù)和文件系統(tǒng)是分散的。[0007]從而,在傳統(tǒng)的信息管理設(shè)備中,用戶想要知道的內(nèi)容信息,和與之相關(guān)的注解信息,不能適當(dāng)?shù)乇凰阉?。【專利附圖】【附圖說(shuō)明】[0008]圖1是圖解根據(jù)第一實(shí)施例的信息處理終端I和2的方框圖;[0009]圖2A和2B是圖解由彳目息處理終端I和2進(jìn)行的處理的流程圖;[0010]圖3是圖解由并入信息處理終端I的生成器11進(jìn)行的處理的流程圖;[0011]圖4是對(duì)解釋結(jié)構(gòu)信息有用的視圖;[0012]圖5是圖解元數(shù)據(jù)的實(shí)例的視圖;[0013]圖6是圖解由并入信息處理終端I的獲取單元12進(jìn)行的處理的流程圖;[0014]圖7是圖解對(duì)應(yīng)信息的實(shí)例的視圖;[0015]圖8是對(duì)解釋注解信息有用的視圖;[0016]圖9是圖解由在第三實(shí)施例中采用的判斷單元110進(jìn)行的處理的流程圖;[0017]圖10是圖解在存儲(chǔ)器23中存儲(chǔ)的元數(shù)據(jù)和注解信息的實(shí)例的視圖;[0018]圖11是用于獲取類似的元數(shù)據(jù)的流程圖;[0019]圖12是圖解類似的元數(shù)據(jù)的實(shí)例的視圖;[0020]圖13是圖解在由提取單元22提取注解信息之后進(jìn)行的處理的流程圖;[0021]圖14A和14B是圖解注解信息的顯示實(shí)例的視圖;以及[0022]圖15是圖解根據(jù)第二實(shí)施例的信息處理終端10和信息管理設(shè)備2的方框圖?!揪唧w實(shí)施方式】[0023]所述實(shí)施例的目的是提供一種信息處理終端和方法,以及一種信息管理設(shè)備和方法,其使用戶能夠適當(dāng)?shù)厮阉髟撚脩粝胍赖膬?nèi)容信息。[0024]根據(jù)一個(gè)實(shí)施例,信息處理終端被允許被連接到用于管理電子文檔上的元數(shù)據(jù)項(xiàng)和對(duì)應(yīng)于元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)的信息管理設(shè)備,該終端包括生成器,獲取單元,和輸出單元。生成器分析電子文檔以生成包括該電子文檔中的文本信息和關(guān)于該電子文檔的結(jié)構(gòu)信息的元數(shù)據(jù)項(xiàng)。獲取單元將該元數(shù)據(jù)項(xiàng)傳送至信息管理設(shè)備,令信息管理設(shè)備估算類似于該元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng)并獲取對(duì)應(yīng)于該相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)。輸出單元輸出與電子文檔相關(guān)的注解信息項(xiàng)。[0025](第一實(shí)施例)[0026]根據(jù)第一實(shí)施例的信息處理終端I適合作為能夠處理與電子文檔相關(guān)的資源(文件或應(yīng)用)的信息終端(例如,PC,智能電話,網(wǎng)絡(luò)書籍等等)。根據(jù)第一實(shí)施例的信息管理設(shè)備2適合作為可連接至信息處理終端I的服務(wù)器。與電子文檔相關(guān)的資源是,例如,電子圖書。[0027]信息處理終端I分析作為處理目標(biāo)的電子文檔(以下稱為“目標(biāo)文檔”),生成包括與目標(biāo)文檔相關(guān)的文本數(shù)據(jù)和結(jié)構(gòu)信息的元數(shù)據(jù)(目標(biāo)元數(shù)據(jù)),并將目標(biāo)元數(shù)據(jù)傳送至信息管理設(shè)備2。[0028]文本數(shù)據(jù)包括電子文檔中的文本本身,和通過混編文本獲得的信息。結(jié)構(gòu)信息與在電子文檔中的文檔的邏輯結(jié)構(gòu)和/或布局相關(guān)。例如,結(jié)構(gòu)信息包括在電子文檔的每行中包含的縮進(jìn)數(shù),文本數(shù)據(jù)項(xiàng)、符號(hào)、數(shù)字、文本集的數(shù)目,和字符類型,字體大小,邏輯要素(例如標(biāo)題,索引和正文文本),布局信息等等。縮進(jìn)數(shù)對(duì)應(yīng)于在行的首位部分和該行中的文本數(shù)據(jù)的首位部分之間存在的空格符的數(shù)目。文本集指示不包括空格符的連續(xù)部分的文本數(shù)據(jù)。[0029]信息管理設(shè)備2存儲(chǔ)與電子文檔相關(guān)的元數(shù)據(jù),和與該元數(shù)據(jù)相關(guān)的注解信息,元數(shù)據(jù)和注解信息被互相相關(guān)地存儲(chǔ)。注解信息是附加至包含在電子文檔中的文本數(shù)據(jù)的信息。例如,注解信息包括由未指定的用戶的信息處理終端附加于電子文檔中的文本數(shù)據(jù)的注釋,或者與由用戶在他們大聲讀出電子文檔中的文本的時(shí)候生成的語(yǔ)音相關(guān)的音頻信息。注解信息不局限于以上,并且如果它與電子文檔有關(guān),則可以是任何類型的信息。[0030]信息管理設(shè)備2搜索類似于從信息處理終端I接收的目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù),并且對(duì)信息處理終端I提供相應(yīng)于相似元數(shù)據(jù)的注解信息。[0031]信息處理終端I輸出從信息管理設(shè)備接收的與目標(biāo)文檔相關(guān)的注解信息。結(jié)果,用戶能夠適當(dāng)?shù)厮阉魉麄兿胍赖膬?nèi)容信息。[0032]圖1是圖解信息處理終端I和信息管理設(shè)備2的方框圖。如所示,信息處理終端I包含生成器11,獲取單元12,存儲(chǔ)器13和輸出單元14。[0033]生成器11獲取目標(biāo)文檔,并生成包含與目標(biāo)文檔相關(guān)的結(jié)構(gòu)信息的元數(shù)據(jù)(目標(biāo)元數(shù)據(jù))。例如,生成器11可以獲取存儲(chǔ)在信息處理終端I中的電子文檔,或由用戶下載的電子文檔,作為目標(biāo)文檔。[0034]獲取單元12生成用于使信息管理設(shè)備2能夠估算類似于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)的搜索詢問,并且將該搜索詢問傳送至信息管理設(shè)備2。在這時(shí)候,獲取單元12可以在存儲(chǔ)器13中把目標(biāo)文檔和目標(biāo)元數(shù)據(jù)標(biāo)出以使它們互相關(guān)聯(lián)。獲取單元12從信息管理設(shè)備2獲取對(duì)應(yīng)于由信息管理設(shè)備2估算的相似元數(shù)據(jù)的注解信息。[0035]輸出單元14輸出與目標(biāo)文檔相關(guān)的被獲取的注解信息。[0036]生成器11和獲取單元12可以通過CPU(中央處理單元)和由CPU使用的存儲(chǔ)器被實(shí)現(xiàn)。存儲(chǔ)器13可以通過由CPU使用的內(nèi)存或輔助存儲(chǔ)器被實(shí)現(xiàn)。輸出單元14可以由諸如液晶顯示器或有機(jī)EL顯示器的顯示單元(未顯示),或者由諸如揚(yáng)聲器的語(yǔ)音輸出單元(未顯示)被實(shí)現(xiàn)。[0037]信息管理設(shè)備2包含接收器21,提取單元22,存儲(chǔ)器23和傳送器24。[0038]接收器21從信息處理終端I的獲取單元12接收搜索詢問,并向提取單元22提供被接收到的搜索詢問。[0039]存儲(chǔ)器23存儲(chǔ)互相相關(guān)的電子文檔上的元數(shù)據(jù)和元數(shù)據(jù)上的注解信息。例如,存儲(chǔ)器23可以使用由未指定的用戶添加的對(duì)某一電子文檔中的文本數(shù)據(jù)的注釋作為注解信息,并且存儲(chǔ)與該電子文檔的元數(shù)據(jù)相關(guān)的注解信息。[0040]提取單元22基于所提供的搜索詢問搜索存儲(chǔ)器23,從而估算對(duì)應(yīng)于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)。提取單元22從存儲(chǔ)器23提取對(duì)應(yīng)于所估算的相似元數(shù)據(jù)的注解信息,并且向傳送器24提供被提取出來(lái)的注解信息。[0041]傳送器24將所提供的注解信息傳送至信息處理終端I的獲取單元12。[0042]接收器21、提取單元22和傳送器24可以通過CPU和由CPU使用的存儲(chǔ)器被實(shí)現(xiàn)。存儲(chǔ)器23可以通過由CPU使用的內(nèi)存或輔助存儲(chǔ)裝置實(shí)被現(xiàn)。[0043]信息處理終端I和信息管理設(shè)備2是如以上所述被構(gòu)造的。[0044]圖2A和2B分別是圖解信息處理終端I和信息管理設(shè)備2的處理的流程圖。[0045]首先參考圖2A,將描述由信息處理終端I進(jìn)行的處理。[0046]生成器11生成目標(biāo)文檔并生成目標(biāo)元數(shù)據(jù)(SlOl)。獲取單元12生成用于使信息管理設(shè)備2能夠估算類似于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)的搜索詢問(S102)。獲取單元12將被生成的搜索詢問傳送至信息管理設(shè)備2(S103)。獲取單元12從信息管理設(shè)備2獲取對(duì)應(yīng)于由信息管理設(shè)備2估算的相似元數(shù)據(jù)的注解信息(S104)。輸出單元14輸出被獲取的與目標(biāo)文檔相關(guān)的注解信息(S105),這是此程序的終止。[0047]然后參考圖2B,將描述由信息管理設(shè)備2進(jìn)行的處理。由信息管理設(shè)備2進(jìn)行的處理是在由信息處理終端I進(jìn)行的處理的步驟S103和S104之間進(jìn)行的。[0048]接收器21從信息處理終端I的獲取單元12接收搜索詢問(S201)。按照該搜索詢問,提取單元22在存儲(chǔ)器23中搜索對(duì)應(yīng)于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)(S202),并從存儲(chǔ)器23提取對(duì)應(yīng)于被估算的相似元數(shù)據(jù)的注解信息(S203)。傳送器24將注解信息傳送至信息處理終端I的獲取單元12(S204),這是此程序的終止。[0049]圖3是圖解由并入信息處理終端I的生成器11進(jìn)行的處理的流程圖。生成器11使被獲取的電子文檔經(jīng)過形態(tài)分析以將文檔中的文本數(shù)據(jù)劃分為單詞(S301)。生成器11在通過劃分步驟被獲得的單詞中檢測(cè)高出現(xiàn)頻率的單詞(S302)。例如,生成器11可以獲取出現(xiàn)頻率順序高于預(yù)定順序的單詞。生成器11還將關(guān)于高出現(xiàn)頻率順序的單詞的信息存儲(chǔ)為文本信息。[0050]生成器11分析被獲取的電子文檔以獲得關(guān)于其的結(jié)構(gòu)信息(S303)。圖4是對(duì)解釋結(jié)構(gòu)信息有用的視圖。如圖4所示,在該實(shí)施例中所采用的結(jié)構(gòu)信息與電子文檔的每行中的文本數(shù)據(jù)的結(jié)構(gòu)相關(guān),并且包括縮進(jìn)數(shù),字符、符號(hào)、數(shù)字、和文本集的數(shù)目,字體大小,邏輯要素,布局信息等等。[0051]將對(duì)圖4中顯示的電子文檔“SKAZKAOIVANE-DURAKE”的第一行的結(jié)構(gòu)信息給出說(shuō)明。在第一行,如果在該行的第一部分和文本數(shù)據(jù)“IvantheFool”的首字符“I”之間存在的空格符的數(shù)目是4,則縮進(jìn)數(shù)是4。在“IvantheFool”中包括的字符數(shù)目是11。在“IvantheFool”中包括的符號(hào)數(shù)目是O。在“IvantheFool”中包括的數(shù)字?jǐn)?shù)目是O。在“IvantheFool”中包括的文本集的數(shù)目是3。在“IvantheFool”中包括的字符類型數(shù)目是I。文本數(shù)據(jù)“IvantheFool”的字體大小是20。“IvantheFool”的邏輯要素是“標(biāo)題”。[0052]布局信息通過用“I”代表文本數(shù)據(jù)至少在每四個(gè)字符的組中存在所在的位置,并且用“O”代表文本數(shù)據(jù)不存在在每四個(gè)字符的組中所在的位置,來(lái)指示在該行的文本數(shù)據(jù)的布局。從而,在圖4中顯示的電子文檔的第一行處的布局信息能夠用,例如,“0111100000000000000”來(lái)表示。對(duì)于第二和第三行,布局信息能夠用例如圖4中所示的這種結(jié)構(gòu)信息來(lái)表示。對(duì)其它行來(lái)說(shuō)也是如此。[0053]生成器11通過構(gòu)造文本信息和結(jié)構(gòu)信息來(lái)生成目標(biāo)元數(shù)據(jù)(S304)。圖5顯示元數(shù)據(jù)的實(shí)例。如圖5所示,該實(shí)施例的目標(biāo)元數(shù)據(jù)包括用于識(shí)別目標(biāo)元數(shù)據(jù)的元數(shù)據(jù)ID?metadataid?,并且該實(shí)施例的目標(biāo)元數(shù)據(jù)是通過構(gòu)造文本信息和結(jié)構(gòu)信息被獲得的。分配給圖5的目標(biāo)元數(shù)據(jù)的元數(shù)據(jù)ID是“123”。[0054]例如,生成器11把“Tolstoi”標(biāo)為〈creator〉要素,把“IvantheFool”標(biāo)為〈title〉要素,并且把“xxx”標(biāo)為〈translator〉要素,如在圖5中顯示的。在這時(shí)候,生成器11把這些要素標(biāo)為對(duì)應(yīng)于目標(biāo)文檔的標(biāo)識(shí)ID(〈desCript1nid?的內(nèi)容。圖5中顯示的目標(biāo)文檔的標(biāo)識(shí)ID是“456”。生成器11可以在對(duì)應(yīng)于目標(biāo)文檔的標(biāo)識(shí)ID?descript1nid?的內(nèi)容中包括對(duì)于目標(biāo)文檔的電子文檔URL(統(tǒng)一資源定位器)。圖5中顯示的目標(biāo)文檔的電子文檔URL是:[0055]“http://www.toshiba.c0.jp/ebook/#1298129sw”[0056]生成器11把在步驟S303獲得的圖4中顯示的結(jié)構(gòu)信息標(biāo)為〈layout_pattern>要素。生成器11還把在步驟S302獲得的文本出現(xiàn)頻率標(biāo)為<text-1nfo>要素。在圖5情況中,作為經(jīng)常出現(xiàn)的單詞或詞組的實(shí)例的“olddeVil”,“StraW”,“table”和“Ivan”的各自的出現(xiàn)頻率分別是“35”,“20”,“10”和“5”。生成器11向獲取單元12提供目標(biāo)文檔和被生成的目標(biāo)元數(shù)據(jù)。生成器11還把對(duì)應(yīng)于目標(biāo)元數(shù)據(jù)的用于識(shí)別目標(biāo)文檔的電子文檔ID,和目標(biāo)文檔的URL標(biāo)為結(jié)構(gòu)信息。在圖5中顯示的指示目標(biāo)文檔的電子文檔ID是“100”。[0057]雖然在以上實(shí)例中,為了便于說(shuō)明,在每行的文本數(shù)據(jù)的內(nèi)容被寫為文本要素的一個(gè)行,但是舉例來(lái)說(shuō)布局信息可以被寫為混編的信息。更進(jìn)一步,元數(shù)據(jù)可以包括能夠作為書目信息,以及結(jié)構(gòu)信息被提取的要素。例如,除如在圖5中的實(shí)例顯示的創(chuàng)作者,標(biāo)題和翻譯者之外,出版者名字,出版年份,月份和日期,卷次編號(hào),等等,可以包括在元數(shù)據(jù)中。[0058]圖6是圖解由獲取單元12進(jìn)行的處理的流程圖。獲取單元12在存儲(chǔ)器13中寫入使提供的目標(biāo)文檔能夠與目標(biāo)元數(shù)據(jù)相聯(lián)系的對(duì)應(yīng)信息(S401)。獲取單元12生成用于使信息管理設(shè)備2能夠估算類似于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)的搜索詢問,并且將該搜索詢問傳送至信息管理設(shè)備2(S402)。獲取單元12從信息管理設(shè)備2獲取對(duì)應(yīng)于相似元數(shù)據(jù)的注解信息(S403)。隨后將詳細(xì)地描述在信息管理設(shè)備2中估算相似元數(shù)據(jù)的方法。[0059]現(xiàn)在將對(duì)對(duì)應(yīng)信息給出說(shuō)明。圖7顯示對(duì)應(yīng)信息的實(shí)例。如圖7所示,對(duì)應(yīng)信息使在圖5中顯示的每個(gè)電子文檔的元數(shù)據(jù)的元數(shù)據(jù)ID、每個(gè)電子文檔的電子文檔ID、每個(gè)電子文檔的URL、以及元數(shù)據(jù)的URL互相相關(guān)。如果元數(shù)據(jù)的內(nèi)容本身,或?qū)?yīng)于元數(shù)據(jù)內(nèi)容的鏈接(路徑)在元數(shù)據(jù)欄中被標(biāo)出就足夠了。[0060]將詳細(xì)地描述信息管理設(shè)備2。信息管理設(shè)備2的存儲(chǔ)器23存儲(chǔ)互相關(guān)聯(lián)的元數(shù)據(jù)和關(guān)于每個(gè)電子文檔的注解信息。圖8是對(duì)解釋注解信息有用的視圖。舉例來(lái)說(shuō),在圖8中顯示的注解信息是對(duì)包含在用戶正在經(jīng)由他的信息處理終端瀏覽的電子文檔中、并且由該用戶指定的文本數(shù)據(jù)的用戶注釋。換句話說(shuō),注解信息可能是關(guān)于文本數(shù)據(jù)的音頻信息(發(fā)音或音調(diào))。[0061]圖8顯示其中某個(gè)用戶已經(jīng)對(duì)在電子文檔“IvantheFool”中包含的文本數(shù)據(jù)“threesons—Simeon(asoldier),Tarras-Briukhan(afatman),andIvan(afool)—”寫了注釋“Thisexpress1nis...”的情況。進(jìn)一步地,關(guān)于指定的文本數(shù)據(jù)“threesons—Simeon(asoldier),Tarras-Briukhan(afatman),andIvan(afool)—,,的音步頁(yè)信息包括這個(gè)句子的發(fā)音、以及與該句子相關(guān)的音調(diào)的位置。即,在這個(gè)實(shí)例中的注解信息包含注釋“Thisexpress1nis...”和音頻信息。[0062]圖9顯示在存儲(chǔ)器23中存儲(chǔ)的注解信息的實(shí)例。例如,可以用XML格式標(biāo)出注解信息。在顯示的實(shí)例中,注釋和音頻信息被標(biāo)為<annotat1n-1nfo>要素中的注解信息。[0063]存儲(chǔ)器23存儲(chǔ)用于識(shí)別注解信息的注解信息ID、被分配給對(duì)應(yīng)于該注解信息的電子文檔的電子文檔ID(〈refid>)、指示該注解信息對(duì)應(yīng)于電子文檔的哪個(gè)部分的索引位置或長(zhǎng)度信息等等。[0064]最好是諸如GUID的可唯一限定的ID被事先指定為電子文檔ID。如果電子文檔是可直接訪問的,則能夠使用以上所述的ID來(lái)提取電子文檔的對(duì)應(yīng)于注解信息的部分。[0065]圖9的上部顯示注解信息是用戶注釋的情況。在這種情況下,由某個(gè)用戶作出的注釋被標(biāo)為〈commentary〉要素。圖9的下部顯示注解信息是音頻信息的情況。音頻信息以文本格式被標(biāo)為〈midterm〉要素。[0066]圖10顯示在存儲(chǔ)器23中存儲(chǔ)的元數(shù)據(jù)和注解信息的實(shí)例。存儲(chǔ)器23使用元數(shù)據(jù)ID、注解信息ID、和注解信息存儲(chǔ)互相相關(guān)的元數(shù)據(jù)和注解信息。[0067]將描述信息管理設(shè)備2的提取單元22。當(dāng)估算對(duì)應(yīng)于從接收器21被提供的目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)時(shí),提取單元22基于文本信息計(jì)算第一相似度、基于結(jié)構(gòu)信息計(jì)算第二相似度、并基于文本信息和結(jié)構(gòu)信息計(jì)算第三相似度。提取單元22基于第一到第三相似度從存儲(chǔ)器23提取出相似元數(shù)據(jù)。[0068]圖11是圖解由提取單元22進(jìn)行的處理的流程圖。提取單元22計(jì)算第一相似度(S501)。第一相似度指示與文本信息相關(guān)的相似度。例如,提取單元22可以基于目標(biāo)元數(shù)據(jù)和被存儲(chǔ)在存儲(chǔ)器23中的元數(shù)據(jù)之間的高出現(xiàn)頻率的單詞或字符的N元組(n-gram)的匹配度、或基于出現(xiàn)的文本序列之間的模式的匹配度來(lái)計(jì)算第一相似度。[0069]更具體地說(shuō),舉例來(lái)說(shuō),第一相似度是通過測(cè)量目標(biāo)元數(shù)據(jù)和被存儲(chǔ)在存儲(chǔ)器23中的元數(shù)據(jù)之間的字符或單詞的出現(xiàn)頻率的差值、或者計(jì)算較前和較后的元數(shù)據(jù)項(xiàng)中的關(guān)鍵字序列之間的編輯距離(Loewenstein距離)從而計(jì)算關(guān)鍵字序列之間的相似度來(lái)獲得的。[0070]提取單元22計(jì)算第二相似度(S502)。第二相似度指示作為樹形結(jié)構(gòu)之間的相似度,其中,結(jié)構(gòu)信息中的邏輯要素的層次以該樹形結(jié)構(gòu)的形式被表達(dá)。[0071]更具體地說(shuō),舉例來(lái)說(shuō),第二相似度能夠通過計(jì)算樹形結(jié)構(gòu)數(shù)據(jù)項(xiàng)之間的編輯距尚來(lái)獲得。[0072]當(dāng)計(jì)算第二相似度時(shí),提取單元22可以根據(jù)邏輯要素的類型來(lái)改變對(duì)于對(duì)應(yīng)于每個(gè)邏輯要素的每個(gè)結(jié)點(diǎn)的權(quán)重。例如,較重的權(quán)重可以被分配給對(duì)應(yīng)于“章節(jié)”的結(jié)點(diǎn),而較輕的權(quán)重可以被分配給對(duì)應(yīng)于“參考文獻(xiàn)”或“評(píng)論”的結(jié)點(diǎn)。[0073]提取單元22計(jì)算第三相似度(S503)。第三相似度是作為結(jié)構(gòu)信息和文本信息的組合的信息的相似度,諸如包括標(biāo)題、創(chuàng)作者/翻譯者、以及電子文檔的出版日期的書目的事項(xiàng)。在這個(gè)實(shí)例中,書目的事項(xiàng)作為指示電子文檔的信息被利用或被出版。[0074]更具體地說(shuō),假定在目標(biāo)元數(shù)據(jù)的要素〈LayoutSim〉中,被包括在目標(biāo)元數(shù)據(jù)中的“標(biāo)題”的字符串被編碼為“pathinformat1n:/document/root/chapter[ititle=〃chapterl〃],,,“textelement:let’smeetatKawasakistat1n,,。[0075]另一方面,假定被存儲(chǔ)在存儲(chǔ)器23中的元數(shù)據(jù)項(xiàng)中的一個(gè)被編碼為“pathinformat1n:/document/chapter/chapter_title,,,“textelement:let’smeetatKawasakistat1n,,。[0076]在這種情況下,能夠通過計(jì)算與路徑信息相關(guān)的編輯距離的相似度、以及與文本要素相關(guān)的編輯距離的相似度,并計(jì)算被計(jì)算出來(lái)的度的總和來(lái)獲得三個(gè)相似度。[0077]通常,即使當(dāng)電子文檔在正文文字上是等同的時(shí),它們?cè)诮Y(jié)構(gòu)信息上也并不總是等同的。例如,存在以不同的題字(例如,以不同的字體)寫相同的標(biāo)題的情況、由不同的翻譯者或以不同的翻譯風(fēng)格翻譯相同的文本的情況、相同的文本具有不同的版本的情況、或者由不同的出版者出版相同的文本的情況。因此,對(duì)于每個(gè)應(yīng)用確定相似度,憑借該相似度,電子文檔被認(rèn)為是相同的電子文檔。[0078]例如,存在一種情況,其中對(duì)于某個(gè)外國(guó)的文學(xué)作品應(yīng)該與它的翻譯者無(wú)關(guān)地提取注解信息,或者一種情況,其中如果該文學(xué)作品是由不同的翻譯者翻譯,則不應(yīng)該提取注解信息。[0079]以上所述的這種差異能夠在步驟S504被反映為加權(quán)因數(shù)。這樣,能夠使用加權(quán)因數(shù)計(jì)算基于以上觀點(diǎn)的相似度。[0080]提取單元22為第一,第二和第三相似度分別設(shè)置權(quán)重因數(shù)α,β和Y,其用來(lái)搜索對(duì)應(yīng)于被提供的目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)(S504)。存在用于設(shè)置權(quán)重因數(shù)的不同的方法??梢圆捎眠x擇由,例如,系統(tǒng)管理員預(yù)置的因數(shù)的方法,或根據(jù)由目標(biāo)元數(shù)據(jù)指示的電子文檔的類型動(dòng)態(tài)地設(shè)置因數(shù)的方法。還作為選擇,可以使用被計(jì)算出來(lái)的相似度設(shè)置權(quán)重因數(shù)。提取單元22也可以改變相似度的計(jì)算順序。即,提取單元22可以,例如,響應(yīng)于與高優(yōu)先級(jí)的項(xiàng)相關(guān)的被計(jì)算出來(lái)的相似度,忽略后續(xù)的處理。[0081]基于這樣被計(jì)算出來(lái)的第一,第二和第三相似度,提取單元22在存儲(chǔ)器23中搜索相似元數(shù)據(jù)。例如,提取單元22使用以下等式(I)基于第一,第二和第三相似度和加權(quán)因數(shù)α,β和Y計(jì)算元數(shù)據(jù)的相似度,從而如果被計(jì)算出來(lái)的元數(shù)據(jù)相似度不低于預(yù)定閾值,則估算該元數(shù)據(jù)作為相似元數(shù)據(jù):[0082]相似度=αχ第一相似度+βχ第二相似度+Υχ第三相似度(I)[0083]在這里假定,例如,提取單元22已經(jīng)估算了圖12中顯示的相似元數(shù)據(jù)。更具體地說(shuō),假定在圖10中和在圖12的上部中顯示的元數(shù)據(jù),以及對(duì)應(yīng)于由另一個(gè)用戶分配至不同的電子文檔ID的電子文檔的注解信息的元數(shù)據(jù)已經(jīng)被估算作為相似元數(shù)據(jù)。[0084]在這時(shí)候,提取單元22從存儲(chǔ)器23提取對(duì)應(yīng)于相似元數(shù)據(jù)的元數(shù)據(jù)ID的注解信息(S506)。在這個(gè)實(shí)例中,提取單元22提取圖12中顯示的兩個(gè)注解信息項(xiàng)。對(duì)于對(duì)應(yīng)于不同的元數(shù)據(jù)項(xiàng)的注解信息,必須確保注解信息和目標(biāo)文檔之間的匹配,因?yàn)椴煌碾娮游臋n被搜索,并且由此即使當(dāng)總體上確保匹配時(shí),也可能對(duì)于細(xì)節(jié)丟失匹配。所以,所希望的是檢測(cè)用于確保匹配的共享結(jié)構(gòu)。[0085]將更詳細(xì)地描述提取注解信息的方法。圖13是圖解在由提取單元22提取注解信息之后進(jìn)行的處理的流程圖。[0086]提取單元22提取對(duì)應(yīng)于相似元數(shù)據(jù)的注解信息(S601),然后獲取與注解信息的參照范圍相關(guān)的信息(S602)。這個(gè)信息指示在圖12的注解信息中顯示的這種不同的屬性。具體地說(shuō),屬性包括指示從與對(duì)應(yīng)于注解信息的文本數(shù)據(jù)相關(guān)的電子文檔的開頭起的第η個(gè)(η是自然數(shù))字符的“index”,該第η個(gè)字符指示文本數(shù)據(jù)的開始位置,指示文本數(shù)據(jù)長(zhǎng)度的“l(fā)ength”,指示文本數(shù)據(jù)所屬的章節(jié)結(jié)構(gòu)的“chapter”,指示子章節(jié)結(jié)構(gòu)的“sect1n”,指示段落結(jié)構(gòu)的“para”,指示包括在參照范圍中的具有更高的出現(xiàn)頻率的文本數(shù)據(jù)項(xiàng)的順序的信息等等。[0087]對(duì)于與參照范圍相關(guān)的以上信息,提取單元22以結(jié)構(gòu)的遞減次序進(jìn)行關(guān)于目標(biāo)元數(shù)據(jù)中的目標(biāo)部分和相似元數(shù)據(jù)中的目標(biāo)部分的匹配判斷(S603)。[0088]提取單元22判斷目標(biāo)部分是否互相匹配(S604)。因?yàn)楫?dāng)前的注解信息已經(jīng)從元數(shù)據(jù)項(xiàng)之間的相似的匹配中得到,所以假定匹配是基于作為最大的單元的結(jié)構(gòu)單元被檢測(cè)的。進(jìn)一步地,在這里假定在結(jié)構(gòu)中建立“chapter>sect1n>para>freqterm>index”的遞減次序,并且提取單元22以這個(gè)順序作出匹配的判斷。[0089]如果判斷匹配被檢測(cè)(在步驟S604的是),則對(duì)于更小的結(jié)構(gòu)單元進(jìn)行關(guān)于匹配的判斷(S605),并且處理轉(zhuǎn)到步驟S603。相反,如果匹配沒有被檢測(cè)(在步驟S604的否),則處理轉(zhuǎn)到步驟S606。在圖12的實(shí)例中,很清楚,當(dāng)與“index”的結(jié)構(gòu)單元相聯(lián)系地進(jìn)行比較時(shí),將出現(xiàn)差值。從而,提取單元22進(jìn)行在其中以“#4”檢定匹配的“freqterm”的結(jié)構(gòu)單元中注解信息的對(duì)應(yīng),并且將該注解信息發(fā)送至傳送器24(S606)。傳送器24將提供的注解信息發(fā)送至信息處理終端I的獲取單元12。[0090]信息處理終端I的輸出單元14輸出被獲取的與目標(biāo)文檔相關(guān)的注解信息。圖14A和14B是圖解由輸出單元14輸出至信息處理終端I的顯示屏幕的注解信息的顯示實(shí)例的視圖。如在圖14A中顯示的,輸出單元14可以利用指定目標(biāo)范圍的彈出功能顯示注解信息,可以將它插入在后續(xù)的文檔中,或者可以將它顯示在具有被動(dòng)態(tài)地給予它的引用符(例如,依賴注入代碼(daggercode))的另一個(gè)區(qū)域中。進(jìn)一步地,輸出單元14可以不同時(shí)地顯示注釋,但是可以通過,例如,高亮度顯示對(duì)應(yīng)的區(qū)域,并在用戶請(qǐng)求它們的顯示的時(shí)候顯示注釋,來(lái)通知用戶存在對(duì)目標(biāo)文檔的評(píng)論。相反,如果匹配即使在詳細(xì)的區(qū)域中也沒有被檢測(cè),則可以與瀏覽的頁(yè)面相關(guān)地以欄的形式顯示注解信息,如在圖14B中顯示的。進(jìn)一步地,當(dāng)顯示包括腳注區(qū)域的目標(biāo)區(qū)域時(shí),可以在該腳注區(qū)域中顯示注解信息。[0091]在第一實(shí)施例中,能夠使得之前與相似內(nèi)容項(xiàng)相關(guān)或者之前是源自相似內(nèi)容項(xiàng)的產(chǎn)物但是因?yàn)椴荒苁沟盟鼈兓ハ鄬?duì)應(yīng)而之前被分散了的注解信息項(xiàng)互相對(duì)應(yīng)。這不但使由作為特定的服務(wù)提供者的書籍商準(zhǔn)備的受限的文檔內(nèi)容被利用或參考,而且使在不同的網(wǎng)址上的相似信息或與由用戶計(jì)算機(jī)化的內(nèi)容項(xiàng)相關(guān)的注解信息能夠被利用或參考。[0092](第二實(shí)施例)[0093]根據(jù)第二實(shí)施例的信息處理終端10與第一實(shí)施例的終端的不同在于前者能夠接受終端用戶的注解信息輸入,并且將輸入的注解信息傳送到信息管理設(shè)備2。[0094]圖15是圖解信息處理終端10和信息管理設(shè)備2的方框圖。除第一實(shí)施例的信息處理終端I的元件之外,信息處理終端10包含分析單元15。分析單元15在由終端的用戶輸入的電子文檔上接受例如注釋的注解信息。根據(jù)第二實(shí)施例的注解信息可以使用,例如,電子圖書閱讀器的插件程序功能或在電子文檔瀏覽服務(wù)站點(diǎn)上的Π功能來(lái)輸入。[0095]分析單元15將輸入的注解信息提供至獲取單元12。獲取單元12使得所提供的注解信息對(duì)應(yīng)于目標(biāo)元數(shù)據(jù)以便構(gòu)造它,并且將它寫在存儲(chǔ)器12中。進(jìn)一步地,將被使得互相對(duì)應(yīng)的注解信息和目標(biāo)元數(shù)據(jù)傳送至信息管理設(shè)備2的接收器21。在信息管理設(shè)備2中,提取單元22將注解信息和目標(biāo)元數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器23中。[0096]第二實(shí)施例的信息處理終端10能夠從信息管理設(shè)備2獲取與對(duì)應(yīng)于目標(biāo)元數(shù)據(jù)的相似元數(shù)據(jù)相關(guān)的注解信息,并且也能夠?qū)⒂山K端10的用戶輸入的注解信息傳送至信息管理設(shè)備2。[0097]第二實(shí)施例的系統(tǒng)能夠適當(dāng)?shù)厮阉饔脩粝胍@取的內(nèi)容信息。[0098]以上描述的實(shí)施例的信息處理終端和信息管理設(shè)備還可以使用,例如,多用途計(jì)算機(jī)作為基本的硬件來(lái)實(shí)現(xiàn)。即,應(yīng)該并入信息處理終端和信息管理設(shè)備的結(jié)構(gòu)元件能夠通過令計(jì)算機(jī)中的處理器執(zhí)行程序被實(shí)現(xiàn)。在這時(shí)候,信息處理終端和信息管理設(shè)備可以通過事先在計(jì)算機(jī)中安裝程序、或通過在例如CD-ROM的記錄介質(zhì)中存儲(chǔ)程序、或通過經(jīng)由網(wǎng)絡(luò)下載程序至計(jì)算機(jī)被實(shí)現(xiàn)。還做為選擇,能夠通過適當(dāng)?shù)乩冒惭b在計(jì)算機(jī)中或外部地附加于計(jì)算機(jī)的記錄介質(zhì),例如存儲(chǔ)器、硬盤、⑶-RXD_RW、DVD-RAM或DVDR來(lái)實(shí)現(xiàn)程序。[0099]雖然已經(jīng)描述了某些實(shí)施例,但是這些實(shí)施例僅僅已經(jīng)經(jīng)由例子被給出,而不意欲限制該發(fā)明的范圍。實(shí)際上,在這里描述的新穎的設(shè)備,方法和計(jì)算機(jī)可讀的介質(zhì)可以用各種其它的形式體現(xiàn);此外,可以在沒有脫離本發(fā)明的精神的情況下作出在這里描述的設(shè)備、方法和計(jì)算機(jī)可讀的介質(zhì)的形式上的各種省略、替換和變化。伴隨的權(quán)利要求書和它們的同等物是用來(lái)包括這樣的形式或修改,其將落入該發(fā)明的范圍和精神。【權(quán)利要求】1.一種信息處理終端,所述信息處理終端被允許連接到用于管理電子文檔上的元數(shù)據(jù)項(xiàng)和對(duì)應(yīng)于所述元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)的信息管理設(shè)備,其特征在于,所述信息處理終端包含:生成器,所述生成器被配置成分析電子文檔以生成元數(shù)據(jù)項(xiàng),所述元數(shù)據(jù)項(xiàng)包括所述電子文檔中的文本信息和關(guān)于所述電子文檔的結(jié)構(gòu)信息;獲取單元,所述獲取單元被配置成將所述元數(shù)據(jù)項(xiàng)傳送至所述信息管理設(shè)備,以使得所述信息管理設(shè)備估算類似于所述元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng)并獲取對(duì)應(yīng)于所述相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng);以及輸出單元,所述輸出單元被配置成輸出與所述電子文檔相關(guān)的所述注解信息項(xiàng)。2.如權(quán)利要求1所述的終端,其特征在于,所述注解信息項(xiàng)是指示由用戶添加至所述電子文檔的注釋的注釋信息,或者是對(duì)應(yīng)于所述電子文檔的音頻信息。3.如權(quán)利要求2所述的終端,其特征在于,進(jìn)一步包含被配置成分析所述注釋信息的分析單元,并且其中所述獲取單元將互相相關(guān)的所述注釋信息和所述元數(shù)據(jù)項(xiàng)傳送至所述信息管理設(shè)備。4.如權(quán)利要求3所述的終端,其特征在于,所述輸出單元按照所述元數(shù)據(jù)項(xiàng)和所述相似元數(shù)據(jù)項(xiàng)之間的相似度來(lái)修改所述注解信息項(xiàng)的輸出形式。5.一種信息管理設(shè)備,所述信息管理設(shè)備被允許從信息處理終端接收電子文檔上的元數(shù)據(jù)項(xiàng),其特征在于,所述信息管理設(shè)備包含:存儲(chǔ)器,所述存儲(chǔ)器被配置成存儲(chǔ)所述元數(shù)據(jù)項(xiàng)和對(duì)應(yīng)于所述元數(shù)據(jù)項(xiàng)的注解信息項(xiàng),所述元數(shù)據(jù)項(xiàng)包括關(guān)于所述電子文檔的結(jié)構(gòu)信息項(xiàng)和所述電子文檔中的文本信息項(xiàng);獲取單元,所述獲取單元被配置成從所述信息處理終端獲取作為搜索目標(biāo)的第一元數(shù)據(jù)項(xiàng);提取單元,所述提取單元被配置成在所述存儲(chǔ)器中搜索類似于所述第一元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng),并且提取對(duì)應(yīng)于所述相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng);以及傳送器,所述傳送器被配置成將被提取的注解信息項(xiàng)傳送至所述信息處理終端。6.如權(quán)利要求5所述的設(shè)備,其特征在于,如果被包括在所述第二元數(shù)據(jù)項(xiàng)中的文本信息和結(jié)構(gòu)信息類似于被包括在所述第一元數(shù)據(jù)項(xiàng)中的所述文本信息和所述結(jié)構(gòu)信息,則所述提取單元提取第二元數(shù)據(jù)項(xiàng)作為所述相似元數(shù)據(jù)項(xiàng)。7.一種信息處理方法,所述信息處理方法用于控制信息處理終端,所述信息處理終端被允許連接到用于管理電子文檔上的元數(shù)據(jù)項(xiàng)和對(duì)應(yīng)于所述元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)的信息管理設(shè)備,其特征在于,所述信息處理方法包含:分析電子文檔以生成包括所述電子文檔中的文本信息和關(guān)于所述電子文檔的結(jié)構(gòu)信息的元數(shù)據(jù)項(xiàng);將所述元數(shù)據(jù)項(xiàng)傳送至所述信息管理設(shè)備;使得所述信息管理設(shè)備估算類似于所述元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng);獲取對(duì)應(yīng)于所述相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng);以及輸出與所述電子文檔相關(guān)的所述注解信息項(xiàng)。8.如權(quán)利要求7所述的方法,其特征在于,所述注解信息項(xiàng)是指示由用戶添加至所述電子文檔的注釋的注釋信息,或者是對(duì)應(yīng)于所述電子文檔的音頻信息。9.如權(quán)利要求8所述的方法,其特征在于,進(jìn)一步包含分析所述注釋信息,并且其中所述傳送所述元數(shù)據(jù)項(xiàng)將互相相關(guān)的所述注釋信息和所述元數(shù)據(jù)項(xiàng)傳送至所述信息管理設(shè)備。10.如權(quán)利要求9所述的方法,其特征在于,所述輸出所述注解信息項(xiàng)按照所述元數(shù)據(jù)項(xiàng)和所述相似元數(shù)據(jù)項(xiàng)之間的相似度來(lái)修改所述注解信息項(xiàng)的輸出形式。11.一種信息處理方法,所述信息處理方法用于被允許從信息處理終端接收電子文檔上的元數(shù)據(jù)項(xiàng)的信息管理設(shè)備,其特征在于,所述信息處理方法包含:從所述信息處理終端獲取元數(shù)據(jù)項(xiàng)作為搜索目標(biāo);搜索存儲(chǔ)所述元數(shù)據(jù)項(xiàng)和對(duì)應(yīng)于所述元數(shù)據(jù)項(xiàng)的注解信息項(xiàng)的存儲(chǔ)器,以便檢測(cè)類似于被獲取的所述元數(shù)據(jù)項(xiàng)的相似元數(shù)據(jù)項(xiàng),并提取對(duì)應(yīng)于所述相似元數(shù)據(jù)項(xiàng)的注解信息項(xiàng),所述元數(shù)據(jù)項(xiàng)包括關(guān)于所述電子文檔的結(jié)構(gòu)信息項(xiàng)和所述電子文檔中的文本信息項(xiàng);以及將被提取的注解信息項(xiàng)傳送至所述信息處理終端。12.如權(quán)利要求11所述的方法,其特征在于,如果被包括在所述第二元數(shù)據(jù)項(xiàng)中的文本信息和結(jié)構(gòu)信息類似于被包括在所述第一元數(shù)據(jù)項(xiàng)中的所述文本信息和所述結(jié)構(gòu)信息,則所述搜索所述存儲(chǔ)器提取第二元數(shù)據(jù)項(xiàng)作為所述相似元數(shù)據(jù)項(xiàng)。【文檔編號(hào)】G06F17/30GK104169912SQ201380005184【公開日】2014年11月26日申請(qǐng)日期:2013年3月12日優(yōu)先權(quán)日:2012年3月27日【發(fā)明者】布目光生,鈴木優(yōu),森田真弘申請(qǐng)人:株式會(huì)社東芝
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1