国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      對(duì)通過(guò)通信網(wǎng)絡(luò)的視頻內(nèi)容搜索的輔助的制作方法

      文檔序號(hào):6495250閱讀:272來(lái)源:國(guó)知局
      對(duì)通過(guò)通信網(wǎng)絡(luò)的視頻內(nèi)容搜索的輔助的制作方法
      【專利摘要】一種用于輔助用戶通過(guò)通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括:由所述用戶確定第一內(nèi)容項(xiàng)目(CZ)的步驟;從這個(gè)第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟;根據(jù)語(yǔ)義數(shù)據(jù)針對(duì)至少一個(gè)服務(wù)自動(dòng)生成查詢、使得能夠在這個(gè)服務(wù)或這些服務(wù)上檢索一個(gè)視頻集合的步驟;將該視頻內(nèi)容的集合呈現(xiàn)給用戶的步驟。
      【專利說(shuō)明】對(duì)通過(guò)通信網(wǎng)絡(luò)的視頻內(nèi)容搜索的輔助
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及通過(guò)互聯(lián)網(wǎng)來(lái)訪問(wèn)視頻內(nèi)容提供服務(wù)。這些服務(wù)是諸如“YouTube”、“Vimeo”、以及“DailyMotion”的多面手平臺(tái),或者更專業(yè)的平臺(tái)(教育部門、醫(yī)療部門等)。
      【背景技術(shù)】
      [0002]這兩種類型的服務(wù)共有一個(gè)共同的特性:使得用戶能夠?qū)⑺麄冏约旱膬?nèi)容上傳到平臺(tái)。結(jié)果是,在所有這些服務(wù)上,有非常大量的視頻內(nèi)容可供使用。當(dāng)前,每分鐘大約有355小時(shí)的視頻上傳到“YouTube”服務(wù)上。
      [0003]可用內(nèi)容上的這個(gè)激增的對(duì)應(yīng)事物是,大多數(shù)的內(nèi)容沒(méi)有接收到足夠的可見(jiàn)性。因此,只有40%的可用視頻內(nèi)容將被觀看多于300次。
      [0004]這個(gè)低比率主要?dú)w因于如下事實(shí):對(duì)于用戶,在如此大量的內(nèi)容中識(shí)別使他們感興趣的視頻已經(jīng)變得極其困難。
      [0005]視頻內(nèi)容與描述相關(guān)聯(lián),描述最經(jīng)常是文本的,這些描述通過(guò)自由文本字段或一組標(biāo)簽,使得能夠基于關(guān)鍵詞搜索。因此每個(gè)希望上傳一個(gè)新視頻的用戶被要求提供一個(gè)描述,該描述使得其他用戶 能夠使用并入到服務(wù)中的搜索引擎或者外部的搜索引擎(諸如“谷歌”、“必應(yīng)”,或“雅虎”)來(lái)找到他或她的視頻。
      [0006]然而,這種解決方案是不夠的,因?yàn)檫@些描述由用戶提供,并且因此是完全主觀的。特別是,它們可能以各種語(yǔ)言說(shuō)明了個(gè)人用戶的興趣,并且在一個(gè)給定的語(yǔ)言內(nèi),這些描述包含的關(guān)鍵詞的選擇包括若干可能的同義詞。為了找到一個(gè)視頻,用戶必須因此選擇合適的關(guān)鍵詞,而沒(méi)有工具用其來(lái)確定這些關(guān)鍵詞。一個(gè)人如何能知道上傳了該視頻的用戶所選擇的標(biāo)簽和詞匯呢?
      [0007]由此產(chǎn)生的問(wèn)題是雙重的:
      [0008]_搜索不一定提供最相關(guān)的視頻內(nèi)容;
      [0009]-一個(gè)視頻可能對(duì)進(jìn)行搜索的用戶不是足夠可見(jiàn)的。

      【發(fā)明內(nèi)容】

      [0010]本發(fā)明的目的是改善這種情形。
      [0011]為了這樣做,本發(fā)明的第一個(gè)目標(biāo)是用于輔助用戶通過(guò)通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括:
      [0012]?由所述用戶確定第一內(nèi)容項(xiàng)目的步驟;
      [0013]?從這個(gè)第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟;
      [0014]?根據(jù)所述語(yǔ)義數(shù)據(jù)針對(duì)至少一個(gè)服務(wù)自動(dòng)生成查詢、使得能夠在所述至少一個(gè)服務(wù)上檢索視頻集合的步驟;
      [0015]?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
      [0016]根據(jù)本發(fā)明的一個(gè)實(shí)施例,該方法還可以包括:根據(jù)第一內(nèi)容項(xiàng)目與關(guān)聯(lián)于這個(gè)集合中的視頻內(nèi)容的描述之間的語(yǔ)義接近度的標(biāo)準(zhǔn),從所述集合中選擇視頻子集的步驟。[0017]至少一個(gè)服務(wù)可以被確定為語(yǔ)義數(shù)據(jù)的函數(shù)。
      [0018]這些步驟可以由在人機(jī)界面(WB)中選擇第一內(nèi)容項(xiàng)目(CZ)而觸發(fā),以及由選擇通過(guò)所述人機(jī)界面可訪問(wèn)的軟件功能而觸發(fā)。
      [0019]自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟可以包括提取“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系??梢曰谒鲫P(guān)系構(gòu)建所生成的查詢。
      [0020]本發(fā)明還具有如下目標(biāo):裝備有處理裝置的通信終端來(lái)實(shí)施如先前所描述的方法,以及裝備有編碼裝置的計(jì)算機(jī)程序來(lái)實(shí)施這個(gè)方法。
      [0021]本發(fā)明還具有用于通信終端的人機(jī)界面的目標(biāo),該通信終端裝備有使得用戶能夠選擇第一內(nèi)容項(xiàng)目的裝置,以及使得能夠觸發(fā)以下步驟的裝置:
      [0022]?從該第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟;
      [0023]?根據(jù)這些語(yǔ)義數(shù)據(jù)針對(duì)至少一個(gè)服務(wù)自動(dòng)生成查詢、使得能夠在所述至少一個(gè)服務(wù)上檢索視頻集合的步驟;
      [0024]?將該視頻內(nèi)容的 集合呈現(xiàn)給用戶的步驟。
      [0025]以這種方式,基于第一內(nèi)容項(xiàng)目,一般是文本的內(nèi)容項(xiàng)目,本發(fā)明使得有可能消除或者至少減少用戶主觀性,以便提高視頻內(nèi)容的可見(jiàn)性和搜索的相關(guān)性。它使得有可能減少視頻內(nèi)容與搜索主題之間的語(yǔ)義差距。
      【專利附圖】

      【附圖說(shuō)明】
      [0026]參考所附的附圖,在以下描述中,本發(fā)明和它的益處將變得更加清楚地明顯。
      [0027]圖1描繪了實(shí)施本發(fā)明的人機(jī)界面。
      [0028]圖2是示意性地描繪根據(jù)本發(fā)明的方法的可能步驟鏈的流程圖。
      [0029]圖3描繪了文本內(nèi)容的示例以及所提取的語(yǔ)義數(shù)據(jù)。
      【具體實(shí)施方式】
      [0030]圖1描繪了一個(gè)web瀏覽器,web瀏覽器使得用戶能夠從網(wǎng)頁(yè)的URL (統(tǒng)一資源定位符)訪問(wèn)網(wǎng)頁(yè)。這個(gè)瀏覽器為用戶呈現(xiàn)人機(jī)界面或者“窗口"WB。這個(gè)窗口示出了若干部分,包括瀏覽器空間WP和菜單區(qū)域MZ,頁(yè)面被顯示在瀏覽器空間WP中(包括視頻內(nèi)容)。
      [0031]這個(gè)菜單區(qū)域本身可以包括下拉菜單SM和圖標(biāo)頂。通過(guò)這個(gè)菜單區(qū)域MZ,瀏覽器為用戶提供對(duì)它的各種功能的訪問(wèn)。一個(gè)給定的功能通過(guò)下拉菜單、圖標(biāo)、或者它們兩者也可以是可訪問(wèn)的。這是由瀏覽器的開(kāi)發(fā)者所做出的人機(jī)工程選擇。
      [0032]此外,這些和/或其他的功能通過(guò)上下文菜單CM,對(duì)用戶也是可訪問(wèn)的。典型地,在來(lái)自微軟公司的Windows (TM)操作系統(tǒng)下,這樣的上下文菜單用鼠標(biāo)上的右菜單按鈕打開(kāi),并且它的元素取決于鼠標(biāo)指針的位置和瀏覽器的狀態(tài)。
      [0033]在圖1中的示例中,瀏覽器空間WP顯示文本內(nèi)容。人機(jī)界面WB使得有可能選擇這個(gè)文本內(nèi)容的全部或部分。這個(gè)選擇可以通過(guò)已知的方法,使用鼠標(biāo)或者任何其他定點(diǎn)設(shè)備,或者鍵盤等來(lái)做出。在所描述的示例中,只有CZ區(qū)域被選擇。
      [0034]一旦這個(gè)第一內(nèi)容CZ被選擇,用戶能夠從人機(jī)接口 WB中的菜單選擇對(duì)應(yīng)于本發(fā)明的功能。這個(gè)功能可以從下拉菜單SM、圖標(biāo)IM或者上下文菜單CM來(lái)選擇。這種選擇可以包括點(diǎn)擊圖標(biāo)IM,或者從下拉菜單SM或上下文菜單CM選擇元素。[0035]本發(fā)明也可以應(yīng)用到不同于瀏覽器的軟件應(yīng)用程序。特別是,它可以應(yīng)用到文件顯示應(yīng)用程序。閱讀電子書籍(或“電子書”)或者閱讀來(lái)自Adobe公司的“PDF”格式的文件的用戶可以,如上面所描述的,選擇一個(gè)內(nèi)容區(qū)域以及基于所選擇的內(nèi)容從考慮中的軟件應(yīng)用程序中的菜單觸發(fā)該功能。
      [0036]軟件應(yīng)用程序也可以是文字處理器,如來(lái)自微軟公司的“Word”軟件。
      [0037]類似地,本發(fā)明可以應(yīng)用到不同于文本內(nèi)容的內(nèi)容。因此,有可能選擇圖像,聲音、或者視頻。
      [0038]不同于用戶的選擇的機(jī)制來(lái)確定初始內(nèi)容可以是可能的。例如,確定(determination)可以作為所顯示的網(wǎng)頁(yè)、正在播放的視頻、正在閱讀的電子郵件的內(nèi)容等的函數(shù)而是自動(dòng)的。
      [0039]圖2中的步驟El描繪了這個(gè)確定第一內(nèi)容項(xiàng)目CZ的步驟。
      [0040]對(duì)第一內(nèi)容項(xiàng)目CZ的選擇以及該適當(dāng)?shù)暮瘮?shù),觸發(fā)了從這個(gè)第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的第一算法步驟。
      [0041]這個(gè)步驟被描繪為步驟E2。
      [0042]這個(gè)步驟可以被細(xì)分成為若干子步驟。
      [0043]第一子步驟E2a包括確定內(nèi)容的類型,這也就是說(shuō),該內(nèi)容是否是文本、視頻、圖
      像、音頻等。
      [0044]作為內(nèi)容類型的函數(shù),各種算法然后可以被用來(lái)提取語(yǔ)義數(shù)據(jù)。這些算法可以由分離的軟件模塊實(shí)施。
      [0045]提取步驟E2之后的子步驟可以取決于內(nèi)容類型。
      [0046]在文本內(nèi)容的情況下,第二子步驟E2b可以包括從內(nèi)容項(xiàng)目CZ提取原始語(yǔ)義數(shù)據(jù)。
      [0047]這些原始語(yǔ)義數(shù)據(jù)可以逐句地提取或者逐個(gè)句子集團(tuán)(sentence bloc)地提取。
      [0048]句子集團(tuán)的提取以人稱代詞的存在為條件,人稱代詞引用之前被識(shí)別的實(shí)體。一個(gè)人然后可以能夠說(shuō),每個(gè)句子的主語(yǔ)是相同的,并且因此識(shí)別了關(guān)于相同主題的、連貫的句子集團(tuán)。
      [0049]并非所有的詞語(yǔ)可以被提取。一些詞語(yǔ)可以被省略,因?yàn)樗鼈儗?duì)于理解文本是沒(méi)有用的。
      [0050]該提取可在若干步驟中被執(zhí)行:
      [0051]-刪除所謂的“停止詞”:并列連詞等。
      [0052]-使用統(tǒng)計(jì)和自然的語(yǔ)言算法,來(lái)分析剩余的信息并且提取一組具有判別詞(discriminant)意義的關(guān)鍵詞。例如,在對(duì)一個(gè)人的描述中,詞語(yǔ)“眼睛”不是判別詞,因?yàn)槊總€(gè)人都具有眼睛。另一方面,詞語(yǔ)“獨(dú)眼的”是判別詞。為了這樣做,一個(gè)人能夠使用語(yǔ)料庫(kù),語(yǔ)料庫(kù)給出了關(guān)于一組文檔中的詞語(yǔ)頻率的信息:頻率越低,詞語(yǔ)的先驗(yàn)重要性越大。
      [0053]基于這些原始語(yǔ)義數(shù)據(jù),第三子步驟E2c使得有可能確定精煉的語(yǔ)義數(shù)據(jù)。這些精煉的語(yǔ)義數(shù)據(jù)可以是“概念”;人、公司、地點(diǎn)(城市、國(guó)家、地區(qū),等等)的名稱;日期;等
      坐寸o
      [0054]“概念”可以視為來(lái)自該組原始語(yǔ)義數(shù)據(jù)的基本語(yǔ)義數(shù)據(jù)。它們可以以各種方法來(lái)確定。例如,每個(gè)原始語(yǔ)義數(shù)據(jù)可以關(guān)聯(lián)于跨所有文本內(nèi)容CZ的出現(xiàn)計(jì)數(shù)器(occurrencecounter)。然后,這些概念是對(duì)應(yīng)于最高出現(xiàn)率的語(yǔ)義數(shù)據(jù)。
      [0055]還有可能使用一種本體論,以便考慮同義詞和來(lái)自各種語(yǔ)義層次的原始數(shù)據(jù),并且特別是上位詞(這也就是說(shuō),更一般的原始語(yǔ)義數(shù)據(jù)涵蓋一個(gè)或多個(gè)更具體的語(yǔ)義數(shù)據(jù)項(xiàng)目)。
      [0056]概念然后可以由原始語(yǔ)義數(shù)據(jù)的出現(xiàn)數(shù)量來(lái)確定,原始語(yǔ)義數(shù)據(jù)的出現(xiàn)數(shù)量基于同義詞和上位詞而被合計(jì)。例如,包含原始數(shù)據(jù)“橙子”、“葡萄”、“香蕉”等的出現(xiàn)的文本內(nèi)容,可以帶出概念“水果”。
      [0057]有可能帶出最重要的概念,例如,與最強(qiáng)烈的出現(xiàn)(strongest occurrence)相關(guān)聯(lián)的概念,以便確定文本內(nèi)容CZ所屬的類別??紤]到先前所確定的概念的連續(xù)上位詞,這個(gè)類別可以被搜索。
      [0058]可以從詞典確定人、公司、地點(diǎn)等的名稱。這個(gè)詞典對(duì)發(fā)明的軟件裝置可以是內(nèi)部的,或者它可以以web服務(wù)的形式或者任何其他技術(shù)設(shè)備(數(shù)據(jù)庫(kù)等)的形式遠(yuǎn)程地位于互聯(lián)網(wǎng)上。
      [0059]圖3示出了文本內(nèi)容CZ的示例與所提取的語(yǔ)義數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。在這個(gè)示例中,文本內(nèi)容CZ是由用戶在瀏覽器空間WP上所顯示的網(wǎng)頁(yè)中選擇的區(qū)域。在該圖中,它被示出在灰色的背景上。
      [0060]在觸發(fā)了本發(fā)明的功能后,一個(gè)“彈出”窗口 PW與最相關(guān)的視頻內(nèi)容VC以及其他相關(guān)的視頻內(nèi)容RVC—起被顯示。這個(gè)窗口 PW還顯示了“類別”、概念、人和地點(diǎn)(“州或國(guó)家”)的名稱以及原始語(yǔ)義數(shù)據(jù)(“標(biāo)簽”)。如果這個(gè)信息對(duì)用戶沒(méi)有多大的意義并且在內(nèi)部更有用,則它可以不被顯示。然而,在這里它被顯示,以使該解釋清楚易懂。
      [0061]在這個(gè)示例中,類別“商業(yè)”(交易,貿(mào)易)基于所提取的概念來(lái)確定。因此,概念“廣告”和“銷售”具有上位詞“商業(yè)”。原始數(shù)據(jù),諸如“低價(jià)”、“市場(chǎng)”、“證券經(jīng)紀(jì)業(yè)務(wù)”、“先令”等的存在,進(jìn)一步加強(qiáng)了這個(gè)推斷。
      [0062]通過(guò)這個(gè)語(yǔ)義域中若干概念的出現(xiàn),發(fā)明的方法然后可以自動(dòng)地確定該文本內(nèi)容CZ涉及商業(yè)。
      [0063]子步驟E2d包括對(duì)語(yǔ)義數(shù)據(jù)加權(quán)。作為每個(gè)語(yǔ)義數(shù)據(jù)及其同義詞和上位詞的出現(xiàn)數(shù)量的函數(shù),權(quán)重可以被指派以識(shí)別語(yǔ)義數(shù)據(jù)的重要性并且表現(xiàn)文本內(nèi)容CZ。
      [0064]還可以指派更高的權(quán)重。
      [0065]在實(shí)踐中,這個(gè)子步驟可以與子步驟E2c同時(shí)執(zhí)行。
      [0066]它還可以包括對(duì)語(yǔ)義數(shù)據(jù)的過(guò)濾,來(lái)僅保存權(quán)重超過(guò)某個(gè)閾值的語(yǔ)義數(shù)據(jù),或者根據(jù)基于這些權(quán)重的排序的有限數(shù)量的語(yǔ)義數(shù)據(jù),這些語(yǔ)義數(shù)據(jù)將被使用在隨后的步驟中。
      [0067]在本發(fā)明的一個(gè)實(shí)施例中,有可能對(duì)文本內(nèi)容CZ執(zhí)行語(yǔ)法分析,以便確定該語(yǔ)義數(shù)據(jù)的語(yǔ)法功能并且在它們之間構(gòu)建邏輯鏈接。
      [0068]這種鏈接可以通過(guò)“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系來(lái)形式化。
      [0069]本發(fā)明的方法尋求在句子或詞組中識(shí)別“主語(yǔ)”、“動(dòng)詞”、以及“賓語(yǔ)”功能,并且通過(guò)語(yǔ)義分析,在三個(gè)所提取的元素之間建立這樣的鏈接。自然地,各種方法都是可能的。
      [0070]一種可能的方法可以包括:
      [0071]?從句子或詞組提取主語(yǔ)。這個(gè)主語(yǔ),動(dòng)作的作者,可以被識(shí)別為個(gè)人、知名組織、真實(shí)位置等。詞典可以用于這樣的識(shí)別。
      [0072]?檢測(cè)接近于所提取的主語(yǔ)的動(dòng)詞。再次地,這里可以使用詞典來(lái)識(shí)別動(dòng)詞形式。還可以規(guī)劃考慮給定動(dòng)詞的變化形式和各種形式。取決于該形式,一個(gè)人可以提取附加語(yǔ)義信息來(lái)知道其是否涉及一個(gè)動(dòng)作(動(dòng)作動(dòng)詞)或一種狀態(tài)(被動(dòng)式、過(guò)去分詞)。
      [0073]?提取接近于該動(dòng)詞的關(guān)鍵詞和概念以識(shí)別該動(dòng)作的“賓語(yǔ)”。
      [0074]為了提高這個(gè)過(guò)程的效率,可以規(guī)劃僅考慮及物動(dòng)詞。這些使得有可能構(gòu)建更貼近的“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系。為了這樣做,用來(lái)提取動(dòng)詞形式的詞典可以僅包含及物動(dòng)
      o
      [0075]還可以規(guī)劃把對(duì)“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系的創(chuàng)建從屬于對(duì)賓語(yǔ)的確定,賓語(yǔ)也屬于語(yǔ)料庫(kù),而語(yǔ)料庫(kù)屬于詞典。接著“主語(yǔ)”的該示例,這個(gè)“賓語(yǔ)”可以是個(gè)人、知名組織、
      真實(shí)位置等。
      [0076]然后,步驟E3可以包括基于該語(yǔ)義數(shù)據(jù)來(lái)確定至少一個(gè)服務(wù)。
      [0077]事實(shí)上,一些視頻內(nèi)容提供服務(wù)專業(yè)于一個(gè)主題(體育、新聞、藝術(shù)短片、教育等),并且取決于從文本內(nèi)容CZ所提取的語(yǔ)義數(shù)據(jù),其可能有關(guān)于把最相關(guān)的服務(wù)作為目標(biāo)。
      [0078]多面手服務(wù),例如DailyMotion或YouTube也可被查詢,或者系統(tǒng)地被查詢,另外,或者如果沒(méi)有專業(yè)于所提取主題的服務(wù),或者如果它們是不足的,而偶爾地被查詢。
      [0079]可替換地,這些服務(wù) 可以通過(guò)配置而被靜態(tài)地識(shí)別。
      [0080]步驟E4包括基于語(yǔ)義數(shù)據(jù),為所識(shí)別的服務(wù)或多個(gè)服務(wù)自動(dòng)生成查詢。
      [0081]典型地,這可以包括構(gòu)建HTTP (超文本傳輸協(xié)議)查詢,HTTP查詢包含全部或部分的所提取語(yǔ)義數(shù)據(jù)作為參數(shù)。
      [0082]這些數(shù)據(jù)可以用來(lái)構(gòu)建單個(gè)查詢或多個(gè)查詢。因此,有可能構(gòu)建與具有超出某個(gè)閾值的權(quán)重的語(yǔ)義數(shù)據(jù)一樣多的查詢。
      [0083]同樣,在包括提取“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系的實(shí)施方式中,可以有可能為每個(gè)關(guān)系構(gòu)建不同的查詢。
      [0084]可以逐句地或者逐個(gè)詞語(yǔ)集團(tuán)地瀏覽所有的文本內(nèi)容CZ。對(duì)于每個(gè)句子或詞語(yǔ)集團(tuán),如果存在“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系,則它們可以被用來(lái)構(gòu)建查詢;否則,查詢可以從原始語(yǔ)義數(shù)據(jù)來(lái)構(gòu)建。
      [0085]這些查詢使得有可能檢索在所識(shí)別的服務(wù)或多個(gè)服務(wù)上可用的一組視頻。
      [0086]這些視頻然后可以在人機(jī)界面WB中,并且更具體地,在瀏覽器空間WP中,被呈現(xiàn)給用戶。
      [0087]在本發(fā)明的一個(gè)實(shí)施例中,有可能實(shí)施文本內(nèi)容CZ與檢索到的視頻之間的語(yǔ)義接近度的標(biāo)準(zhǔn)。
      [0088]可以基于在先前的步驟中從文本內(nèi)容CZ所提取的語(yǔ)義數(shù)據(jù),以及與檢索到的視頻相關(guān)聯(lián)的語(yǔ)義內(nèi)容,來(lái)計(jì)算語(yǔ)義接近度。這些數(shù)據(jù)可以是由用戶:“標(biāo)簽”、域:“標(biāo)題”、“描述”等所保存的原始數(shù)據(jù)。
      [0089]還有可能實(shí)施對(duì)檢索到的視頻的分析。
      [0090]因此,有可能相當(dāng)容易地確定質(zhì)地(海、砂、冰等)和/或顏色。
      [0091]還有可能實(shí)施形狀辨識(shí)算法。這些算法尋求從恒量(也就是說(shuō),不依賴于視角而改變的形狀的部分)來(lái)確定已知的外形。
      [0092]各種方法可以一起使用以獲得協(xié)同效果:
      [0093]-例如,通過(guò)形狀分析對(duì)海豹的確定,可能使得有可能確認(rèn)所檢測(cè)的質(zhì)地實(shí)際上是冰。一個(gè)人然后能夠減少誤差并且提高結(jié)果的可靠性。
      [0094]-在另一個(gè)示例中,與對(duì)形狀的確定相關(guān)的對(duì)顏色的確定能夠使得有可能增加含義。一個(gè)人能夠因此確定“黑馬”的存在,比對(duì)馬的簡(jiǎn)單確定更加有判別性的概念。
      [0095]有可能對(duì)來(lái)自視頻的圖像(或一系列圖像)執(zhí)行全局分析。因此,一個(gè)人能夠分析環(huán)境光水平并且從它抽取語(yǔ)義信息。例如,如果一個(gè)人還已經(jīng)檢測(cè)到該屏幕是戶外,他可以確定是否是白天或者夜晚。
      [0096]通過(guò)比較這個(gè)信息,特別是通過(guò)使用本體,有可能確定距離。
      [0097]各種方法也有可能用于建立這樣的距離。
      [0098]特別是:
      [0099]-在給定的本體中的概念之間的啟發(fā)式度量(heuristicmetrics),基于圖形中將被覆蓋的距離。這個(gè)距離可以是圖形上節(jié)點(diǎn)的數(shù)量,其中節(jié)點(diǎn)是關(guān)鍵詞或概念。某些配對(duì)通過(guò)鏈接直接連接。鏈接可以是定向的或者對(duì)稱的。如果兩個(gè)詞語(yǔ)之間的鏈接是對(duì)稱的,則這兩個(gè)詞語(yǔ)之間的關(guān)系更強(qiáng)。例如,這個(gè)距離可以有可能量化兩個(gè)概念的相似性。它還可用于消除歧義的目的。
      [0100]-TF-1DF(術(shù)語(yǔ)頻率-反向文檔頻率)方法是在彳目息搜索中以及特別是在文本比較中經(jīng)常使用的加權(quán)方法。這個(gè)統(tǒng)計(jì)測(cè)量使得有可能評(píng)價(jià)文檔中所包含的術(shù)語(yǔ)相對(duì)于集合或語(yǔ)料庫(kù)的重要性。該權(quán)重與該詞語(yǔ)在文檔中的出現(xiàn)次數(shù)成比例地增加。它還基于語(yǔ)料庫(kù)中的該詞語(yǔ)的頻率而變化。原始公式的替代公式經(jīng)常被使用在搜索引擎中,來(lái)評(píng)估一個(gè)文檔關(guān)于用戶的搜索標(biāo)準(zhǔn)的相關(guān)性。
      [0101]例如,如果詞語(yǔ)“恐龍”在IDF語(yǔ)料庫(kù)中具有低出現(xiàn)率,這可能意味著它更重要,因?yàn)樗绕胀ǖ脑~語(yǔ)更有判別性;如果詞語(yǔ)出現(xiàn)在所提取的詞語(yǔ)的每個(gè)“TF”列表中(鏈接到從上下文提取的語(yǔ)料庫(kù)的列表以及鏈接到從視頻描述提取的語(yǔ)料庫(kù)的列表),基于它的出現(xiàn)數(shù)量,一個(gè)人可以給予它較高或較低的權(quán)重。在兩個(gè)列表上都發(fā)現(xiàn)該詞語(yǔ)的事實(shí),使得有可能基于IDF值來(lái)定義一個(gè)或強(qiáng)或弱的鏈接。
      [0102]一個(gè)人還可以組合這兩種方法。例如,在從上下文提取的詞語(yǔ)的第一列表中,一個(gè)人發(fā)現(xiàn)了詞語(yǔ)“恐龍”,詞語(yǔ)“恐龍”在IDF語(yǔ)料庫(kù)中具有相對(duì)高的權(quán)重。在從視頻描述提取的第二列表中,一個(gè)人發(fā)現(xiàn)詞語(yǔ)“暴龍”。該圖形示出,存在具有兩跳(該圖形中的節(jié)點(diǎn)數(shù)量)的對(duì)稱鏈接。因此,一個(gè)人能夠考慮,這個(gè)視頻的上下文示出了與“IDF值/跳數(shù)”的相似性。
      [0103]通過(guò)將這種算法應(yīng)用到每個(gè)詞語(yǔ),一個(gè)人能夠因此計(jì)算出總體的相似性。
      [0104]基于每個(gè)檢索到的視頻的距離,有可能對(duì)它們排序,以便于以最相關(guān)的方式將它們呈現(xiàn)給用戶:因此,具有與文本內(nèi)容CZ最接近的接近度的視頻,將在檢索到的其他相關(guān)視頻之前被呈現(xiàn)。
      [0105]還有可能基于接近度標(biāo)準(zhǔn),來(lái)選擇檢索到的視頻的子集。
      [0106]這可以包括:根據(jù)排序,僅選擇預(yù)定數(shù)量的視頻,該排序基于它們與文本內(nèi)容CZ的語(yǔ)義距離。[0107]它還可以包括僅選擇對(duì)應(yīng)于預(yù)定閾值之下的語(yǔ)義距離的視頻。如果沒(méi)有一個(gè)檢索到的視頻是足夠接近的,這個(gè)實(shí)施例可以因此不將任何視頻內(nèi)容示出給用戶。
      [0108]對(duì)本領(lǐng)域的技術(shù)人員,其他替代方案和實(shí)施例也是可能的以及可得到的。本發(fā)明因此不能被理解為被限制于上面所描述的這些實(shí)施方式。
      【權(quán)利要求】
      1.一種用于輔助用戶通過(guò)通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括: ?由所述用戶確定第一內(nèi)容項(xiàng)目(CZ)的步驟; ?從這個(gè)第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟; ?根據(jù)所述語(yǔ)義數(shù)據(jù)針對(duì)至少一個(gè)服務(wù)自動(dòng)生成查詢、使得能夠在所述至少一個(gè)服務(wù)上檢索一個(gè)視頻集合的步驟; ?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
      2.根據(jù)前一個(gè)權(quán)利要求所述的方法,還包括:基于所述第一內(nèi)容與關(guān)聯(lián)于所述集合中的視頻的描述之間的語(yǔ)義接近度的標(biāo)準(zhǔn),從所述集合中選擇視頻子集的步驟。
      3.根據(jù)前一個(gè)權(quán)利要求所述的方法,其中基于所述語(yǔ)義數(shù)據(jù)來(lái)確定所述至少一個(gè)服務(wù)。
      4.根據(jù)前述權(quán)利要求之一所述的方法,其中所述步驟可以由在人機(jī)界面(WB)中選擇第一內(nèi)容項(xiàng)目(CZ)以及由選擇通過(guò)所述人機(jī)界面可訪問(wèn)的軟件功能而被觸發(fā)。
      5.根據(jù)前述權(quán)利要求之一所述的方法,其中所述自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟包括提取“主語(yǔ)-動(dòng)詞-賓語(yǔ)”關(guān)系。
      6.根據(jù)前一個(gè)權(quán)利要求所述的方法,其中基于所述關(guān)系來(lái)構(gòu)建所生成的所述查詢。
      7.一種通信終端,裝備有處理裝置以實(shí)施根據(jù)前述權(quán)利要求之一所述的方法。
      8.一種計(jì)算機(jī)程序,裝備`有處理裝置以實(shí)施根據(jù)權(quán)利要求1-7之一所述的方法。
      9.一種用于通信終端的人機(jī)界面(WB),裝備有使得用戶能夠選擇第一內(nèi)容項(xiàng)目(CZ)的裝置,以及使得能夠觸發(fā)以下步驟的裝置: ?從所述第一內(nèi)容項(xiàng)目自動(dòng)提取語(yǔ)義數(shù)據(jù)的步驟; ?根據(jù)所述語(yǔ)義數(shù)據(jù)針對(duì)至少一個(gè)服務(wù)自動(dòng)生成查詢、使得能夠在所述至少一個(gè)服務(wù)上檢索一個(gè)視頻集合的步驟; ?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
      【文檔編號(hào)】G06F17/30GK103562912SQ201280023863
      【公開(kāi)日】2014年2月5日 申請(qǐng)日期:2012年4月27日 優(yōu)先權(quán)日:2011年5月17日
      【發(fā)明者】S·斯奎汀, A·范貝爾 申請(qǐng)人:阿爾卡特朗訊
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1