本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及一種試題搜索方法及裝置。
背景技術(shù):
目前,教育行業(yè)也在與互聯(lián)網(wǎng)接軌,出現(xiàn)了許多在線教育產(chǎn)品,其中包括具備拍照答疑等功能的搜題類產(chǎn)品。搜題類產(chǎn)品旨在學(xué)生用戶在作業(yè)中遇到難題時,可以獲取包含題目的圖像并對該圖像進(jìn)行圖像識別,基于圖像識別的結(jié)果在后臺題庫搜索用戶需要的題目和答案解析。
然而,由于現(xiàn)有的圖像識別技術(shù)會被拍攝的環(huán)境光線及燈光所影響,常常導(dǎo)致用戶使用搜題類產(chǎn)品時,無法準(zhǔn)確地搜索出用戶所需要的試題及答案解析,滿足不了用戶的搜題需求,影響該類產(chǎn)品的用戶體驗。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種試題搜索方法及裝置,旨在提高試題搜索的準(zhǔn)確率。
本發(fā)明實施例的第一方面,提供一種試題搜索方法,所述試題搜索方法包括:
獲取目標(biāo)試題的原始圖像,并對所述目標(biāo)試題的原始圖像進(jìn)行圖像識別;
基于圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果;
當(dāng)獲取的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)全文檢索的評分機(jī)制,計算獲取的各個試題搜索結(jié)果分別對應(yīng)的第一評分;
根據(jù)相似度算法,計算獲取的各個試題搜索結(jié)果分別對應(yīng)的第二評分;
根據(jù)預(yù)設(shè)加權(quán)線性方案,對所述第一評分及第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)所述最終評分,由高至低對所述試題搜索結(jié)果進(jìn)行排序并輸出。
本發(fā)明實施例的第二方面,提供一種試題搜索裝置,所述試題搜索裝置包括:
目標(biāo)試題獲取單元,用于獲取目標(biāo)試題的原始圖像,并對所述目標(biāo)試題的原始圖像進(jìn)行圖像識別;
初步檢索單元,用于基于所述目標(biāo)試題獲取單元得到圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果;
第一評分計算單元,用于當(dāng)所述初步檢索單元獲取到的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)全文檢索的評分機(jī)制,計算獲取的各個試題搜索結(jié)果分別對應(yīng)的第一評分;
第二評分計算單元,用于根據(jù)相似度算法,計算所述初步檢索單元獲取到的各個試題搜索結(jié)果分別對應(yīng)的第二評分;
搜索結(jié)果確定單元,用于根據(jù)預(yù)設(shè)加權(quán)線性方案,對所述第一評分計算單元得到的第一評分及所述第二評分計算單元得到的第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)所述最終評分,由高至低對所述試題搜索結(jié)果進(jìn)行排序并輸出。
由上可見,在本發(fā)明方案中,首先獲取目標(biāo)試題的原始圖像,并對所述目標(biāo)試題的原始圖像進(jìn)行圖像識別,然后基于圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果,當(dāng)試題搜索結(jié)果包含兩個以上結(jié)果時,根據(jù)全文檢索的評分機(jī)制,計算各個試題搜索結(jié)果分別對應(yīng)的第一評分,并根據(jù)相似度算法,計算各個試題搜索結(jié)果分別對應(yīng)的第二評分,最后根據(jù)預(yù)設(shè)加權(quán)線性方案,對所述第一評分及第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)所述最終評分,由高至低對所述試題搜索結(jié)果進(jìn)行排序并輸出。使得試題搜索的結(jié)果能夠被進(jìn)一步篩選,并最終篩選出更加準(zhǔn)確的,匹配度更高的試題及相應(yīng)解析。相對于現(xiàn)有技術(shù)中,由于圖像識別的不準(zhǔn)確性而影響到最終搜索到的試題結(jié)果,導(dǎo)致無法搜索出匹配的試題,本發(fā)明方案提高了試題搜索時的準(zhǔn)確率,更好的滿足了用戶的搜題需求,提升了用戶體驗。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例一提供的試題搜索方法的實現(xiàn)流程圖;
圖2為本發(fā)明實施例一提供的試題搜索方法步驟S102的具體實現(xiàn)流程圖;
圖3為本發(fā)明實施例二提供的試題搜索裝置的結(jié)構(gòu)框圖。
具體實施方式
為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而非全部實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
在本發(fā)明實施例中,首先獲取目標(biāo)試題的原始圖像,并對所述目標(biāo)試題的原始圖像進(jìn)行圖像識別,然后基于圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果,當(dāng)試題搜索結(jié)果包含兩個以上結(jié)果時,根據(jù)全文檢索的評分機(jī)制,計算各個試題搜索結(jié)果分別對應(yīng)的第一評分,并根據(jù)相似度算法,計算各個試題搜索結(jié)果分別對應(yīng)的第二評分,最后根據(jù)預(yù)設(shè)加權(quán)線性方案,對所述第一評分及第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)所述最終評分,由高至低對所述試題搜索結(jié)果進(jìn)行排序并輸出。使得試題搜索的結(jié)果能夠被進(jìn)一步篩選,并最終篩選出更加準(zhǔn)確的,匹配度更高的試題及相應(yīng)解析。
以下結(jié)合具體實施例對本發(fā)明的實現(xiàn)進(jìn)行詳細(xì)描述:
實施例一
圖1示出了本發(fā)明實施例一提供的試題搜索方法的實現(xiàn)流程,詳述如下:
在步驟S101中,獲取目標(biāo)試題的原始圖像,并對上述目標(biāo)試題的原始圖像進(jìn)行圖像識別。
在本發(fā)明實施例中,可以通過攝像頭拍攝的方式獲取包含目標(biāo)試題的原始圖像,例如可以是啟動拍照功能后,通過攝像頭對目標(biāo)試題進(jìn)行拍照?;蛘?,在步驟S101中,也可以從其它設(shè)備主動或被動地獲取包含目標(biāo)試題的原始圖像;或者,在步驟S101中,也可以從圖像庫中獲取包含目標(biāo)試題的原始圖像,此處不作限定。在獲取到目標(biāo)試題的原始圖像后,對上述目標(biāo)試題的原始圖像進(jìn)行文本識別,以此實現(xiàn)通過多種方式,方便迅速的獲取到包含有目標(biāo)試題的原始圖像。具體地,在步驟S101中,可以采用光學(xué)字符識別(OCR,Optical Character Recognition)技術(shù)對獲取到的包含目標(biāo)試題的原始圖像進(jìn)行文本識別。當(dāng)然,步驟S104也可以采用其它文本識別技術(shù)對獲取到的包含目標(biāo)試題的原始圖像進(jìn)行文本識別,此處不作限定。
在步驟S102中,基于圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果。
在本發(fā)明實施例中,試題搜索裝置將會在接收到包含有目標(biāo)試題的原始圖像并對上述原始圖像進(jìn)行圖像識別后,基于圖像識別的結(jié)果,在題庫中進(jìn)行全文檢索,獲取到與目標(biāo)試題相關(guān)的搜索結(jié)果。其中,題庫包括本地的題庫,也包括互聯(lián)網(wǎng)上的題庫。本地題庫可以為試題搜索裝置中內(nèi)置的題庫,也可以是用戶經(jīng)由互聯(lián)網(wǎng)下載至試題搜索裝置中的題庫,以此方便用戶在聯(lián)網(wǎng)環(huán)境下能夠下載所需題庫,并能夠在離線環(huán)境下訪問下載好的題庫,此處不做限定。全文檢索由于會將步驟S101中圖像識別得到的結(jié)果全部進(jìn)行檢索,因而所獲得的搜索結(jié)果的相關(guān)度與匹配度都會較高。
具體地,在基于圖像識別的結(jié)果在題庫中進(jìn)行全文檢索時,可以使用Lucene框架對圖像識別的結(jié)果進(jìn)行全文檢索。Lucene使用的開發(fā)語言為Java,是一款開源的全文檢索引擎工具包。它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎與部分文本分析引擎。Lucene為開發(fā)人員提供了簡單易用的工具包,以此實現(xiàn)方便的在試題搜索裝置中建立起完整的全文搜索引擎,因而用戶能夠基于此實現(xiàn)全文檢索的功能。當(dāng)然,步驟S102中,還可以使用其他檢索框架或檢索程序?qū)D像識別的結(jié)果進(jìn)行全文檢索,例如Galago、Xapian或者Zebra等,在此不做限定。
在步驟S103中,當(dāng)獲取的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)全文檢索的評分機(jī)制,計算獲取的各個實體搜索結(jié)果分別對應(yīng)的第一評分。
在本發(fā)明實施例中,步驟S102最終獲得的試題搜索結(jié)果的數(shù)量是無法確定的。當(dāng)用戶搜索的目標(biāo)試題較為新穎時,步驟S102可能會出現(xiàn)檢索到的試題搜索結(jié)果很少,甚至沒有的情況。針對獲取的試題搜索結(jié)果數(shù)量不同,存在以下幾種應(yīng)用場景:
在一種應(yīng)用場景中,步驟S102沒有獲取到任何與目標(biāo)試題相匹配的試題搜索結(jié)果。此時,步驟S103可以直接返回?zé)o搜索結(jié)果的信息,以此告知用戶,無法在已有題庫中搜索到與目標(biāo)試題相匹配的題目。
在另一種應(yīng)用場景中,步驟S102只獲取到一個試題搜索結(jié)果。此時,步驟S103直接將獲取到的上述一個試題搜索結(jié)果返回給用戶,供用戶查閱。
可選地,在上述兩種應(yīng)用場景中,還可以在屏幕上顯示步驟S102中,試題搜索裝置具體在哪些題庫中進(jìn)行了搜索,并為用戶推薦可以嘗試進(jìn)行搜索的其它題庫,用戶可自行選擇下載題庫進(jìn)行再次搜索或者聯(lián)網(wǎng)在線再次搜索,以此獲得更多的試題搜索結(jié)果。
在第三種應(yīng)用場景中,步驟S102獲取到了兩個以上試題搜索結(jié)果。此時,由于試題搜索結(jié)果存在多個,因而步驟S103可以先對其進(jìn)行第一次評分篩選。全文檢索技術(shù)提供了一種評分機(jī)制,可以對搜索得到的結(jié)果進(jìn)行評分,搜索結(jié)果的評分越高,代表其與目標(biāo)試題的相關(guān)度越高。在步驟S103中,針對步驟S102獲得的每一個搜索結(jié)果,都會進(jìn)行一次評分,所得得分即為各個搜索結(jié)果分別對應(yīng)的第一評分,并將其記為S1。上述第一評分S1將會被暫時的存儲起來,以待后續(xù)利用上述第一評分S1進(jìn)行進(jìn)一步的計算。
具體地,當(dāng)在步驟S102中為使用Lucene框架對圖像識別的結(jié)果進(jìn)行全文檢索時,針對上述第三種應(yīng)用場景,步驟S103可以為,對獲取的各個試題搜索結(jié)果分別進(jìn)行Lucene評分,獲得上述各個試題搜索結(jié)果分別對應(yīng)的第一評分。基于Lucene框架進(jìn)行全文檢索時,能夠?qū)γ恳粋€試題搜索結(jié)果進(jìn)行評分。其中,任一試題搜索結(jié)果所對應(yīng)的Lucene評分的最大分值為1.0.
在步驟S104中,根據(jù)相似度算法,計算獲取的各個試題搜索結(jié)果分別對應(yīng)的第二評分。
在本發(fā)明實施例中,步驟S103中可能會出現(xiàn)三種應(yīng)用場景,而步驟S104則是針對第三種應(yīng)用場景,即,步驟S102獲得的試題搜索數(shù)量為兩個以上時,才會執(zhí)行的步驟。在步驟S104中,將會根據(jù)相似度算法,針對步驟S102獲得的每一個搜索結(jié)果,與目標(biāo)試題作相似度對比,再次進(jìn)行一次評分,所得得分即為各個搜索結(jié)果分別對應(yīng)的第二評分,將其記為S2。上述第二評分S2將會被暫時的存儲起來,以待后續(xù)利用上述第二評分S2進(jìn)行進(jìn)一步的計。
具體地,上述相似度算法可以為最長公共子序列算法。則此時,步驟S104具體表現(xiàn)為,根據(jù)最長公共子序列算法,對獲取的各個試題搜索結(jié)果分別進(jìn)行評分,獲得上述各個試題搜索結(jié)果分別對應(yīng)的第二評分。最長公共子序列,英文縮寫為LCS(longest Common Subsequence),它可以描述兩段文本之間的相似度,因而在步驟S104中,使用最長公共子序列算法,可以有效地對各個試題搜索結(jié)果與目標(biāo)試題之間的相似度進(jìn)行計算,以此對試題搜索結(jié)果進(jìn)行進(jìn)一步的分析??蛇x地,試題搜索裝置可以根據(jù)第二評分S2的分值,由高至低對試題搜索結(jié)果進(jìn)行二次排序。
在步驟S105中,根據(jù)預(yù)設(shè)加權(quán)線性方案,對上述第一評分及第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)上述最終評分,由高至低對上述兩個以上的試題搜索結(jié)果進(jìn)行排序并輸出。
在本發(fā)明實施例中,當(dāng)處于的上述的第三種應(yīng)用場景時,即步驟S102獲得的試題搜索結(jié)果數(shù)量為兩個以上時,步驟S105中的試題搜索裝置將分別針對每一個試題搜索結(jié)果,獲取對應(yīng)的第一評分S1及第二評分S2,并根據(jù)預(yù)設(shè)加權(quán)線性方案,對每一個試題搜索結(jié)果所對應(yīng)的第一評分S1及第二評分S2進(jìn)行加權(quán)計算,得到試題搜索結(jié)果對應(yīng)的最終評分,將其記為S3,并根據(jù)最終評分S3的分值,由高至低,對相應(yīng)的試題搜索結(jié)果進(jìn)行排序,并將排序后的結(jié)果輸出,以供用戶查閱。
進(jìn)一步地,上述預(yù)設(shè)加權(quán)線性方案可以為:S3=n1*S1+n2*S2。其中,n1>0,n2>0,n1+n2=1。具體地,可以取n1=0.3,取n2=0.7,這種情況下得到的最終評分S3及相對應(yīng)試題搜索結(jié)果的排序較為符合大部分用戶的搜題需求。
由上可見,在本發(fā)明實施例中,可以對試題搜索結(jié)果進(jìn)行兩次評分,并對這兩次評分作加權(quán)計算,得到最終評分,由于最終評分是對前兩次評分的加權(quán)處理,因而得到的最終試題搜索結(jié)果準(zhǔn)確性將得到提高,可以很好的解決用戶在光線不強(qiáng)或者受到其他外界壞境干擾的情況下,對目標(biāo)試題進(jìn)行拍照搜題時,試題搜索結(jié)果會受到影響,導(dǎo)致結(jié)果不準(zhǔn)確這一問題。提高了用戶搜題時的準(zhǔn)確率,提升了用戶的操作體驗,更好的滿足了用戶的搜題需求。
圖2示出了本發(fā)明實施例提供的試題搜索方法步驟S102的具體實現(xiàn)流程圖,詳述如下:
在步驟S201中,根據(jù)圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲得所有相關(guān)的試題搜索結(jié)果。
在步驟S202中,當(dāng)上述所有相關(guān)的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)預(yù)設(shè)的數(shù)據(jù)模型對上述所有相關(guān)的試題搜索結(jié)果進(jìn)行多維度統(tǒng)計,確定包含試題搜索結(jié)果數(shù)量最多的試題類別。
在本發(fā)明實施例中,步驟S201中獲得的所有相關(guān)的試題搜索結(jié)果的數(shù)量是不確定的。只有當(dāng)步驟S201中獲得的所有相關(guān)試題搜索結(jié)果的數(shù)量為兩個以上時,步驟S202才會根據(jù)預(yù)設(shè)的數(shù)據(jù)過濾模型對上述所有相關(guān)的試題搜索結(jié)果進(jìn)行多維度統(tǒng)計,以此能夠篩選出最佳類別下的試題搜索結(jié)果。具體地,上述維度包括但不限于如下一種以上:時間、地域、科目、年級。
其中,時間為試題所對應(yīng)的命題年份。對于學(xué)生用戶,特別是對于處于初高中的學(xué)生用戶群體,他們所面對的題目常常是往年的中高考真題或者中高考模擬題,這些題目在題庫中常常會保留有年份信息。此時在步驟S202中,試題搜索裝置可以統(tǒng)計出與目標(biāo)試題相關(guān)的試題搜索結(jié)果中,各個試題結(jié)果時間分布的情況,并篩選出包含試題搜索結(jié)果最多的所屬年份,獲得該所屬年份下的所有試題搜索結(jié)果。
相對應(yīng)的,地域為試題所對應(yīng)的命題區(qū)域。對于初高中學(xué)生用戶群體來說,地域也是他們在搜索試題時的一個重要因素,因為初高中試題常常有很強(qiáng)的地域性。此時在步驟S202中,用戶在搜索試題時,試題搜索裝置可以以地域作為統(tǒng)計的一個維度,統(tǒng)計各個試題結(jié)果地域分布的情況,并篩選出包含試題搜索結(jié)果最多的所屬地域,并獲得該所屬地域下的所有試題搜索結(jié)果。
同時,科目也是一個重要維度。每一個試題都有其所屬的學(xué)科科目,但由于實際生活中,知識是交叉的,因此某些知識點(diǎn)可能會在多個科目中都出現(xiàn)。以理科為例,物理、化學(xué)、生物、數(shù)學(xué)等科目,相互之間都會有所交叉,特別是數(shù)學(xué)作為理科類的基礎(chǔ)學(xué)科,在物理、化學(xué)、生物中,都會有所涉及。例如,當(dāng)用戶以一道數(shù)學(xué)中的應(yīng)用題作為目標(biāo)試題進(jìn)行搜索時,如果此應(yīng)用題的包含有物理背景,題目為計算某個物體的位移,速度,路程或其他物理量時,若對上述目標(biāo)試題在題庫中作全文檢索,有極大可能不僅能夠檢索到數(shù)學(xué)科目下的試題,而且會檢索到包含有物理或者其他科目的題目。此時在步驟S202中,設(shè)置科目為其中一個統(tǒng)計維度,在對搜索到的所有試題結(jié)果進(jìn)行了科目統(tǒng)計,確定不同科目下所屬的試題搜索結(jié)果的數(shù)量后,能夠有效地篩選出與目標(biāo)試題所屬科目相同的試題搜索結(jié)果。
而針對年級,現(xiàn)實生活中,對某一個知識點(diǎn)的,往往在學(xué)習(xí)了這個知識點(diǎn)的年級,出題數(shù)目最為集中,而其他年級對該知識點(diǎn)是不會著重考察的。因而試題搜索裝置也設(shè)置了對于出題年級的統(tǒng)計,能夠較為準(zhǔn)確的篩選出與目標(biāo)試題處于同一年級的試題搜索結(jié)果,避免了試題搜索結(jié)果超綱或其他不符合用戶期望的情況發(fā)生。
可選地,用戶可自行選擇使用哪種或者哪幾種維度進(jìn)行統(tǒng)計。
可選地,用戶可在進(jìn)行了多維度統(tǒng)計后,在不同維度下所包含的不同試題類別中,自行選擇用戶感興趣或者需要的試題類別,而不用試題搜索裝置自動挑選包含試題搜索結(jié)果數(shù)量最多的試題類別。
在步驟S203中,在上述包含試題搜索結(jié)果數(shù)量最多的試題類別下,保留相關(guān)度高的試題搜索結(jié)果。
在本發(fā)明實施例中,由于步驟S202能夠獲取到某一維度下,試題搜索結(jié)果數(shù)量最多的某一試題類別,其中該試題類別下的試題搜索結(jié)果數(shù)是不確定的,其中我們只需要保留與目標(biāo)試題相關(guān)度高的試題搜索結(jié)果,對于與目標(biāo)試題有所相關(guān),但相關(guān)度不高的試題搜索結(jié)果來說,該試題搜索結(jié)果是可以被過濾的。
具體地,當(dāng)上述試題類別下的試題搜索結(jié)果數(shù)量多于N個時,則對上述試題類別下的試題搜索結(jié)果進(jìn)行相關(guān)度排序,保留相關(guān)度高的前N個試題搜索結(jié)果。其中上述試題類別為步驟S202確定的包含試題搜索結(jié)果數(shù)量最多的試題類別。在對上述試題類別進(jìn)行相關(guān)度排序時,可以用包括但不限于如下任一種算法進(jìn)行相關(guān)度計算:TF-IDF(Term Frequency-Inverse Document Frequency)或者Okapi BM25(Best Match 25)。根據(jù)上述相關(guān)度計算的得分,由高至低對試題搜索結(jié)果進(jìn)行排序,并基于上述相關(guān)度得分作篩選,只保留排序后排名靠前的相關(guān)度得分較高的N個試題搜索結(jié)果,并不考慮試題類別,剔除步驟S201得到其它所有試題搜索結(jié)果。
若上述試題類別下的試題搜索結(jié)果數(shù)量不多于N個,則保留上述試題類別下的所有試題搜索結(jié)果。此時由于上述試題類別下的試題搜索結(jié)果數(shù)量并未多余N個,則無論試題搜索結(jié)果與目標(biāo)試題的相關(guān)度高低,都作保留處理,無需在上述試題類別下作基于相關(guān)度的進(jìn)一步篩選。但是,其他試題類別下的試題搜索結(jié)果將全部被剔除。
其中,上述提到的N為預(yù)設(shè)的大于或等于2的自然數(shù)。在步驟S203中,N可以是由試題搜索裝置初始設(shè)定的,也可以是用戶自行設(shè)定的。可選地,試題搜索裝置將初始地設(shè)定N為100。
由上可見,在本實施例中,能夠在對試題結(jié)果進(jìn)行評分之前,首先對試題結(jié)果進(jìn)行一次粗略的初步篩選,以此避免了對所有的試題搜索結(jié)果都進(jìn)行后續(xù)的第一評分,第二評分及最終評分。大大節(jié)約了試題搜索方法對系統(tǒng)資源的占用。
需要說明的是,本發(fā)明實施例中提及的試題搜索裝置具體可以以軟件的方式(例如App的形式)和/或硬件的方式集成在移動終端(例如智能手機(jī)、平板電腦、學(xué)習(xí)機(jī)等終端)中。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,相應(yīng)的程序可以存儲于一計算機(jī)可讀取存儲介質(zhì)中,上述的存儲介質(zhì),如ROM/RAM、磁盤或光盤等。
實施例二
圖3示出了本發(fā)明實施例二提供的試題搜索裝置的具體結(jié)構(gòu)框圖,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。該試題搜索裝置3包括:
目標(biāo)試題獲取單元31,用于獲取目標(biāo)試題的原始圖像,并對上述目標(biāo)試題的原始圖像進(jìn)行圖像識別;
初步檢索單元32,用于基于上述目標(biāo)試題獲取單元31得到圖像識別的結(jié)果在題庫中進(jìn)行全文檢索,獲取試題搜索結(jié)果;
第一評分計算單元33,用于當(dāng)上述初步檢索單元32獲取到的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)全文檢索的評分機(jī)制,計算獲取的各個試題搜索結(jié)果分別對應(yīng)的第一評分;
第二評分計算單元34,用于根據(jù)相似度算法,計算上述初步檢索單元32獲取到的各個試題搜索結(jié)果分別對應(yīng)的第二評分;
搜索結(jié)果確定單元35,用于根據(jù)預(yù)設(shè)加權(quán)線性方案,對上述第一評分計算單元33得到的第一評分及上述第二評分計算單元34得到的第二評分進(jìn)行加權(quán)計算,確定最終評分,并根據(jù)上述最終評分,由高至低對上述試題搜索結(jié)果進(jìn)行排序并輸出。
具體地,上述初步檢索單元32,用于使用Lucene框架對圖像識別的結(jié)果進(jìn)行全文檢索;
具體地,上述第一評分確定單元33用于,對上述初步檢索單元32獲取到的各個試題搜索結(jié)果分別進(jìn)行Lucene評分,獲得上述各個試題搜索結(jié)果分別對應(yīng)的第一評分。
具體地,上述第二評分確定單元34用于,當(dāng)使用的相似度算法為最長公共子序列算法時,根據(jù)最長公共子序列算法,對上述初步檢索單元32獲取到的各個試題搜索結(jié)果分別進(jìn)行評分,獲得上述各個試題搜索結(jié)果分別對應(yīng)的第二評分。
可選地,上述初步檢索單元32還包括:
搜索結(jié)果獲取子單元,用于根據(jù)上述目標(biāo)試題獲取單元31得到的圖像識別結(jié)果在題庫中進(jìn)行全文檢索,獲得所有相關(guān)的試題搜索結(jié)果;
多維度統(tǒng)計子單元,用于當(dāng)上述搜索結(jié)果獲取子單元獲取到的所有相關(guān)的試題搜索結(jié)果的數(shù)量為兩個以上時,根據(jù)預(yù)設(shè)的數(shù)據(jù)模型對上述搜索結(jié)果獲取子單元獲取到的所有相關(guān)的試題搜索結(jié)果進(jìn)行多維度統(tǒng)計,確定包含試題搜索結(jié)果數(shù)量最多的試題類別;
結(jié)果篩選子單元,用于在上述多維度統(tǒng)計子單元確定的包含試題搜索結(jié)果數(shù)量最多的試題類別下,保留相關(guān)度高的試題搜索結(jié)果。
具體地,上述結(jié)果篩選子單元用于,若上述多維度統(tǒng)計子單元確定的試題類別下的試題搜索結(jié)果數(shù)量多于N個,則對上述試題類別下的試題搜索結(jié)果進(jìn)行相關(guān)度排序,保留相關(guān)度高的前N個試題搜索結(jié)果;若上述多維度統(tǒng)計子單元確定的試題類別下的試題搜索結(jié)果數(shù)量不多于N個,則保留上述試題類別下的所有試題搜索結(jié)果;其中,N為預(yù)設(shè)的大于或等于2的自然數(shù)。
需要說明的是,本發(fā)明實施例中的試題搜索裝置具體可以以軟件的方式(例如App的形式)和/或硬件的方式集成在移動終端(例如智能手機(jī)、平板電腦、學(xué)習(xí)機(jī)等終端)中。
應(yīng)理解,本發(fā)明實施例中的試題搜索裝置可以用于實現(xiàn)上述方法實施例中的全部技術(shù)方案,其各個功能模塊的功能可以根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可參照上述實施例中的相關(guān)描述,此處不再贅述。
由上可見,在本發(fā)明實施例中,試題搜索裝置能夠在對試題結(jié)果進(jìn)行評分之前,首先對試題結(jié)果進(jìn)行一次粗略的初步篩選,以此避免了對所有的試題搜索結(jié)果都進(jìn)行后續(xù)的第一評分,第二評分及最終評分。大大節(jié)約了試題搜索裝置對系統(tǒng)資源的占用。
需要說明的是,在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,上述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其它順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定都是本發(fā)明所必須的。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關(guān)描述。
以上為對本發(fā)明所提供的一種較佳實施例而已,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實施例的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。