国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于主題模型的軟件問答推薦方法和裝置與流程

      文檔序號:11134046閱讀:413來源:國知局
      基于主題模型的軟件問答推薦方法和裝置與制造工藝

      本發(fā)明涉及信息技術,尤其涉及一種基于主題模型的軟件問答推薦方法和裝置。



      背景技術:

      在軟件開發(fā)、代碼編寫等各類工作中,當技術人員遇到難以解決的問題時,通常會采用檢索的方式在網絡中搜索相關資料,以作為參考。

      技術人員在檢索之前,需根據(jù)遇到的問題自行設定檢索關鍵詞,在搜索引擎或相關論壇、資料共享網站中輸入檢索關鍵詞,得到檢索結果。技術人員需在所有檢索結果中,進行人工篩選,確定出相關度較高的信息后再進一步進行仔細分析,確定是否能夠真正解決問題。

      由于人工篩選消耗時間和精力較多,且可能因為關鍵詞設置不合理,導致技術人員即使耗時較長也無法檢索得到對問題有幫助的信息,人工檢索效率較低。現(xiàn)有技術提供一種自動推薦相關信息的方法,采用提前訓練得到的關鍵詞與網頁的對應模型,將技術人員實時輸入的內容作為關鍵詞,自動為技術人員提供可能相關的網頁。但是由于模型過于簡單,導致推薦的信息不準確、推薦效果較差。



      技術實現(xiàn)要素:

      本發(fā)明提供一種基于主題模型的軟件問答推薦方法和裝置,用以解決現(xiàn)有軟件問答推薦中推薦效果較差的問題。

      本發(fā)明一方面提供一種基于主題模型的軟件問答推薦方法,包括:

      根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取所述用戶文檔的檢索串;

      根據(jù)所述檢索串,在所述軟件問答信息庫中獲取至少一個信息文檔;

      獲取各所述信息文檔與所述用戶文檔的相似度,根據(jù)各所述相似度,向所述用戶進行軟件問答推薦。

      如上所述的基于主題模型的軟件問答推薦方法,所述根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取所述用戶文檔的檢索串,包括:

      根據(jù)所述主題模型,獲取所述用戶文檔的主題結構;

      根據(jù)所述用戶文檔的主題結構,獲取所述用戶文檔中出現(xiàn)概率最高的預設數(shù)量個單詞,作為所述用戶文檔的檢索串。

      如上所述的基于主題模型的軟件問答推薦方法,所述根據(jù)所述用戶文檔的主題結構,獲取所述用戶文檔中出現(xiàn)概率最高的預設數(shù)量個單詞,包括:

      根據(jù)所述用戶文檔的主題結構,采用如下的公式一獲取所述用戶文檔中出現(xiàn)概率最高的L個單詞,作為所述用戶文檔的檢索串Q;

      其中,P(qi|D)是所述用戶文檔D中單詞qi出現(xiàn)的概率,L為所述預設數(shù)量,i的取值范圍為從1至L的正整數(shù);P(zj|θ,D)是所述用戶文檔D中主題zj出現(xiàn)的概率,θ是所述用戶文檔D的主題分布,是主題zj中單詞qi出現(xiàn)的概率,是所述主題zj的單詞分布,K為所述主題模型中主題的總數(shù)量,j的取值范圍為從1至K的正整數(shù)。

      如上所述的基于主題模型的軟件問答推薦方法,所述獲取各所述信息文檔與所述用戶文檔的相似度,包括:

      采用如下的公式二確定所述用戶文檔與各所述信息文檔的相似度Sim;

      其中,P(zj|θ′,D′)表示任一信息文檔D′中主題zj出現(xiàn)的概率,θ′為所述信息文檔D′的主題分布。

      如上所述的基于主題模型的軟件問答推薦方法,所述根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取所述用戶文檔的檢索串之前,還包括:

      采用隱含狄利克雷分布算法,獲取所述軟件問答信息庫的主題模型;

      確定所述用戶文檔的變化量達到預設變化量,則確定執(zhí)行獲取所述用戶文檔的檢索串的操作。

      如上所述的基于主題模型的軟件問答推薦方法,所述獲取各所述信息文檔與所述用戶文檔的相似度Sim,根據(jù)各所述相似度,向所述用戶進行軟件問答推薦,包括:

      針對任一信息文檔,獲取所述信息文檔與所述用戶文檔的相似度Sim;

      根據(jù)所述信息文檔的至少一項元信息特征,對所述信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      根據(jù)各所述修正后的相似度Sim′,向所述用戶進行軟件問答推薦。

      如上所述的基于主題模型的軟件問答推薦方法,所述根據(jù)所述信息文檔的至少一項元信息特征,對所述信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′,包括:

      根據(jù)所述信息文檔的至少一項元信息特征tm,采用如下的公式三對所述信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      其中,α為所述信息文檔的相似度Sim的權重,M為所述信息文檔的元信息特征的總數(shù)量,m的取值為從1至M的正整數(shù),βm為元信息特征tm的權重,α和βm的取值為從0至1的實數(shù)。

      如上所述的基于主題模型的軟件問答推薦方法,所述軟件問答信息庫中包括如下至少一種文檔:

      百科文檔、網絡貼吧文檔、網絡社區(qū)文檔、問答網站中的文檔。

      如上所述的基于主題模型的軟件問答推薦方法,當所述信息文檔為問答網站中的文檔時,所述元信息特征包括如下中的至少一項:

      信息文檔中的問題質量、答案質量、提問用戶聲望、回答用戶聲望、應用程序接口相似度、文本相似度。

      本發(fā)明另一方面提供一種基于主題模型的軟件問答推薦裝置,包括:

      檢索串獲取模塊,用于根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取所述用戶文檔的檢索串;

      信息文檔獲取模塊,用于根據(jù)所述檢索串,在所述軟件問答信息庫中獲取至少一個信息文檔;

      推薦模塊,用于獲取各所述信息文檔與所述用戶文檔的相似度,根據(jù)各所述相似度,向所述用戶進行軟件問答推薦。

      本發(fā)明提供的基于主題模型的軟件問答推薦方法和裝置,基于軟件問答信息庫的主題模型,獲取用戶文檔的檢索串,再根據(jù)檢索串在軟件問答信息庫中獲取至少一個信息文檔,最后獲取各信息文檔與用戶文檔的相似度,根據(jù)獲取到的各相似度向用戶進行軟件問答推薦,通過采用基于主題模型的檢索串獲取方法,可自動根據(jù)開發(fā)人員的當前操作文檔中的內容確定準確的檢索串,不僅簡化了檢索操作而且結合充分利用了用戶文檔的上下文信息,使得提高了檢索串的準確性,提高了軟件問答的推薦效果,并為各信息文檔與用戶文檔計算相似度,確定推薦順序,進一步提高了軟件問答的推薦效果。

      附圖說明

      為了更清楚地說明本發(fā)明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

      圖1為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例一的流程示意圖;

      圖2為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例二的流程示意圖;

      圖3為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例三的流程示意圖;

      圖4為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例四的流程示意圖;

      圖5本發(fā)明提供的基于主題模型的軟件問答推薦裝置實施例一的結構示意圖。

      具體實施方式

      為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

      在軟件開發(fā)領域中,軟件開發(fā)人員在代碼編寫過程中,若遇到技術難題,需從開發(fā)環(huán)境切換至瀏覽器,再自行設定檢索關鍵詞在搜索引擎或軟件開發(fā)問答網站中進行搜索,在搜索得到的相關文檔中人工篩選具有參考性的文檔。為簡化軟件開發(fā)人員的操作、提高效率,現(xiàn)有技術在開發(fā)環(huán)境中集成軟件問答推薦工具,用于自動根據(jù)軟件開發(fā)人員輸入的內容,生產檢索關鍵詞,在網頁中檢索相關的信息文檔,并按相似度向軟件開發(fā)人員推薦,節(jié)省了軟件開發(fā)人員在開發(fā)環(huán)境和瀏覽器之間切換的時間,但是在生成檢索關鍵詞時,僅在開發(fā)人員的開發(fā)環(huán)境中檢測是否存在預設關鍵詞或根據(jù)開發(fā)人員當前輸入的單詞生成檢索關鍵詞,導致檢索效果較差,而且,在確定檢索關鍵詞后,采用提前訓練得到的關鍵詞與網頁的對應模型,自動為技術人員提供可能相關的網頁,因此推薦效果較差。

      為解決上述問題,本發(fā)明實施例提供一種基于主題模型的軟件問答推薦方法和裝置,根據(jù)軟件問答信息庫中的信息文檔的主題模型,自動為開發(fā)人員當前的編寫的代碼文檔提取多個檢索關鍵詞作為檢索串,并根據(jù)檢索串在軟件問答信息庫中進行檢索,得到用于參考的信息文檔并向開發(fā)人員進行推薦,提高了軟件問答的推薦效果。

      下面以具體地實施例對本發(fā)明的技術方案以及本發(fā)明的技術方案如何實現(xiàn)進行詳細說明。

      本發(fā)明實施例提供一種基于主題模型的軟件問答推薦方法,該方法的執(zhí)行主體可以為基于主題模型的軟件問答推薦裝置,該裝置可以由軟件和/或硬件實現(xiàn),集成在軟件開發(fā)人員使用的開發(fā)環(huán)境中。圖1為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例一的流程示意圖。如圖1所示,該方法包括:

      步驟101、根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取用戶文檔的檢索串;

      步驟102、根據(jù)檢索串,在軟件問答信息庫中獲取至少一個信息文檔;

      步驟103、獲取各信息文檔與用戶文檔的相似度,根據(jù)各相似度,向用戶進行軟件問答推薦。

      具體的,在步驟101中,該裝置實時監(jiān)測開發(fā)人員在開發(fā)環(huán)境中進行的代碼編寫,代碼文檔即為用戶文檔,當用戶編寫的代碼不同,用戶可能遇到的技術問題也不同,需根據(jù)用戶文檔中的內容選擇至少一個檢索關鍵詞作為檢索串。示例性的,可以根據(jù)軟件問答信息庫的主題模型,生成用戶文檔的檢索串??蛇x的,軟件問答信息庫中包括如下至少一種文檔:百科文檔、網絡貼吧文檔、網絡社區(qū)文檔、問答網站中的文檔。軟件問答信息庫還可以為開發(fā)人員預設的其他網絡文檔,本發(fā)明對此不做限定。上述文檔中包括任意開發(fā)人員分享的開發(fā)過程中所遇到的問題的解決辦法。為便于準確確定各文檔內容,便于檢索,需獲取軟件問答信息庫的主題模型,主題模型包括上述各文檔的主題分布,以及各文檔的各主題下的單詞分布,即表示一個單詞、一個主題在某一文檔中的出現(xiàn)概率。根據(jù)該主題模型,對用戶文檔進行訓練,可以得到用戶文檔的主題結構,用戶文檔的主題結構中包括用戶文檔的主題分布,以及各主題下的單詞分布。通過采用基于主題模型的方法,自動獲取用戶文檔的檢索串,可以準確的確定出能夠代表用戶文檔的檢索關鍵詞。

      具體的,在步驟102中,根據(jù)步驟101中獲取的檢索串,在軟件問答信息庫中進行搜索,確定出至少一個信息文檔。示例性的,在軟件問答信息庫中進行檢索時,利用軟件問答信息庫自身的搜索引擎進行搜索,得到搜索引擎提供的至少一個信息文檔。示例性的,當搜索得到的信息文檔過多時,可僅選用搜索引擎推薦的相關度較高的N個信息文檔,N為開發(fā)人員預設的正整數(shù)??梢允纠缘恼J為相關度排名在N之后的信息文檔與檢索串代表的用戶文檔相關度較低。

      具體的,由于步驟102中獲取到的各信息文檔的排序是根據(jù)其與檢索串的吻合度進行的排序,并不能完全代表各信息文檔與用戶文檔的相似度。因此在步驟103中,對步驟102中獲取到的各信息文檔分別與用戶文檔進行相似度計算,得到各信息文檔與用戶文檔的相似度,再根據(jù)各相似度的值的大小,按照從大到小的順序,向用戶進行推薦,以提高推薦效果。具體的,在進行相似度計算時,可采用資訊檢索資訊探勘的常用加權技術(term frequency–inverse document frequency,簡稱TF-IDF)、淺層語義分析(Latent semantic analysis,簡稱LSA)等算法。

      本發(fā)明提供的基于主題模型的軟件問答推薦方法,基于軟件問答信息庫的主題模型,獲取用戶文檔的檢索串,再根據(jù)檢索串在軟件問答信息庫中獲取至少一個信息文檔,最后獲取各信息文檔與用戶文檔的相似度,根據(jù)獲取到的各相似度向用戶進行軟件問答推薦,通過采用基于主題模型的檢索串獲取方法,可自動根據(jù)開發(fā)人員的當前操作文檔中的內容確定準確的檢索串,不僅簡化了檢索操作而且結合充分利用了用戶文檔的上下文信息,使得提高了檢索串的準確性,提高了軟件問答的推薦效果,并為各信息文檔與用戶文檔計算相似度,確定推薦順序,進一步提高了軟件問答的推薦效果。

      下面在圖1所示實施例的基礎上,以具體地實施例對本發(fā)明的獲取檢索串的方法進行詳細說明。

      圖2為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例二的流程示意圖,如圖2所示,獲取檢索串具體包括:

      步驟201、根據(jù)主題模型,獲取用戶文檔的主題結構;

      步驟202、根據(jù)用戶文檔的主題結構,獲取用戶文檔中出現(xiàn)概率最高的預設數(shù)量個單詞,作為用戶文檔的檢索串。

      具體的,采用隱含狄利克雷分布算法,根據(jù)軟件問答信息庫的主題模型對用戶文檔進行訓練,即可確定用戶文檔在該主題模型上的主題結構。然后,根據(jù)用戶文檔的主題結構,即可得到用戶文檔中包括的每個單詞出現(xiàn)的概率,概率越高的單詞在用戶文檔中出現(xiàn)的次數(shù)越多,越能代表用戶文檔,因此,可篩選出用戶文檔中出現(xiàn)概率最高的預設數(shù)量個單詞,作為用戶文檔的檢索串。

      進一步的,在上述實施例的基礎上,具體獲取檢索串的方法包括:

      根據(jù)用戶文檔的主題結構,采用如下的公式一獲取用戶文檔中出現(xiàn)概率最高的L個單詞,作為用戶文檔的檢索串Q;

      其中,P(qi|D)是用戶文檔D中單詞qi出現(xiàn)的概率,L為預設數(shù)量,i的取值范圍為從1至L的正整數(shù);P(zj|θ,D)是用戶文檔D中主題zj出現(xiàn)的概率,θ是用戶文檔D的主題分布,是主題zj中單詞qi出現(xiàn)的概率,是主題zj的單詞分布,K為主題模型中主題的總數(shù)量,j的取值范圍為從1至K的正整數(shù)。

      具體的,每次取L個概率P(qi|D),代入公式中,即可得到多個P(Q|D),再在多個P(Q|D)中獲取當獲取到最大的P(Q|D)時,用于生產最大的P(Q|D)的L個單詞,組成用戶文檔的檢索串Q。

      進一步的,在上述實施例的基礎上,采用基于主題模型的相似度計算方法,獲取各信息文檔與用戶文檔的相似度。

      示例性的,采用如下的公式二確定用戶文檔與任一信息文檔D′的相似度Sim;

      其中,P(zj|θ′,D′)表示任一信息文檔D′中主題zj出現(xiàn)的概率,θ′為信息文檔D′的主題分布。

      具體的,在獲取任一信息文檔D′與用戶文檔D的相似度時,也可基于主題模型,利用信息文檔D′的主題結構與用戶文檔D的主題結構,計算兩文檔的相似度。示例性的,當兩篇文檔中的主題分布相同,且單詞分布相同,則認為兩篇文章在內容上越相似。如公式二所示,當兩篇文檔中的各主題的分布越相似,則Sim的值越趨近于1。

      可選的,在上述任一實施例的基礎上,結合圖1或圖2所示實施例對本發(fā)明實施例的獲取檢索串之前的準備步驟進行詳細說明。圖3為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例三的流程示意圖,如圖3所示,本發(fā)明提供的基于主題模型的軟件問答推薦方法,包括:

      步驟301、采用隱含狄利克雷分布算法,獲取軟件問答信息庫的主題模型;

      步驟302、確定用戶文檔的變化量達到預設變化量;

      步驟303、根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取用戶文檔的檢索串;

      步驟304、根據(jù)檢索串,在軟件問答信息庫中獲取至少一個信息文檔;

      步驟305、獲取各信息文檔與用戶文檔的相似度,根據(jù)各相似度,向用戶進行軟件問答推薦。

      具體的,在獲取用戶文檔的檢索串之前,需采用隱含狄利克雷分布算法,對開發(fā)人員確定的軟件問答信息庫進行訓練,得到軟件問答信息庫的主題模型,并定期對主題模型進行更新。當檢測到開發(fā)人員在用戶文檔中進行代碼編寫時,對開發(fā)人員的操作進行實時監(jiān)控,當檢測到開發(fā)人員對用戶文檔進行了修改,且確定用戶文檔的變化量達到預設變化量時,開始確定檢索串,為開發(fā)人員提供信息文檔,以方便開發(fā)人員在遇到問題時,無需再手動檢索。示例性的,可以為在檢測到用戶文檔中的代碼變化量達到兩行時,開始執(zhí)行獲取檢索串的操作。

      進一步的,在上述任一實施例的基礎上,針對獲取相似度的過程進行詳細說明。圖4為本發(fā)明提供的基于主題模型的軟件問答推薦方法實施例四的流程示意圖。如圖4所示,獲取相似度的過程具體包括:

      步驟401、針對任一信息文檔,獲取信息文檔與用戶文檔的相似度Sim;

      步驟402、根據(jù)信息文檔的至少一項元信息特征,對信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      步驟403、根據(jù)各修正后的相似度Sim′,向用戶進行軟件問答推薦。

      具體的,針對任一信息文檔,可采用上述實施例所述的基于主題模型的方法,獲取信息文檔與用戶文檔的相似度Sim??紤]到軟件問答信息庫中的各信息文檔除了包含開發(fā)人員分享的用于解決技術問題的內容外,還包括文檔發(fā)布者的信息,該文檔被查閱、引用次數(shù)的信息等。該些元信息特征也可用于評價信息文檔的可參考性。因此,在獲取到相似度Sim后,進一步根據(jù)信息文檔的至少一項元信息特征,對信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′。最后根據(jù)各修正后的相似度Sim′,向用戶進行軟件問答推薦。

      例如,當獲取到兩篇相似度分別為S1和S2的信息文檔D1和D2,且S1>S2時,考慮到信息文檔S1的發(fā)布者的聲望F1遠大于信息文檔S2的發(fā)布者的聲望F2,則根據(jù)F1和F2對原本的相似度S1和S2進行修訂,得到修訂后的相似度S11、S22,且修訂后的S11<S22,則按照先信息文檔D2、后信息文檔D1的順序進行軟件問答推薦。

      示例性的,在上述實施例的基礎上,對相似度進行修正的過程,具體包括:

      根據(jù)信息文檔的至少一項元信息特征tm,采用如下的公式三對信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      其中,α為信息文檔的相似度Sim的權重,M為信息文檔的元信息特征的總數(shù)量,m的取值為從1至M的正整數(shù),βm為元信息特征tm的權重,α和βm的取值為從0至1的實數(shù)。

      可選的,當信息文檔為問答網站中的文檔時,元信息特征包括如下中的至少一項:

      信息文檔中的問題質量、答案質量、提問用戶聲望、回答用戶聲望、應用程序接口(Application Programming Interface,簡稱API)相似度、文本相似度。

      其中,問題質量指問答網站的用戶對于問題的評分,答案質量指問答網站的用戶對于答案的評分,提問用戶聲望指問答網站的其他用戶對提出問題的用戶的評分,回答用戶聲望指問答網站的其他用戶對提供答案的用戶的評分,API相似度指信息文檔中若包含代碼時,信息文檔所包含的代碼與用戶文檔中的代碼的相似度,文本相似度指信息文檔的詞向量與用戶文檔的詞向量的相似度。

      示例性的,可先對上述元信息特征進行歸一化,然后根據(jù)歸一化后的元信息特征對相似度進行修正。

      本發(fā)明另一方面提供一種基于主題模型的軟件問答推薦裝置,用于執(zhí)行如上述實施例所述的基于主題模型的軟件問答推薦方法,具有相同的技術特征和技術效果,本發(fā)明不再贅述。

      圖5本發(fā)明提供的基于主題模型的軟件問答推薦裝置實施例一的結構示意圖。如圖5所示,包括:

      檢索串獲取模塊501,用于根據(jù)用戶文檔和軟件問答信息庫的主題模型,獲取用戶文檔的檢索串;

      信息文檔獲取模塊502,用于根據(jù)檢索串,在軟件問答信息庫中獲取至少一個信息文檔;

      推薦模塊503,用于獲取各信息文檔與用戶文檔的相似度,根據(jù)各相似度,向用戶進行軟件問答推薦。

      可選的,檢索串獲取模塊501具體用于:

      根據(jù)主題模型,獲取用戶文檔的主題結構;

      根據(jù)用戶文檔的主題結構,獲取用戶文檔中出現(xiàn)概率最高的預設數(shù)量個單詞,作為用戶文檔的檢索串。

      可選的,檢索串獲取模塊501具體用于:

      根據(jù)用戶文檔的主題結構,采用如下的公式一獲取用戶文檔中出現(xiàn)概率最高的L個單詞,作為用戶文檔的檢索串Q;

      其中,P(qi|D)是用戶文檔D中單詞qi出現(xiàn)的概率,L為預設數(shù)量,i的取值范圍為從1至L的正整數(shù);P(zj|θ,D)是用戶文檔D中主題zj出現(xiàn)的概率,θ是用戶文檔D的主題分布,是主題zj中單詞qi出現(xiàn)的概率,是主題zj的單詞分布,K為主題模型中主題的總數(shù)量,j的取值范圍為從1至K的正整數(shù)。

      可選的,推薦模塊503具體用于:

      采用如下的公式二確定用戶文檔與各信息文檔的相似度Sim;

      其中,P(zj|θ′,D′)表示任一信息文檔D′中主題zj出現(xiàn)的概率,θ′為信息文檔D′的主題分布。

      可選的,該裝置還包括:

      主題模型獲取模塊,用于采用隱含狄利克雷分布算法,獲取軟件問答信息庫的主題模型;

      變化檢測模塊,用于在確定用戶文檔的變化量達到預設變化量時,控制檢索串獲取模塊501執(zhí)行獲取用戶文檔的檢索串的操作。

      可選的,推薦模塊503具體用于:

      針對任一信息文檔,獲取信息文檔與用戶文檔的相似度Sim;

      根據(jù)信息文檔的至少一項元信息特征,對信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      根據(jù)各修正后的相似度Sim′,向用戶進行軟件問答推薦。

      可選的,推薦模塊503具體用于:

      根據(jù)信息文檔的至少一項元信息特征tm,采用如下的公式三對信息文檔的相似度Sim進行修正,得到修正后的相似度Sim′;

      其中,α為信息文檔的相似度Sim的權重,M為信息文檔的元信息特征的總數(shù)量,m的取值為從1至M的正整數(shù),βm為元信息特征tm的權重,α和βm的取值為從0至1的實數(shù)。

      可選的,軟件問答信息庫中包括如下至少一種文檔:百科文檔、網絡貼吧文檔、網絡社區(qū)文檔、問答網站中的文檔。

      可選的,當信息文檔為問答網站中的文檔時,元信息特征包括如下中的至少一項:

      信息文檔中的問題質量、答案質量、提問用戶聲望、回答用戶聲望、應用程序接口相似度、文本相似度。

      在本申請所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。

      所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

      另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。

      所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發(fā)明的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的部分可以以軟件產品的形式體現(xiàn)出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory,簡稱ROM)、隨機存取存儲器(Random Access Memory,簡稱RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質。

      最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的范圍。

      當前第1頁1 2 3 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1