信息排序方法、用于生成信息排序模型的方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及計算機技術領域,尤其涉及一種信息排序方法、用于生成信息排序模 型的方法及裝置。
【背景技術】
[0002] 當前,網絡上的信息數量龐大,且來源豐富。以新聞文章為例,用戶從各種信息源 可獲得大量的新聞,優(yōu)選地需要對新聞進行合理排序,將用戶最關心的新聞推薦在頁面的 最前面。在用戶具有明顯的地域特點,非常關心某些區(qū)域相關的新聞的情況下,如何將用戶 最關心的與地域相關的新聞推薦在頁面的最前面,是一個急需解決的技術難題。
[0003] 現有技術中,主要通過地理信息關鍵詞匹配的方法為用戶推薦與地域相關的新 聞。但此種方法容易出現誤判,例如在用戶關心珠三角地區(qū)(香港、深圳等)的新聞的情況 下,一篇關于"香港腳"這種疾病的科普性的新聞很容易被誤判為與"香港"這一區(qū)域相關 的新聞而推薦給用戶,降低新聞推薦的準確率。
【發(fā)明內容】
[0004] 本發(fā)明的目的在于提供一種信息排序方法、用于生成信息排序模型的方法及裝 置,以較為準確地為用戶推薦與地域相關的文章。
[0005] 根據本發(fā)明的一方面,本發(fā)明提供一種信息排序方法,所述方法包括:獲取關聯的 多篇文章;根據預先訓練的地理主題模型分別從所述多篇文章提取相應的與地理位置相關 的主題的信息;分別將從所述多篇文章提取的主題的信息輸入預先訓練的相關度排序模 型,以分別獲取所述多篇文章的相關度;根據所述多篇文章的相關度對所述多篇文章進行 排序。
[0006] 可選地,所述方法還包括:從客戶端接收包括至少一個關鍵詞的搜索詞;所述獲 取關聯的多篇文章的處理包括:根據所述至少一個關鍵詞獲取所述多篇文章。
[0007] 可選地,所述方法還包括:向所述客戶端發(fā)送經過排序的所述多篇文章。
[0008] 根據本發(fā)明的另一方面,本發(fā)明還提供一種用于生成信息排序模型的方法,所述 方法包括:獲取已標注相關度的多篇樣本文章;根據預先訓練的地理主題模型分別從所述 多篇樣本文章提取相應的與地理位置相關的主題的信息;根據已標注相關度的所述多篇樣 本文章以及為其提取的與地理位置相關的主題的信息訓練所述信息排序模型。
[0009] 根據本發(fā)明的另一方面,本發(fā)明還提供一種用于信息排序的裝置,所述裝置包括: 文章獲取單元,用于獲取關聯的多篇文章;主題信息提取單元,用于根據預先訓練的地理主 題模型分別從所述多篇文章提取相應的與地理位置相關的主題的信息;相關度獲取單元, 用于將從所述多篇文章提取的主題的信息輸入預先訓練的相關度排序模型,以分別獲取所 述多篇文章的相關度;排序單元,用于根據所述多篇文章的相關度對所述多篇文章進行排 序。
[0010] 可選地,所述裝置還包括:搜索詞接收單元,用于從客戶端接收包括至少一個關鍵 詞的搜索詞;所述文章獲取單元包括:文章獲取子單元,用于根據所述至少一個關鍵詞獲 取所述多篇文章。
[0011] 可選地,所述裝置還包括:文章發(fā)送單元,用于向所述客戶端發(fā)送經過排序的所述 多篇文章。
[0012] 根據本發(fā)明的另一方面,本發(fā)明還提供一種用于生成信息排序模型的裝置,所述 裝置包括:樣本文章獲取單元,用于獲取已標注相關度的多篇樣本文章;樣本主題信息提 取單元,用于根據預先訓練的地理主題模型分別從所述多篇樣本文章提取相應的與地理位 置相關的主題的信息;信息排序模型訓練單元,用于根據已標注相關度的所述多篇樣本文 章以及為其提取的與地理位置相關的主題的信息訓練所述信息排序模型。
[0013] 本發(fā)明提供的信息排序方法、用于生成信息排序模型的方法及裝置,根據預先訓 練的地理主題模型分別從待排序的多篇文章提取相應的與地理位置相關的主題的信息,將 提取的主題的信息輸入預先訓練的相關度排序模型,以獲取所述多篇文章的相關度,根據 所述多篇文章的相關度對所述多篇文章進行排序。由于在排序過程中考慮了地理位置因 素,因此可較為準確地為用戶推薦與地域相關的文章。
【附圖說明】
[0014] 圖1是示出本發(fā)明示例性實施例信息排序方法的流程示意圖;
[0015] 圖2是示出在信息系統中基于地理位置的文章推薦頁面示意圖;
[0016] 圖3是示出在信息系統中用戶配置感興趣的地理位置的頁面示意圖;
[0017] 圖4是示出本發(fā)明示例性實施例用于生成信息排序模型的方法的流程示意圖;
[0018] 圖5是示出本發(fā)明示例性實施例用于信息排序的裝置的結構示意圖;
[0019] 圖6是示出本發(fā)明示例性實施例用于生成信息排序模型的裝置的結構示意圖。
【具體實施方式】
[0020] 本發(fā)明的基本構思是,將地理位置信息作為選取文章(如新聞文章)的主題的要 素之一來對信息排序模型進行訓練,從而基于所述信息排序模型對多篇文章進行優(yōu)化排 序,為用戶推薦其最關心的與地域相關的新聞。
[0021] 在對本發(fā)明示例性實施例的信息排序方法、用于生成信息排序模型的方法及裝置 進行描述之前,先介紹一下地理主題模型的訓練過程。
[0022] 具體地,獲取多篇樣本文章,根據樣本文章的內容獲得所述樣本文章的地理位置 和主題,根據樣本文章的地理位置和主題訓練得到所述地理主題模型,以便后續(xù)在對文章 進行排序和生成信息排序模型的過程中根據所述地理主題模型從文章中提取相應的與地 理位置相關的主題的信息。樣本文章的地理位置和主題可如表1所示。
[0023] 表1樣本文章的地理位置和主題
[0024]
[0025] 下面結合附圖對本發(fā)明示例性實施例的信息排序方法、用于生成信息排序模型的 方法及裝置進行詳細描述。
[0026] 實施例一
[0027] 圖1是示出本發(fā)明示例性實施例信息排序方法的流程示意圖。
[0028] 參照圖1,在步驟S110,獲取關聯的多篇文章。
[0029] 具體地,本步驟中的多篇文章即待排序的多篇文章。
[0030] 在步驟S120,根據預先訓練的地理主題模型分別從所述多篇文章提取相應的與地 理位置相關的主題的信息。
[0031] 具體地,從文章提取的主題的信息可以用例如表2中所示的文章的主題向量表 不O
[0032] 表2文章的主題向量
[0033]
[0034] 在步驟S130,分別將從所述多篇文章提取的主題的信息輸入預先訓練的相關度排 序模型,以分別獲取所述多篇文章的相關度。
[0035] 具體地,根據從所述多篇文章提取的主題的信息采用相關度排序模型分別對所述 多篇文章的相關度進行預測,得到所述多篇文章的相關度,如表3所示。
[0036] 表3文章的相關度
[0037]
[0038] 在步驟S140,根據所述多篇文章的相關度對所述多篇文章進行排序。
[0039] 本發(fā)明實施例的信息排序方法,根據預先訓練的地理主題模型分別從待排序的多 篇文章提取相應的與地理位置相關的主題的信息,將提取的主題的信息輸入預先訓練的相 關度排序模型,以獲取所述多篇文章的相關度,根據所述多篇文章的相關度對所述多篇文 章進行排序。由于在排序過程中考慮了地理位置因素,因此可較為準確地為用戶推薦與地 域相關的文章。
[0040] 可選地,本發(fā)明實施例的信息排序方法還可包括:從客戶端接收包括至少一個關 鍵詞的搜索詞。上述步驟SllO的處理包括:根據所述至少一個關鍵詞獲取所述多篇文章。
[0041] 可選地,本發(fā)明實施例的信息排序方法還可包括:向所述客戶端發(fā)送經過排序的 所述多篇文章。
[0042] 具體地,本發(fā)明實施例的信息排序方法可應用于任何具有文章推薦的應用程序 (Application,簡稱APP)、搜索引擎和網站等,也可應用于一個獨立的模塊或開放平臺的應 用程序編程接口(Application Programming Interface,簡稱API),例如在信息系統。圖 2是示出在信息系統中基于地理位置的文章推薦頁面示意圖。如圖2所示為時間關鍵詞為 "近24小時",輿情屬性關鍵詞為"全部",地理位置關鍵詞為"全國",媒體類型關鍵詞為"全 部"時的文章推薦頁面。圖3是示出在信息系統中用戶配置感興趣的地理位置的頁面示意 圖。如圖3所示,用戶可通過頁面上的"地域篩選"選擇感興趣的地理位置,例如"廣東"。
[0043] 實施例二
[0044]圖4是示出本發(fā)明示例性實施例用于生成信息排序模型的方法的流程示意圖。
[0045] 參照圖4,本發(fā)明實施例的用于生成信息排序模型的方法可用于生成實施例一中 的相關度排序模型。
[0046] 在步驟S410,獲取已標注相關度的多篇樣本文章。
[0047] 具體地,多篇樣本文章的相關度可如表4所示。
[0048] 表4樣本文章的相關度
[0049]
[0050] 在步驟S420,根據預先訓練的地理主題模型分別從所述多篇樣本文章提取相應的 與地理位置相關的主題的信息。
[0051] 具體地,本步驟中的地理主題模型與實施例一步驟S120中的地理主題模型相同。 本步驟中提取樣