技術特征:
技術總結
本發(fā)明涉及一種網頁訓練的方法和裝置,包括:獲取人工標注類別的訓練網頁集合,生成訓練網頁集合中的網頁的網頁向量,具體包括:獲取訓練網頁集合中的第一訓練網頁的有效歷史查詢字符串,對有效歷史查詢字符串進行分詞;獲取各個分詞的有效次數(shù),有效次數(shù)為有效歷史查詢字符串中分詞出現(xiàn)的總次數(shù);根據各個分詞的有效次數(shù)計算各個分詞的分詞權重;根據各個分詞和對應的分詞權重生成所述第一訓練網頁的網頁向量;根據訓練網頁集合中的網頁的人工標注類別和對應的網頁向量訓練生成網頁分類模型,訓練成本低,效率高,且生成網頁分類模型后可自動對網頁進行標注類別,可使識別出的意圖正確率更高,還提出一種搜索意圖識別的方法和裝置。
技術研發(fā)人員:王忠存
受保護的技術使用者:騰訊科技(深圳)有限公司
技術研發(fā)日:2016.01.07
技術公布日:2017.07.14