專利名稱:一種具有信息發(fā)布和搜索功能的系統(tǒng)及信息發(fā)布方法
一種具有信息發(fā)布和搜索功能的系統(tǒng)及信息發(fā)布方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索技術(shù)領(lǐng)域,特別涉及一種具有信息發(fā)布和搜索功能的系統(tǒng)及信息 發(fā)布方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,搜索已經(jīng)成為了人們生活當(dāng)中不可或缺的一部分。通過 搜索,人們可以輕易地獲取到各個領(lǐng)域的知識和信息,這大大地加速了信息的傳播。搜索 技術(shù)的出現(xiàn),極大地改變了人們傳統(tǒng)的學(xué)習(xí)方式,以往需要從圖書館、教育機(jī)構(gòu)才能獲取的 知識,現(xiàn)在人們只要輕點一下鼠標(biāo),就可以輕松地從浩瀚的互聯(lián)網(wǎng)信息海洋中獲取到。隨 著搜索技術(shù)向著更加智能的方向發(fā)展,人們也越來越容易獲取到個性化的信息,然而,隨 著TOB2.0的廣泛應(yīng)用,現(xiàn)在的互聯(lián)網(wǎng)已經(jīng)成為了一個溝通和交流的平臺,人們不僅從互聯(lián) 網(wǎng)獲取信息,更是常常為互聯(lián)網(wǎng)提供信息,例如人們廣泛使用的博客、微博、知識問答社區(qū)、 SNS等,都為人們提供了一個發(fā)布信息、分享知識的平臺,但是目前的還沒有一種系統(tǒng),能夠 根據(jù)用戶輸入的信息,判斷用戶的意圖,從而決定是給用戶返回搜索結(jié)果還是將用戶輸入 信息發(fā)布到上文所述的平臺上去。此外,由于目前上文所述的平臺彼此之間都是獨立的,每 一個發(fā)布信息的平臺都建立在自己的管理基礎(chǔ)之上,如果用戶在多個平臺都注冊了服務(wù), 并且希望在不同的平臺發(fā)布相同的信息,那么他就不得不在多個平臺進(jìn)行登錄和發(fā)布的操 作,這顯然給用戶帶來了不便。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種具有信息發(fā)布和搜索功能的系統(tǒng)及信息 發(fā)布方法,以實現(xiàn)通過用戶輸入信息判斷用戶意圖,并根據(jù)用戶意圖對輸入信息進(jìn)行檢索 或發(fā)布的目的。本發(fā)明為解決技術(shù)問題而采用的技術(shù)方案是提供一種具有信息發(fā)布和搜索功能 的系統(tǒng),包括展示模塊,用于為用戶提供所述系統(tǒng)的使用界面,所述使用界面用于接收用 戶的輸入信息和將所述系統(tǒng)返回的處理結(jié)果展示給用戶;分類器構(gòu)建模塊,用于根據(jù)線下 挖掘的歷史數(shù)據(jù)或第三方信息發(fā)布平臺提供的語料數(shù)據(jù),構(gòu)建分類器模型;信息分析模塊, 用于根據(jù)所述分類器模型對所述輸入信息進(jìn)行分析,輸出所述輸入信息具有信息發(fā)布需求 的第一概率,所述第一概率用于描述所述輸入信息基于語義特征角度的具有所述信息發(fā)布 需求的可能性;綜合決策模塊,用于根據(jù)所述第一概率決定是否對所述輸入信息進(jìn)行檢索 或發(fā)布;發(fā)布模塊,用于調(diào)用所述第三方信息發(fā)布平臺的數(shù)據(jù)接口,連接互聯(lián)網(wǎng)以將所述輸 入信息發(fā)布到所述第三方信息發(fā)布平臺;檢索模塊,用于根據(jù)所述輸入信息查詢索引庫,并 將查詢結(jié)果返回給所述展示模塊。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)為搜索引擎系統(tǒng)。根據(jù)本發(fā)明之一優(yōu)選實施例,所述使用界面的形式包括TOB頁面、WAP頁面、帶有 搜索插件的瀏覽器與所述WEB頁面的結(jié)合、或帶有搜索插件的瀏覽器與所述WAP頁面的結(jié)口 O根據(jù)本發(fā)明之一優(yōu)選實施例,所述TOB頁面或所述WAP頁面內(nèi)包括搜索框、地址 欄、輸入法框或信息輸入界面。根據(jù)本發(fā)明之一優(yōu)選實施例,所述第三方信息發(fā)布平臺包括微博平臺、社交網(wǎng)絡(luò) 平臺、論壇平臺或電子公告平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述分類器模型是根據(jù)所述歷史數(shù)據(jù)或所述語料數(shù) 據(jù),采用機(jī)器學(xué)習(xí)算法構(gòu)建的。根據(jù)本發(fā)明之一優(yōu)選實施例,所述信息發(fā)布需求包括具體信息發(fā)布需求或通用信 息發(fā)布需求。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)在發(fā)布前由所述展示模塊對用戶進(jìn)行提示 以獲取用戶對所述提示的確認(rèn)信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述展示模塊在對用戶進(jìn)行提示時返回所述檢索模 塊對所述輸入信息的檢索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實施例,所述提示包括多個關(guān)于所述第三方信息發(fā)布平臺的 提示信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述確認(rèn)信息包括對所述第三方信息發(fā)布平臺的選 擇信息或登錄信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述展示模塊在接收到用戶對所述提示的確認(rèn)信息 后,通過所述發(fā)布模塊對所述輸入信息進(jìn)行發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,所述發(fā)布模塊進(jìn)一步用于將所述輸入信息發(fā)布于多 個所述第三方信息發(fā)布平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)進(jìn)一步包括用戶信息獲取模塊,用于獲取 用戶在所述第三方信息發(fā)布平臺中的用戶信息,以得到所述輸入信息具有所述信息發(fā)布需 求的第二概率,其中所述第二概率用于描述所述輸入信息基于用戶信息特征角度的具有信 息發(fā)布需求的可能性;所述綜合決策模塊利用所述第一概率與所述第二概率,決定是否對 所述輸入信息進(jìn)行檢索或發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,所述用戶信息包括用戶的帳號信息或用戶的使用頻
率信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述用戶信息的獲取方式包括檢驗用戶在所述第三 方信息發(fā)布平臺的在線狀態(tài)、調(diào)用用戶在所述第三方信息發(fā)布平臺的帳號的使用記錄或接 收用戶在所述展示模塊的輸入。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)進(jìn)一步包括用戶行為分析模塊,用于分析 用戶以往的行為,以得到所述輸入信息具有所述信息發(fā)布需求的第三概率,其中所述第三 概率用于描述所述輸入信息基于用戶歷史行為特征角度的具有所述信息發(fā)布需求的可能 性;所述綜合決策模塊利用所述第一概率與所述第三概率,決定是否對所述輸入信息進(jìn)行 檢索或發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)進(jìn)一步包括高級語法挖掘模塊,用于對 互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提取用戶描述所述第三方信息發(fā)布平臺的關(guān)鍵 詞,并對所述關(guān)鍵詞進(jìn)行語義擴(kuò)展,生成針對所述第三方信息發(fā)布平臺的描述詞語庫;高級
7語法匹配模塊,用于根據(jù)所述描述詞語庫對所述輸入信息進(jìn)行匹配驗證,以判斷用戶使用 高級語法的第四概率,當(dāng)所述第四概率大于第一閾值時,所述高級語法匹配模塊進(jìn)一步將 所述輸入信息分解為內(nèi)容部分與語法部分,并將所述內(nèi)容部分與所述第四概率傳遞給所述 信息分析模塊,當(dāng)所述第四概率不大于第一閾值時,所述高級語法匹配模塊進(jìn)一步將所述 輸入信息直接傳遞給所述信息分析模塊;所述信息分析模塊利用所述高級語法匹配模塊傳 遞的數(shù)據(jù)及所述分類器模型,輸出所述第一概率。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)進(jìn)一步包括用戶配置模塊,用于根據(jù)用戶 的選擇為所述系統(tǒng)配置默認(rèn)的行為模式,所述默認(rèn)的行為模式包括默認(rèn)為搜索或默認(rèn)為發(fā) 布,其中當(dāng)系統(tǒng)被配置成所述默認(rèn)為搜索時,系統(tǒng)只執(zhí)行檢索不執(zhí)行發(fā)布,系統(tǒng)被配置成所 述默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布不執(zhí)行檢索;用戶配置識別模塊,用于識別用戶配置信 息,并根據(jù)所述用戶配置信息對所述輸入信息進(jìn)行檢索或發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,所述系統(tǒng)在發(fā)布前由所述展示模塊對用戶進(jìn)行提示 以獲取用戶對所述提示的確認(rèn)信息。本發(fā)明還提供了一種信息發(fā)布方法,包括步驟a.接收用戶輸入信息;b.根據(jù)分 類器模型對所述輸入信息進(jìn)行分析,以得到所述輸入信息具有信息發(fā)布需求的第一概率, 所述第一概率用于描述所述輸入信息基于語義特征角度的具有所述信息發(fā)布需求的可能 性;c.根據(jù)所述第一概率對所述輸入信息進(jìn)行檢索或?qū)⑺鲚斎胄畔l(fā)布到第三方信息 發(fā)布平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟a中從搜索引擎的使用界面接收用戶輸入 fn息ο根據(jù)本發(fā)明之一優(yōu)選實施例,所述使用界面的具體形式包括TOB頁面、WAP頁面、 帶有搜索插件的瀏覽器與所述WEB頁面的結(jié)合、或帶有搜索插件的瀏覽器與所述WAP頁面 的結(jié)合。根據(jù)本發(fā)明之一優(yōu)選實施例,所述TOB頁面或所述WAP頁面內(nèi)包括搜索框、地址 欄、輸入法框或信息輸入界面。根據(jù)本發(fā)明之一優(yōu)選實施例,所述第三方信息發(fā)布平臺包括微博平臺、社交網(wǎng)絡(luò) 平臺、論壇平臺或電子公告平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述分類器模型是根據(jù)線下挖掘的歷史數(shù)據(jù)或所述 第三方信息發(fā)布平臺提供的語料數(shù)據(jù),采用機(jī)器學(xué)習(xí)算法構(gòu)建的。根據(jù)本發(fā)明之一優(yōu)選實施例,所述信息發(fā)布需求包括具體信息發(fā)布需求或通用信 息發(fā)布需求。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟c中,在所述發(fā)布前對用戶進(jìn)行提示以獲 取用戶對所述提示的確認(rèn)信息。根據(jù)本發(fā)明之一優(yōu)選實施例,在對用戶進(jìn)行所述提示時返回對所述輸入信息的檢
索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實施例,所述提示包括多個關(guān)于所述第三方信息發(fā)布平臺的 提示信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述確認(rèn)信息包括對所述第三方信息發(fā)布平臺的選 擇信息或登錄信息。
根據(jù)本發(fā)明之一優(yōu)選實施例,在接收到用戶對所述提示的確認(rèn)信息后,對所述輸 入信息進(jìn)行發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟c中,將所述輸入信息發(fā)布于多個所述第
三方信息發(fā)布平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法在步驟c前進(jìn)一步包括步驟d.獲取用戶 在所述第三方信息發(fā)布平臺中的用戶信息,以得到所述輸入信息具有所述信息發(fā)布需求的 第二概率,其中所述第二概率用于描述所述輸入信息基于用戶信息特征角度的具有所述信 息發(fā)布需求的可能性;所述步驟c中利用所述第一概率與所述第二概率對所述輸入信息進(jìn) 行檢索或?qū)⑺鲚斎胄畔l(fā)布到第三方信息發(fā)布平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述用戶信息包括用戶的帳號信息或用戶的使用頻
率信息。根據(jù)本發(fā)明之一優(yōu)選實施例,所述步驟d中用戶信息的獲取方式包括檢驗用戶在 所述第三方信息發(fā)布平臺的在線狀態(tài)、調(diào)用用戶在所述第三方信息發(fā)布平臺的帳號的使用 記錄或接收用戶在所述展示模塊的輸入。根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法在步驟c前進(jìn)一步包括步驟e.分析用戶 以往的行為,以得到所述輸入信息具有所述信息發(fā)布需求的第三概率,其中所述第三概率 用于描述所述輸入信息基于用戶歷史行為特征角度的具有所述信息發(fā)布需求的可能性;所 述步驟c中利用所述第一概率與所述第三概率對所述輸入信息進(jìn)行檢索或?qū)⑺鲚斎胄?息發(fā)布到第三方信息發(fā)布平臺。根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法在步驟b前進(jìn)一步包括步驟f.根據(jù)描述 詞語庫對所述輸入信息進(jìn)行匹配驗證,以判斷用戶使用高級語法的第四概率,其中所述描 述詞語庫是通過對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提取用戶描述所述第三方信 息發(fā)布平臺的關(guān)鍵詞,并對所述關(guān)鍵詞進(jìn)行語義擴(kuò)展后生成的;當(dāng)所述第四概率大于第一 閾值時,將所述輸入信息分解為內(nèi)容部分與語法部分,所述步驟b利用所述內(nèi)容部分與所 述第四概率及所述分類器模型得到第一概率。根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法在步驟b前進(jìn)一步包括步驟g.識別用戶 配置信息,其中所述用戶配置信息是根據(jù)用戶的選擇為系統(tǒng)配置的默認(rèn)的行為模式,所述 默認(rèn)的行為模式包括默認(rèn)為搜索或默認(rèn)為發(fā)布,其中當(dāng)系統(tǒng)被配置成所述默認(rèn)為搜索時, 系統(tǒng)只執(zhí)行檢索不執(zhí)行發(fā)布,系統(tǒng)被配置成所述默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布不執(zhí)行檢 索;當(dāng)識別出系統(tǒng)具有用戶配置信息時,根據(jù)所述用戶配置信息對所述輸入信息進(jìn)行檢索 或發(fā)布。根據(jù)本發(fā)明之一優(yōu)選實施例,在所述發(fā)布前對用戶進(jìn)行提示以獲取用戶對所述提 示的確認(rèn)信息。由以上技術(shù)方案可以看出,所述系統(tǒng)通過對用戶輸入信息進(jìn)行分析判斷,可以很 好地滿足不同用戶的不同需要,使得所述系統(tǒng)在信息檢索的基礎(chǔ)上具有了信息發(fā)布功能,, 在用戶有不指定特定發(fā)布平臺的信息發(fā)布需求時,所述系統(tǒng)還可以輕易地為用戶在多個信 息發(fā)布平臺上進(jìn)行信息發(fā)布,這不僅大大簡化了信息發(fā)布流程,節(jié)約了用戶的時間,也為用 戶發(fā)布的信息更快更準(zhǔn)確地到達(dá)信息需求方提供了可能。
9
圖1是本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例一的結(jié)構(gòu)示意 框圖;圖2是本發(fā)明實施例中使用界面的一種具體形式的實施例示意圖;圖3是本發(fā)明實施例中使用界面的另一種具體形式的實施例示意圖;圖4是本發(fā)明實施例中使用界面將系統(tǒng)返回的結(jié)果展示給用戶時的一個實施例 示意圖;圖5是本發(fā)明實施例中展示模塊返回的提示中包含多個第三方信息發(fā)布平臺的 提示信息的實施例示意圖;圖6是本發(fā)明實施例中展示模塊返回的提示中包含登錄提示的實施例示意圖;圖7為本發(fā)明實施例中展示模塊返回的提示中包含選擇提示的實施例示意圖;圖8為本發(fā)明實施例中發(fā)布成功后展示模塊返回發(fā)布成功的通知的實施例示意 圖;圖9是本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例二的結(jié)構(gòu)示意 框圖;圖10是本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例三的結(jié)構(gòu)示意 框圖;圖11是本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例四的結(jié)構(gòu)示意 框圖。圖12是本發(fā)明實施例中信息發(fā)布方法的實施例一的流程示意圖;圖13是本發(fā)明實施例中信息發(fā)布方法的實施例二的流程示意圖;圖14是本發(fā)明實施例中信息發(fā)布方法的實施例三的流程示意圖;圖15是本發(fā)明實施例中信息發(fā)布方法的實施例四的流程示意圖。
具體實施方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對 本發(fā)明進(jìn)行詳細(xì)描述。本發(fā)明中具有信息發(fā)布和搜索功能的系統(tǒng),可以是任意的搜索引擎系統(tǒng),或其他 的BS(browser-server)結(jié)構(gòu)或CS(client-server)結(jié)構(gòu)的系統(tǒng)。圖1為本發(fā)明實施例中 具有信息發(fā)布和搜索功能的系統(tǒng)的實施例一的結(jié)構(gòu)示意框圖。如圖1所示,具有信息發(fā)布和搜索功能的系統(tǒng)包括展示模塊101、分類器構(gòu)建模塊 102、信息分析模塊103、綜合決策模塊104、發(fā)布模塊105、檢索模塊106。其中,展示模塊101,用于為用戶提供系統(tǒng)的使用界面,該使用界面可接收用戶的 輸入信息和將搜索引擎返回的處理結(jié)果展示給用戶。如圖2所示,為使用界面的一種具體形式的實施例示意圖。使用界面包括了 WEB 頁面與WAP頁面,其中TOB頁面是符合HTML格式的普通電腦瀏覽器可以識別的網(wǎng)頁文本, WAP頁面是更適用于手機(jī)瀏覽器顯示的網(wǎng)頁文本。如圖3所示,為使用界面的另一種具體形式的實施例示意圖。在該實施例中,使用 界面并不僅僅是一個頁面,而是包含了搜索插件的瀏覽器與頁面的結(jié)合,在瀏覽器的搜索插件的搜索框處,也可以獲取用戶輸入的信息。如圖4所示,為使用界面將系統(tǒng)返回的結(jié)果展示給用戶時的一個實施例示意圖。 在該實施例中,使用界面在搜索的結(jié)果頁面中增加了對用戶發(fā)布信息的引導(dǎo)提示。在上述的TOB頁面或WAP頁面內(nèi),可以包含搜索框、地址欄、輸入法框或信息輸入 界面,其中的信息輸入界面可以用來輸入各種需要發(fā)表的信息,包括微博信息、社交網(wǎng)絡(luò)信 息、論壇信息或電子公告信息等。其中的社交網(wǎng)絡(luò)包括開心網(wǎng),人人網(wǎng)等網(wǎng)站。對于有明確 的信息發(fā)表目的的用戶來說,通過信息輸入的界面,就可以直接輸入信息,通過搜索引擎將 信息發(fā)布出去。分類器構(gòu)建模塊102,用于根據(jù)線下挖掘的歷史數(shù)據(jù)或第三方信息發(fā)布平臺提供 的語料數(shù)據(jù),采用機(jī)器學(xué)習(xí)算法,構(gòu)建分類器模型。所述第三方信息發(fā)布平臺指的是與所述 系統(tǒng)建立了技術(shù)關(guān)聯(lián)的信息發(fā)布平臺系統(tǒng),包括微博平臺、社交網(wǎng)絡(luò)平臺、論壇平臺或電子 公告平臺。線下挖掘的歷史數(shù)據(jù)與第三方信息發(fā)布平臺提供的語料數(shù)據(jù),指的是用戶的 query輸入數(shù)據(jù),是采用機(jī)器學(xué)習(xí)算法構(gòu)建分類器模型時的訓(xùn)練樣本,下面以SVM(支持向 量機(jī))這種機(jī)器學(xué)習(xí)算法為例,對構(gòu)建分類器模型進(jìn)行介紹。SVM的分類原理可概括為尋找一個分類超平面,使得訓(xùn)練樣本中的兩類樣本點 能被分開,并且距離該平面盡可能地遠(yuǎn);而對線性不可分的問題,通過核函數(shù)將低維輸入空 間的數(shù)據(jù)映射到高位空間,從而將原低維空間的線性不可分問題轉(zhuǎn)化為高維空間上的線性 可分問題。對于兩類問題,給定樣本集(Xpyi)^i e Rd, Yi = {1,-1}, i = 1,2,... 1,以及核 函數(shù)K(Xi,Xj) = (Φ (Xi) ·Φ(χ」)),其中Φ是非線性映射函數(shù)。SVM訓(xùn)練出的學(xué)習(xí)機(jī)器為f (x) = (w · Φ (χ) )+b,其中w是權(quán)重,b是偏置。對本發(fā)明而言,樣本集(Xi,Yi)中的Xi是由訓(xùn)練語料(即線下挖掘數(shù)據(jù)或第三方 信息發(fā)布平臺提供的數(shù)據(jù))的特征組成的特征向量,Yi表示兩類問題中的其中一個,如果存 在多類問題,可以把它變?yōu)槎鄠€兩類問題進(jìn)行處理。在本發(fā)明中的類型,指的是信息屬于哪 類發(fā)布需求,包括有發(fā)布平臺一的發(fā)布需求、有發(fā)布平臺二的發(fā)布需求等等。由此可見,要用樣本訓(xùn)練出具有較好分類效果的分類器,也就是得到理想的分類 器權(quán)重w和偏置b,特征選取是個關(guān)鍵因素。在本發(fā)明中,可以采用下述變量作為特征 query中各種標(biāo)點符號的數(shù)量以及位置、query中字符串長度、query的末尾是否為字符、 query是否有特殊字符串、query中數(shù)字的個數(shù)、query中是否有屬于分類詞匯表中的詞語、 query中每個詞的搜索量、query中每個詞由搜索引擎得到的搜索結(jié)果數(shù)等,其中的分類詞 匯表指的是諸如經(jīng)濟(jì)、歷史、天文、地理之類的類別表。需要強調(diào)的是,上述所列的特征僅是為了說明本實施例而列舉,并不代表本發(fā)明 僅限于使用上述特征,任何為了構(gòu)建分類器模型而使用的特征,都不超出本發(fā)明的思想范圍。信息分析模塊103,用于根據(jù)由分類器構(gòu)建模塊102構(gòu)建的分類器模型對用戶輸 入信息進(jìn)行分析,輸出用戶輸入信息具有信息發(fā)布需求的第一概率,其中所述第一概率用 于描述輸入信息基于語義特征角度的具有信息發(fā)布需求的可能性。
所述信息發(fā)布需求包括具體信息發(fā)布需求或通用信息發(fā)布需求。具體信息發(fā)布需 求指的是諸如發(fā)布于微博、SNS等特定的發(fā)布平臺的發(fā)布需求,而通用的信息發(fā)布需求指的 是用戶沒有指定發(fā)布平臺的發(fā)布需求,例如用戶可能想要轉(zhuǎn)讓火車票,或者需要在某個區(qū) 域租一套房子,這些信息發(fā)布需求并不指定特定的發(fā)布平臺,用戶只是希望將此類型的信 息發(fā)布到互聯(lián)網(wǎng)上,只要能被其他用戶看到,那么信息發(fā)布的用戶并不介意信息在哪個平 臺上發(fā)布。信息分析模塊依靠分類器模型,可以對用戶輸入的信息在語義上進(jìn)行分析,判斷 用戶輸入的信息從語義角度考慮,在各種發(fā)布平臺上發(fā)布的第一概率大小。例如用戶輸入 的信息為“求租中關(guān)村三居室一套”,信息分析模塊輸出的結(jié)果為(求租中關(guān)村三居室一 套,Ps^= 0. 9)、(求租中關(guān)村三居室一套,Pws= 0. 7)、(求租中關(guān)村三居室一套,Pm55問答 ttK=0. 2)等等,其中P代表的是第一概率。如果用戶輸入的信息為“哪兒的菜最好吃”,那 么信息分析模塊輸出的結(jié)果為(哪兒的菜最好吃,P⑩=0. 2)、(哪兒的菜最好吃,Pws = 0. 1)、(哪兒的菜最好吃,PMR1Mttg= 0. 1)等等,由于在各個平臺上得到的第一概率都很 小,那么“哪兒的菜最好吃”從語義角度考慮,就很可能不具備信息發(fā)布需求,而有可能是用 戶輸入的查詢信息。另外如果用戶輸入“發(fā)微博”,則表明用戶就是打算要在微博平臺上發(fā) 布信息,相應(yīng)的在微博平臺上的第一概率就非常大,在其他平臺上的第一概率就很小。上述 輸出結(jié)果的數(shù)據(jù)結(jié)構(gòu)僅是為了說明本發(fā)明而采用的示意性描述,在具體實現(xiàn)時可根據(jù)需要 采取其他方式,本發(fā)明對此不作限定。綜合決策模塊104,用于根據(jù)第一概率決定是否對用戶輸入的信息進(jìn)行檢索或發(fā) 布。在判斷出應(yīng)該對輸入信息進(jìn)行發(fā)布時進(jìn)一步包括判斷是否需要在發(fā)布前對用戶進(jìn)行提 示。當(dāng)需要對用戶進(jìn)行提示時,由展示模塊返回對用戶的提示,其中所述的提示可包括一個 或多個關(guān)于第三方信息發(fā)布平臺的提示信息。請參考圖5,圖5為本發(fā)明實施例中展示模塊 返回的提示中包含多個第三方信息發(fā)布平臺的提示信息的實施例示意圖。例如當(dāng)?shù)谝桓怕屎苄r(假設(shè)概率< 閾值一),可以對用戶輸入的信息執(zhí)行普通 搜索引擎的檢索流程,把用戶輸入信息當(dāng)作查詢信息來處理。當(dāng)?shù)谝桓怕饰挥谀硞€區(qū)間時(假設(shè)閾值二<概率<閾值三),則通過展示模塊提 示用戶是否需要發(fā)布信息,例如在搜索結(jié)果頁面提示“在新浪微博發(fā)布這條信息我今天買 了一件衣服”,當(dāng)展示模塊接收到用戶返回的確認(rèn)信息后,就可以對輸入信息進(jìn)行發(fā)布。進(jìn) 一步地,提示可包括登錄提示或第三方信息發(fā)布平臺的選擇提示或在第三方信息發(fā)布平臺 的帳號提示,相應(yīng)的,確認(rèn)信息可包括第三方信息發(fā)布平臺的登錄信息或選擇信息。其中的 登錄信息包括帳號或密碼,選擇信息包括對第三方信息發(fā)布平臺的選擇或?qū)υ诘谌叫畔?發(fā)布平臺上的帳號的選擇。請參考圖6和圖7,其中圖6為本發(fā)明實施例中展示模塊返回的 提示中包含登錄提示的實施例示意圖,圖7為本發(fā)明實施例中展示模塊返回的提示中包含 選擇提示的實施例示意圖。值得注意的是,在對用戶進(jìn)行發(fā)布提示的時候,也可以同時對輸 入信息執(zhí)行檢索操作,將發(fā)布提示與查詢結(jié)果一并返回。當(dāng)?shù)谝桓怕史浅4髸r(假設(shè)概率> 閾值四),系統(tǒng)就直接發(fā)布該條信息。除以上策 略之外,也可以根據(jù)概率的不同,對用戶輸入信息分別執(zhí)行單純的搜索、搜索與發(fā)布提示并 存、單純的發(fā)布提示或直接發(fā)布等操作。另外,在發(fā)布成功后,還可以給用戶返回發(fā)布成功的通知。請參考圖8,圖8為本發(fā)明實施例中發(fā)布成功后展示模塊返回發(fā)布成功的通知的實施例示意圖。發(fā)布模塊105,用于調(diào)用第三方信息發(fā)布平臺的數(shù)據(jù)接口,連接互聯(lián)網(wǎng)以將用戶輸 入的信息發(fā)布到第三方的信息發(fā)布平臺。當(dāng)綜合決策模塊判斷需要對用戶輸入信息進(jìn)行發(fā)布時,綜合決策模塊將調(diào)用發(fā)布 模塊將用戶輸入的信息發(fā)布到第三方信息發(fā)布平臺。此外當(dāng)展示模塊接收到用戶返回的 對發(fā)布提示的確認(rèn)信息時,發(fā)布模塊也會將用戶信息輸入的信息發(fā)布到第三方信息發(fā)布平臺。根據(jù)具體需要的不同,發(fā)布模塊可以將具有某一具體信息發(fā)布需求的信息發(fā)布到 微博、知識問答社區(qū)、社交網(wǎng)絡(luò)之類的發(fā)布平臺,也可以將具有通用信息發(fā)布需求的信息發(fā) 布到諸如58同城之類的分類信息發(fā)布平臺。此外,發(fā)布模塊還可以將用戶輸入的信息發(fā)布 于多個第三方信息發(fā)布平臺。例如用戶想要發(fā)布一條轉(zhuǎn)讓火車票的信息,以往用戶為了盡 快讓更多人找到自己的這條信息,會在多個分類信息發(fā)布平臺上發(fā)布這條信息,但是通過 本發(fā)明,用戶只需要在搜索引擎的搜索框中輸入信息,本發(fā)明的系統(tǒng)就可以自動將該信息 發(fā)布于多個信息發(fā)布平臺,大大簡化了信息發(fā)布流程。檢索模塊106,用于根據(jù)用戶輸入信息查詢索引庫,并將查詢結(jié)果返回給展示模 塊。在用戶的輸入信息沒有發(fā)布需求或者用戶的輸入信息有發(fā)布需求但需要返回發(fā) 布提示的情況下,綜合決策模塊通過調(diào)用檢索模塊,都可實現(xiàn)對輸入信息的檢索。檢索模塊包括查詢子模塊和排序子模塊,與普通的搜索引擎一樣,查詢子模塊用 于根據(jù)用戶輸入信息查詢索引庫,而排序子模塊用于對查詢結(jié)果進(jìn)行排序,并將排序后的 結(jié)果返回。由于檢索模塊的實現(xiàn)技術(shù)與現(xiàn)有技術(shù)相同,在此不再贅述。圖9為本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例二的結(jié)構(gòu)示意 框圖。在本實施例中,具有信息發(fā)布和搜索功能的系統(tǒng)進(jìn)一步還包括用戶信息獲取模塊107 或用戶行為分析模塊108或以上兩個模塊的任意組合。其中用戶信息獲取模塊107,用于獲取用戶在第三方信息發(fā)布平臺中的用戶信息, 以得到輸入信息具有信息發(fā)布需求的第二概率,所述第二概率用于描述輸入信息基于用戶 信息特征角度的具有信息發(fā)布需求的可能性。用戶在第三方信息發(fā)布平臺中的用戶信息, 包括用戶的帳號信息或用戶的使用頻率信息,其中帳號信息指用戶是否在第三方信息發(fā)布 平臺具有帳號及帳號是什么,使用頻率信息指哪一個第三方信息發(fā)布平臺是用戶的常用平 臺。用戶信息獲取模塊可以通過用戶的cookie數(shù)據(jù)或用戶的IP地址或電腦的MAC地 址等多種方式向多個第三方信息發(fā)布平臺進(jìn)行輪詢,得到用戶在第三方信息發(fā)布平臺的用 戶信息。用戶信息獲取的方式還包括檢驗用戶在第三方信息發(fā)布平臺的在線狀態(tài)、調(diào)用用 戶在第三方信息發(fā)布平臺的帳號的使用記錄或接收用戶在展示模塊的輸入。例如在展示模 塊,提供用戶登錄微博的帳號和密碼窗口,由用戶自行在窗口輸入信息。由于有了第二概率,因此在一個實施例中,綜合決策模塊根據(jù)第一概率決定是否 對輸入信息進(jìn)行檢索或發(fā)布時的具體實施方式
為利用第一概率與第二概率決定是否對輸 入信息進(jìn)行檢索或發(fā)布,具體可采用為第一概率與第二概率預(yù)置權(quán)重的方式,來決定最終 的判斷邏輯。
用戶行為分析模塊108,用于分析用戶以往的行為,以得到輸入信息具有信息發(fā)布 需求的第三概率,該第三概率用于描述輸入信息基于用戶歷史行為特征角度的具有信息發(fā) 布需求的可能性。用戶過去的行為對推導(dǎo)用戶當(dāng)前行為意圖具有指導(dǎo)作用。如果用戶常常用同一種 語言方式發(fā)布信息,那么當(dāng)用戶仍以這種語言方式輸入信息時,就較有可能是為了發(fā)布信 息。用戶以往的行為包括其在搜索引擎、微博、論壇、博客等平臺上的行為,表現(xiàn)為語言方 式、行為習(xí)慣(如常向別人提問還是?;卮饎e人的問題)等。用戶行為分析模塊采用的技術(shù)手段包括數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),即通過用戶日志, 挖掘出用戶的行為數(shù)據(jù)作為訓(xùn)練樣本,由特征選擇算法及機(jī)器學(xué)習(xí)方法,對用戶的行為進(jìn) 行分類并輸出第三概率。由于有了第三概率,在一個實施例中,綜合決策模塊根據(jù)第一概率決定是否對輸 入信息進(jìn)行檢索或發(fā)布時的具體實施方式
為利用第一概率與第三概率決定是否對輸入信 息進(jìn)行檢索或發(fā)布,具體可采用為第一概率與第三概率預(yù)置權(quán)重的方式,來決定最終的判 斷邏輯。圖10為本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例三的結(jié)構(gòu)示意 框圖。在本實施例中,具有信息發(fā)布和搜索功能的系統(tǒng)進(jìn)一步還包括高級語法挖掘模塊109 與高級語法匹配模塊110。其中高級語法挖掘模塊109,用于對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提 取用戶描述第三方信息發(fā)布平臺的關(guān)鍵詞,并對關(guān)鍵詞進(jìn)行語義擴(kuò)展,生成針對第三方信 息發(fā)布平臺的描述詞語庫。例如,微博平臺通常被稱為圍脖,可以由微博擴(kuò)展出“wb ”或“圍脖”作為對微 博第三方信息發(fā)布平臺的描述詞語。常用的數(shù)據(jù)挖掘方法包括神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、決策樹方法、粗集方法、統(tǒng)計 分析方法、模糊集方法等,由于這些都屬于現(xiàn)有技術(shù),在此不再進(jìn)行詳細(xì)描述。高級語法匹配模塊110,用于根據(jù)描述詞語庫對輸入信息進(jìn)行匹配驗證,以判斷用 戶使用高級語法的第四概率,當(dāng)?shù)谒母怕蚀笥陂撝礨時,將輸入信息分解為內(nèi)容部分及語 法部分,并將內(nèi)容部分及第四概率傳遞給信息分析模塊,當(dāng)?shù)谒母怕什淮笥陂撝礨時,直接 將輸入信息傳遞給信息分析模塊。所謂的高級語法,指的是符合描述詞語庫寫法的信息輸 入方式,例如輸入信息為“wb 今天釣到一條很大的魚”,就使用了高級語法。在高級語法匹配模塊中,進(jìn)一步包括驗證單元與分解單元,其中驗證單元用于根 據(jù)預(yù)先定義的策略對輸入信息進(jìn)行匹配驗證,并產(chǎn)生相應(yīng)的用戶使用高級語法的第四概 率,分解單元用于將第四概率大于閾值χ的信息分解為內(nèi)容部分和語法部分。例如用戶輸入“wb 今天釣到一條很大的魚”,驗證單元根據(jù)預(yù)先定義的策略對輸 入信息進(jìn)行掃描以得到第四概率,例如一種策略為在輸入信息的開頭掃描到完全符合描述 詞語庫中的描述詞語時,第四概率為0. 9。假設(shè)閾值X為0. 5,由于第四概率大于閾值X,則 分解單元會將“wb 今天釣到一條很大的魚”分解為“wb ”和“今天釣到一條很大的魚”,其 中“wb ”為語法部分,“今天釣到一條很大的魚”為內(nèi)容部分。高級語法匹配模塊不僅會輸出分解后的內(nèi)容部分,還會輸出用戶使用高級語法的 第四概率。驗證單元在匹配驗證時,根據(jù)不同的策略,可以得到不同的使用高級語法第四
14概率,例如用戶輸入信息的開頭部分完全匹配描述詞語庫中的描述詞語時,得到第四概率 為0.9 ;用戶輸入信息的開頭部分不完全匹配描述詞語庫中的描述詞語時,得到第四概率 為0. 5 ;用戶輸入信息的中間部分匹配描述詞語庫中的描述詞語時,得到第四概率為0. 3等寸。在本實施例中,高級語法匹配模塊輸出的內(nèi)容部分與第四概率將傳遞到信息分析 模塊,用以為信息分析模塊計算第一概率提供更多的依據(jù)。信息分析模塊根據(jù)分類器模型 輸出第一概率的具體實施方式
為利用高級語法匹配模塊傳遞的數(shù)據(jù)及分類器模型輸出第 一概率,可采用預(yù)置策略實現(xiàn),例如第四概率很大,說明用戶使用高級語法的可能性很大, 相應(yīng)地,用戶想要發(fā)布信息的可能性也就很大,第一概率也就很大。圖11為本發(fā)明實施例中具有信息發(fā)布和搜索功能的系統(tǒng)的實施例四的結(jié)構(gòu)示意 框圖。在本實施例中,具有信息發(fā)布和搜索功能的系統(tǒng)進(jìn)一步包括用戶配置模塊111和用 戶配置識別模塊112。其中,用戶配置模塊111,用于根據(jù)用戶的選擇為搜索引擎系統(tǒng)配置默認(rèn)的行為模 式。默認(rèn)的行為模式包括默認(rèn)為搜索或默認(rèn)為發(fā)布,其中當(dāng)系統(tǒng)被配置成默認(rèn)為搜索時,系 統(tǒng)只執(zhí)行檢索不執(zhí)行發(fā)布;當(dāng)系統(tǒng)被配置成默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布不執(zhí)行檢索。默認(rèn)為搜索或默認(rèn)為發(fā)布可以進(jìn)一步分為更細(xì)化的配置,例如默認(rèn)為發(fā)布時,又 可以配置為每次接收到用戶輸入的信息,都通過發(fā)布模塊直接發(fā)布或通過展示模塊向用戶 顯示發(fā)布信息前的提示,或者是配置為發(fā)布到某個特定的平臺等等。用戶配置識別模塊112,用于識別用戶配置信息,并根據(jù)用戶配置信息對輸入信息 進(jìn)行搜索發(fā)布,其中在發(fā)布前還可由展示模塊對用戶進(jìn)行提示以獲取用戶對提示的確認(rèn)信 肩、O系統(tǒng)如果識別出用戶配置為默認(rèn)搜索,則將用戶輸入信息都當(dāng)作查詢信息看待, 對輸入信息發(fā)出搜索請求;系統(tǒng)如果識別出用戶配置為默認(rèn)發(fā)布,則根據(jù)進(jìn)一步細(xì)化的配 置,判斷是直接發(fā)布的配置還是在發(fā)布前進(jìn)行提示的配置。如果是直接發(fā)布配置,則對用戶 輸入信息發(fā)出直接發(fā)布的請求,否則就對輸入信息發(fā)出在發(fā)布前對用戶進(jìn)行提示的請求, 當(dāng)接收到用戶的確認(rèn)信息時,就可以對輸入信息進(jìn)行發(fā)布。例如,用戶配置為將輸入信息直 接發(fā)布到新浪微博,這說明用戶使用本發(fā)明的搜索引擎系統(tǒng),是有特定目的的,用戶自己本 身非常明確這種目的,在這種情況下,只要按照用戶配置進(jìn)行相應(yīng)的處理,就能夠很好地滿 足用戶需要了,因此沒有必要再讓搜索引擎執(zhí)行其他的操作。如果用戶識別模塊識別的結(jié)果是用戶并未進(jìn)行任何配置,則將用戶輸入信息輸出 至下一個處理模塊。圖12為本發(fā)明實施例中信息發(fā)布方法的實施例一的流程示意圖。在本實施例中, 信息發(fā)布方法包括步驟201 接收用戶輸入信息。在一種方式下,是從搜索引擎的使用界面 接收用戶輸入信息,其中搜索引擎的使用界面包括了 WEB頁面、WAP頁面、帶有搜索插件的 瀏覽器與WEB頁面的結(jié)合、或帶有搜索插件的瀏覽器與WAP頁面的結(jié)合。在上述的WEB頁 面或WAP頁面內(nèi),可以包含搜索框、地址欄、輸入法框或信息輸入界面,其中的信息輸入界 面可以用來輸入各種需要發(fā)表的信息,包括微博信息、社交網(wǎng)絡(luò)信息、論壇信息或電子公告 信息等。接收用戶輸入信息是進(jìn)行后續(xù)處理的前提。步驟202 根據(jù)分類器模型對用戶輸入信息進(jìn)行分析,以得到輸入信息具有信息發(fā)布需求的第一概率,其中第一概率用于描述輸入信息基于語義特征角度的具有信息發(fā)布 需求的可能性。分類器模型是根據(jù)線下挖掘的歷史數(shù)據(jù)或第三方信息發(fā)布平臺提供的語料數(shù)據(jù), 采用機(jī)器學(xué)習(xí)算法進(jìn)行構(gòu)建的。線下挖掘的歷史數(shù)據(jù)與第三方信息發(fā)布平臺提供的語料數(shù) 據(jù),指的是用戶的query輸入數(shù)據(jù),是采用機(jī)器學(xué)習(xí)算法構(gòu)建分類器模型時的訓(xùn)練樣本,下 面以SVM(支持向量機(jī))這種機(jī)器學(xué)習(xí)算法為例,對構(gòu)建分類器模型進(jìn)行介紹。SVM的分類原理可概括為尋找一個分類超平面,使得訓(xùn)練樣本中的兩類樣本點 能被分開,并且距離該平面盡可能地遠(yuǎn);而對線性不可分的問題,通過核函數(shù)將低維輸入空 間的數(shù)據(jù)映射到高位空間,從而將原低維空間的線性不可分問題轉(zhuǎn)化為高維空間上的線性 可分問題。對于兩類問題,給定樣本集(X^yi)jXi e Rd, Yi = {1,-1}, i = 1,2,... 1,以及核 函數(shù)K(Xi,Xj) = (Φ (Xi) ·Φ(χ」)),其中Φ是非線性映射函數(shù)。SVM訓(xùn)練出的學(xué)習(xí)機(jī)器為f (x) = (w · Φ (χ) )+b,其中w是權(quán)重,b是偏置。對本發(fā)明而言,樣本集(Xi,Yi)中的Xi是由訓(xùn)練語料(即線下挖掘數(shù)據(jù)或第三方 信息發(fā)布平臺提供的數(shù)據(jù))的特征組成的特征向量,Yi表示兩類問題中的其中一個,如果存 在多類問題,可以把它變?yōu)槎鄠€兩類問題進(jìn)行處理。在本發(fā)明中的類型,指的是信息屬于哪 類發(fā)布需求,包括有發(fā)布平臺一的發(fā)布需求、有發(fā)布平臺二的發(fā)布需求等等。由此可見,要用樣本訓(xùn)練出具有較好分類效果的分類器,也就是得到理想的分類 器權(quán)重w和偏置b,特征選取是個關(guān)鍵因素。在本發(fā)明中,可以采用下述變量作為特征 query中各種標(biāo)點符號的數(shù)量以及位置、query中字符串長度、query的末尾是否為字符、 query是否有特殊字符串、query中數(shù)字的個數(shù)、query中是否有屬于分類詞匯表中的詞語、 query中每個詞的搜索量、query中每個詞由搜索引擎得到的搜索結(jié)果數(shù)等,其中的分類詞 匯表指的是諸如經(jīng)濟(jì)、歷史、天文、地理之類的類別表。信息發(fā)布需求包括具體信息發(fā)布需求或通用信息發(fā)布需求,其中具體信息發(fā)布需 求指的是諸如發(fā)布于微博、SNS等特定的發(fā)布平臺的發(fā)布需求,而通用的信息發(fā)布需求指的 是用戶沒有指定發(fā)布平臺的發(fā)布需求,例如用戶可能想要轉(zhuǎn)讓火車票,或者需要在某個區(qū) 域租一套房子,這些信息發(fā)布需求并不指定特定的發(fā)布平臺,用戶只是希望將此類型的信 息發(fā)布到互聯(lián)網(wǎng)上,只要能被其他用戶看到,那么信息發(fā)布的用戶并不介意信息在哪個平 臺上發(fā)布。依靠分類器模型,可以對用戶輸入的信息在語義上進(jìn)行分析,判斷用戶輸入的信 息從語義角度考慮,在各種發(fā)布平臺上發(fā)布的第一概率大小。例如用戶輸入的信息為“求 租中關(guān)村三居室一套”,分析的結(jié)果為(求租中關(guān)村三居室一套,Pgg= 0.9)、(求租中關(guān)村 三居室一套,Pws= 0. 7)、(求租中關(guān)村三居室一套,Ptowinmttg= 0. 2)等等,其中P代表的 是第一概率。如果用戶輸入的信息為“哪兒的菜最好吃”,那么信息分析模塊輸出的結(jié)果為 (哪兒的菜最好吃,0. 2)、(哪兒的菜最好吃,Pttw= 0. 1),(哪兒的菜最好吃,Ptowfn^ ttK= 0. 1)等等,由于在各個平臺上得到的第一概率都很小,那么“哪兒的菜最好吃”從語義 角度考慮,就很可能不具備信息發(fā)布需求,而有可能是用戶輸入的查詢信息。另外如果用戶 輸入“發(fā)微博”,則表明用戶就是打算要在微博平臺上發(fā)布信息,相應(yīng)的在微博平臺上的第一概率就非常大,在其他平臺上的第一概率就很小。上述結(jié)果的數(shù)據(jù)結(jié)構(gòu)僅是為了說明本 發(fā)明而采用的示意性描述,在具體實現(xiàn)時可根據(jù)需要采取其他方式,本發(fā)明對此不作限定。
步驟203 根據(jù)第一概率對輸入信息進(jìn)行檢索或?qū)⑤斎胄畔l(fā)布到第三方信息發(fā) 布平臺。其中將所述輸入信息發(fā)布到第三方信息發(fā)布平臺進(jìn)一步包括在發(fā)布前對用戶進(jìn)行 發(fā)布提示。所述提示可包括一個或多個關(guān)于第三方信息發(fā)布平臺的提示信息。根據(jù)第一概 率的不同,可以預(yù)先設(shè)置一系列的策略對用戶輸入信息執(zhí)行檢索還是發(fā)布進(jìn)行判斷。例如當(dāng)?shù)谝桓怕屎苄r(假設(shè)概率< 閾值一),可以對用戶輸入的信息執(zhí)行普通 搜索引擎的檢索流程,把用戶輸入信息當(dāng)作查詢信息來處理。當(dāng)?shù)谝桓怕饰挥谀硞€區(qū)間時(假設(shè)閾值二<概率<閾值三),提示用戶是否需要 發(fā)布信息,例如在搜索結(jié)果頁面提示“在新浪微博發(fā)布這條信息我今天買了一件衣服”,當(dāng) 接收到用戶返回的確認(rèn)信息后,就可以對輸入信息進(jìn)行發(fā)布。進(jìn)一步地,提示可包括登錄提 示或第三方信息發(fā)布平臺的選擇提示或在第三方信息發(fā)布平臺的帳號提示,相應(yīng)的,確認(rèn) 信息可包括第三方信息發(fā)布平臺的登錄信息或選擇信息。其中的登錄信息包括帳號或密 碼,選擇信息包括對第三方信息發(fā)布平臺的選擇或?qū)υ诘谌叫畔l(fā)布平臺上的帳號的選 擇。值得注意的是,在對用戶進(jìn)行發(fā)布提示的時候,也可以同時對輸入信息執(zhí)行檢索操作, 將發(fā)布提示與查詢結(jié)果一并返回。當(dāng)?shù)诙怕史浅4髸r(假設(shè)概率> 閾值四),系統(tǒng)就直接發(fā)布該條信息。在發(fā)布成 功后,還可以給用戶返回發(fā)布成功的通知。除了這種策略之外,也可以根據(jù)概率的不同,對 用戶輸入信息分別執(zhí)行單純的搜索、搜索與發(fā)布提示并存、單純的發(fā)布提示或直接發(fā)布等 操作。當(dāng)需要對用戶輸入信息進(jìn)行發(fā)布時,通過調(diào)用第三方信息發(fā)布平臺的數(shù)據(jù)接口, 就可以將用戶輸入的信息發(fā)布到第三方信息發(fā)布平臺。根據(jù)具體需要的不同,可以將具有 某一具體信息發(fā)布需求的信息發(fā)布到微博、知識問答社區(qū)、社交網(wǎng)絡(luò)之類的發(fā)布平臺,也可 以將具有通用信息發(fā)布需求的信息發(fā)布到諸如58同城之類的分類信息發(fā)布平臺。此外,本 發(fā)明的方法還可以將用戶輸入的信息發(fā)布于多個第三方信息發(fā)布平臺。例如用戶想要發(fā)布 一條轉(zhuǎn)讓火車票的信息,以往用戶為了盡快讓更多人找到自己的這條信息,會在多個分類 信息發(fā)布平臺上發(fā)布這條信息,但是通過本發(fā)明的方法,用戶只需要在搜索引擎的搜索框 中輸入信息,就可以實現(xiàn)將該信息發(fā)布于多個信息發(fā)布平臺的目的,大大簡化了信息發(fā)布 流程。當(dāng)需要對用戶輸入信息進(jìn)行檢索時,可以執(zhí)行普通搜索引擎的檢索流程,這里不 再詳細(xì)描述。圖13為本發(fā)明實施例中信息發(fā)布方法的實施例二的流程示意圖。請參考圖13,在 本實施例中,步驟301、302分別與實施例一中的步驟201、202、相同,在此不再贅述。步驟303 獲取用戶在第三方信息發(fā)布平臺中的用戶信息,以得到輸入信息具有 信息發(fā)布需求的第二概率,或分析用戶以往的行為,以得到輸入信息具有信息發(fā)布需求的 第三概率,其中第二概率用于描述輸入信息基于用戶信息特征角度的具有信息發(fā)布需求的 可能性,第三概率用于描述輸入信息基于用戶歷史行為特征角度的具有信息發(fā)布需求的可 能性。用戶在第三方信息發(fā)布平臺中的用戶信息,包括用戶的帳號信息或用戶的使用頻
17率信息,其中帳號信息指用戶是否在第三方信息發(fā)布平臺具有帳號及帳號是什么,使用頻 率信息指哪一個第三方信息發(fā)布平臺是用戶的常用平臺。通過用戶的cookie數(shù)據(jù)或用戶 的IP地址或電腦的MAC地址等多種方式向多個第三方信息發(fā)布平臺進(jìn)行輪詢,就得到用戶 在第三方信息發(fā)布平臺的用戶信息。用戶信息獲取的方式還包括檢驗用戶在第三方信息 發(fā)布平臺的在線狀態(tài)、調(diào)用用戶在第三方信息發(fā)布平臺的帳號的使用記錄或由用戶自行輸 入。用戶過去的行為對推導(dǎo)用戶當(dāng)前行為意圖具有指導(dǎo)作用。如果用戶常常用同一種 語言方式發(fā)布信息,那么當(dāng)用戶仍以這種語言方式輸入信息時,就較有可能是為了發(fā)布信 息。用戶以往的行為包括其在搜索引擎、微博、論壇、博客等平臺上的行為,表現(xiàn)為語言方 式、行為習(xí)慣(如常向別人提問還是?;卮饎e人的問題)等。對用戶行為進(jìn)行分析,采用的技術(shù)手段包括數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),即通過用戶日 志,挖掘出用戶的行為數(shù)據(jù)作為訓(xùn)練樣本,由特征選擇算法及機(jī)器學(xué)習(xí)方法,對用戶的行為 進(jìn)行分類并輸出第三概率。步驟304 利用第一概率與第二概率或利用第一概率與第三概率對輸入信息進(jìn)行 檢索或?qū)⑤斎胄畔l(fā)布到三方信息發(fā)布平臺。由于有了第二、第三概率,在步驟304中根據(jù)第一概率對輸入信息進(jìn)行檢索或?qū)?輸入信息發(fā)布到第三方信息發(fā)布平臺的具體實施方式
為利用第一概率與第二概率、第三概 率的任意組合對輸入信息進(jìn)行檢索或?qū)⑤斎胄畔l(fā)布到第三方信息發(fā)布平臺,具體可采用 為各個概率預(yù)置權(quán)重的方式,來決定最終的判斷邏輯。圖14為本發(fā)明實施例中信息發(fā)布方法的實施例三的流程示意圖。請參考圖14, 在本實施例中,步驟401、404、405分別與實施例二中的步驟301、303、304相同,在此不再贅 述。步驟402 根據(jù)描述詞語庫對用戶輸入信息進(jìn)行匹配驗證,以判斷用戶使用高級 語法的第四概率。其中所述描述詞語庫是通過對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提取用 戶描述所述第三方信息發(fā)布平臺的關(guān)鍵詞,并對關(guān)鍵詞進(jìn)行語義擴(kuò)展后生成的。例如,微博 平臺通常被稱為圍脖,可以由微博擴(kuò)展出“wb: ”或“圍脖”作為對微博第三方信息發(fā)布 平臺的描述詞語。常用的數(shù)據(jù)挖掘方法包括神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、決策樹方法、粗集方 法、統(tǒng)計分析方法、模糊集方法等,由于這些都屬于現(xiàn)有技術(shù),在此不再進(jìn)行詳細(xì)描述。所謂 的高級語法,指的是符合描述詞語庫寫法的信息輸入方式,例如輸入信息為“wb 今天釣到 一條很大的魚”就使用了高級語法。對用戶輸入信息進(jìn)行匹配驗證可以根據(jù)預(yù)先定義的策略進(jìn)行。例如用戶輸入信息 的開頭部分完全匹配描述詞語庫中的描述詞語時,得到第四概率為0.9;用戶輸入信息的 開頭部分不完全匹配描述詞語庫中的描述詞語時,得到第四概率為0.5 ;用戶輸入信息的 中間部分匹配描述詞語庫中的描述詞語時,得到第四概率為0. 3等等。更進(jìn)一步的,在第四概率大于閾值X時,步驟402進(jìn)一步包括步驟4021 將用戶輸 入信息分解為內(nèi)容部分與語法部分。例如用戶輸入“wb 今天釣到一條很大的魚”,得到第四 概率為0. 9。假設(shè)閾值X為0. 5,由于第四概率大于閾值X,則步驟4021會將“wb 今天釣到 一條很大的魚”分解為“wb: ”和“今天釣到一條很大的魚”,其中“wb: ”為語法部分,“今天釣到一條很大的魚”為內(nèi)容部分。步驟403根據(jù)第四概率的不同,可以執(zhí)行兩條分支,當(dāng)?shù)谒母怕什淮笥诘谝婚撝?時,步驟403利用分類器模型對輸入信息進(jìn)行分析,以得到輸入信息具有信息發(fā)布需求的 第一概率;當(dāng)?shù)谒母怕蚀笥诘谝婚撝禃r,步驟403'利用內(nèi)容部分與第四概率及分類器模 型對輸入信息進(jìn)行分析,以得到輸入信息具有信息發(fā)布需求的第一概率,這是因為在第四 概率比較大時,把第四概率也作為計算第一概率的一個依據(jù),可以有效地提高第一概率的 置信度。圖15為本發(fā)明實施例中信息發(fā)布方法的實施例四的流程示意圖。請參考圖15,在 本實施中,步驟501、503、5031、504(504' )、505、506與實施例三中的步驟401、402、4021、 403(403' )、404、405相同,在此不再贅述。步驟502 識別用戶配置信息,其中用戶配置信息是根據(jù)用戶的選擇為系統(tǒng)配置 的默認(rèn)的行為方式。默認(rèn)的行為模式包括默認(rèn)為搜索或默認(rèn)為發(fā)布,其中當(dāng)系統(tǒng)被配置成默認(rèn)為搜索 時,系統(tǒng)只執(zhí)行檢索不執(zhí)行發(fā)布;當(dāng)系統(tǒng)被配置成默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布不執(zhí)行檢 索。默認(rèn)為搜索或默認(rèn)為發(fā)布可以進(jìn)一步分為更細(xì)化的配置,例如默認(rèn)為發(fā)布時,又可以配 置為每次接收到用戶輸入的信息,都直接發(fā)布或顯示發(fā)布信息前的提示,或者是配置為發(fā) 布到某個特定的平臺等等。更進(jìn)一步地,當(dāng)識別出系統(tǒng)具有用戶配置信息時,步驟502進(jìn)一步包括步驟5021 根據(jù)用戶的配置信息對用戶輸入信息進(jìn)行檢索或發(fā)布。在發(fā)布前還可對用戶進(jìn)行提示以獲 取用戶對所述提示的確認(rèn)信息。例如用戶配置為對每次接收到的用戶輸入信息,都直接發(fā) 布到新浪微博,這說明用戶發(fā)布信息的目的非常明確,在這種情況下,只要按照用戶配置進(jìn) 行相應(yīng)的處理,就能夠很好地滿足用戶需要了,因此沒有必要再執(zhí)行其他的操作。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
19
權(quán)利要求
1.一種具有信息發(fā)布和搜索功能的系統(tǒng),其特征在于,所述系統(tǒng)包括展示模塊,用于為用戶提供所述系統(tǒng)的使用界面,所述使用界面用于接收用戶的輸入 信息和將所述系統(tǒng)的處理結(jié)果展示給用戶;分類器構(gòu)建模塊,用于根據(jù)線下挖掘的歷史數(shù)據(jù)或第三方信息發(fā)布平臺提供的語料數(shù) 據(jù),構(gòu)建分類器模型;信息分析模塊,用于根據(jù)所述分類器模型對所述輸入信息進(jìn)行分析,輸出所述輸入信 息具有信息發(fā)布需求的第一概率,所述第一概率用于描述所述輸入信息基于語義特征角度 的具有所述信息發(fā)布需求的可能性;綜合決策模塊,用于根據(jù)所述第一概率決定是否對所述輸入信息進(jìn)行檢索或發(fā)布;發(fā)布模塊,用于調(diào)用所述第三方信息發(fā)布平臺的數(shù)據(jù)接口,連接互聯(lián)網(wǎng)以將所述輸入 信息發(fā)布到所述第三方信息發(fā)布平臺;檢索模塊,用于根據(jù)所述輸入信息查詢索引庫,并將查詢結(jié)果返回給所述展示模塊。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)為搜索引擎系統(tǒng)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述使用界面的形式包括WEB頁面、WAP 頁面、帶有搜索插件的瀏覽器與所述WEB頁面的結(jié)合、或帶有搜索插件的瀏覽器與所述WAP 頁面的結(jié)合。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,所述WEB頁面或所述WAP頁面內(nèi)包括搜索 框、地址欄、輸入法框或信息輸入界面。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述第三方信息發(fā)布平臺包括微博平臺、 社交網(wǎng)絡(luò)平臺、論壇平臺或電子公告平臺。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述分類器模型是根據(jù)所述歷史數(shù)據(jù)或 所述語料數(shù)據(jù),采用機(jī)器學(xué)習(xí)算法構(gòu)建的。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述信息發(fā)布需求包括具體信息發(fā)布需 求或通用信息發(fā)布需求。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)在發(fā)布前由所述展示模塊對用 戶進(jìn)行提示以獲取用戶對所述提示的確認(rèn)信息。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述展示模塊在對用戶進(jìn)行提示時返回 所述檢索模塊對所述輸入信息的檢索結(jié)果。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述提示包括多個關(guān)于所述第三方信息 發(fā)布平臺的提示信息。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述確認(rèn)信息包括對所述第三方信息發(fā) 布平臺的選擇信息或登錄信息。
12.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述展示模塊在接收到用戶對所述提示 的確認(rèn)信息后,所述發(fā)布模塊對所述輸入信息進(jìn)行發(fā)布。
13.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述發(fā)布模塊進(jìn)一步用于將所述輸入信 息發(fā)布于多個所述第三方信息發(fā)布平臺。
14.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括用戶信息獲取模 塊,用于獲取用戶在所述第三方信息發(fā)布平臺中的用戶信息,以得到所述輸入信息具有所 述信息發(fā)布需求的第二概率,其中所述第二概率用于描述所述輸入信息基于用戶信息特征角度的具有信息發(fā)布需求的可能性;所述綜合決策模塊利用所述第一概率與所述第二概 率,決定是否對所述輸入信息進(jìn)行檢索或發(fā)布。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述用戶信息包括用戶的帳號信息或 用戶的使用頻率信息。
16.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述用戶信息的獲取方式包括檢驗用 戶在所述第三方信息發(fā)布平臺的在線狀態(tài)、調(diào)用用戶在所述第三方信息發(fā)布平臺的帳號的 使用記錄或接收用戶在所述展示模塊的輸入。
17.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括用戶行為分析模 塊,用于分析用戶以往的行為,以得到所述輸入信息具有所述信息發(fā)布需求的第三概率,其 中所述第三概率用于描述所述輸入信息基于用戶歷史行為特征角度的具有所述信息發(fā)布 需求的可能性;所述綜合決策模塊利用所述第一概率與所述第三概率,決定是否對所述輸 入信息進(jìn)行檢索或發(fā)布。
18.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括高級語法挖掘模塊,用于對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提取用戶描述 所述第三方信息發(fā)布平臺的關(guān)鍵詞,并對所述關(guān)鍵詞進(jìn)行語義擴(kuò)展,生成針對所述第三方 信息發(fā)布平臺的描述詞語庫;高級語法匹配模塊,用于根據(jù)所述描述詞語庫對所述輸入信息進(jìn)行匹配驗證,以判斷 用戶使用高級語法的第四概率,當(dāng)所述第四概率大于第一閾值時,所述高級語法匹配模塊 進(jìn)一步將所述輸入信息分解為內(nèi)容部分與語法部分,并將所述內(nèi)容部分與所述第四概率傳 遞給所述信息分析模塊,當(dāng)所述第四概率不大于第一閾值時,所述高級語法匹配模塊進(jìn)一 步將所述輸入信息直接傳遞給所述信息分析模塊;所述信息分析模塊利用所述高級語法匹 配模塊傳遞的數(shù)據(jù)及所述分類器模型,輸出所述第一概率。
19.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括用戶配置模塊,用于根據(jù)用戶的選擇為所述系統(tǒng)配置默認(rèn)的行為模式,所述默認(rèn)的行 為模式包括默認(rèn)為搜索或默認(rèn)為發(fā)布,其中當(dāng)系統(tǒng)被配置成所述默認(rèn)為搜索時,系統(tǒng)只執(zhí) 行檢索不執(zhí)行發(fā)布,系統(tǒng)被配置成所述默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布不執(zhí)行檢索;用戶配置識別模塊,用于識別用戶配置信息,并根據(jù)所述用戶配置信息對所述輸入信 息進(jìn)行檢索或發(fā)布。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于,所述系統(tǒng)在發(fā)布前由所述展示模塊對 用戶進(jìn)行提示以獲取用戶對所述提示的確認(rèn)信息。
21.一種信息發(fā)布的方法,其特征在于,所述方法包括步驟a.接收用戶輸入信息;b.根據(jù)分類器模型對所述輸入信息進(jìn)行分析,以得到所述輸入信息具有信息發(fā)布需求 的第一概率,所述第一概率用于描述所述輸入信息基于語義特征角度的具有所述信息發(fā)布 需求的可能性;c.根據(jù)所述第一概率對所述輸入信息進(jìn)行檢索或?qū)⑺鲚斎胄畔l(fā)布到第三方信息 發(fā)布平臺。
22.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述步驟a中從搜索引擎的使用界面接 收用戶輸入信息。
23.根據(jù)權(quán)利要求22所述的方法,其特征在于,所述使用界面的具體形式包括WEB頁 面、WAP頁面、帶有搜索插件的瀏覽器與所述WEB頁面的結(jié)合、或帶有搜索插件的瀏覽器與 所述WAP頁面的結(jié)合。
24.根據(jù)權(quán)利要求23所述的方法,其特征在于,所述WEB頁面或所述WAP頁面內(nèi)包括搜 索框、地址欄、輸入法框或信息輸入界面。
25.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述第三方信息發(fā)布平臺包括微博平 臺、社交網(wǎng)絡(luò)平臺、論壇平臺或電子公告平臺。
26.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述分類器模型是根據(jù)線下挖掘的歷 史數(shù)據(jù)或所述第三方信息發(fā)布平臺提供的語料數(shù)據(jù),采用機(jī)器學(xué)習(xí)算法構(gòu)建的。
27.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述信息發(fā)布需求包括具體信息發(fā)布 需求或通用信息發(fā)布需求。
28.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述步驟c中,在所述發(fā)布前對用戶進(jìn) 行提示以獲取用戶對所述提示的確認(rèn)信息。
29.根據(jù)權(quán)利要求觀所述的方法,其特征在于,在對用戶進(jìn)行所述提示時返回對所述 輸入信息的檢索結(jié)果。
30.根據(jù)權(quán)利要求觀所述的方法,其特征在于,所述提示包括多個關(guān)于所述第三方信 息發(fā)布平臺的提示信息。
31.根據(jù)權(quán)利要求觀所述的方法,其特征在于,所述確認(rèn)信息包括對所述第三方信息 發(fā)布平臺的選擇信息或登錄信息。
32.根據(jù)權(quán)利要求觀所述的方法,其特征在于,在接收到用戶對所述提示的確認(rèn)信息 后,對所述輸入信息進(jìn)行發(fā)布。
33.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述步驟c中,將所述輸入信息發(fā)布于 多個所述第三方信息發(fā)布平臺。
34.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述方法在步驟c前進(jìn)一步包括步驟d.獲取用戶在所述第三方信息發(fā)布平臺中的用戶信息,以得到所述輸入信息具有所述信息 發(fā)布需求的第二概率,其中所述第二概率用于描述所述輸入信息基于用戶信息特征角度的 具有所述信息發(fā)布需求的可能性;所述步驟c中利用所述第一概率與所述第二概率對所述 輸入信息進(jìn)行檢索或?qū)⑺鲚斎胄畔l(fā)布到第三方信息發(fā)布平臺。
35.根據(jù)權(quán)利要求34所述的方法,其特征在于,所述用戶信息包括用戶的帳號信息或 用戶的使用頻率信息。
36.根據(jù)權(quán)利要求34所述的方法,其特征在于,所述步驟d中用戶信息的獲取方式包括 檢驗用戶在所述第三方信息發(fā)布平臺的在線狀態(tài)、調(diào)用用戶在所述第三方信息發(fā)布平臺的 帳號的使用記錄或接收用戶在所述展示模塊的輸入。
37.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述方法在步驟c前進(jìn)一步包括步驟e.分析用戶以往的行為,以得到所述輸入信息具有所述信息發(fā)布需求的第三概率,其中所 述第三概率用于描述所述輸入信息基于用戶歷史行為特征角度的具有所述信息發(fā)布需求 的可能性;所述步驟c中利用所述第一概率與所述第三概率對所述輸入信息進(jìn)行檢索或?qū)?所述輸入信息發(fā)布到第三方信息發(fā)布平臺。
38.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述方法在步驟b前進(jìn)一步包括步驟f.根據(jù)描述詞語庫對所述輸入信息進(jìn)行匹配驗證,以判斷用戶使用高級語法的第四概率, 其中所述描述詞語庫是通過對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行挖掘,從所述互聯(lián)網(wǎng)數(shù)據(jù)中提取用戶描述所 述第三方信息發(fā)布平臺的關(guān)鍵詞,并對所述關(guān)鍵詞進(jìn)行語義擴(kuò)展后生成的;當(dāng)所述第四概 率大于第一閾值時,將所述輸入信息分解為內(nèi)容部分與語法部分,所述步驟b利用所述內(nèi) 容部分與所述第四概率及所述分類器模型得到第一概率。
39.根據(jù)權(quán)利要求21所述的方法,其特征在于,所述方法在步驟b前進(jìn)一步包括步驟g.識別用戶配置信息,其中所述用戶配置信息是根據(jù)用戶的選擇為系統(tǒng)配置的默認(rèn)的行為 模式,所述默認(rèn)的行為模式包括默認(rèn)為搜索或默認(rèn)為發(fā)布,其中當(dāng)系統(tǒng)被配置成所述默認(rèn) 為搜索時,系統(tǒng)只執(zhí)行檢索不執(zhí)行發(fā)布,系統(tǒng)被配置成所述默認(rèn)為發(fā)布時,系統(tǒng)只執(zhí)行發(fā)布 不執(zhí)行檢索;當(dāng)識別出系統(tǒng)具有用戶配置信息時,根據(jù)所述用戶配置信息對所述輸入信息 進(jìn)行檢索或發(fā)布。
40.根據(jù)權(quán)利要求39所述的方法,其特征在于,在所述發(fā)布前對用戶進(jìn)行提示以獲取 用戶對所述提示的確認(rèn)信息。
全文摘要
本發(fā)明提供了一種具有信息發(fā)布和搜索功能的系統(tǒng)及信息發(fā)布方法,其中所述系統(tǒng)包括展示模塊;分類器構(gòu)建模塊,用于構(gòu)建分類器模型;信息分析模塊,用于根據(jù)分類器模型對輸入信息進(jìn)行分析,輸出所述輸入信息具有信息發(fā)布需求的第一概率;綜合決策模塊,用于根據(jù)第一概率決定是否對所述輸入信息進(jìn)行檢索或發(fā)布;發(fā)布模塊,用于將輸入信息發(fā)布到第三方信息發(fā)布平臺;檢索模塊,用于將查詢結(jié)果返回給所述展示模塊。通過上述方式,所述系統(tǒng)在搜索的基礎(chǔ)上具有了信息發(fā)布的功能,可以很好地滿足不同用戶的需要。
文檔編號G06F17/30GK102110170SQ20111006613
公開日2011年6月29日 申請日期2011年3月18日 優(yōu)先權(quán)日2011年3月18日
發(fā)明者廖若雪, 李彥宏 申請人:北京百度網(wǎng)訊科技有限公司