本發(fā)明實(shí)施例涉及數(shù)據(jù)處理以及搜索領(lǐng)域,更為具體而言,涉及一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法、搜索方法及相應(yīng)裝置。
背景技術(shù):
:o2o電商平臺(tái)近年來在互聯(lián)網(wǎng)領(lǐng)域迅速發(fā)崛起,其中以餐飲配送為主的外賣領(lǐng)域發(fā)展最為迅速。用戶通過在應(yīng)用軟件上搜索選擇美食來完成消費(fèi),這一過程中必然涉及的一個(gè)核心功能就是搜索。不同于百度、google等傳統(tǒng)的通用文本搜索引擎,餐飲電商的搜索引擎需要通過特定的搜索場(chǎng)景和專業(yè)化的數(shù)據(jù)源展開搜索任務(wù)。例如,搜索“油條”,則對(duì)應(yīng)的特定場(chǎng)景應(yīng)該為早餐以及北方等。簡(jiǎn)單來說,搜索場(chǎng)景就是在挖掘用戶搜索行為背后的信息,例如搜索“小龍蝦”,對(duì)應(yīng)的搜索場(chǎng)景就是“夏季、宵夜、多人聚會(huì)、海鮮”等一些信息,通過這些場(chǎng)景數(shù)據(jù)的“聯(lián)想”,可以更精準(zhǔn)地產(chǎn)出用戶期待的結(jié)果。目前,基于餐飲領(lǐng)域知識(shí)的搜索場(chǎng)景識(shí)別技術(shù)在國(guó)內(nèi)還處于摸索階段。在工業(yè)界,由于餐飲領(lǐng)域垂搜起步晚且發(fā)展迅速,搜索場(chǎng)景識(shí)別的技術(shù)升級(jí)未能跟上需求的提升;而學(xué)界由于難以獲得大規(guī)模高價(jià)值搜索數(shù)據(jù),該領(lǐng)域研究進(jìn)展也基本停滯。然而巨大的市場(chǎng)需求給餐飲領(lǐng)域搜索帶來巨大壓力。因此,精準(zhǔn)且專業(yè)化的識(shí)別搜索場(chǎng)景就成了這一領(lǐng)域搜索引擎技術(shù)的核心優(yōu)化方向。在一種現(xiàn)有技術(shù)中,餐飲領(lǐng)域垂直電商搜索的場(chǎng)景識(shí)別主要采用人工標(biāo)記的方式完成。這種方式具有人力成本高、標(biāo)記標(biāo)準(zhǔn)主觀性強(qiáng)無法客觀統(tǒng)一等缺陷。即使現(xiàn)有技術(shù)支持自動(dòng)化方式,也難以保證搜索場(chǎng)景的精準(zhǔn)且專業(yè)化的識(shí)別。技術(shù)實(shí)現(xiàn)要素:為了解決現(xiàn)有技術(shù)所存在的缺陷,本發(fā)明實(shí)施例提供一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法、搜索方法及相應(yīng)裝置,能夠自動(dòng)化、精準(zhǔn)化地實(shí)現(xiàn)搜索場(chǎng)景的映射,改善搜索場(chǎng)景的識(shí)別準(zhǔn)確度,提高搜索結(jié)果的精準(zhǔn)度。第一方面,本發(fā)明實(shí)施方式中提供了一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法,包括:建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述方法還包括:按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集。或者,所述方法還包括:對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析,得到所述監(jiān)督數(shù)據(jù)集。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)除了包括短語(yǔ)名稱,還包括權(quán)重和/或懲罰因子。進(jìn)一步地,所述根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,包括:采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景,包括:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射至第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。第二方面,本發(fā)明實(shí)施方式中提供了一種搜索場(chǎng)景識(shí)別方法,該方法包括:對(duì)搜索項(xiàng)進(jìn)行切詞,得到搜索詞;通過匹配處理確定第二數(shù)據(jù)集中與所述搜索詞匹配的匹配數(shù)據(jù);根據(jù)所述匹配數(shù)據(jù)所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景;其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景采用前述數(shù)據(jù)處理方法確定。第三方面,本發(fā)明實(shí)施方式還提供一種搜索方法,包括:根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的所述場(chǎng)景采用前述數(shù)據(jù)映射方法確定(該步驟的輸出結(jié)果是識(shí)別搜索場(chǎng)景,其具體可以通過上述第二方面實(shí)現(xiàn));加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;根據(jù)所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。第四方面,本發(fā)明實(shí)施方式中提供一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理裝置,包括:數(shù)據(jù)映射建立模塊,用于建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);數(shù)據(jù)映射調(diào)整模塊,用于根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;搜索場(chǎng)景映射模塊,用于基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述裝置還包括:第一數(shù)據(jù)處理模塊,用于按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集。或者,所述裝置還包括:監(jiān)督數(shù)據(jù)處理模塊,用于對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析,得到所述監(jiān)督數(shù)據(jù)集。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)除了包括短語(yǔ)名稱,還包括權(quán)重和/或懲罰因子。進(jìn)一步地,所述數(shù)據(jù)映射調(diào)整模塊包括:匹配子模塊,用于采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);第一調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,第二調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。在本發(fā)明實(shí)施方式的一種實(shí)現(xiàn)方式中,所述搜索場(chǎng)景映射模塊具體用于:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射到第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。第五方面,本發(fā)明實(shí)施方式中提供一種搜索場(chǎng)景識(shí)別裝置,包括:切詞模塊,用于對(duì)搜索項(xiàng)進(jìn)行切詞,得到搜索詞;匹配模塊,用于通過匹配處理確定第二數(shù)據(jù)集中與所述搜索詞匹配的匹配數(shù)據(jù);確定模塊,用于根據(jù)所述匹配數(shù)據(jù)所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景;其中,所述第二數(shù)據(jù)集所映射的場(chǎng)景采用前述數(shù)據(jù)映射方法確定。第六方面,本發(fā)明實(shí)施例中提供一種搜索裝置,包括:場(chǎng)景確定模塊,用于根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的場(chǎng)景采用前述數(shù)據(jù)映射方法確定(該模塊的輸出結(jié)果是識(shí)別搜索場(chǎng)景,其具體可以通過上述搜索場(chǎng)景識(shí)別裝置實(shí)現(xiàn));加載模塊,用于加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;優(yōu)化模塊,用于根據(jù)加載的所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。所述搜索場(chǎng)景識(shí)別裝置和搜索裝置的功能可以通過硬件實(shí)現(xiàn),也可以通過硬件執(zhí)行相應(yīng)的軟件實(shí)現(xiàn)。所述硬件或軟件包括一個(gè)或多個(gè)與上述功能相對(duì)應(yīng)的模塊。在一個(gè)可能的設(shè)計(jì)中,上述搜索場(chǎng)景識(shí)別裝置或搜索裝置的結(jié)構(gòu)中包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持相關(guān)裝置執(zhí)行前述相應(yīng)處理的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。相關(guān)裝置還可以包括通信接口,用于裝置與其他設(shè)備或通信網(wǎng)絡(luò)通信。第七方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存所述搜索場(chǎng)景識(shí)別裝置和/或搜索裝置所用的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行上述相應(yīng)方法以使搜索場(chǎng)景識(shí)別裝置和/或搜索裝置實(shí)現(xiàn)相應(yīng)數(shù)據(jù)處理所涉及的程序。本發(fā)明實(shí)施例能夠有效優(yōu)化數(shù)據(jù)映射關(guān)系,改善映射的精準(zhǔn)度,進(jìn)而提高后續(xù)確定搜索場(chǎng)景的精準(zhǔn)度;此外還能夠提升匹配效率,有效地提升匹配場(chǎng)景的廣度,進(jìn)而有效提高搜索結(jié)果的準(zhǔn)確性。本發(fā)明的這些方面或其他方面在以下實(shí)施例的描述中會(huì)更加簡(jiǎn)明易懂。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是根據(jù)本發(fā)明實(shí)施例的一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法的流程示意圖;圖2是根據(jù)本發(fā)明實(shí)施例的一種建立場(chǎng)景特征庫(kù)的方法的流程示意圖;圖3是根據(jù)本發(fā)明實(shí)施例的一種獲取監(jiān)督數(shù)據(jù)的方法的流程示意圖;圖4是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)映射邏輯示意圖;圖5是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)映射方法的流程示意圖;圖6是根據(jù)本發(fā)明實(shí)施例的一種搜索場(chǎng)景識(shí)別方法的流程示意圖;圖7是根據(jù)本發(fā)明實(shí)施例的一種搜索方法的流程示意圖;圖8是根據(jù)本發(fā)明實(shí)施例的一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理裝置的框圖的一例;圖9是根據(jù)本發(fā)明實(shí)施例的一種搜索場(chǎng)景識(shí)別裝置的框圖的一例;圖10是根據(jù)本發(fā)明實(shí)施例的一種搜索裝置的框圖的一例。具體實(shí)施方式為了使本
技術(shù)領(lǐng)域:
的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。在本發(fā)明的說明書和權(quán)利要求書及上述附圖中的描述的一些流程中,包含了按照特定順序出現(xiàn)的多個(gè)操作,但是應(yīng)該清楚了解,這些操作可以不按照其在本文中出現(xiàn)的順序來執(zhí)行或并行執(zhí)行,操作的序號(hào)如101、102等,僅僅是用于區(qū)分開各個(gè)不同的操作,序號(hào)本身不代表任何的執(zhí)行順序。另外,這些流程可以包括更多或更少的操作,并且這些操作可以按順序執(zhí)行或并行執(zhí)行。需要說明的是,本文中的“第一”、“第二”等描述,是用于區(qū)分不同的消息、設(shè)備、模塊等,不代表先后順序,也不限定“第一”和“第二”是不同的類型。首先,對(duì)本發(fā)明涉及或可能涉及的部分名詞進(jìn)行說明。這些解釋僅為了便于理解,而并不構(gòu)成對(duì)本發(fā)明各種實(shí)施例的限制。搜索技術(shù),針對(duì)互聯(lián)網(wǎng)的數(shù)據(jù)資源建立信息數(shù)據(jù)庫(kù)和索引數(shù)據(jù)信息,通過各種軟件、硬件技術(shù)實(shí)現(xiàn)性能優(yōu)化,利用相關(guān)算法策略進(jìn)行搜索準(zhǔn)確性和排序結(jié)果的功能優(yōu)化。場(chǎng)景識(shí)別,針對(duì)搜索關(guān)鍵詞進(jìn)行基于大數(shù)據(jù)和自然語(yǔ)言處理的深度數(shù)據(jù)挖掘,分析關(guān)鍵詞所處的搜索情景,進(jìn)而從更高層次優(yōu)化搜索結(jié)果。領(lǐng)域知識(shí),行業(yè)領(lǐng)域中的專門知識(shí)與技能。領(lǐng)域指某個(gè)限定的專業(yè)或行業(yè)的范圍,如金融、制造、餐飲等。領(lǐng)域內(nèi)的專家經(jīng)驗(yàn)、技能、管理素質(zhì)構(gòu)成的知識(shí)框架稱為知識(shí)領(lǐng)域。自然語(yǔ)言處理,是用計(jì)算機(jī)處理自然語(yǔ)言信息的過程和有關(guān)技術(shù)。自然語(yǔ)言指的是人類自身的書面或口頭形式的語(yǔ)言,如漢語(yǔ)、英語(yǔ)、日語(yǔ)等,它是相對(duì)于人造的形式化的計(jì)算機(jī)語(yǔ)言而言的。處理自然語(yǔ)言的關(guān)鍵是要讓計(jì)算機(jī)理解自然語(yǔ)言。下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1是根據(jù)本發(fā)明實(shí)施例的一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法的流程示意圖,參照?qǐng)D1,所述方法包括:10:建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射。其中,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù)。在本發(fā)明中,第一數(shù)據(jù)集和第二數(shù)據(jù)集均包含可以直接進(jìn)行數(shù)據(jù)映射處理的數(shù)據(jù)。關(guān)于如何得到特定應(yīng)用環(huán)境下的第一數(shù)據(jù)集和第二數(shù)據(jù)集,將在下文進(jìn)行詳細(xì)說明??蛇x地,在本實(shí)施例中,處理10也可以理解為利用第一數(shù)據(jù)集對(duì)第二數(shù)據(jù)集進(jìn)行數(shù)據(jù)標(biāo)記,從而建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始映射關(guān)系。12:根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,監(jiān)督數(shù)據(jù)集的作用是對(duì)處理10得到的初始映射關(guān)系進(jìn)行優(yōu)化,例如,防止對(duì)第一數(shù)據(jù)集的數(shù)據(jù)標(biāo)記的過擬合情況,對(duì)映射強(qiáng)度進(jìn)行限制。其中,監(jiān)督數(shù)據(jù)集包含監(jiān)督數(shù)據(jù),本發(fā)明中的監(jiān)督數(shù)據(jù)可以理解為一種規(guī)范化的數(shù)據(jù)樣本,用于輔助進(jìn)行數(shù)據(jù)過濾、調(diào)整、優(yōu)化等處理,具有數(shù)據(jù)參考意義。14:基于所述實(shí)際數(shù)據(jù)映射確定所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景。具體而言,基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景。采用本實(shí)施例提供的方法,相對(duì)于存在映射效果不足或者過擬合情況的現(xiàn)有映射技術(shù)而言,基于監(jiān)督數(shù)據(jù)對(duì)數(shù)據(jù)映射進(jìn)行調(diào)整,能夠有效優(yōu)化數(shù)據(jù)映射關(guān)系,改善映射的精準(zhǔn)度,進(jìn)而提高所確定的搜索場(chǎng)景的精準(zhǔn)度??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)包含短語(yǔ)名稱和調(diào)整參數(shù),所述調(diào)整參數(shù)包括權(quán)重和/或懲罰因子。此時(shí),處理12可以通過以下方式實(shí)現(xiàn):首先,采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù)。例如,將短語(yǔ)名稱和第一數(shù)據(jù)集中的第一數(shù)據(jù)進(jìn)行匹配處理,確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù)。然后,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。其中,所述修改第二數(shù)據(jù)其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,包括:刪除所匹配的監(jiān)督數(shù)據(jù)的權(quán)重值不滿足預(yù)設(shè)條件的第一數(shù)據(jù)與第二數(shù)據(jù)的映射關(guān)系、根據(jù)第一數(shù)據(jù)所匹配的監(jiān)督數(shù)據(jù)的權(quán)重值對(duì)第一數(shù)據(jù)與第二數(shù)據(jù)之間的映射進(jìn)行排序等??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源得到所述第一數(shù)據(jù)集;對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行文本處理(包括:切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析),得到所述監(jiān)督數(shù)據(jù)集;第二數(shù)據(jù)集可以是已有的數(shù)據(jù)集??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,第一數(shù)據(jù)集、第二數(shù)據(jù)集和監(jiān)督數(shù)據(jù)集是同一領(lǐng)域的數(shù)據(jù)。例如,以餐飲領(lǐng)域?yàn)槔谝粩?shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù),監(jiān)督數(shù)據(jù)集則基于外源挖掘的有效餐飲領(lǐng)域信息得到??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射至第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。舉例而言,以第二數(shù)據(jù)集中的“油條”這個(gè)菜品詞為例,假設(shè)映射到的第一數(shù)據(jù)包括:“早餐”、“北方”、“主食”、“油炸食品”、“中華傳統(tǒng)”等。其中“早餐”出現(xiàn)頻次最高,最具代表性。因此,在“油條”這個(gè)菜品詞的映射數(shù)據(jù)中,可以將“早餐”排在所有特征的首位,對(duì)應(yīng)最大的權(quán)重。進(jìn)而,在處理14中,可以選取“早餐”作為油條的搜索場(chǎng)景。當(dāng)然,也可以從映射的詞語(yǔ)中選取至少部分詞語(yǔ)組合構(gòu)成場(chǎng)景,例如將“北方的早餐”作為場(chǎng)景。換言之,在本實(shí)現(xiàn)方式中,可以根據(jù)所匹配的監(jiān)督數(shù)據(jù)的權(quán)重(例如,權(quán)重排序)選取權(quán)重滿足預(yù)設(shè)條件的第一數(shù)據(jù)或第一數(shù)據(jù)的組合作為相應(yīng)的搜索場(chǎng)景。在該實(shí)現(xiàn)方式中,可以采用特征詞的頻次對(duì)“油條”所對(duì)應(yīng)的特征詞進(jìn)行篩選,也可以根據(jù)特征詞的頻次對(duì)各個(gè)特征詞的權(quán)重進(jìn)行優(yōu)化,這樣,通過將特征詞的頻次作為輔助參數(shù)對(duì)權(quán)重進(jìn)行調(diào)整/修正,將權(quán)重描述可能存在的不準(zhǔn)確的問題弱化,也保證了基于權(quán)重進(jìn)行調(diào)整而得到的實(shí)際數(shù)據(jù)映射的準(zhǔn)確性。關(guān)于特征詞的頻次,其是指特征詞在所述第一數(shù)據(jù)集的數(shù)據(jù)收集、統(tǒng)計(jì)階段所記錄到的數(shù)量。例如:假設(shè)“早餐”一詞在第一數(shù)據(jù)集的數(shù)據(jù)收集階段,一共統(tǒng)計(jì)到723個(gè)“早餐”或“早餐”作為主要語(yǔ)義的短語(yǔ),那么在所述第一數(shù)據(jù)集中,“早餐”這個(gè)特征詞的詞頻就是723/(所有特征詞出現(xiàn)的總次數(shù))。下面,以將本發(fā)明應(yīng)用于餐飲領(lǐng)域?yàn)槔?,?duì)與本發(fā)明相關(guān)的各個(gè)細(xì)節(jié)進(jìn)行詳細(xì)說明。圖2是根據(jù)本發(fā)明實(shí)施例的一種建立場(chǎng)景特征庫(kù)的方法的流程示意圖。所述場(chǎng)景特征庫(kù)是第一數(shù)據(jù)集的一種具體實(shí)現(xiàn)方式。參照?qǐng)D2,所述方法包括:首先,獲取第一數(shù)據(jù)源。所述第一數(shù)據(jù)源包括用戶行為數(shù)據(jù)和外源挖掘數(shù)據(jù)。用戶行為數(shù)據(jù)主要反映用戶在時(shí)間維度上的行為,利用客戶端(例如,app客戶端)收集到的用戶點(diǎn)擊以及瀏覽記錄,在服務(wù)端以時(shí)間為維度,將用戶的這些行為依次整理收集,例如:用戶a在2016年11月03日11點(diǎn)的行為數(shù)據(jù)為“打開app->瀏覽首頁(yè)->下拉菜單至第3頁(yè)->停留2秒后選擇第三家商戶并進(jìn)入->在商戶詳情頁(yè)選擇x產(chǎn)品->進(jìn)入下單頁(yè)面->選擇付款方式以及配送地理信息”等。而外源挖掘數(shù)據(jù)包括主流專業(yè)餐飲網(wǎng)站的公開菜單、菜品做法、餐飲分類等信息。接著,通過數(shù)據(jù)分析子系統(tǒng),對(duì)所述第一數(shù)據(jù)源進(jìn)行分析,得到時(shí)間場(chǎng)景基本數(shù)據(jù)、節(jié)日?qǐng)鼍盎緮?shù)據(jù)、地理信息基本數(shù)據(jù)。具體而言,利用文本模式匹配技術(shù)將第一數(shù)據(jù)源劃分為早餐、午餐、晚餐以及夜宵四個(gè)基本時(shí)間場(chǎng)景、中西方傳統(tǒng)節(jié)假日等基本節(jié)日?qǐng)鼍耙约盎诘乩硇畔⒌挠脩襞渌蛨?chǎng)景等基本特征。接著,在獲得基本特征信息后,通過擬合算法對(duì)特征過濾模型進(jìn)行訓(xùn)練和擬合優(yōu)化,完成特征數(shù)據(jù)的過濾,去除錯(cuò)誤的、不屬于餐飲領(lǐng)域的關(guān)聯(lián)信息的數(shù)據(jù),使特征庫(kù)的數(shù)據(jù)合理化。此處,之所以要對(duì)特征過濾模型進(jìn)行訓(xùn)練,是因?yàn)槲唇?jīng)過濾的原始特征數(shù)據(jù)往往存在各種噪聲數(shù)據(jù)。例如:“香煙”這個(gè)搜索詞在原始的場(chǎng)景特征提取中,可能產(chǎn)生“早餐”、“甜品”這兩個(gè)場(chǎng)景特征。顯然地,這是由于臟數(shù)據(jù)造成的錯(cuò)誤識(shí)別,需要被過濾掉。因此,通過人為設(shè)置模型預(yù)期的目標(biāo)狀態(tài),采用擬合過程,可以不斷地讓過濾條件更加精確,進(jìn)而可以過濾掉邏輯關(guān)聯(lián)不強(qiáng)的特征庫(kù)數(shù)據(jù)。通過以上處理,即可得到場(chǎng)景特征庫(kù)。示例性地,場(chǎng)景特征庫(kù)中的基本數(shù)據(jù)結(jié)構(gòu)如下表所示:(表一)參照表一。其中,特征id表示每個(gè)特征的唯一識(shí)別信息,在搜索場(chǎng)景識(shí)別中使用該id調(diào)用相關(guān)特征。特征名稱方便特征庫(kù)管理者查看以及信息展示。特征分類代表特征所處類別,例如,可以將特征分為一級(jí)特征、二級(jí)特征以及三級(jí)子類。更具體而言,“早餐”屬于一級(jí)特征,其中包含“減肥早餐”這個(gè)二級(jí)特征,該二級(jí)特征又包含“金槍魚肉制品”等三級(jí)特征。特征權(quán)重表示該特征在特征庫(kù)中的影響因子,其計(jì)算公式為:wi=θ*ci/∑j=0cj+punishment(i>=0,j從0開始)wi表示第i個(gè)特征的權(quán)重(也稱影響因子),θ表示人為設(shè)置的正向激勵(lì)參數(shù),這個(gè)參數(shù)用來削弱前文所提到的噪聲引起的干擾,ci表示第i個(gè)特征在訓(xùn)練數(shù)據(jù)中經(jīng)過切詞、詞頻分析以及語(yǔ)義分析(相關(guān)說明請(qǐng)參照與下文在監(jiān)督數(shù)據(jù)中的說明)所得的特征名稱,而訓(xùn)練數(shù)據(jù)即前文的第一數(shù)據(jù)源。punishment為懲罰因子,用于修正過擬合問題帶來的權(quán)重因子影響過大的問題。特征關(guān)系表示特征之間的關(guān)系,包括近似、互斥以及包含三種關(guān)系。例如:“早餐”與“晚餐”就屬于互斥特征。特征關(guān)系信息對(duì)之后特征映射部分的優(yōu)化有著重要作用,通過特征權(quán)重以及特征關(guān)系的比較,可以較精準(zhǔn)的過濾掉錯(cuò)誤的映射結(jié)果。采用本實(shí)施例提供的方法,通過全自動(dòng)化的流程進(jìn)行數(shù)據(jù)處理,尤其是引入時(shí)間維度和地理信息維度來劃分海量數(shù)據(jù),能夠有效地縮短數(shù)據(jù)挖掘處理以及人工評(píng)審帶來的無效時(shí)間成本消耗,提高整體策略評(píng)估性能。此外,為提升特征庫(kù)的可描述性和可代表性,可采用特征模型反向激勵(lì)的方式二次優(yōu)化特征庫(kù)。與傳統(tǒng)的特征提取技術(shù)相比,準(zhǔn)確性更高,所包含的特征也更具代表性。圖3是根據(jù)本發(fā)明實(shí)施例的一種獲取監(jiān)督數(shù)據(jù)的方法的流程示意圖。該方法針對(duì)餐飲領(lǐng)域信息進(jìn)行文本處理,獲得監(jiān)督數(shù)據(jù),所述監(jiān)督數(shù)據(jù)是指適用于監(jiān)督模型(一種基本的機(jī)器學(xué)習(xí)方法)的數(shù)據(jù)。具體而言,如圖3所示,所述方法包括:30:獲取餐飲領(lǐng)域信息。所述餐飲領(lǐng)域信息可以由網(wǎng)絡(luò)爬蟲機(jī)器人從外源挖掘數(shù)據(jù)中提取。32:切詞分析。具體而言,可以使用切詞工具完成切詞分析。例如,采用wordseg切詞工具,其基本原理是將海量數(shù)據(jù)生成的單詞字典與一段餐飲信息進(jìn)行匹配,一旦發(fā)現(xiàn)匹配成功的短語(yǔ),則將其視為候選切詞,并依據(jù)單詞字典提供的單詞權(quán)重去挑選出匹配度最高的切詞方式,繼而可以認(rèn)為這種切詞結(jié)果就是最終結(jié)果。一段餐飲信息切詞后形成由短語(yǔ)組成的集合,例如:“糖醋里脊主要食材包括里脊肉、淀粉、番茄等”這句文本被視為餐飲信息,切詞后的短語(yǔ)集合為{“糖醋里脊”,“主要食材”,“里脊肉”,“淀粉”,“番茄”}。34:詞頻分析。具體而言,在針對(duì)每一段餐飲領(lǐng)域信息都進(jìn)行切詞分析之后,進(jìn)而統(tǒng)計(jì)每個(gè)切詞后短語(yǔ)出現(xiàn)的次數(shù),這個(gè)次數(shù)就是詞頻信息。詞頻分析的主要目的是過濾掉不需要的詞語(yǔ),留下最具代表性的詞語(yǔ)。例如:針對(duì)餐飲領(lǐng)域信息,在切詞后形成這樣兩個(gè)詞語(yǔ):“雞排”,“大雞排”。根據(jù)詞頻統(tǒng)計(jì),“雞排”一共出現(xiàn)了12834次,而“大雞排”一共出現(xiàn)了231次,那么針對(duì)這兩個(gè)具有相似文本組織結(jié)構(gòu)的詞語(yǔ),可以只保留“雞排”。36:詞干提取。具體而言,使用詞干字典與前述生成的切詞短語(yǔ)進(jìn)行部分匹配檢查,例如:“美味的里脊肉”會(huì)被提取為“里脊肉”,其中的定語(yǔ)“美味的”會(huì)被去除。詞干提取會(huì)識(shí)別短語(yǔ)的詞性,進(jìn)而對(duì)短語(yǔ)進(jìn)行二次切割,最后只留下核心的名詞部分。38:語(yǔ)義分析。示例性地,可以進(jìn)行基于n-gram(一種語(yǔ)言模型)的語(yǔ)義分析。該分析方法基于一種假設(shè),第n個(gè)詞的出現(xiàn)只與前面n-1個(gè)詞相關(guān),而不與其他因素相關(guān),這個(gè)短語(yǔ)的概率就是各個(gè)詞干出現(xiàn)的概率的乘積。通過以上處理30-38,即可得到餐飲領(lǐng)域的監(jiān)督數(shù)據(jù)。示例性地,監(jiān)督數(shù)據(jù)的結(jié)構(gòu)如下表所示:短語(yǔ)id短語(yǔ)名稱權(quán)重懲罰因子表二其中,短語(yǔ)id唯一標(biāo)示該短語(yǔ),用于在調(diào)用監(jiān)督數(shù)據(jù)時(shí)使用。短語(yǔ)名稱用于與第一數(shù)據(jù)集中的數(shù)據(jù)(例如,場(chǎng)景特征庫(kù)中的特征詞)進(jìn)行文本匹配。權(quán)重是指該監(jiān)督數(shù)據(jù)的重要性,例如菜品“魚香肉絲”映射到“川菜”、“流行”、“時(shí)尚創(chuàng)意”這三個(gè)特征詞,而系統(tǒng)的監(jiān)督數(shù)據(jù)中“川菜”、“流行”兩個(gè)監(jiān)督短語(yǔ)的權(quán)重明顯大于“時(shí)尚創(chuàng)意”這個(gè)短語(yǔ),那么過濾后留下來的特征就是“川菜”、“流行”,同時(shí),“魚香xx”這個(gè)短語(yǔ)表達(dá)方式也被系統(tǒng)定義為一個(gè)監(jiān)督公式。當(dāng)下次類似于“魚香xx”的短語(yǔ)被處理時(shí),但凡出現(xiàn)“川菜”、“流行”或類似特征時(shí),監(jiān)督模型將會(huì)提升這些特征的影響因子,同時(shí),會(huì)限制其他特征的映射強(qiáng)度。懲罰因子是監(jiān)督數(shù)據(jù)的修正選項(xiàng),該數(shù)值通常是人為設(shè)置,通過數(shù)據(jù)采樣后的人工審核去評(píng)估監(jiān)督數(shù)據(jù)對(duì)特征的約束。圖4是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)映射邏輯示意圖,其示出的是場(chǎng)景特征庫(kù)與餐飲領(lǐng)域數(shù)據(jù)的實(shí)際數(shù)據(jù)映射邏輯。參照?qǐng)D4,該數(shù)據(jù)映射邏輯包括:首先,基于餐飲領(lǐng)域數(shù)據(jù)(包括菜品數(shù)據(jù)和商戶數(shù)據(jù))與場(chǎng)景特征庫(kù)建立二者之間的數(shù)據(jù)映射。然后,讀取監(jiān)督數(shù)據(jù)的權(quán)重和懲罰因子,進(jìn)而進(jìn)行提升與限制。具體而言,在將場(chǎng)景特征庫(kù)映射到菜品或者商戶數(shù)據(jù)時(shí),利用監(jiān)督數(shù)據(jù)自身的權(quán)重提升與監(jiān)督數(shù)據(jù)匹配上的那部分特征詞,同時(shí)通過監(jiān)督數(shù)據(jù)的懲罰因子限制映射強(qiáng)度(即,特征詞的權(quán)重),生成有效映射數(shù)據(jù)(即,實(shí)際映射數(shù)據(jù))。傳統(tǒng)的特征映射技術(shù)存在映射效果不足或者過擬合的情況。而本實(shí)施例采用的數(shù)據(jù)映射邏輯,引入監(jiān)督數(shù)據(jù)的概念,可以通過第三方數(shù)據(jù)構(gòu)建餐飲領(lǐng)域知識(shí)的監(jiān)督模型,進(jìn)而在數(shù)據(jù)映射中基于監(jiān)督數(shù)據(jù)過濾菜品、店鋪名稱的場(chǎng)景特征,提升映射精確度。在本實(shí)施例中,在生成有效映射數(shù)據(jù)處理之后,可以利用特征詞頻次對(duì)每個(gè)餐飲領(lǐng)域信息詞(例如,菜品和商戶名稱)映射到的特征詞進(jìn)行排序。以“油條”這個(gè)菜品詞為例,映射到的特征詞包括:“早餐”、“北方”、“主食”、“油炸食品”、“中華傳統(tǒng)”等,其中“早餐”這個(gè)場(chǎng)景特征出現(xiàn)頻次最高,最具代表性。因此在“油條”這個(gè)菜品詞的映射數(shù)據(jù)中,“早餐”排在所有特征的首位,權(quán)重最大??梢詫ⅰ霸绮汀弊鳛橛蜅l的搜索場(chǎng)景。圖5是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)映射方法的流程示意圖,其示出了場(chǎng)景特征庫(kù)與餐飲領(lǐng)域數(shù)據(jù)(包括菜品數(shù)據(jù)和商戶數(shù)據(jù))的實(shí)際數(shù)據(jù)映射過程。參照?qǐng)D5,所述方法包括:50:建立場(chǎng)景特征庫(kù)與餐飲領(lǐng)域數(shù)據(jù)的數(shù)據(jù)映射。52:基于監(jiān)督數(shù)據(jù)優(yōu)化所述數(shù)據(jù)映射。例如,通過前述的權(quán)重、懲罰因子進(jìn)行優(yōu)化。54:確定餐飲領(lǐng)域數(shù)據(jù)所對(duì)應(yīng)的搜索場(chǎng)景。例如,針對(duì)第二數(shù)據(jù)集中的單個(gè)第二數(shù)據(jù),根據(jù)與其映射的第一數(shù)據(jù)的出現(xiàn)頻次、權(quán)重或其它參數(shù)進(jìn)行排序、篩選或組合,從而得到對(duì)應(yīng)的搜索場(chǎng)景。圖6是根據(jù)本發(fā)明實(shí)施例的一種搜索場(chǎng)景識(shí)別方法的流程示意圖。參照?qǐng)D6,所述方法包括:60:對(duì)搜索項(xiàng)進(jìn)行切詞,得到搜索詞。所述搜索詞可以是一個(gè)或多個(gè)??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,首先針對(duì)用戶輸入的搜索項(xiàng)進(jìn)行識(shí)別處理,該識(shí)別處理包括簡(jiǎn)單的過濾、首次召回觸發(fā)。其中,過濾是指針對(duì)該搜索項(xiàng)進(jìn)行異常判斷,如果發(fā)現(xiàn)該搜索項(xiàng)異常,例如:搜索詞包含非法字符、敏感信息等,搜索將不再進(jìn)行下一步處理??蛇x地,在本實(shí)施例中,可以采用前文提及的切詞工具進(jìn)行切詞。62:通過匹配處理確定第二數(shù)據(jù)集中與所述搜索詞匹配的匹配數(shù)據(jù)。其中,所述第二數(shù)據(jù)集與所述第一數(shù)據(jù)集采用如前文所述的數(shù)據(jù)映射方法建立數(shù)據(jù)映射(即,實(shí)際數(shù)據(jù)映射)。關(guān)于第一數(shù)據(jù)集和第二數(shù)據(jù)集的說明,請(qǐng)參見前文??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,所述匹配處理為文本匹配處理,并且優(yōu)選采用部分匹配。所述部分匹配是指,如果第二數(shù)據(jù)集中的第二數(shù)據(jù)與搜索項(xiàng)切詞后的任意一個(gè)詞匹配,則該第二數(shù)據(jù)與搜索項(xiàng)匹配。例如,利用搜索項(xiàng)的切詞結(jié)果與特征詞庫(kù)的詞語(yǔ)進(jìn)行近似計(jì)算,假如搜索詞“川香回鍋肉”與特征庫(kù)中的“回鍋”這一特征匹配成功,其實(shí)是“川香回鍋肉”中的“回鍋”兩字與相關(guān)特征匹配成功。采用部分匹配的方式快速匹配餐飲領(lǐng)域數(shù)據(jù),一方面提升匹配效率,另一方面有效地提升匹配場(chǎng)景的廣度。64:根據(jù)所述匹配數(shù)據(jù)所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景。可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,以餐飲領(lǐng)域?yàn)槔谝粩?shù)據(jù)集是場(chǎng)景特征庫(kù)、第二數(shù)據(jù)集是餐飲領(lǐng)域數(shù)據(jù)。在確定搜索詞對(duì)應(yīng)的搜索場(chǎng)景后,可以利用場(chǎng)景特征庫(kù)中預(yù)計(jì)算的場(chǎng)景權(quán)重進(jìn)行場(chǎng)景排序。圖7是根據(jù)本發(fā)明實(shí)施例的一種搜索方法的流程示意圖,參照?qǐng)D7,所述方法包括:70:識(shí)別搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景。例如,根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景。其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景采用前文所述的數(shù)據(jù)映射方法確定。更具體而言,可以采用圖6所示的方法進(jìn)行識(shí)別。72:加載與搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件。所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略。可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,動(dòng)態(tài)加載不同場(chǎng)景所對(duì)應(yīng)的數(shù)據(jù)文件,繼而得到符合用戶搜索意圖的搜索結(jié)果。所述動(dòng)態(tài)加載即熱加載技術(shù),即在不重啟服務(wù)的情況下,可以實(shí)時(shí)的更換數(shù)據(jù)。而在本實(shí)施例中,將召回邏輯的排序策略構(gòu)造成一個(gè)個(gè)的數(shù)據(jù)文件,通過加載這些數(shù)據(jù)文件,來構(gòu)造排序算法。示例性地,這些排序策略的數(shù)據(jù)文件如下表所示:策略id策略名稱策略分類描述參數(shù)參數(shù)作用范圍擴(kuò)展信息(表三)其中,描述參數(shù)和參數(shù)作用范圍旨在表示策略的影響點(diǎn),例如:基于距離的排序策略中,描述參數(shù)就是“距離因子”,而參數(shù)作用范圍就是“0km–20km”。74:根據(jù)數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。采用本實(shí)施例提供的方法,為搜索召回提供了模塊化的計(jì)算入口,可以針對(duì)不同的搜索場(chǎng)景設(shè)計(jì)各自的排序優(yōu)化策略,實(shí)現(xiàn)“千人千面”的搜索個(gè)性化效果。以上結(jié)合附圖對(duì)根據(jù)本發(fā)明實(shí)施例的方法實(shí)施例進(jìn)行了詳細(xì)說明。下面結(jié)合附圖對(duì)根據(jù)本發(fā)明的裝置實(shí)施例進(jìn)行說明。圖8是根據(jù)本發(fā)明實(shí)施例的一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理裝置的框圖的一例。參照?qǐng)D8,數(shù)據(jù)處理裝置包括:數(shù)據(jù)映射建立模塊80,用于建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射;數(shù)據(jù)映射調(diào)整模塊82,用于根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;搜索場(chǎng)景映射模塊84,用于基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)除了包括權(quán)重和/或懲罰因子??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,數(shù)據(jù)映射調(diào)整模塊82包括:匹配子模塊,用于采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);第一調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,第二調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,所述搜索場(chǎng)景映射模塊84具體用于:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射到第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。例如,基于第一數(shù)據(jù)所匹配的監(jiān)督數(shù)據(jù)的權(quán)重選取所述至少部分第一數(shù)據(jù)。可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。圖9是根據(jù)本發(fā)明實(shí)施例的一種搜索場(chǎng)景識(shí)別裝置的框圖的一例,參照?qǐng)D9,該裝置包括:切詞模塊90,用于對(duì)搜索項(xiàng)進(jìn)行切詞,得到搜索詞;匹配模塊92,用于通過匹配處理確定第二數(shù)據(jù)集中與所述搜索詞匹配的匹配數(shù)據(jù);確定模塊94,用于根據(jù)所述匹配數(shù)據(jù)所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景。其中,采用前文所述的方法為第二數(shù)據(jù)集映射搜索場(chǎng)景。圖10是根據(jù)本發(fā)明實(shí)施例的一種搜索裝置的框圖的一例,參照?qǐng)D10,該裝置包括:場(chǎng)景確定模塊102,用于根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景(其中,所述第二數(shù)據(jù)集所映射的場(chǎng)景采用前文所述的數(shù)據(jù)映射方法確定,或采用圖9所示搜索場(chǎng)景識(shí)別裝置確定);加載模塊104,用于加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;優(yōu)化模塊106,用于根據(jù)加載的所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。以上結(jié)合附圖對(duì)根據(jù)本發(fā)明實(shí)施例的信息推送方法及裝置進(jìn)行了說明,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明提供的方法實(shí)施例或?qū)崿F(xiàn)方式可以相應(yīng)地由本發(fā)明提供的裝置實(shí)施例或?qū)崿F(xiàn)方式實(shí)現(xiàn),而本發(fā)明的裝置實(shí)施例的處理過程/邏輯又與本發(fā)明的方法實(shí)施例相一致。因此,在本發(fā)明的裝置實(shí)施例中,關(guān)于各個(gè)模塊、子模塊所執(zhí)行處理或可執(zhí)行處理的詳細(xì)說明,關(guān)于特定名稱、術(shù)語(yǔ)、范圍的解釋,以及關(guān)于各個(gè)實(shí)施例、相關(guān)特征所具有的有益效果的描述,請(qǐng)參見方法實(shí)施例中的相應(yīng)說明,此處不再贅述。在與本發(fā)明相關(guān)的一種可能的設(shè)計(jì)中,前述數(shù)據(jù)處理裝置可以包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持所述數(shù)據(jù)處理裝置執(zhí)行前述相應(yīng)模塊/子模塊所執(zhí)行的處理的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。所述程序包括一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行。更具體而言,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以用于:建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)所映射的搜索場(chǎng)景??蛇x地,所述處理器還可以通過執(zhí)行所述計(jì)算機(jī)指令以用于:按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集;對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析,得到所述監(jiān)督數(shù)據(jù)集??蛇x地,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)除了包括短語(yǔ)名稱,還包括權(quán)重和/或懲罰因子。此時(shí),所述處理還可以通過執(zhí)行所述計(jì)算機(jī)指令以用于:采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重??蛇x地,所述處理還可以通過執(zhí)行所述計(jì)算機(jī)指令以用于:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射至第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。相應(yīng)地,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存前述數(shù)據(jù)映射裝置所執(zhí)行的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行上述數(shù)據(jù)映射方法的數(shù)據(jù)映射裝置所涉及的程序。在與本發(fā)明相關(guān)的另一種可能的設(shè)計(jì)中,前述搜索裝置可以包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持所述數(shù)據(jù)處理裝置執(zhí)行相應(yīng)模塊/子模塊所執(zhí)行的處理的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。所述程序包括一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行。更具體而言,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以用于:根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景采用前述數(shù)據(jù)映射方法確定;加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;根據(jù)所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。相應(yīng)地,本發(fā)明實(shí)施例中還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存前述搜索裝置所執(zhí)行的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行前文所述搜索方法的搜索裝置所涉及的程序。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件。基于這樣的理解,上述技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。本發(fā)明公開a1、一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理方法,包括:建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)所映射的搜索場(chǎng)景。a2、如a1所述的方法中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。a3、如a1所述的方法中,所述方法還包括:按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集。a4、如a1所述的方法中,還包括:對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行文本處理(包括:切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析),得到所述監(jiān)督數(shù)據(jù)集。a5、如a1~a4中任一項(xiàng)所述的方法,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)包括權(quán)重和/或懲罰因子。a6、如a5所述的方法中,根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射關(guān)系,包括:采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。a7、如a1-a4或a6中任一項(xiàng)所述的方法中,所述基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景,包括:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射至第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。本發(fā)明還公開了b8、一種搜索方法,包括:根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景采用如a1-a7中任一項(xiàng)所述的方法確定;加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;根據(jù)所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。本發(fā)明還公開了c9、一種用于確認(rèn)搜索場(chǎng)景的數(shù)據(jù)處理裝置,包括:數(shù)據(jù)映射建立模塊,用于建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);數(shù)據(jù)映射調(diào)整模塊,用于根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;搜索場(chǎng)景映射模塊,用于基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)對(duì)應(yīng)的搜索場(chǎng)景。c10、如c9所述的裝置中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。c11、如c9所述的裝置中,所述裝置還包括第一數(shù)據(jù)處理模塊,用于按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集。c12、如c9所述的裝置中,所述裝置還包括監(jiān)督數(shù)據(jù)處理模塊,用于對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行文本處理(例如,包括:切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析),得到所述監(jiān)督數(shù)據(jù)集。c13、如c9-c12所述的裝置中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)除了包括短語(yǔ)名稱,還包括權(quán)重和/或懲罰因子。c14、如c13所述的裝置中,所述數(shù)據(jù)映射調(diào)整模塊包括:匹配子模塊,用于采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);第一調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,第二調(diào)整子模塊,用于針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。c15、如c9-c12或c14中任一項(xiàng)所述的裝置中,所述搜索場(chǎng)景映射模塊具體用于:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射到第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。本發(fā)明還公開d16、一種搜索裝置,包括:場(chǎng)景確定模塊,用于根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景采用如a1-a7中任一項(xiàng)所述的方法確定;加載模塊,用于加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;優(yōu)化模塊,用于根據(jù)加載的所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序本發(fā)明還公開了e1、一種數(shù)據(jù)映射裝置,包括存儲(chǔ)器和處理器;其中,所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行;所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:建立第一數(shù)據(jù)集與第二數(shù)據(jù)集之間的初始數(shù)據(jù)映射,所述第一數(shù)據(jù)集包含多項(xiàng)第一數(shù)據(jù),所述第二數(shù)據(jù)集包含多項(xiàng)第二數(shù)據(jù);根據(jù)監(jiān)督數(shù)據(jù)集調(diào)整所述初始數(shù)據(jù)映射,得到所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集之間的實(shí)際數(shù)據(jù)映射;基于所述第二數(shù)據(jù)集中的第二數(shù)據(jù)實(shí)際映射到的所述第一數(shù)據(jù)集中的第一數(shù)據(jù),確定所述第二數(shù)據(jù)集中的第二數(shù)據(jù)所映射的搜索場(chǎng)景。e2、如e1所述的數(shù)據(jù)映射裝置中,所述第一數(shù)據(jù)集為餐飲領(lǐng)域的場(chǎng)景特征庫(kù),所述第二數(shù)據(jù)集包括菜品數(shù)據(jù)和商戶數(shù)據(jù)。e3、如e1所述的數(shù)據(jù)映射裝置中,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:按照時(shí)間維度和地理維度處理第一數(shù)據(jù)源,得到所述第一數(shù)據(jù)集。e4、如e1所述的數(shù)據(jù)映射裝置中,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:對(duì)監(jiān)督數(shù)據(jù)源進(jìn)行文本處理(例如,包括:切詞分析、詞頻分析、詞干提取以及語(yǔ)義分析)得到所述監(jiān)督數(shù)據(jù)集。e5、如e1-e4中任一項(xiàng)所述的數(shù)據(jù)映射裝置中,所述監(jiān)督數(shù)據(jù)集中的監(jiān)督數(shù)據(jù)包括權(quán)重和/或懲罰因子。e6、如e5所述的數(shù)據(jù)映射裝置中,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:采用文本匹配處理確定相互匹配的監(jiān)督數(shù)據(jù)和第一數(shù)據(jù);針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的權(quán)重,修改第二數(shù)據(jù)與其初始映射到的第一數(shù)據(jù)之間的映射關(guān)系,和/或,針對(duì)各項(xiàng)第二數(shù)據(jù),基于與第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)匹配的監(jiān)督數(shù)據(jù)的懲罰因子,調(diào)整第二數(shù)據(jù)初始映射到的第一數(shù)據(jù)的權(quán)重。e7、如e1-e4或e6中任一項(xiàng)所述的裝置,所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:針對(duì)各項(xiàng)第二數(shù)據(jù),從實(shí)際映射至第二數(shù)據(jù)的第一數(shù)據(jù)中選取至少部分第一數(shù)據(jù)或所述至少部分第一數(shù)據(jù)的組合作為所述搜索場(chǎng)景。本發(fā)明還公開了f1、一種搜索裝置,包括存儲(chǔ)器和處理器;其中,所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行;所述處理器通過執(zhí)行所述計(jì)算機(jī)指令以執(zhí)行以下處理:根據(jù)搜索項(xiàng)和第二數(shù)據(jù)集及所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景,確定所述搜索項(xiàng)對(duì)應(yīng)的搜索場(chǎng)景,其中,所述第二數(shù)據(jù)集所映射的搜索場(chǎng)景如a1-a7中任一項(xiàng)所述的方法確定;加載與所述搜索場(chǎng)景對(duì)應(yīng)的數(shù)據(jù)文件,所述數(shù)據(jù)文件配置有召回?cái)?shù)據(jù)的優(yōu)化策略;根據(jù)所述數(shù)據(jù)文件對(duì)召回?cái)?shù)據(jù)進(jìn)行優(yōu)化排序。當(dāng)前第1頁(yè)12