本申請涉及計算機技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及基于人工智能的新聞推送的方法和裝置。
背景技術(shù):
推送,是通過一定的技術(shù)標準或協(xié)議,在互聯(lián)網(wǎng)上提供用戶需要的信息來減少信息過載的一項技術(shù)。其中,信息推送技術(shù)通過主動推送信息給用戶,可以減少用戶在網(wǎng)絡(luò)上搜索所花的時間?,F(xiàn)有的新聞推送過程中,僅僅推送新聞內(nèi)容給用戶,對于新聞內(nèi)容中涉及的新聞主體,例如實體(如人物、物品、建筑、景點等)、事件、話題等,需要讀者仔細閱讀新聞后對其進行感情傾向的判斷。當讀者不了解真相,或者對真相了解不全面時,容易被作者的感情色彩同化,或者需要花較多時間去弄清楚新聞?wù)嫦唷R虼耍侣勍扑偷挠行杂写岣摺?/p>
人工智能(artificialintelligence,英文縮寫為ai),是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。因此,可以將人工智能應(yīng)用于新聞推送中的感情傾向分析,提高信息推送的有效性。
技術(shù)實現(xiàn)要素:
本申請的目的在于提出一種改進的基于人工智能的新聞推送的方法和裝置,來解決以上背景技術(shù)部分提到的技術(shù)問題。
第一方面,本申請?zhí)峁┝艘环N基于人工智能的新聞推送的方法,該方法包括:從待推送新聞的新聞文本中確定至少一個新聞主體;提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段;對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽;基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞。
在一些實施例中,上述從待推送新聞的新聞文本中確定至少一個新聞主體包括:將新聞文本與預設(shè)的主體關(guān)鍵詞進行匹配;根據(jù)匹配到的主體關(guān)鍵詞確定至少一個新聞主體。
在一些實施例中,上述提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段包括:對每個新聞主體:將上述新聞文本中的各個分句分別與該新聞主體進行匹配;提取匹配到的分句作為與該新聞主體相關(guān)聯(lián)的文本片段。
在一些實施例中,上述提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段還包括:對于上述新聞文本中沒有匹配到新聞主體的分句,判斷其中是否包含代詞;若有,通過指代消解確定代詞所對應(yīng)的新聞主體,并將該分句提取為與所包含的代詞相對應(yīng)的新聞主體相關(guān)聯(lián)的文本片段。
在一些實施例中,上述基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞包括:將上述至少一個新聞主體的主體標簽與上述待推送新聞的新聞文本一起生成頁面進行新聞推送。
在一些實施例中,上述基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞包括:將用戶的個性化標簽與上述至少一個新聞主體進行匹配;響應(yīng)于從用戶的個性化標簽中匹配到上述至少一個新聞主體中的至少一個,將上述待推送新聞推送給該用戶;其中,上述個性化標簽通過以下方法生成:獲取用戶發(fā)布的文章;從用戶發(fā)布的文章中確定文章主體作為個性化標簽。
第二方面,本申請還提供了一種基于人工智能的新聞推送的裝置,該裝置包括:確定模塊,配置用于從待推送新聞的新聞文本中確定至少一個新聞主體;提取模塊,配置用于提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段;生成模塊,配置用于對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽;推送模塊,配置用于基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞。
在一些實施例中,上述確定模塊包括:匹配單元,配置用于將新聞文本與預設(shè)的主體關(guān)鍵詞進行匹配;確定單元,配置用于根據(jù)匹配到的主體關(guān)鍵詞確定至少一個新聞主體。
在一些實施例中,上述提取模塊進一步配置用于:對每個新聞主體:將上述新聞文本中的各個分句分別與該新聞主體進行匹配;提取匹配到的分句作為與該新聞主體相關(guān)聯(lián)的文本片段。
在一些實施例中,上述提取模塊還配置用于:對于上述新聞文本中沒有匹配到新聞主體的分句,判斷其中是否包含代詞;若有,通過指代消解確定代詞所對應(yīng)的新聞主體,并將該分句提取為與所包含的代詞相對應(yīng)的新聞主體相關(guān)聯(lián)的文本片段。
在一些實施例中,上述推送模塊還配置用于:將上述至少一個新聞主體的主體標簽與上述待推送新聞的新聞文本一起生成頁面進行新聞推送。
在一些實施例中,上述推送模塊進一步配置用于:將用戶的個性化標簽與上述至少一個新聞主體進行匹配;響應(yīng)于從用戶的個性化標簽中匹配到上述至少一個新聞主體中的至少一個,將上述待推送新聞推送給該用戶;其中,上述個性化標簽通過以下方法生成:獲取用戶發(fā)布的文章;從用戶發(fā)布的文章中確定文章主體作為個性化標簽。
第三方面,本申請還提供了一種計算設(shè)備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序;當該一個或多個程序被上述一個或多個處理器執(zhí)行,使得該一個或多個處理器實現(xiàn)上述的方法。
本申請?zhí)峁┑幕谌斯ぶ悄艿男侣勍扑偷姆椒ê脱b置,通過從待推送新聞的新聞文本中確定至少一個新聞主體,然后提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段,接著對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽,然后基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞。由于基于從新聞文本中確定的新聞主體和主體標簽進行新聞推送,可以直觀表達新聞主體的描述特征,或是作者或讀者對新聞主體的感情傾向,從而提高新聞推送的有效性。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
圖1是本申請可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
圖2是根據(jù)本申請的基于人工智能的新聞推送的方法的一個實施例的流程圖;
圖3a、圖3b是根據(jù)本申請的基于人工智能的新聞推送的方法的實施例的應(yīng)用場景示意圖;
圖4是根據(jù)本申請的基于人工智能的新聞推送的方法的另一個實施例的流程圖;
圖5是根據(jù)本申請的基于人工智能的新聞推送裝置的一個實施例的結(jié)構(gòu)示意圖;
圖6是適于用來實現(xiàn)本申請實施例的終端設(shè)備或服務(wù)器的計算機系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式
下面結(jié)合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細說明本申請。
圖1示出了可以應(yīng)用本申請的基于人工智能的新聞推送的方法或基于人工智能的新聞推送裝置的實施例的示例性系統(tǒng)架構(gòu)100。
如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如瀏覽器應(yīng)用、搜索類應(yīng)用、新聞推送類應(yīng)用、購物類應(yīng)用、即時通信工具、郵箱客戶端、社交平臺軟件等。
終端設(shè)備101、102、103可以是具有顯示屏的各種電子設(shè)備,包括但不限于智能手機、平板電腦、電子書閱讀器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,動態(tài)影像專家壓縮標準音頻層面3)、mp4(movingpictureexpertsgroupaudiolayeriv,動態(tài)影像專家壓縮標準音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。
服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對終端設(shè)備101、102、103上瀏覽器應(yīng)用、搜索類應(yīng)用、新聞推送類應(yīng)用等提供支持的后臺服務(wù)器等。服務(wù)器105可以對接收到的數(shù)據(jù)進行分析等處理,并將處理結(jié)果(例如推送的新聞)反饋給終端設(shè)備。
需要說明的是,本申請所提供的基于人工智能的新聞推送的方法一般由服務(wù)器105執(zhí)行,但不排除由終端設(shè)備101、102、103執(zhí)行的可能。相應(yīng)地,基于人工智能的新聞推送裝置一般設(shè)置在服務(wù)器105中,但不排除設(shè)置在終端設(shè)備101、102、103中的可能。
應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
繼續(xù)參考圖2,示出了根據(jù)本申請的基于人工智能的新聞推送的方法的一個實施例的流程200。該基于人工智能的新聞推送的方法,包括以下步驟:
步驟201,從待推送新聞的新聞文本中確定至少一個新聞主體。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)首先可以從待推送新聞的新聞文本中確定出新聞中所包含的主體。其中,這里新聞中所包含的主體例如可以是實體(如人物、物品、建筑、景點等)、事件、話題等??梢岳斫?,一條待推送新聞中的新聞主體可以有一個,也可以有多個。例如,在體育比賽新聞中,新聞主體至少涉及參加比賽的兩方。
通常,待推送新聞中至少可以包括新聞文本,還可以包括但不限于以下至少一種:圖片、音頻、視頻等等。當待推送新聞中包括圖片、音頻、視頻等等中的至少一種時,可以對應(yīng)包含相應(yīng)的描述文本,上述電子設(shè)備可以將該描述文本作為新聞文本的一部分。實踐中,上述電子設(shè)備可以根據(jù)任一合理的方法確定新聞主體,例如從新聞標題中確定新聞主體,通過統(tǒng)計新聞文本中的段首句或段尾句的主語等確定新聞主體,等等。舉例而言,新聞標題為“nba直播:馬刺vs火箭”,則上述電子設(shè)備可以獲取其中的名詞“nba”、“馬刺”、“火箭”作為新聞主體。在一些實現(xiàn)中,上述電子設(shè)備還可以預設(shè)有主體關(guān)鍵詞集合,將新聞文本與預設(shè)的主體關(guān)鍵詞進行匹配,根據(jù)匹配到的主體關(guān)鍵詞確定新聞主體。例如,上述電子設(shè)備可以將所有匹配到的主題關(guān)鍵詞分別確定為新聞主體,還可以選擇出匹配到的次數(shù)最多的主體關(guān)鍵詞確定為新聞主體。這里,主體關(guān)鍵詞與新聞文本的匹配可以是精確匹配,也可以是擴展匹配,例如主體關(guān)鍵詞的同義詞、近義詞與新聞文本的匹配。如主體關(guān)鍵詞包括人名“××剛”,該人名對應(yīng)的人物還有別稱“剛子”等,該別稱“剛子”與新聞文本的匹配即可以作為主體關(guān)鍵詞“××剛”與新聞文本的擴展匹配,上述電子設(shè)備在新聞文本中匹配到“剛子”時即認為匹配到了主體關(guān)鍵詞“××剛”。
步驟202,提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)接著可以根據(jù)所確定的新聞主體,分別從新聞文本中提取出與各個新聞主體相關(guān)聯(lián)的文本片段。這里,文本片段可以是一個段落、一個句子、長句中的一個分句、句子中的詞匯等等,或者以上任意組合,本申請對此不作限定。可以理解,新聞文本中與新聞主體有關(guān)的描述,都可以作為與新聞主體相關(guān)聯(lián)的文本片段。
實踐中,在一些實現(xiàn)中,上述電子設(shè)備可以按“段落—句子—分句”的優(yōu)先順序?qū)⑿侣勚黧w與新聞文本進行匹配。例如,判斷段落中出現(xiàn)的新聞主體個數(shù),如果新聞主體僅有一個,則將整個段落作為與該新聞主體相關(guān)聯(lián)的文本片段,如果新聞主體有多個,則逐句判斷該段落中的每個句子包含的新聞主體個數(shù)。同理,如果句子中新聞主體僅有一個,則將整個句子作為與該新聞主體相關(guān)聯(lián)的文本片段,如果句子中新聞主體有多個,則判斷該句子中的每個分句包含的新聞主體。在另一些實現(xiàn)中,上述電子設(shè)備還可以直接將新聞文本中的各個分句作為文本片段,分別與所確定的新聞主體進行匹配,提取匹配到的分句作為與新聞主體相關(guān)聯(lián)的文本片段。本申請對此不做限定。
可以理解,新聞文本中并非所有分句都包含主語或新聞主體,例如“她站起來,走到窗戶前,望向那一片高樓”。對于沒有匹配到新聞主體的分句,上述電子設(shè)備可以判斷其中是否包含代詞(如他、她、其、它等);若有,則可以通過指代消解的方法確定代詞所對應(yīng)的新聞主體,并將該分句作為與所包含的代詞相對應(yīng)的新聞主體相關(guān)聯(lián)的文本片段。否則,可以根據(jù)向前文追溯等方法確定文本片段所對應(yīng)的新聞主體,如“走到窗戶前”、“望向那一片高樓”對應(yīng)的主語“她”所關(guān)聯(lián)的新聞主體。其中,指代消解是用在自然語言處理的信息抽取過程中的一項技術(shù),可以用于解決在篇章中確定代詞指向哪個名詞短語的問題,在此不再贅述。
步驟203,對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)進一步可以針對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成該新聞主體的主體標簽。其中,主體標簽可以是詞或短語,其可以用于描述新聞主體的特征,如籃球、音樂等,也可以是表達作者或讀者對新聞主體的感情色彩,例如喜歡、厭惡等。
在本實施例中,上述電子設(shè)備可以預先通過一定數(shù)量的自然語言樣本訓練有深度學習模型,用于對文本片段進行分類,其中所分類別即為主體標簽。這里的深度學習模型例如可以是多層反饋神經(jīng)網(wǎng)絡(luò)rnn(recurrentneuralnetwork)、時間遞歸網(wǎng)絡(luò)lstm(longshort-termmemory)等等,在此不再贅述??梢岳斫猓黧w標簽可以有一個,也可以有多個,本申請對此不做限定。實踐中,上述電子設(shè)備可以根據(jù)通過深度學習模型進行分類后在每個類別上的概率來確定主體標簽。例如上述電子設(shè)備可以將在每個類別上的概率有高到期進行排列,選擇排列靠前的預設(shè)個數(shù)的類別作為主體標簽,也可以選擇概率大于預設(shè)概率閾值的一個或多個類別作為主體標簽。
步驟204,基于上述新聞主體和上述主體標簽進行新聞推送。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)進一步可以基于上述確定的新聞主體,以及新聞主體對應(yīng)的主體標簽進行新聞推送。
在本實施例的一些可選實現(xiàn)方式中,上述電子設(shè)備可以將主體標簽與新聞文本一起生成頁面推送給用戶。實踐中,上述電子設(shè)備可以根據(jù)新聞主體數(shù)量的不同,選擇不同的推送方式。例如,當新聞文本中只有一個新聞主體時,上述電子設(shè)備可以將一個或多個主體標簽排列在新聞頁面的預定位置進行推送,當新聞文本中只有一個新聞主體時,上述電子設(shè)備可以采取分別在預定位置進行標注主體標簽的形式進行推送。
作為一個應(yīng)用場景,本申請?zhí)峁┑幕谌斯ぶ悄艿男侣勍扑偷姆椒梢詰?yīng)用于為新聞推送類應(yīng)用提供支持的后臺服務(wù)器。每獲取一條待推送新聞時,上述后臺服務(wù)器可以:獲取該待推送新聞的新聞文本,然后按照預設(shè)的主題關(guān)鍵詞從新聞文本中確定新聞主體;接著,提取新聞文本中與所確定的新聞主體相關(guān)聯(lián)的文本片段;然后,對所提取的文本片段通過深度學習方法生成主體標簽;接著,如圖3a和圖3b所示,基于所確定的新聞主體和主體標簽向運行有上述新聞推送類應(yīng)用的終端300進行新聞推送。為了更直觀地說明本申請所達到的效果,請參考圖3a和圖3b。圖3a和圖3b給出了兩種不同的推送場景。如圖3a所示,在推送的新聞301中,新聞主體包括“趙××”,后臺服務(wù)器對該新聞主體生成的主體標簽302包括伸大拇指的圖案、文字“英雄,贊”,后臺服務(wù)器將主體標簽302與新聞301的內(nèi)容一起生成頁面推送至終端300。如圖3b所示,在搜索“趙××”的頁面上,包括后臺服務(wù)器根據(jù)新聞文本生成的關(guān)于新聞主體“趙××”的主體標簽302′和推送的新聞301′。
因此,本實施例的基于人工智能的新聞推送的方法,由于基于從新聞文本中確定的新聞主體和主體標簽進行新聞推送,可以直觀表達新聞主體的描述特征,或是作者或讀者對新聞主體的感情傾向,從而提高新聞推送的有效性。
繼續(xù)參考圖4,示出了根據(jù)本申請的基于人工智能的新聞推送的方法的另一個實施例的流程400。該基于人工智能的新聞推送的方法,包括以下步驟:
步驟401,從待推送新聞的新聞文本中確定至少一個新聞主體。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)首先可以從待推送新聞的新聞文本中確定出新聞中所包含的主體。其中,這里新聞中所包含的主體例如可以是實體(如人物、物品、建筑、景點等)、事件、話題等??梢岳斫?,一條待推送新聞中的新聞主體可以有一個,也可以有多個。在一些實現(xiàn)中,上述電子設(shè)備還可以預設(shè)有主體關(guān)鍵詞集合,將新聞文本與預設(shè)的主體關(guān)鍵詞進行匹配,根據(jù)匹配到的主體關(guān)鍵詞確定新聞主體。
步驟402,提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)接著可以根據(jù)所確定的新聞主體,分別從新聞文本中提取出與各個新聞主體相關(guān)聯(lián)的文本片段。這里,文本片段可以是一個段落、一個句子、長句中的一個分句、句子中的詞匯等等,或者以上任意組合,本申請對此不作限定??梢岳斫?,新聞文本中與新聞主體有關(guān)的描述,都可以作為與新聞主體相關(guān)聯(lián)的文本片段。
步驟403,對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)進一步可以針對每個新聞主體,根據(jù)所提取的文本片段通過諸如rnn、lstm之類的深度學習方法生成該新聞主體的主體標簽。其中,主體標簽可以是詞或短語,其可以用于描述新聞主體的特征,如籃球、音樂等,也可以是表達作者或讀者對新聞主體的感情色彩,例如喜歡、厭惡等。
步驟404,將用戶的個性化標簽與上述至少一個新聞主體進行匹配。
在本實施例中,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)進一步可以獲取至少一個用戶的個性化標簽,并將所獲取的每個用戶的個性化標簽分別與所確定的至少一個新聞主體進行匹配。
其中,用戶的個性化標簽可以用于表示用戶的偏好及所關(guān)注的事物。用戶的個性化標簽可以預先存儲在上述電子設(shè)備上,也可以有上述電子設(shè)備實時生成,還可以由上述電子設(shè)備從用于生成用戶個性化標簽的其他電子設(shè)備(如用戶所持有的的終端設(shè)備)獲取,本申請對此不做限定。用戶的而個性化標簽可以通過用戶手動設(shè)置,也可以根據(jù)的歷史行為記錄(如歷史訪問記錄、歷史搜索記錄等)提取。在一些實現(xiàn)中,用戶的個性化標簽可以通過以下方法生成:獲取用戶發(fā)布的文章;從用戶發(fā)布的文章中確定文章主體作為個性化標簽。這里,用戶發(fā)布的文章可以是用戶通過包括但不限于以下至少一個網(wǎng)站發(fā)布的文章:微博、期刊、論壇等等。文章主體的確定方法和新聞主體的確定方法類似,在此不再贅述。
用戶的個性化標簽與待推送新聞的至少一個新聞主體進行匹配過程中,由于個性化標簽包括的主體和新聞主體的描述可以不同,因此在匹配過程中可以將個性化標簽和新聞主體分別擴展到同義詞、近義詞的匹配。當個性化標簽及其同義詞、近義詞中的一個與新聞主體及其同義詞、近義詞中的一個相匹配時,可以確定用戶的個性化標簽與這一個新聞主體相匹配。
步驟405,響應(yīng)于從用戶的個性化標簽中匹配到上述至少一個新聞主體中的至少一個,將上述待推送新聞推送給該用戶。
在本實施例中,響應(yīng)于從用戶的個性化標簽中匹配到上述至少一個新聞主體中的至少一個,運行有基于人工智能的新聞推送的方法的電子設(shè)備(例如圖1所示的服務(wù)器105)就可以將上述待推送新聞推送給該個性化標簽所對應(yīng)的用戶。
從圖4中可以看出,與圖2對應(yīng)的實施例相比,本實施例中的基于人工智能的新聞推送的方法的流程400突出了根據(jù)用戶的個性化標簽進行新聞推送的步驟。由此,本實施例描述的方案可以結(jié)合用戶的個性化特征,實現(xiàn)富于針對性的基于人工智能的新聞推送。
進一步參考圖5,作為對上述基于人工智能的新聞推送的方法的實現(xiàn),本申請?zhí)峁┝艘环N基于人工智能的新聞推送裝置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應(yīng)。
如圖5所示,本實施例的基于人工智能的新聞推送裝置500包括:確定模塊501、提取模塊502、生成模塊503和推送模塊504。其中,確定模塊501可以配置用于從待推送新聞的新聞文本中確定至少一個新聞主體;提取模塊502可以配置用于提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段;生成模塊503可以配置用于對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽;推送模塊504可以配置用于基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞。
在本實施例的一些可選實現(xiàn)方式中,上述確定模塊501可以包括:匹配單元(未示出),可以配置用于將新聞文本與預設(shè)的主體關(guān)鍵詞進行匹配;確定單元(未示出),可以配置用于根據(jù)匹配到的主體關(guān)鍵詞確定至少一個新聞主體。
在本實施例的一些可選實現(xiàn)方式中,上述提取模塊502進一步可以配置用于:對每個新聞主體:將上述新聞文本中的各個分句分別與該新聞主體進行匹配;提取匹配到的分句作為與該新聞主體相關(guān)聯(lián)的文本片段。
在本實施例的另一些可選實現(xiàn)方式中,上述提取模塊502還可以配置用于:對于上述新聞文本中沒有匹配到新聞主體的分句,判斷其中是否包含代詞;若有,通過指代消解確定代詞所對應(yīng)的新聞主體,并將該分句提取為與所包含的代詞相對應(yīng)的新聞主體相關(guān)聯(lián)的文本片段。
在本實施例的一些可選實現(xiàn)方式中,上述推送模塊504還可以配置用于:將上述至少一個新聞主體的主體標簽與上述待推送新聞的新聞文本一起生成頁面進行新聞推送。
在本實施例的另一些可選實現(xiàn)方式中,上述推送模塊504進一步還可以配置用于:將用戶的個性化標簽與上述至少一個新聞主體進行匹配;響應(yīng)于從用戶的個性化標簽中匹配到上述至少一個新聞主體中的至少一個,將上述待推送新聞推送給該用戶;其中,上述個性化標簽通過以下方法生成:獲取用戶發(fā)布的文章;從用戶發(fā)布的文章中確定文章主體作為個性化標簽。
值得說明的是,基于人工智能的新聞推送的裝置500中記載的諸模塊與參考圖2描述的方法中的各個步驟相對應(yīng)。由此,上文針對方法描述的操作和特征同樣適用于裝置500及其中包含的模塊或單元,在此不再贅述。
本領(lǐng)域技術(shù)人員可以理解,上述基于人工智能的新聞推送的裝置500還包括一些其他公知結(jié)構(gòu),例如處理器、存儲器等,為了不必要地模糊本公開的實施例,這些公知的結(jié)構(gòu)在圖5中未示出。
下面參考圖6,其示出了適于用來實現(xiàn)本申請實施例的終端設(shè)備/服務(wù)器的計算機系統(tǒng)600的結(jié)構(gòu)示意圖。圖6示出的終端設(shè)備/服務(wù)器僅僅是一個示例,不應(yīng)對本申請實施例的功能和使用范圍帶來任何限制。
如圖6所示,計算機系統(tǒng)600包括中央處理單元(cpu)601,其可以根據(jù)存儲在只讀存儲器(rom)602中的程序或者從存儲部分608加載到隨機訪問存儲器(ram)603中的程序而執(zhí)行各種適當?shù)膭幼骱吞幚怼T趓am603中,還存儲有系統(tǒng)600操作所需的各種程序和數(shù)據(jù)。cpu601、rom602以及ram603通過總線604彼此相連。輸入/輸出(i/o)接口605也連接至總線604。
以下部件連接至i/o接口605:包括鍵盤或觸摸屏等的輸入部分606;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等的輸出部分607;包括硬盤等的存儲部分608;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分609。通信部分609經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器610也根據(jù)需要連接至i/o接口605??刹鹦督橘|(zhì)611,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據(jù)需要安裝在驅(qū)動器610上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分608。
特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括承載在計算機可讀介質(zhì)上的計算機程序,該計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分609從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)611被安裝。在該計算機程序被中央處理單元(cpu)601執(zhí)行時,執(zhí)行本申請的方法中限定的上述功能。需要說明的是,本申請所涉及的非易失性計算機可讀介質(zhì)可以是非易失性計算機可讀信號介質(zhì)或者非易失性計算機可讀存儲介質(zhì)或者是上述兩者的任意組合。非易失性計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。非易失性計算機可讀存儲介質(zhì)的更具體的例子可以包括但不限于:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機訪問存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本申請中,非易失性計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本申請中,計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、rf等等,或者上述的任意合適的組合。
附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,該模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括確定模塊、提取模塊、生成模塊和推送模塊。其中,這些模塊的名稱在某種情況下并不構(gòu)成對該單元本身的限定,例如,確定模塊還可以被描述為“配置用于從待推送新聞的新聞文本中確定至少一個新聞主體的模塊”。
作為另一方面,本申請還提供了一種計算機可讀介質(zhì),該計算機可讀介質(zhì)可以是上述實施例中描述的裝置中所包含的;也可以是單獨存在,而未裝配入該裝置中。上述計算機可讀介質(zhì)承載有一個或者多個程序,當上述一個或者多個程序被該裝置執(zhí)行時,使得該裝置:從待推送新聞的新聞文本中確定至少一個新聞主體;提取上述新聞文本中分別與各個新聞主體相關(guān)聯(lián)的文本片段;對每個新聞主體,根據(jù)所提取的文本片段通過深度學習方法生成主體標簽;基于上述至少一個新聞主體和所生成的主體標簽推送上述待推送新聞。
以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離上述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進行互相替換而形成的技術(shù)方案。