消息推薦方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實施例涉及互聯(lián)網(wǎng)技術(shù),尤其涉及一種消息推薦方法及裝置。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)中的社交媒體,例如微博、Twitter等受到廣大用戶的歡迎。用戶可方便的 獲取該用戶所關(guān)注的人發(fā)送的各類消息,極大的方便了用戶獲取信息的需求。
[0003] 現(xiàn)有技術(shù)中,社交媒體推送消息的方式主要是基于用戶的圈子(例如用戶所關(guān)注 的人)來發(fā)送消息。一般來說,沒有被該用戶關(guān)注的圈子中的消息無法被用戶獲取。
[0004] 用戶從其關(guān)注的圈子中獲取的消息中,有大量的消息是用戶不感興趣的,這樣就 浪費了用戶的時間和精力。而沒有被該用戶關(guān)注的圈子中的消息中,有大量的消息是用戶 感興趣的,但用戶無法獲得這些消息,因此,現(xiàn)有技術(shù)中社交媒體向用戶推送消息的方式缺 乏靈活性。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例提供一種消息推薦方法及裝置,以使用戶可以方便靈活地獲取到感 興趣的消息。
[0006] 第一方面,本發(fā)明實施例提供一種消息推薦方法,包括:
[0007] 分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò)上發(fā)布的第二 消息,獲取所述第一消息的興趣描述信息以及所述第二消息的話題描述信息;其中,所述第 二用戶為除所述第一用戶之外的其它用戶;
[0008] 將所述話題描述信息與所述興趣描述信息進(jìn)行比較,并計算所述話題描述信息與 所述興趣描述信息的相似度;
[0009] 若所述相似度大于或等于預(yù)定值時,向所述第一用戶推送所述第二用戶發(fā)布的所 述第二消息。
[0010] 結(jié)合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,所述興趣描述信息包括 所述第一用戶發(fā)布的所述第一消息在K個話題上的概率分布信息;所述話題描述信息包括 所述第二用戶發(fā)布的所述第二消息在K個話題上的概率分布信息,所述K為大于0的整數(shù);
[0011] 相應(yīng)地,所述對所述話題描述信息與所述興趣描述信息進(jìn)行比較,并計算所述話 題描述信息與所述興趣描述信息的相似度,包括:
[0012] 比較所述第二消息在K個話題上的概率分布信息與所述第一消息在K個話題上的 概率分布信息,并計算所述第二消息在K個話題上的概率分布信息與所述第一消息在K個 話題上的概率分布信息的相似度。
[0013] 結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式 中,所述分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò)上發(fā)布的第二消 息,獲取所述第一消息的興趣描述信息以及所述第二消息的話題描述信息,具體包括:
[0014] 分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò)上發(fā)布的第二 消息,獲取所述第一消息以及所述第二消息中每一個詞在K個話題上的分配信息;分別根 據(jù)所述分配信息確定所述第一消息的興趣描述信息以及所述第二消息的話題描述信息。
[0015] 結(jié)合第一方面的第二種可能的實現(xiàn)方式,在第一方面的第三種可能的實現(xiàn)方式 中,所述分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò)上發(fā)布的第二消 息,獲取所述第一消息以及所述第二消息中每一個詞在K個話題上的分配信息;分別根據(jù) 所述分配信息確定所述第一消息的興趣描述信息以及所述第二消息的話題描述信息,包 括:
[0016] 將消息中的每一個詞隨機分配給所述K個話題中的任意一個,獲取經(jīng)過隨機分配 后所述消息中每一個詞在所述K個話題上的分配信息;其中,所述消息包括所述第一消息 或所述第二消息;
[0017] 使用吉布斯采樣的方法,從所述消息中的第一個詞開始,根據(jù)所述詞屬于其他話 題概率的大小,確定是否需要將所述詞重新分配到其他話題,當(dāng)確定結(jié)果為是,則將所述詞 進(jìn)一步分配到所述需要分配的話題上,直至遍歷所述消息中所有詞,更新經(jīng)過所述遍歷之 后所述消息中需要重新分配的詞在所述K個話題上的分配信息;
[0018] 重復(fù)所述遍歷,直至重復(fù)的次數(shù)達(dá)到第一預(yù)定值,或者需要被重新分配話題的詞 占據(jù)發(fā)送所述消息的用戶發(fā)布的所有消息中的所有詞的比例少于第二預(yù)定值時停止所述 遍歷,并獲取經(jīng)過最后一次遍歷之后所述消息中每一個詞在K個話題上的當(dāng)前分配信息;
[0019] 若所述消息為所述第一消息時,根據(jù)所述第一消息中每一個詞在所述K個話題上 的當(dāng)前分配信息確定所述第一消息的興趣描述信息;
[0020] 若所述消息為所述第二消息時,根據(jù)所述第二消息中每一個詞在所述K個話題上 的當(dāng)前分配信息確定所述第二消息的話題描述信息。
[0021 ] 結(jié)合第一方面的第一種至第三種任一種可能的實現(xiàn)方式,在第一方面的第四種可 能的實現(xiàn)方式中,所述比較所述第二消息在K個話題上的概率分布信息與所述第一消息在 K個話題上的概率分布信息,并計算所述第二消息在K個話題上的概率分布信息與所述第 一消息在K個話題上的概率分布信息的相似度,具體包括:
[0022] 使用余弦相似度算法:
[0023]
其中,s(u,d)表示所述第一消息的興趣描述信息與所述 第二消息的話題描述信息的相似度;u表示所述第一消息的興趣描述信息;d表示所述第二 消息的話題描述信息;Pl表示向量U的第i個分量;qi表示向量d的第i個分量。
[0024] 結(jié)合第一方面的第一種至第三種任一種可能的實現(xiàn)方式,在第一方面的第五種可 能的實現(xiàn)方式中,所述比較所述第二消息在K個話題上的概率分布信息與所述第一消息在 K個話題上的概率分布信息,并計算所述第二消息在K個話題上的概率分布信息與所述第 一消息在K個話題上的概率分布信息的相似度,具體包括:
[0025] 使用KL散度算法:
[0026]
,其中,KL (u,d)表示所述第一消息的興趣描述信息與所述第 二消息的話題描述信息的相似度;U表示所述第一消息的興趣描述信息;d表示所述第二消 息的話題描述信息;Pi表示向量u的第i個分量表示向量d的第i個分量。
[0027] 第二方面,本發(fā)明實施例提供一種消息推薦裝置,包括:
[0028] 獲取模塊,用于分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò) 上發(fā)布的第二消息,獲取所述第一消息的興趣描述信息以及所述第二消息的話題描述信 息;其中,所述第二用戶為除所述第一用戶之外的其它用戶;
[0029] 比較模塊,用于將所述話題描述信息與所述興趣描述信息進(jìn)行比較,并計算所述 話題描述信息與所述興趣描述信息的相似度;
[0030] 推送模塊,用于若所述相似度大于或等于預(yù)定值時,向所述第一用戶推送所述第 二用戶發(fā)布的消息。
[0031] 結(jié)合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,所述興趣描述信息包括 所述第一用戶發(fā)布的所述第一消息在K個話題上的概率分布信息;所述話題描述信息包括 所述第二用戶發(fā)布的所述第二消息在K個話題上的概率分布信息,所述K為大于0的整數(shù);
[0032] 相應(yīng)地,所述比較模塊具體用于:比較所述第二消息在K個話題上的概率分布信 息與所述第一消息在K個話題上的概率分布信息,并計算所述第二消息在K個話題上的概 率分布信息與所述第一消息在K個話題上的概率分布信息的相似度。
[0033] 結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式 中,所述獲取模塊具體用于:
[0034] 分別解析第一用戶在網(wǎng)絡(luò)上發(fā)布的第一消息以及第二用戶在網(wǎng)絡(luò)上發(fā)布的第二 消息,獲取所述第一消息以及所述第二消息中每一個詞在K個話題上的分配信息;分別根 據(jù)所述分配信息確定所述第一消息的興趣描述信息以及所述第二消息的話題描述信息。
[0035] 結(jié)合第二方面的第二種可能的實現(xiàn)方式,在第二方面的第三種可能的實現(xiàn)方式 中,所述獲取模塊,包括:
[0036] 分配單元,用于將消息中的每一個詞隨機分配給所述K個話題中的任意一個,獲 取經(jīng)過隨機分配后所述消息中每一個詞在所述K個話題上的分配信息;其中,所述消息包 括所述第一消息或所述第二消息;
[0037] 第一確定單元,用于使用吉布斯采樣的方法,從所述消息中的第一個詞開始,根據(jù) 所述詞屬于其他話題概率的大小,確定是否需要將所述詞重新分配到其他話題,當(dāng)確定結(jié) 果為是,則將所述詞進(jìn)一步分配到所述需要分配的話題上,直至遍歷所述消息中所有詞,更 新經(jīng)過所述遍歷之后所述消息中需要重新分配的詞在所述K個話題上的分配信息;
[0038] 所述第一確定單元,還用于:重復(fù)所述遍歷,直至重復(fù)的次數(shù)達(dá)到第一預(yù)定值,或 者