本發(fā)明實(shí)施例涉及機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及一種詞向量學(xué)習(xí)模型的訓(xùn)練方法及服務(wù)器。
背景技術(shù):
義原是單詞的最小語義單元,可以使用有限個(gè)義原描述數(shù)量龐大的中文單詞的語義。對(duì)于每個(gè)單詞來說,這個(gè)單詞擁有的義原并沒有直觀的表現(xiàn)出來,為了進(jìn)行相應(yīng)的研究,一些研究人員對(duì)每個(gè)單詞進(jìn)行了人工標(biāo)注,通過語言學(xué)的知識(shí)來為每個(gè)單詞分配一個(gè)或多個(gè)義原,并由此形成了一個(gè)知識(shí)庫(kù)hownet(知網(wǎng))。
詞向量是指將單詞向量化,詞向量包括有不同的維數(shù),每一維數(shù)描述了單詞的一種特征,將單詞轉(zhuǎn)化為詞向量可以幫助計(jì)算機(jī)去理解自然語言,現(xiàn)有技術(shù)通過對(duì)詞向量學(xué)習(xí)模型進(jìn)行訓(xùn)練,來預(yù)測(cè)單詞語義信息。但是上述詞向量學(xué)習(xí)模型中的詞向量沒有關(guān)系到單詞的最小語義單元——義原,因此,不能充分地表達(dá)單詞的語義信息。
因此,如何通過義原向量或詞義向量訓(xùn)練詞向量學(xué)習(xí)模型中的詞向量,使其能夠充分地表達(dá)單詞的語義信息,成為亟須解決的問題。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)存在的問題,本發(fā)明實(shí)施例提供一種詞向量學(xué)習(xí)模型的訓(xùn)練方法及服務(wù)器。
第一方面,本發(fā)明實(shí)施例提供一種詞向量學(xué)習(xí)模型的訓(xùn)練方法,所述方法包括:
獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;
根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;
將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
第二方面,本發(fā)明實(shí)施例提供一種詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器,所述服務(wù)器包括:
獲取模塊,用于獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;
表示模塊,用于根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;
代入模塊,用于將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
第三方面,本發(fā)明實(shí)施例提供另一種詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器,包括:處理器、存儲(chǔ)器和總線,其中,
所述處理器和所述存儲(chǔ)器通過所述總線完成相互間的通信;
所述存儲(chǔ)器存儲(chǔ)有可被所述處理器執(zhí)行的程序指令,所述處理器調(diào)用所述程序指令能夠執(zhí)行如下方法:
獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;
根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;
將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
第四方面,本發(fā)明實(shí)施例提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:
所述非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)指令,所述計(jì)算機(jī)指令使所述計(jì)算機(jī)執(zhí)行如下方法:
獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;
根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;
將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法及服務(wù)器,通過義原向量或詞義向量表示詞向量,并訓(xùn)練由詞義向量或義原向量表示的詞向量對(duì)應(yīng)的詞向量學(xué)習(xí)模型,使其能夠充分地表達(dá)單詞的語義信息。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例詞向量學(xué)習(xí)模型的訓(xùn)練方法流程示意圖;
圖2為本發(fā)明實(shí)施例詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器結(jié)構(gòu)示意圖;
圖3為本發(fā)明實(shí)施例提供的服務(wù)器實(shí)體結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1為本發(fā)明實(shí)施例詞向量學(xué)習(xí)模型的訓(xùn)練方法流程示意圖,如圖1所示,本發(fā)明實(shí)施例提供的一種詞向量學(xué)習(xí)模型的訓(xùn)練方法,包括以下步驟:
s1:獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量。
具體的,服務(wù)器獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量。需要說明的是:詞向量學(xué)習(xí)模型使用之前需要先進(jìn)行單詞詞向量的訓(xùn)練,訓(xùn)練要使用訓(xùn)練樣本文本,訓(xùn)練樣本文本包括有可作為樣本的單詞對(duì)應(yīng)的詞義向量和義原向量,下面舉例說明詞義向量和義原向量,以單詞“蘋果”為例:詞義向量可以代表蘋果品牌、水果中的蘋果;其中代表蘋果品牌的詞義向量還包括有多個(gè)義原向量,如:電腦、手機(jī)、方便攜帶、樣式值等最小化的語義單元,即單詞詞向量、詞義向量和義原向量之間的關(guān)系是:詞向量可以包括一個(gè)或多個(gè)詞義向量;一個(gè)詞義向量可以包括一個(gè)或多個(gè)義原向量。可以從知識(shí)庫(kù)hownet(知網(wǎng))的原始詞集中獲取到訓(xùn)練樣本文本中單詞對(duì)應(yīng)的義原。
s2:根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量。
具體的,服務(wù)器根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量。從上述實(shí)施例的說明可以看出:用詞義向量或義原向量表示詞向量,能夠使得詞向量所表示的語義信息更加豐富。
s3:將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
具體的,服務(wù)器將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。已有的詞向量學(xué)習(xí)模型包括有skip-gram模型等,進(jìn)行模型訓(xùn)練的方法可以有多種,可以采用后向傳播計(jì)算參數(shù)的梯度,并使用該梯度更新參數(shù),更新的參數(shù)可以包括更新詞向量、義原向量等。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過義原向量或詞義向量表示詞向量,并訓(xùn)練由詞義向量或義原向量表示的詞向量對(duì)應(yīng)的詞向量學(xué)習(xí)模型,使其能夠充分地表達(dá)單詞的語義信息。
在上述實(shí)施例的基礎(chǔ)上,所述根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量,包括:
在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi。
具體的,服務(wù)器在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi。可以按順序或隨機(jī)選擇句子和句子中的單詞,選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi,用詞義向量或義原向量表示后,再依次選擇該句子中的每一個(gè)單詞作為目標(biāo)單詞wi,再用詞義向量或義原向量表示,直至完成該句子中所有單詞用詞義向量或義原向量表示,然后在訓(xùn)練樣本文本中遍歷所有的句子,重復(fù)上述的將每一個(gè)句子中所有單詞用詞義向量或義原向量表示的步驟,直至完成訓(xùn)練樣本文本中所有單詞用詞義向量或義原向量表示。
用所述目標(biāo)單詞wi對(duì)應(yīng)的義原向量總和的平均值表示所述目標(biāo)單詞wi的詞向量。
具體的,服務(wù)器用所述目標(biāo)單詞wi對(duì)應(yīng)的義原向量總和的平均值表示所述目標(biāo)單詞wi的詞向量??梢圆捎萌缦鹿竭M(jìn)行計(jì)算:
其中,m代表目標(biāo)單詞wi的義原向量總數(shù)量,s(wi)表示目標(biāo)單詞wi的詞義向量集合,x(s)表示其中一個(gè)詞義向量中的義原向量集合,x表示義原向量。簡(jiǎn)單來說,就是用目標(biāo)單詞wi的義原向量的平均值表示目標(biāo)單詞wi的詞向量。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過用目標(biāo)單詞對(duì)應(yīng)的義原向量總和的平均值表示目標(biāo)單詞的詞向量,并訓(xùn)練義原向量總和的平均值表示目標(biāo)單詞的詞向量對(duì)應(yīng)的詞向量學(xué)習(xí)模型,使其能夠充分地表達(dá)目標(biāo)單詞的語義信息。
在上述實(shí)施例的基礎(chǔ)上,所述根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量,包括:
在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi。
具體的,服務(wù)器在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi??蓞⒄丈鲜鰧?shí)施例的說明,此處不再贅述。
將所述目標(biāo)單詞wi的前k個(gè)與后k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,前k個(gè)與后k個(gè)單詞組成的上下文單詞的集合記為c(wi)。
具體的,服務(wù)器將所述目標(biāo)單詞wi的前k個(gè)與后k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,前k個(gè)與后k個(gè)單詞組成的上下文單詞的集合記為c(wi)。需要說明的是,如果目標(biāo)單詞wi位于該句子中的句首,則將所述目標(biāo)單詞wi的后k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,如果目標(biāo)單詞wi所在的位置與句首單詞之間的單詞數(shù)不足k個(gè),則將目標(biāo)單詞wi與句首單詞之間的所有單詞和后k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞;如果目標(biāo)單詞wi位于該句子中的句尾,則將所述目標(biāo)單詞wi的前k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,如果目標(biāo)單詞wi所在的位置與句尾單詞之間的單詞數(shù)不足k個(gè),則將目標(biāo)單詞wi與句尾單詞之間的所有單詞和前k個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞。
用所述目標(biāo)單詞wi對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述目標(biāo)單詞wi的詞向量。
具體的,服務(wù)器用所述目標(biāo)單詞wi對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述目標(biāo)單詞wi的詞向量??梢圆捎萌缦鹿竭M(jìn)行計(jì)算:
其中,att(s)表示目標(biāo)單詞wi中的一個(gè)詞義向量的權(quán)值,s表示的是詞義向量,s(wi)表示目標(biāo)單詞wi的詞義向量集合、|s(wi)|表示目標(biāo)單詞wi的詞義向量集合總值。
特定的一個(gè)詞義向量的權(quán)值的計(jì)算公式為:
其中,att(sj)表示目標(biāo)單詞wi第j個(gè)詞義向量的權(quán)值,w表示上下文單詞的平均詞向量,
其中特定的一個(gè)
其中,x是這個(gè)詞義向量中的一個(gè)義原向量、x(sj)是這個(gè)詞義向量的所有義原向量集合、|x(sj)|是這個(gè)詞義向量的所有義原向量集合總值。
其中w的計(jì)算公式為:
其中,wc表示前k個(gè)與后k個(gè)單詞組成的上下文單詞中的一個(gè)、c(wi)表示前k個(gè)與后k個(gè)單詞組成的上下文單詞的集合、其中分母中的2k的具體數(shù)值需要根據(jù)上述實(shí)施例中目標(biāo)單詞wi位于該句子中的句首、句尾等不同情況作相應(yīng)的調(diào)整,以使分母數(shù)值等于上下文單詞總個(gè)數(shù)。
或,
用與所述目標(biāo)單詞wi對(duì)應(yīng)的權(quán)重最大的詞義向量表示所述目標(biāo)單詞wi的詞向量。
具體的,服務(wù)器用與所述目標(biāo)單詞wi對(duì)應(yīng)的權(quán)重最大的詞義向量表示所述目標(biāo)單詞wi的詞向量??梢砸来胃鶕?jù)上述的公式:
計(jì)算每一個(gè)詞義向量的權(quán)值,將其中權(quán)值最大的詞義向量表示所述目標(biāo)單詞wi的詞向量。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過用目標(biāo)單詞對(duì)應(yīng)的詞義向量的加權(quán)平均值或權(quán)重最大的詞義向量表示目標(biāo)單詞的詞向量,并訓(xùn)練表示后的詞向量學(xué)習(xí)模型,考慮了上下文對(duì)于目標(biāo)單詞的影響,能夠結(jié)合上下文的語義判斷目標(biāo)單詞的語義。
在上述實(shí)施例的基礎(chǔ)上,所述方法還包括:
在所述上下文單詞的集合c(wi)中選擇一個(gè)上下文單詞wc,用與所述上下文單詞wc對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述上下文單詞wc的詞向量。
具體的,服務(wù)器在所述上下文單詞的集合c(wi)中選擇一個(gè)上下文單詞wc,用與所述上下文單詞wc對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述上下文單詞wc的詞向量??梢圆捎萌缦鹿竭M(jìn)行計(jì)算:
其中,att(s)表示目標(biāo)單詞wi的上下文單詞wc中的一個(gè)詞義向量的權(quán)值,s表示的是詞義向量,s(wc)表示目標(biāo)單詞wi的上下文單詞wc的詞向量集合、|s(wc)|表示目標(biāo)單詞wi的上下文單詞wc的詞義向量集合總值。
特定的一個(gè)詞義向量的權(quán)值的計(jì)算公式為:
其中,att(sj)表示目標(biāo)單詞wi的上下文單詞wc中的第j個(gè)詞義向量的權(quán)值,wi表示上下文單詞對(duì)應(yīng)的目標(biāo)單詞,
其中特定的一個(gè)
其中,x是這個(gè)詞義向量中的一個(gè)義原向量、x(sj)是這個(gè)詞義向量的所有義原向量集合、|x(sj)|是這個(gè)詞義向量的所有義原向量集合總值。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過上下文單詞對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述上下文單詞的詞向量,并訓(xùn)練表示后的詞向量學(xué)習(xí)模型,能夠充分地表達(dá)上下文單詞的語義信息。
在上述實(shí)施例的基礎(chǔ)上,所述方法還包括:
將所述目標(biāo)單詞wi的前k′個(gè)與后k′個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,前k′個(gè)與后k′個(gè)單詞組成的上下文單詞的集合記為c′(wi),其中k′<k。
具體的,服務(wù)器將所述目標(biāo)單詞wi的前k′個(gè)與后k′個(gè)單詞組成所述目標(biāo)單詞wi的上下文單詞,前k′個(gè)與后k′個(gè)單詞組成的上下文單詞的集合記為c′(wi),其中k′<k。一般來說,選擇最靠近目標(biāo)單詞wi的幾個(gè)上下文單詞已經(jīng)足夠表示目標(biāo)單詞wi的準(zhǔn)確語義,使用更多的詞反而可能引入更多誤差,因此,可以選擇更少的、距離更近的一些單詞作為目標(biāo)單詞wi上下文的單詞。
用所述目標(biāo)單詞wi對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述目標(biāo)單詞wi的詞向量。
具體的,服務(wù)器用所述目標(biāo)單詞wi對(duì)應(yīng)的詞義向量的加權(quán)平均值表示所述目標(biāo)單詞wi的詞向量。需要說明的是:將計(jì)算w的公式變更如下:
具體步驟及說明可參照上述實(shí)施例,不再贅述。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過前k′個(gè)與后k′個(gè)單詞組成的上下文單詞對(duì)應(yīng)的詞義向量的加權(quán)平均值表示上下文單詞的詞向量,并訓(xùn)練表示后的詞向量學(xué)習(xí)模型,不僅考慮了上下文單詞對(duì)于目標(biāo)單詞的影響,還能夠更加準(zhǔn)確表示目標(biāo)單詞的語義。
在上述實(shí)施例的基礎(chǔ)上,所述將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,包括:
將由所述義原向量或詞義向量表示的所述目標(biāo)單詞wi代入公式:
中的wi;
或,
將由所述詞義向量表示的所述上下文單詞wc代入上述公式中的wc;
或,
將由所述詞義向量的加權(quán)平均值表示的目標(biāo)單詞wi代入上述公式中的wi;所述詞義向量的加權(quán)平均值由公式
其中,wc是目標(biāo)單詞wi的上下文單詞、c(wi)是前k個(gè)與后k個(gè)單詞組成的目標(biāo)單詞wi的上下文單詞的集合、c‘(wi)是前k′個(gè)與后k′個(gè)單詞組成的目標(biāo)單詞wi的上下文單詞的集合、k′<k、w是訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量所在的原始詞集,所述原始詞集從知網(wǎng)中獲取、wi是目標(biāo)單詞、w′i是包括所述目標(biāo)單詞wi在內(nèi)的所有目標(biāo)單詞集。
具體的,服務(wù)器將公式:
代入公式:
中的wi;
或,
將公式:
或由公式:
計(jì)算出的權(quán)值最大的詞義向量
代入公式:
中的wc;
或,
將由所述詞義向量的加權(quán)平均值表示的目標(biāo)單詞wi代入上述公式中的wi;所述詞義向量的加權(quán)平均值由公式
其中,wc是目標(biāo)單詞wi的上下文單詞、c(wi)是前k個(gè)與后k個(gè)單詞組成的目標(biāo)單詞wi的上下文單詞的集合、c‘(wi)是前k′個(gè)與后k′個(gè)單詞組成的目標(biāo)單詞wi的上下文單詞的集合、k′<k、w是訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量所在的原始詞集,所述原始詞集從知網(wǎng)中獲取、該知網(wǎng)可以是上文中提及的知識(shí)庫(kù)hownet、wi是目標(biāo)單詞、w′i是包括所述目標(biāo)單詞wi在內(nèi)的所有目標(biāo)單詞集。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練方法,通過將由詞義向量或義原向量表示的詞向量代入詞向量學(xué)習(xí)模型,進(jìn)一步實(shí)現(xiàn)單詞的語義信息表達(dá)的充分性。
圖2為本發(fā)明實(shí)施例詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器結(jié)構(gòu)示意圖,如圖2所示,本發(fā)明實(shí)施例提供了一種詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器,包括獲取模塊1、表示模塊2和代入模塊3,其中:
獲取模塊1用于獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量,表示模塊2用于根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量,代入模塊3用于將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
具體的,獲取模塊1用于獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量,獲取模塊1將詞義向量和義原向量發(fā)送給表示模塊2,表示模塊2用于根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量,表示模塊2將根據(jù)詞義向量或義原向量表示的詞向量代入模塊3,代入模塊3用于將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器,通過義原向量或詞義向量表示詞向量,并訓(xùn)練由詞義向量或義原向量表示的詞向量對(duì)應(yīng)的詞向量學(xué)習(xí)模型,使其能夠充分地表達(dá)單詞的語義信息。
在上述實(shí)施例的基礎(chǔ)上,所述表示模塊2具體用于:
在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi;用所述目標(biāo)單詞wi對(duì)應(yīng)的義原向量總和的平均值表示所述目標(biāo)單詞wi的詞向量。
具體的,所述表示模塊2具體用于:
在所述訓(xùn)練樣本文本中選擇一個(gè)句子中的一個(gè)單詞作為目標(biāo)單詞wi;用所述目標(biāo)單詞wi對(duì)應(yīng)的義原向量總和的平均值表示所述目標(biāo)單詞wi的詞向量。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的訓(xùn)練服務(wù)器,通過用目標(biāo)單詞對(duì)應(yīng)的義原向量總和的平均值表示目標(biāo)單詞的詞向量,并訓(xùn)練義原向量總和的平均值表示目標(biāo)單詞的詞向量對(duì)應(yīng)的詞向量學(xué)習(xí)模型,使其能夠充分地表達(dá)目標(biāo)單詞的語義信息。
本發(fā)明實(shí)施例提供的詞向量學(xué)習(xí)模型的服務(wù)器具體可以用于執(zhí)行上述各方法實(shí)施例的處理流程,其功能在此不再贅述,可以參照上述方法實(shí)施例的詳細(xì)描述。
圖3為本發(fā)明實(shí)施例提供的服務(wù)器實(shí)體結(jié)構(gòu)示意圖,如圖3所示,所述服務(wù)器包括:處理器(processor)301、存儲(chǔ)器(memory)302和總線303;
其中,所述處理器301、存儲(chǔ)器302通過總線303完成相互間的通信;
所述處理器301用于調(diào)用所述存儲(chǔ)器302中的程序指令,以執(zhí)行上述各方法實(shí)施例所提供的方法,例如包括:獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
本實(shí)施例公開一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)在非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序指令,當(dāng)所述程序指令被計(jì)算機(jī)執(zhí)行時(shí),計(jì)算機(jī)能夠執(zhí)行上述各方法實(shí)施例所提供的方法,例如包括:獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
本實(shí)施例提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)指令,所述計(jì)算機(jī)指令使所述計(jì)算機(jī)執(zhí)行上述各方法實(shí)施例所提供的方法,例如包括:獲取訓(xùn)練樣本文本中單詞對(duì)應(yīng)的詞義向量和義原向量;根據(jù)所述詞義向量或所述義原向量表示所述訓(xùn)練樣本文本中的詞向量;將由所述詞義向量或所述義原向量表示的詞向量代入已有的詞向量學(xué)習(xí)模型,并進(jìn)行模型訓(xùn)練。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所描述的服務(wù)器等實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件。基于這樣的理解,上述技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的實(shí)施例的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明的實(shí)施例進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明的實(shí)施例各實(shí)施例技術(shù)方案的范圍。