關鍵詞的顯示方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種關鍵詞的顯示方法和裝置,該方法包括:在確定輸入的信息為人名時,查找與該人名對應的語句;將查找到的語句作為目標語句進行分詞處理,得到目標語句分詞后的詞匯;在目標語句分詞后的詞匯中確定關鍵詞;獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值;根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序;將查找到的語句和已確定的關鍵詞進行顯示,其中每個關鍵詞是按照該排列順序顯示的。能夠在輸入指定的人名后自動顯示與該人名對應的語句以及關鍵詞,能夠解決通過人工總結語錄關鍵詞的工作效率低以及準確性低的問題,達到提高工作效率低以及準確性的效果。
【專利說明】
關鍵詞的顯示方法和裝置
技術領域
[0001]本發(fā)明涉及文字處理技術領域,涉及一種關鍵詞的顯示方法和關鍵詞的顯示裝置。
【背景技術】
[0002]隨著互聯(lián)網(wǎng)的普及和發(fā)展,越來越多的新鮮詞匯也在不斷的產(chǎn)生。很多名人說過的經(jīng)典語錄也會在互聯(lián)網(wǎng)上廣為流傳。每到年末的時候也會有各種各樣的機構或媒體對今年的熱點語錄做總結。
[0003]目前,統(tǒng)計人員在制作類似的總結時,需要對檢索結果進行人工瀏覽,總結內容后才能得到某位名人說了那些熱度詞匯或經(jīng)常提到的詞匯。但是這種人工總結的方式不但工作效率低下,總結出的結果的準確性也較低。
【發(fā)明內容】
[0004]本發(fā)明提供一種關鍵詞的顯示方法和裝置,用于解決人工總結方式的工作效率低以及準確性低的問題。
[0005]為了實現(xiàn)上述目的,本發(fā)明提供一種關鍵詞的顯示方法,所述方法包括:
[0006]當確定輸入的信息為人名時,查找與所述人名對應的語句;
[0007]將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯;
[0008]在所述目標語句分詞后的詞匯中確定關鍵詞;
[0009]獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值;
[0010]根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序;
[0011]將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。
[0012]可選的,在所述當確定輸入的信息為人名時,查找與所述人名對應的語句的步驟之前,所述方法還包括:
[0013]接收輸入的目標文章;
[0014]對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯;
[0015]確定所述目標文章分詞后的詞匯中是否存在人名;
[0016]當所述目標文章分詞后的詞匯中存在至少一個人名時,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄;
[0017]當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名;
[0018]將所述第一人名以及所述任一人名對應的語句進行存儲。
[0019]可選的,所述獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中所述每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值的步驟包括:
[0020]統(tǒng)計每個關鍵詞的詞頻;以及,
[0021]根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。
[0022]可選的,所述社會影響指數(shù)包括被引用次數(shù)或評論數(shù)量,所述根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值包括:
[0023]當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理;
[0024]當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及,
[0025]當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理;
[0026]其中,所述第一關鍵詞為所述已確定的關鍵詞中的任意一個關鍵詞。
[0027]可選的,所述確定所述目標文章分詞后的詞匯中是否存在人名包括:
[0028]獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性;
[0029]根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞;
[0030]利用自然語言處理技術識別所述名詞中是否存在人名。
[0031]可選的,所述將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的包括:
[0032]將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照所述排列順序顯示的;
[0033]將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。
[0034]可選的,所述人名對應的語句包括:與所述人名對應的人物語錄,或者包含所述人物語錄的語句或文章。
[0035]本發(fā)明還提供一種關鍵詞的顯示裝置,所述裝置包括:
[0036]人名識別模塊,用于當確定輸入的信息為人名時,查找與所述人名對應的語句;
[0037]分詞模塊,用于將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯;
[0038]關鍵詞提取模塊,用于在所述目標語句分詞后的詞匯中確定關鍵詞;
[0039]屬性確定模塊,用于獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值;
[0040]排序模塊,用于根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序;
[0041]顯示模塊,用于將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。
[0042]可選的,所述裝置還包括:輸入模塊,語錄識別模塊,語句抽取模塊以及存儲模塊;
[0043]所述輸入模塊,用于在所述當確定輸入的信息為人名時,查找與所述人名對應的語句的步驟之前,接收輸入的目標文章;
[0044]所述分詞模塊,用于對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯;
[0045]所述人名識別模塊,用于確定所述目標文章分詞后的詞匯中是否存在人名;
[0046]所述語錄識別模塊,用于當所述目標文章分詞后的詞匯中存在至少一個人名時,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄;
[0047]所述語句抽取模塊,用于當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名;
[0048]所述存儲模塊,用于將所述第一人名以及所述任一人名對應的語句進行存儲。
[0049]可選的,所述屬性確定模塊包括:
[0050]詞頻統(tǒng)計子模塊,用于統(tǒng)計每個關鍵詞的詞頻;以及,
[0051]權重確定子模塊,根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。
[0052]可選的,所述社會影響指數(shù)包括被引用次數(shù)或評論數(shù)量,所述權重確定子模塊用于:
[0053]當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理;
[0054]當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及,
[0055]當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理;
[0056]其中,所述第一關鍵詞為所述已確定的關鍵詞中的任意一個關鍵詞。
[0057]可選的,所述人名識別模塊用于:
[0058]獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性;
[0059]根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞;
[0060]利用自然語言處理技術識別所述名詞中是否存在人名。
[0061 ]可選的,所述顯示模塊用于:
[0062]將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照所述排列順序顯示的;
[0063]將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。
[0064]可選的,所述人名對應的語句包括:與所述人名對應的人物語錄,或者包含所述人物語錄的語句或文章。
[0065]本發(fā)明實施例提供的關鍵詞的顯示方法和裝置,通過在確定輸入的信息為人名時,查找與所述人名對應的語句,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯,而后在所述目標語句分詞后的詞匯中確定關鍵詞,并獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值,而后根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序,最后將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。通過上述技術方案,提供了一種人物熱點詞匯的顯示機制,能夠在輸入指定的人名后自動顯示與該人名對應的語句以及關鍵詞,能夠解決現(xiàn)有的通過人工總結語錄關鍵詞的工作效率低以及準確性低的問題,達到提高工作效率低以及準確性的效果。
[0066]本發(fā)明的其他特征和優(yōu)點將在隨后的【具體實施方式】部分予以詳細說明。
【附圖說明】
[0067]附圖是用來提供對本發(fā)明的進一步理解,并且構成說明書的一部分,與下面的【具體實施方式】一起用于解釋本發(fā)明,但并不構成對本發(fā)明的限制。在附圖中:
[0068]圖1是本發(fā)明一實施例提供一種關鍵詞的顯示方法的流程圖;
[0069]圖2是本發(fā)明一實施例提供一種關鍵詞的顯示方法的流程圖;
[0070]圖3是本發(fā)明一實施例提供的一種顯示界面的示意圖;
[0071 ]圖4是本發(fā)明一實施例提供一種關鍵詞的顯示裝置的框圖;
[0072]圖5是本發(fā)明一實施例提供另一種關鍵詞的顯示裝置的框圖。
【具體實施方式】
[0073]以下結合附圖對本發(fā)明的【具體實施方式】進行詳細說明。應當理解的是,此處所描述的【具體實施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0074]圖1是本發(fā)明一實施例提供一種關鍵詞的顯示方法的流程圖,參見圖1,該方法可以包括以下步驟。
[0075]步驟101,當確定輸入的信息為人名時,查找與所述人名對應的語句。
[0076]其中,與所述人名對應的語句可以是與該人名對應的人物語錄,或者包含人物語錄的語句或文章。查找與所述人名對應的語句,可以是在預先建立好的數(shù)據(jù)庫中查找,在該數(shù)據(jù)庫中可以包括多個人名對應的語句,其中每個人名可以對應多個語句,這些與人名對應的語句也是預先獲取并存儲在數(shù)據(jù)庫中的,其獲取方法可以參照圖2所示的實施例。
[0077]在查找到與所述人名對應的語句后可以進行步驟102。
[0078]步驟102,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯。
[0079]其中,以中文為例,該分詞處理即為中文分詞處理,包括詞匯拆分、標點符號過濾、停止詞過濾等。
[0080]步驟103,在所述目標語句分詞后的詞匯中確定關鍵詞。其中,確定關鍵詞可以通過語義分析以及關鍵詞庫匹配兩種處理技術來實現(xiàn)。
[0081 ]步驟104,獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值。
[0082]步驟105,根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序。
[0083]步驟106,將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。
[0084]綜上,本發(fā)明實施例提供的關鍵詞的顯示方法,通過在確定輸入的信息為人名時,查找與所述人名對應的語句,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯,而后在所述目標語句分詞后的詞匯中確定關鍵詞,并獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值,而后根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序,最后將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。通過上述技術方案,提供了一種人物熱點詞匯的顯示機制,能夠在輸入指定的人名后自動顯示與該人名對應的語句以及關鍵詞,能夠解決現(xiàn)有的通過人工總結語錄關鍵詞的工作效率低以及準確性低的問題,達到提高工作效率低以及準確性的效果。
[0085]圖2是本發(fā)明另一實施例提供一種關鍵詞的顯示方法的流程圖,參見圖2,該方法可以包括以下步驟。
[0086]步驟201,接收輸入的目標文章。
[0087]示例地,目標文章可以是記錄某一新聞的文章。
[0088]步驟202,對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯。
[0089]其中,以中文為例,該分詞處理即為中文分詞處理,包括詞匯拆分、標點符號過濾、停止詞(例如“的”)過濾等。
[0090]步驟203,確定所述目標文章分詞后的詞匯中是否存在人名。示例地,可以通過以下步驟:
[0091]首先,獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性;其次,根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞;最后,利用自然語言處理(NaturalLanguage Processing,簡稱NLP)技術識別所述名詞中是否存在人名。當所述目標文章分詞后的詞匯中存在至少一個人名時,進行步驟204。
[0092]步驟204,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄。
[0093]示例地,指定關鍵詞例如可以包括但不限于:講話、提到、指出、強調、說等用于表示“說”的動詞,這些詞后面的內容通常是人物所說的話,因此可以作為用于判斷是否存在語錄的關鍵詞。例如可以通過遍歷該目標文章的文章內容來檢測目標文章中是否有上述的指定關鍵詞,當在所述目標文章中在某一人名之后檢測到上述的指定關鍵詞中的任一個時,可以確定目標文章中存在語錄。反之,當在所述目標文章中檢測不到上述的指定關鍵詞中的任一個時,可以確定目標文章中不存在語錄。
[0094]或者,對于指定標點符號(或者標點符號組合),例如冒號和雙引號的組合:“”,其中雙引號中的內容也可以確定為語錄。因此,通過遍歷該目標文章的文章內容來檢測目標文章中是否有上述的指定標點符號,當在所述目標文章中在某一人名之后檢測到上述的指定標點符號時,可以確定目標文章中存在語錄。反之,當在所述目標文章中檢測不到上述的指定關鍵詞或者指定標點符號時,可以確定目標文章中不存在語錄。
[0095]示例地,假設目標文章中的一段內容為“XXXXXXX,ABC進行了重要講話XXXXX,提到XXXX,指出XXXX,強調XXXX,說XXX JXXXXXXXXXXXXXX?!逼渲蠥BC為人名,則在檢測到ABC后可以確定該目標文章中存在人名,而后利用上述的指定關鍵詞可以確定這段內容中包括指定關鍵詞“講話、提到、指出、強調、說”,因此可以可以確定該目標文章中存在語錄。
[0096]步驟205,當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名。
[0097]示例地,這里獲取包含所述第一人名對應的語錄的語句可以理解為從目標文章中僅抽取出所述第一人名對應的語錄,或者抽取出包含所述第一人名對應的語錄的句子、段落等等。并且,從所述目標文章獲取包含所述第一人名對應的語錄的語句可以利用NLP技術實現(xiàn),該NLP技術包括:分析目標文章中每個句子的上下文關系,并且可以配合上述的指定關鍵詞以及標點符號進行語句的識別以及獲取。
[0098]示例地,當在某一人名之后發(fā)現(xiàn)某一指定關鍵詞時,可以將從該人名的所在位置起往后的一定范圍內的文章內容抽取出來作為與人名對應的語句,這里的一定范圍可以根據(jù)需要來設置,比如可以是從該人名的所在位置起至出現(xiàn)句號為止。或者,當在某一人名之后發(fā)現(xiàn)某一標點符號時,可以將從該人名開始至該指定標點符號所包含的內容結束所包含的內容作為與該人名對應的語句。例如,雙引號中的內容。以步驟204中所示的目標文章中的一段內容“XXXXXXX,ABC進行了重要講話XXXXX,提到XXXX,指出XXXX,強調XXXX,說XXX。XXXXXXXXXXXXXXX?!睘槔?,通過以上方法,獲取的與人名ABC對應的語句可以是“ABC進行了重要講話XXXXX,提到XXXX,指出XXXX,強調XXXX,說XXX?!?br>[0099]步驟206,將所述第一人名以及所述任一人名對應的語句進行存儲。
[0100]在獲取的目標文章中的所有人名對應的語句后,存儲至數(shù)據(jù)庫中。并且每當有新的新聞或者其他熱點消息需要進行分析時,可以對該新聞或者消息進行上述步驟201-206,從而不斷的更新數(shù)據(jù)庫中的人名以及其對應的語句。當需要檢索某一人物的語錄以及關鍵詞時,可以進行以下步驟。
[0101 ]步驟207,當接收到輸入的信息時,判斷輸入的信息是否為人名。
[0102]當確定輸入的信息為人名時,進行步驟208,如果輸入的不是人名,則不進行后續(xù)步驟。
[0103]步驟208,查找與所述人名對應的語句。
[0104]步驟209,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯。
[0105]其中,以中文為例,該分詞處理即為中文分詞處理,包括詞匯拆分、標點符號過濾、停止詞(例如“的”)過濾等。
[0106]步驟210,在所述目標語句分詞后的詞匯中確定關鍵詞。
[0107]示例地,在所述目標語句分詞后的詞匯中確定關鍵詞,可以對分詞后的詞匯進行語義分析和關鍵詞庫匹配,得到相關語句中的關鍵詞。其中,關鍵詞庫匹配是用于輔助語義分析的技術,在某一詞語通過語義分析無法確定是否為關鍵詞時,可以將該詞語與關鍵詞庫中的詞語進行匹配,以便識別該詞語是否為關鍵詞。
[0108]步驟211,獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值。
[0109]示例地,統(tǒng)計每個關鍵詞的詞頻可以是統(tǒng)計每個關鍵詞在該人名對應的所有語句中的出現(xiàn)的總次數(shù)。而關鍵詞的權重值的獲取可以通過:根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。
[0110]示例地,某一語句的數(shù)據(jù)來源可是指提供該語句的網(wǎng)站(例如新華網(wǎng))或者媒體(例如人民日報);內容來源可是指該語句的出處(例如該語句的內容是在某重大會議中指出的);社會影響指數(shù)例如可以是該語句(或者是該語句所在文章)的被引用次數(shù)或者評論數(shù)量。因此,以第一關鍵詞為例(該第一關鍵詞可以是任意一個關鍵詞),上述的根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值的步驟可以包括:
[0111]當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理;
[0112]當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及,
[0113]當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理。
[0114]其中,上述每種情況中對第一關鍵詞的權重值進行的加值處理所加的權重值與其他兩種情況中對第一關鍵詞的權重值進行的加值處理所加的權重值可以相同,也可以不同。另外,如果某一相關語句滿足上述三種情況中的至少兩種,則加值處理是可以疊加的。
[0115]其中,統(tǒng)計詞頻和計算關鍵詞的權重值之間沒有固定的執(zhí)行順序,可以先執(zhí)行其中的任一個,也可以同時執(zhí)行。
[0116]步驟212,根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序。
[0117]示例地,可以按照每個關鍵詞的詞頻進行降序排列作為該至少一個關鍵詞的排列順序,即詞頻越高顯示的位置越靠前。也可以將每個關鍵詞的詞頻乘以該關鍵詞的權重得到該關鍵詞的熱度指數(shù),然后按照每個關鍵詞的熱度指數(shù)進行降序排列作為該至少一個關鍵詞的排列順序,即熱度指數(shù)越高顯示的位置越靠前。
[0118]步驟213,將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。
[0119]示例地,可以將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照步驟211中得到的排列順序顯示的;并將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。
[0120]示例地,圖3是本發(fā)明一實施例提供的一種顯示界面的示意圖,參見圖3,該界面中包括顯示界面30,該顯示界面30中顯示有搜索欄31,在搜索欄31中輸入有人名ABC,該顯示界面30中的右側為上述的第一顯示位置,顯示有關鍵詞列表32。該顯示界面30中的左側為上述的第二顯示位置,顯示有人名ABC對應的語句33。示例地,如圖3所示,關鍵詞列表32中顯示有4個已確定的關鍵詞,分別為“兩學一做、APEC藍、三嚴三實和供給側改革”,這四個關鍵詞的排序是根據(jù)每個關鍵詞的詞頻和權重值確定的,其中每個關鍵詞的一側還顯示有用于表示該關鍵詞熱度的長條,長條越長,表示該關鍵詞的熱度越高。
[0121]另外,可選的,可以在顯示的相關語句中將該至少一個關鍵詞突出顯示,將關鍵詞突出顯示可以包括但不限于以下方式:將關鍵詞加粗、加下劃線、改變字體,改變底色(不同的關鍵詞可以采用不同的底色)、改變字體顏色(不同的關鍵詞可以采用不同的字體顏色)、字體放大等。
[0122]綜上,本發(fā)明實施例提供的關鍵詞的顯示方法,通過在確定輸入的信息為人名時,查找與所述人名對應的語句,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯,而后在所述目標語句分詞后的詞匯中確定關鍵詞,并獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值,而后根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序,最后將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。通過上述技術方案,提供了一種人物熱點詞匯的顯示機制,能夠在輸入指定的人名后自動顯示與該人名對應的語句以及關鍵詞,能夠解決現(xiàn)有的通過人工總結語錄關鍵詞的工作效率低以及準確性低的問題,達到提高工作效率低以及準確性的效果。
[0123]圖4是本發(fā)明一實施例提供一種關鍵詞的顯示裝置的框圖,該關鍵詞的顯示裝置40可以用于執(zhí)行上述的圖2或圖3所示的方法,參見該顯示裝置40可以包括:人名識別模塊410,分詞模塊420,關鍵詞提取模塊430,屬性確定模塊440,排序模塊450,顯示模塊460;其中:
[0124]人名識別模塊410,用于當確定輸入的信息為人名時,查找與所述人名對應的語句;
[0125]分詞模塊420,用于將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯;
[0126]關鍵詞提取模塊430,用于在所述目標語句分詞后的詞匯中確定關鍵詞;
[0127]屬性確定模塊440,用于獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值;
[0128]排序模塊450,用于根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序;
[0129]顯示模塊460,用于將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。
[0130]可選的,圖5是本發(fā)明一實施例提供另一種關鍵詞的顯示裝置,參見圖5,所述裝置40還包括:輸入模塊470,語錄識別模塊480,語句抽取模塊490以及存儲模塊400;
[0131]所述輸入模塊470,用于在所述當確定輸入的信息為人名時,查找與所述人名對應的語句的步驟之前,接收輸入的目標文章;
[0132]所述分詞模塊420,用于對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯;
[0133]所述人名識別模塊410,用于確定所述目標文章分詞后的詞匯中是否存在人名;
[0134]所述語錄識別模塊480,用于當所述目標文章分詞后的詞匯中存在至少一個人名時,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄;
[0135]所述語句抽取模塊490,用于當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名;
[0136]所述存儲模塊400,用于將所述第一人名以及所述任一人名對應的語句進行存儲。
[0137]可選的,所述屬性確定模塊440,用于:
[0138]詞頻統(tǒng)計子模塊441,用于統(tǒng)計每個關鍵詞的詞頻;以及,
[0139]權重確定子模塊442,用于根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。
[0140]可選的,所述社會影響指數(shù)包括被引用次數(shù)或評論數(shù)量,所述權重確定子模塊442用于:
[0141]當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理;
[0142]當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及,
[0143]當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理;
[0144]其中,所述第一關鍵詞為所述已確定的關鍵詞中的任意一個關鍵詞。
[0145]可選的,所述人名識別模塊410用于:
[0146]獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性;
[0147]根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞;
[0148]利用自然語言處理技術識別所述名詞中是否存在人名。
[0149]可選的,所述顯示模塊460用于:
[0150]將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照所述排列順序顯示的;
[0151]將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。
[0152]可選的,所述人名對應的語句包括:與所述人名對應的人物語錄,或者包含所述人物語錄的語句或文章。
[0153]綜上,本發(fā)明實施例提供的關鍵詞的顯示裝置,通過在確定輸入的信息為人名時,查找與所述人名對應的語句,將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯,而后在所述目標語句分詞后的詞匯中確定關鍵詞,并獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值,而后根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序,最后將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。通過上述技術方案,提供了一種人物熱點詞匯的顯示機制,能夠在輸入指定的人名后自動顯示與該人名對應的語句以及關鍵詞,能夠解決現(xiàn)有的通過人工總結語錄關鍵詞的工作效率低以及準確性低的問題,達到提高工作效率低以及準確性的效果。
[0154]以上結合附圖詳細描述了本發(fā)明的優(yōu)選實施方式,但是,本發(fā)明并不限于上述實施方式中的具體細節(jié),在本發(fā)明的技術構思范圍內,可以對本發(fā)明的技術方案進行多種簡單變型,這些簡單變型均屬于本發(fā)明的保護范圍。
[0155]另外需要說明的是,在上述【具體實施方式】中所描述的各個具體技術特征,在不矛盾的情況下,可以通過任何合適的方式進行組合,為了避免不必要的重復,本發(fā)明對各種可能的組合方式不再另行說明。
[0156]此外,本發(fā)明的各種不同的實施方式之間也可以進行任意組合,只要其不違背本發(fā)明的思想,其同樣應當視為本發(fā)明所公開的內容。
【主權項】
1.一種關鍵詞的顯示方法,其特征在于,所述方法包括: 當確定輸入的信息為人名時,查找與所述人名對應的語句; 將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯; 在所述目標語句分詞后的詞匯中確定關鍵詞; 獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值; 根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序; 將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。2.根據(jù)權利要求1所述的方法,其特征在于,在所述當確定輸入的信息為人名時,查找與所述人名對應的語句的步驟之前,所述方法還包括: 接收輸入的目標文章; 對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯; 確定所述目標文章分詞后的詞匯中是否存在人名; 當所述目標文章分詞后的詞匯中存在至少一個人名時,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄; 當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名; 將所述第一人名以及所述任一人名對應的語句進行存儲。3.根據(jù)權利要求1所述的方法,其特征在于,所述獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中所述每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值的步驟包括: 統(tǒng)計每個關鍵詞的詞頻;以及, 根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。4.根據(jù)權利要求3所述的方法,其特征在于,所述社會影響指數(shù)包括被引用次數(shù)或評論數(shù)量,所述根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值包括: 當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理; 當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及, 當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理; 其中,所述第一關鍵詞為所述已確定的關鍵詞中的任意一個關鍵詞。5.根據(jù)權利要求2所述的方法,其特征在于,所述確定所述目標文章分詞后的詞匯中是否存在人名包括: 獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性; 根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞; 利用自然語言處理技術識別所述名詞中是否存在人名。6.根據(jù)權利要求1-5任一項所述的方法,其特征在于,所述將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的包括: 將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照所述排列順序顯示的; 將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。7.—種關鍵詞的顯示裝置,其特征在于,所述裝置包括: 人名識別模塊,用于當確定輸入的信息為人名時,查找與所述人名對應的語句; 分詞模塊,用于將查找到的語句作為目標語句進行分詞處理,得到所述目標語句分詞后的詞匯; 關鍵詞提取模塊,用于在所述目標語句分詞后的詞匯中確定關鍵詞; 屬性確定模塊,用于獲取已確定的關鍵詞中的每個關鍵詞的關鍵詞屬性,其中每個關鍵詞的關鍵詞屬性包括每個關鍵詞的詞頻和權重值; 排序模塊,用于根據(jù)每個關鍵詞的詞頻和權重值獲取每個關鍵詞的排列順序; 顯示模塊,用于將所述查找到的語句和所述已確定的關鍵詞進行顯示,其中每個關鍵詞是按照所述排列順序顯示的。8.根據(jù)權利要求7所述的裝置,其特征在于,所述裝置還包括:輸入模塊,語錄識別模塊,語句抽取模塊以及存儲模塊; 所述輸入模塊,用于在所述當確定輸入的信息為人名時,查找與所述人名對應的語句的步驟之前,接收輸入的目標文章; 所述分詞模塊,用于對所述目標文章進行分詞處理,得到所述目標文章分詞后的詞匯; 所述人名識別模塊,用于確定所述目標文章分詞后的詞匯中是否存在人名; 所述語錄識別模塊,用于當所述目標文章分詞后的詞匯中存在至少一個人名時,利用指定關鍵詞或者指定標點符號判斷所述目標文章中是否存在語錄; 所述語句抽取模塊,用于當確定所述目標文章中存在與第一人名對應的語錄時,從所述目標文章獲取包含所述第一人名對應的語錄的語句,作為所述第一人名對應的語句;其中,所述第一人名為所述至少一個人名中的任一個人名; 所述存儲模塊,用于將所述第一人名以及所述任一人名對應的語句進行存儲。9.根據(jù)權利要求8所述的裝置,其特征在于,所述屬性確定模塊包括: 詞頻統(tǒng)計子模塊,用于統(tǒng)計每個關鍵詞的詞頻;以及, 權重確定子模塊,用于根據(jù)每個關鍵詞所屬語句的數(shù)據(jù)來源、內容來源以及社會影響指數(shù)中的至少一者確定每個關鍵詞的權重值。10.根據(jù)權利要求9所述的裝置,其特征在于,所述社會影響指數(shù)包括被引用次數(shù)或評論數(shù)量,所述權重確定子模塊用于: 當?shù)谝魂P鍵詞所屬語句的數(shù)據(jù)來源為指定網(wǎng)站或指定媒體時,對所述第一關鍵詞的權重值進行加值處理; 當所述第一關鍵詞所屬語句的內容來源為指定場景時,對所述第一關鍵詞的權重值進行加值處理;以及, 當所述第一關鍵詞所屬語句的被引用次數(shù)高于預設的引用次數(shù)閾值,或者當所述第一關鍵詞所屬語句的評論數(shù)量高于預設的評論數(shù)量時,對所述第一關鍵詞的權重值進行加值處理; 其中,所述第一關鍵詞為所述已確定的關鍵詞中的任意一個關鍵詞。11.根據(jù)權利要求8所述的裝置,其特征在于,所述人名識別模塊用于: 獲取所述目標文章分詞后的詞匯中的每個詞匯的詞性; 根據(jù)所述每個詞匯的詞性確定所述目標文章分詞后的詞匯中的名詞; 利用自然語言處理技術識別所述名詞中是否存在人名。12.根據(jù)權利要求7-11任一項所述的裝置,其特征在于,所述顯示模塊用于: 將包括所述已確定的關鍵詞的關鍵詞列表顯示在顯示界面的第一位置,并且在所述關鍵詞列表中所述已確定的關鍵詞是按照所述排列順序顯示的; 將所述查找到的語句顯示在所述顯示界面的第二位置,并在顯示的語句中將所述已確定的關鍵詞突出顯示。
【文檔編號】G06F17/30GK106021532SQ201610355808
【公開日】2016年10月12日
【申請日】2016年5月25日
【發(fā)明人】王磊, 麥濤, 張旭, 朱志華, 白楊
【申請人】東軟集團股份有限公司