本申請涉及人工智能,特別涉及一種文本分析方法。本申請同時涉及一種文本分析裝置、一種計算設備,以及一種計算機可讀存儲介質(zhì)。
背景技術:
1、自然語言處理(natural?language?processing,nlp)是計算機科學領域與人工智能領域中的一個重要方向。自然語言處理的應用場景,又可以細分為若干任務,包括從一段文本中識別提取詞語,從一段文本中識別出主語、謂語、賓語、定語、狀語、補語,根據(jù)問題從文本中尋找答案,分析一段文本的觀點,等等。
2、其中,對于分析一段文本中的觀點,通常會先提取文本中的觀點詞語,再對觀點詞語直接進行分析,得到文本觀點的分析結果。
3、但是,隨著文本內(nèi)容越來越復雜,對于觀點詞語分析的準確度要求也越來越高。
技術實現(xiàn)思路
1、有鑒于此,本申請實施例提供了一種文本分析方法,以解決現(xiàn)有技術中存在的技術缺陷。本申請實施例同時提供了一種文本分析裝置,一種計算設備,以及一種計算機可讀存儲介質(zhì)。
2、根據(jù)本申請實施例的第一方面,提供了一種文本分析方法,包括:
3、獲取待分析文本,對待分析文本進行實體識別,確定待分析文本中實體詞語的實體信息;
4、根據(jù)實體信息,對待分析文本進行觀點識別,確定待分析文本中針對實體詞語的觀點信息;
5、基于觀點信息進行觀點分類,確定待分析文本的觀點類別和情感類別。
6、根據(jù)本申請實施例的第二方面,提供了一種文本分析裝置,包括:
7、實體識別模塊,被配置為獲取待分析文本,對待分析文本進行實體識別,確定待分析文本中實體詞語的實體信息;
8、觀點識別模塊,被配置為根據(jù)實體信息,對待分析文本進行觀點識別,確定待分析文本中針對實體詞語的觀點信息;
9、分類模塊,被配置為基于觀點信息進行觀點分類,確定待分析文本的觀點類別和情感類別。
10、根據(jù)本申請實施例的第三方面,提供了一種計算設備,包括:
11、存儲器和處理器;
12、存儲器用于存儲計算機可執(zhí)行指令,處理器執(zhí)行計算機可執(zhí)行指令時實現(xiàn)上述文本分析方法的步驟。
13、根據(jù)本申請實施例的第四方面,提供了一種計算機可讀存儲介質(zhì),其存儲有計算機可執(zhí)行指令,該指令被處理器執(zhí)行時實現(xiàn)上述文本分析方法的步驟。
14、根據(jù)本申請實施例的第五方面,提供了一種芯片,其存儲有計算機程序,該計算機程序被芯片執(zhí)行時實現(xiàn)上述文本分析方法的步驟。
15、本申請?zhí)峁┑奈谋痉治龇椒?,首先獲取待分析文本,對待分析文本進行實體識別,確定待分析文本中實體詞語的實體信息,其次根據(jù)實體信息,對待分析文本進行觀點識別,確定待分析文本中針對實體詞語的觀點信息,最后基于觀點信息進行觀點分類,確定待分析文本的觀點類別和情感類別。根據(jù)實體詞語的實體信息和針對實體詞語的觀點信息確定分類,得到了對于文本中觀點全面的分類結果,實現(xiàn)了對復雜文本內(nèi)容的精準、全面的分析。
1.一種文本分析方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,在所述對所述待分析文本進行實體識別,確定所述待分析文本中實體詞語的實體信息之前,還包括:
3.根據(jù)權利要求1所述的方法,其特征在于,所述實體信息包括實體詞語的第一位置信息;
4.根據(jù)權利要求1或3所述的方法,其特征在于,所述觀點信息包括觀點詞語的第二位置信息;
5.根據(jù)權利要求4所述的方法,其特征在于,所述基于所述觀點詞語,對所述待分析文本進行觀點分類,確定所述待分析文本的觀點類別和情感類別,包括:
6.根據(jù)權利要求5所述的方法,其特征在于,所述語義分類模型包括:bert模型、softmax層、觀點類別判斷子模塊、情感類別判斷子模塊;
7.根據(jù)權利要求1所述的方法,其特征在于,所述觀點信息包括多個觀點詞語的觀點信息;
8.根據(jù)權利要求1所述的方法,其特征在于,所述對所述待分析文本進行實體識別,確定所述待分析文本中實體詞語的實體信息,包括:
9.根據(jù)權利要求8所述的方法,其特征在于,在所述將所述待分析文本輸入實體識別模型,利用所述實體識別模型,識別所述待分析文本中實體詞語的實體信息之前,還包括:
10.根據(jù)權利要求9所述的方法,其特征在于,所述根據(jù)所述實體信息,對所述待分析文本進行觀點識別,確定所述待分析文本中針對所述實體詞語的觀點信息,包括:
11.根據(jù)權利要求10所述的方法,其特征在于,所述樣本文本還標注有觀點信息;
12.根據(jù)權利要求11所述的方法,其特征在于,所述基于所述觀點信息進行觀點分類,確定所述待分析文本的觀點類別和情感類別,包括:
13.根據(jù)權利要求12所述的方法,其特征在于,所述樣本文本還標注有觀點詞語的觀點類別和情感類別;
14.根據(jù)權利要求8至13任一項所述的方法,其特征在于,所述實體識別模型由bert模型和softmax層構成。
15.一種文本分析裝置,其特征在于,包括:
16.一種計算設備,其特征在于,包括:
17.一種計算機可讀存儲介質(zhì),其存儲有計算機指令,其特征在于,該指令被處理器執(zhí)行時實現(xiàn)權利要求1至14任意一項所述文本分析方法的步驟。