国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種智能問答系統(tǒng)的制作方法_2

      文檔序號(hào):9865662閱讀:來源:國(guó)知局
      做闡述。例如一個(gè)網(wǎng)絡(luò)銷售平臺(tái)其本身就可以成為本系統(tǒng)中的一個(gè)大用戶,而在此平臺(tái)上想購(gòu)買產(chǎn)品而通過問題輸入模塊提出咨詢問題的用戶就是小用戶,小用戶通過不同終端提出的問題在本系統(tǒng)中都會(huì)體現(xiàn)出小用戶、大用戶、輸入終端等信息。小用戶其實(shí)還可以進(jìn)一步細(xì)分成微小用戶,是否細(xì)分根據(jù)應(yīng)用情況而定,這也只是因?yàn)閷蛹?jí)而定義,例如同樣是個(gè)網(wǎng)絡(luò)銷售平臺(tái),其本身是本系統(tǒng)的大用戶,大用戶下面還有很多小商家,小商家本身是小用戶,小商家下面還有微小用戶,這些微小用戶才是最終具體使用者,其提出需要解決的問題,通過本系統(tǒng)給與其答案。
      [0023]例如圖2為本發(fā)明智能問答系統(tǒng)另一種實(shí)施例示意圖,包括:問題輸入模塊,具體的輸入終端可以為很多個(gè),此問題輸入模塊用來輸入需要回答的問題,并對(duì)問題設(shè)定其來源標(biāo)識(shí),所述來源標(biāo)識(shí)中包含的大用戶信息至少為兩種以上,大用戶下面還包括小用戶,大用戶之間是彼此獨(dú)立的,同一個(gè)大用戶的小用戶之間是獨(dú)立的,小用戶下面還可以進(jìn)一步細(xì)分成更小的用戶;兩個(gè)專業(yè)問題庫(kù),專業(yè)問題庫(kù)中一般是把特定行業(yè)或用戶的專業(yè)問題按照一定規(guī)則將語義相同的問題歸類為同一個(gè)問題,一個(gè)專業(yè)問題庫(kù)至少對(duì)應(yīng)一個(gè)大用戶的來源標(biāo)識(shí);一個(gè)問題匹配模塊,根據(jù)問題輸入模塊輸入的問題在問題庫(kù)中查找到與其相匹配的問題;兩個(gè)專業(yè)答案庫(kù),存儲(chǔ)的答案一般是特定行業(yè)或用戶的專業(yè)答案,相同的問題可能在不同的專業(yè)答案庫(kù)中有不同的答案,一個(gè)專業(yè)答案庫(kù)至少對(duì)應(yīng)一個(gè)大用戶的來源標(biāo)識(shí);一個(gè)問題應(yīng)答模塊,根據(jù)問題匹配模塊的匹配結(jié)果和問題的來源標(biāo)識(shí)在其對(duì)應(yīng)的答案庫(kù)中找到相應(yīng)問題的答案并根據(jù)來源標(biāo)識(shí)將相應(yīng)答案反饋給答案需要方;還包括一個(gè)通用問題庫(kù)和一個(gè)通用答案庫(kù),通用問題庫(kù)中的問題與通用答案庫(kù)中的答案是相對(duì)應(yīng)的;通用問題庫(kù)存儲(chǔ)一些通用問題,一般是至少五個(gè)以上大用戶都會(huì)用到的,也是按照一定規(guī)則將語義相同的問題歸類為同一個(gè)問題;所述的問題匹配模塊在查找匹配問題時(shí)專業(yè)問題庫(kù)比通用問題庫(kù)優(yōu)先匹配。
      [0024]雖然圖1、圖2、圖3中沒有體現(xiàn),實(shí)際上本發(fā)明的智能問答系統(tǒng)還可包括一個(gè)語料標(biāo)注加工模塊,其提取原始語料中的問題進(jìn)行標(biāo)注加工,將標(biāo)注后語義相同的問題和對(duì)應(yīng)的答案建立索引對(duì)應(yīng)關(guān)系,最后形成專業(yè)問題庫(kù)或通用問題庫(kù)一部分或全部;語料標(biāo)注加工模塊對(duì)原始問題語料進(jìn)行分詞處理,提取重要詞語生成關(guān)鍵字詞組,使用關(guān)鍵字詞組代替原始問題;為了完整覆蓋相關(guān)問題,同時(shí)又避免匹配到不相關(guān)問題,根據(jù)問題的實(shí)際情況,在構(gòu)建問題庫(kù)的過程中,人工將問題的匹配方式標(biāo)注為完全保留、關(guān)鍵字保留、有序關(guān)鍵字保留;其中完全保留是指直接使用原始語料作為問題,不做改動(dòng);關(guān)鍵字保留是指用不要求排列順序的一組關(guān)鍵字代替原始語料;有序關(guān)鍵字保留是指用順序排列的一組關(guān)鍵字代替原始語料。相應(yīng)的,在問題匹配過程中,匹配模塊對(duì)不同的匹配方式標(biāo)注進(jìn)行不同處理:完全保留,需問題庫(kù)問題和用戶的提問完全相同才能匹配成功;關(guān)鍵字保留,只需用戶的提問包含問題庫(kù)問題的所有關(guān)鍵字即可匹配成功;有序關(guān)鍵字保留,需用戶的提問包含問題庫(kù)問題的所有關(guān)鍵字,并且是按順序排列的關(guān)鍵字,才能匹配成功。
      [0025]圖3中的輸入終端可以為多種,例如網(wǎng)頁、電腦客戶端、移動(dòng)客戶端、服務(wù)器端中的一種以及輸入該問題的大用戶和小用戶編號(hào),具體輸入終端可以不限于上述范圍。
      [0026]圖1和圖2中專業(yè)答案庫(kù)的建立方式有多種,其可以是專業(yè)問題庫(kù)和與其對(duì)應(yīng)的專業(yè)答案庫(kù),至少有一部分是通過訪問特定網(wǎng)址并讀取該網(wǎng)址上相關(guān)資料信息后,再根據(jù)系統(tǒng)中設(shè)定的一定規(guī)則自動(dòng)形成的;這樣自動(dòng)形成的專業(yè)問題庫(kù)和專業(yè)答案庫(kù)具有其自身大用戶的特定標(biāo)識(shí),其具體內(nèi)容可以由大用戶通過人工方式進(jìn)行修改,這樣使答案更加準(zhǔn)確。
      [0027]問題輸入模塊輸入的問題會(huì)經(jīng)過一定加工,如圖3所示,不同用戶通過不同終端輸入問題,系統(tǒng)會(huì)將不同問題和用戶設(shè)定的來源標(biāo)識(shí)組成輸入問題串,然后將將這些輸入問題串加入輸入隊(duì)列中,順序或根據(jù)一定規(guī)則從輸入隊(duì)列提取一個(gè)輸入問題串,再根據(jù)輸入問題串的來源標(biāo)識(shí)確定匹配問題,然后其選取相應(yīng)的答案庫(kù),問題應(yīng)答模塊在對(duì)應(yīng)的通用答案庫(kù)和專業(yè)答案庫(kù)中選擇匹配答案,將匹配的答案輸出給用戶。
      [0028]圖2中的問題庫(kù)為一個(gè)通用問題庫(kù)和兩個(gè)專業(yè)問題庫(kù)組成,實(shí)際中通用問題庫(kù)存儲(chǔ)一些通用問題,一般是至少5個(gè)以上行業(yè)都會(huì)用到的;專業(yè)問題庫(kù)的數(shù)目雖然圖2中只有兩個(gè),實(shí)際應(yīng)用中很多情況下幾十個(gè)、上百個(gè)只是基礎(chǔ),多的情況下會(huì)成千上萬,其存儲(chǔ)的問題一般是特定行業(yè)或用戶的專業(yè)問題,表現(xiàn)形式相同的問題可能在不同的專業(yè)問題庫(kù)中有不同的匹配問題,進(jìn)而答案也不相同。
      [0029]圖1、圖2和圖3中專業(yè)答案庫(kù)的建立方式有多種,可以是人工建庫(kù),也可以是通過訪問特定網(wǎng)址并讀取該網(wǎng)址上相關(guān)資料信息后再根據(jù)系統(tǒng)中設(shè)定的一定規(guī)則自動(dòng)形成的,自動(dòng)形成的專業(yè)庫(kù)也可以具有其自身大用戶的特定標(biāo)識(shí),該專業(yè)庫(kù)整體內(nèi)容可以由大用戶通過人工方式進(jìn)行修改。自動(dòng)形成的庫(kù)一般由大用戶來操作實(shí)現(xiàn),可以通過設(shè)定特定網(wǎng)址的方式由系統(tǒng)自動(dòng)實(shí)現(xiàn),網(wǎng)址可以根據(jù)需要進(jìn)行增加或刪減,并且這種設(shè)定訪問可以是根據(jù)系統(tǒng)中設(shè)定的時(shí)間點(diǎn)由系統(tǒng)自動(dòng)實(shí)現(xiàn)的,例如一段時(shí)間(如I天或2天)去更新一次相關(guān)內(nèi)容。專業(yè)庫(kù)還可以進(jìn)行進(jìn)一步細(xì)分,可以將小用戶分成更小的用戶,答案更有針對(duì)性,這些都在來源標(biāo)識(shí)中會(huì)有體現(xiàn)。
      [0030]圖1、圖2和圖3中的通用答案庫(kù)或?qū)I(yè)答案庫(kù)的內(nèi)容可以根據(jù)需要設(shè)置成可以被答案需要方對(duì)其準(zhǔn)確性進(jìn)行標(biāo)注,這些標(biāo)注有利于系統(tǒng)管理者參考,提高系統(tǒng)的答案準(zhǔn)確性會(huì)有積極作用,同時(shí)通用答案庫(kù)或?qū)I(yè)答案庫(kù)中的答案可以由大用戶根據(jù)需要進(jìn)行修改,其中大用戶將通用答案庫(kù)的內(nèi)容修改后,該部分內(nèi)容可以變成該大用戶的專業(yè)答案庫(kù)一部分,當(dāng)然該部分內(nèi)容也可以因其具有很強(qiáng)通用性而變成新的通用答案庫(kù)內(nèi)容。
      [0031]下載網(wǎng)上原始語料:
      以農(nóng)業(yè)銀行的自助客服為例,進(jìn)入農(nóng)業(yè)銀行自助客服頁面。網(wǎng)頁的左邊是問答分類,分為“電子銀行”,“銀行卡”,“個(gè)人服務(wù)”等八個(gè)大類,點(diǎn)擊每個(gè)大類,會(huì)把“+”號(hào)展開,顯示出大類下面的小類,網(wǎng)頁的右邊是相應(yīng)小類包含的問題,點(diǎn)擊問題,就可以顯示答案。
      [0032]通過谷歌等網(wǎng)頁工具,找到〈div class=〃collapsed">
      〈span id=〃2〃>銀行卡〈/span〉這樣的網(wǎng)頁格式,可以分析出,在大類名的前面,都有〈div class=〃collapsed〃>
      〈span id=〃2〃>這樣的字符串,通過在網(wǎng)頁源碼中搜索該字符串,可以獲取所有的大類名,緊跟大類名的,就是小類名,格式是這樣的,<ul>
      <li><a href="/Kb/Category/37/2?pn=l&amp;m=2">借記卡</a>〈/IiXliXa href="/Kb/Category/38/2?pn=l&amp;m=2">信用卡〈/^>〈/11>,1^社的值即是小類的1]1^,抓取每個(gè)緊跟大類名的小類1]此,就可以獲得多個(gè)問題的URL。
      [0033]依次訪問小類URL,獲取每個(gè)小類包含的問題,再根據(jù)上述方法,記錄問題的URL,該URL還包含了問題的答案。這樣,我們就獲得了整個(gè)自助客服欄目里所有的問題和答案。
      [0034]這些問題將被添加到行業(yè)知識(shí)庫(kù)(金融-銀行-農(nóng)業(yè)銀行)里,在添加到知識(shí)庫(kù)之前,先檢索已有知識(shí)庫(kù),如果問題已存在,則替換問題的答案,用最新的答案保證問答的時(shí)效性,如果沒有匹配的問題,則將問答作為新知識(shí)添加到知識(shí)庫(kù)。
      [0035]每次抓取網(wǎng)上數(shù)據(jù)后,我們都把該網(wǎng)站獲取問答的規(guī)則和流程記錄下來,以便下次程序自動(dòng)抓取,經(jīng)過一段時(shí)間積累,可以實(shí)現(xiàn)定期批量更新專業(yè)知識(shí)庫(kù)。
      [0036]具體應(yīng)用本發(fā)明時(shí)系統(tǒng)時(shí)會(huì)分行業(yè)進(jìn)行數(shù)據(jù)采,針對(duì)大用戶即合作商家、企業(yè)所從事的行業(yè),通過搜索相關(guān)網(wǎng)絡(luò)問答,客服聊天記錄等渠道,收集大量的行業(yè)問答原始語料。從原始語料中,抽取一定數(shù)量的問答作為樣本,形成一個(gè)有限問答集。樣本的數(shù)量可以是一萬個(gè)問答,也可以是十萬個(gè)問答,根據(jù)實(shí)際情況確定,原則是樣本數(shù)量越多效果越好。由于大量的問答內(nèi)容只限于某個(gè)行業(yè)的網(wǎng)上客服,因此
      當(dāng)前第2頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1