国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      文本挖掘、分析和輸出系統(tǒng)的制作方法

      文檔序號:6497983閱讀:538來源:國知局
      文本挖掘、分析和輸出系統(tǒng)的制作方法
      【專利摘要】一種自然語言創(chuàng)作系統(tǒng),該自然語言創(chuàng)作系統(tǒng)將技術(shù)、財(cái)務(wù)、法律和市場信息組織成觀點(diǎn)特定的分析、視覺和敘述性決定支持內(nèi)容。該專家系統(tǒng)將用戶的觀點(diǎn)轉(zhuǎn)換成量身定制的敘述性和/或可視化報(bào)告。專家規(guī)則將交互式廣告(如附屬URL鏈接)嵌入到分析、視覺和敘述性以及統(tǒng)計(jì)內(nèi)容中。一個(gè)或多個(gè)用戶可以對這些規(guī)則進(jìn)行修改,由此當(dāng)該系統(tǒng)的用戶利用這些規(guī)則時(shí),捕獲知識。
      【專利說明】文本挖掘、分析和輸出系統(tǒng) 相關(guān)申請的引用
      [0001] 本申請要求2011年12月6日提交的標(biāo)題為"專家研究解決方案系統(tǒng)(Expert Research Solution System) "的序列號為61/567, 359的共有美國臨時(shí)專利申請的優(yōu)先權(quán), 該申請通過引用結(jié)合與此。

      【技術(shù)領(lǐng)域】
      [0002] 本發(fā)明涉及自動(dòng)化自然語言創(chuàng)作系統(tǒng),并且更具體地涉及觀點(diǎn)特定的數(shù)據(jù)提取和 多媒體自然語言輸出生成系統(tǒng)。 背景
      [0003] 廣泛的知識系統(tǒng)已經(jīng)演進(jìn),描述了用于通過進(jìn)行文獻(xiàn)數(shù)據(jù)庫的分析來發(fā)現(xiàn)有效、 新穎、可能有用且最終可理解的商業(yè)知識的完善工藝。已經(jīng)廣泛地將在發(fā)現(xiàn)、制定和量化戰(zhàn) 略競爭優(yōu)勢方面中的商業(yè)用途編制成文檔。專利分析、產(chǎn)品分析、法律訴訟分析、投資分析、 競爭市場分析、顧客行為分析、社交網(wǎng)絡(luò)分析和人口統(tǒng)計(jì)分析是可以有效地利用數(shù)據(jù)庫分 析的典型示例。盡管關(guān)于錯(cuò)誤和有用性的風(fēng)險(xiǎn)已經(jīng)對數(shù)據(jù)庫分析(例如,專利、文獻(xiàn)數(shù)據(jù)庫 分析)的某些應(yīng)用進(jìn)行了爭論,但作為競爭技術(shù)和商業(yè)智能的唯一且有效來源其已經(jīng)在商 業(yè)上被接受。在某些情況下,通過使公共領(lǐng)域(例如,文獻(xiàn)計(jì)量學(xué)領(lǐng)域)互相關(guān)已經(jīng)從結(jié)構(gòu) 化數(shù)據(jù)庫記錄(例如,專利、文獻(xiàn))收集了戰(zhàn)略性知識。實(shí)際上,可以對多種文獻(xiàn)類型執(zhí)行 文獻(xiàn)計(jì)量學(xué)領(lǐng)域分析。具體地,此類分析已經(jīng)有效地用于量化對作者、贊助商、引文、相關(guān)日 期、描述符、標(biāo)識碼和其他所希望的數(shù)據(jù)項(xiàng)進(jìn)行描述的關(guān)系。
      [0004] 戰(zhàn)略性商業(yè)知識還可以位于使用語言文本分析的文獻(xiàn)數(shù)據(jù)內(nèi)。例如,在專利和文 獻(xiàn)中可以找出多個(gè)文本密集的字段,可以根據(jù)不同規(guī)則書寫這些專利和文獻(xiàn)并且其以不同 的長度(有時(shí)以數(shù)百或數(shù)千頁)出現(xiàn)。已經(jīng)顯示如自然語言處理(NLP)技術(shù)減少了閱讀專 利或文獻(xiàn)文檔的所有部分的負(fù)擔(dān),但仍然捕獲到有意義的概念。通過使用分類或概念層次 已經(jīng)改進(jìn)了文本分析,分類或概念層次可以降低數(shù)據(jù)復(fù)雜性并且可以對其進(jìn)行進(jìn)一步分析 以傳達(dá)關(guān)于趨勢和過渡的信息以便發(fā)現(xiàn)知識。
      [0005] 除了文獻(xiàn)計(jì)量學(xué)和文本分析方法以外,可視化工具已經(jīng)用于顯示和改進(jìn)數(shù)據(jù)庫 (例如,專利、文獻(xiàn))分析。通常在獨(dú)立式系統(tǒng)內(nèi)準(zhǔn)備可視化或者在線生成可視化作為與 私有數(shù)據(jù)庫集成的工具集的一部分。簡明地使多個(gè)有意義的度量標(biāo)準(zhǔn)(例如,一次5-15 個(gè))相關(guān)的可視化作為"儀表板"、"一次性呼機(jī)(one-pagers)"或"聚集景觀圖(focused landscape map) "對專家分析師和典型的終端用戶極其有用。
      [0006] 然而,對于作者或創(chuàng)作實(shí)體而言,單獨(dú)可視化對向終端用戶傳達(dá)可行意義是不完 整的。必須經(jīng)常添加進(jìn)一步的分析解釋來向終端用戶提供建議、推薦和參考以便一旦已經(jīng) 從數(shù)據(jù)中提出意義并且已經(jīng)得出結(jié)論就生成可行交付成果。
      [0007] 已經(jīng)利用多種技術(shù)來創(chuàng)作遵循經(jīng)驗(yàn)證的論點(diǎn)或規(guī)則的分析和/或觀點(diǎn)。例如,已 經(jīng)開發(fā)出計(jì)量經(jīng)濟(jì)學(xué)方法來就知識產(chǎn)權(quán)價(jià)值而言技術(shù)的重要性或研發(fā)的重要性進(jìn)行評估。 文獻(xiàn)計(jì)量方法已經(jīng)用于測量周期時(shí)間的引文特征、知識盜用的科學(xué)力量或速度以標(biāo)識高影 響力專利。已經(jīng)開發(fā)出"技術(shù)挖掘"文本和數(shù)據(jù)提取方法來使用同現(xiàn)、相關(guān)(互相關(guān)和自相 關(guān))以及因素矩陣揭示合作、進(jìn)入和退出趨勢。專家實(shí)際工作者已經(jīng)設(shè)計(jì)了許可"拇指規(guī) 貝1J"來幫助制定基于價(jià)值的作為或不作為的策略。集成視覺和文本分析的管理風(fēng)格方法也 已經(jīng)用于告知投資和政策決定。營銷決定嚴(yán)重依賴于驅(qū)動(dòng)預(yù)測分析(如商店訪問、籃子組 合、或購買意向)的規(guī)則。無疑地存在組合了提高對除其他屬性之外的優(yōu)勢和劣勢的理解 以能夠?qū)崿F(xiàn)在一個(gè)或多個(gè)數(shù)據(jù)庫內(nèi)發(fā)現(xiàn)的商業(yè)洞察的策略利用的任何或所有方法。
      [0008] 然而,當(dāng)前可用的系統(tǒng)具有一個(gè)主要缺點(diǎn)在于,已經(jīng)在特殊基礎(chǔ)上開發(fā)出它們并 且因此其在方法、設(shè)計(jì)、輸出和質(zhì)量上有很大不同。因此,通常需要高報(bào)酬的專家來自定義 設(shè)計(jì)研究、解釋數(shù)據(jù)、格式化輸出、得出結(jié)論和為終端用戶提出推薦。隨著在線數(shù)據(jù)庫的類 型和來源激增,挑選并解釋有效的并且商業(yè)上重要的源數(shù)據(jù)已經(jīng)變得越來越重要。對于競 爭性商業(yè)模式而言,文獻(xiàn)計(jì)量學(xué)的和其他文本和數(shù)據(jù)提取和分析系統(tǒng)已經(jīng)相應(yīng)地變得越來 越數(shù)據(jù)密集、完善和完整。隨著可用源數(shù)據(jù)的全集的發(fā)展,提取、分析、理解和對數(shù)據(jù)采取行 動(dòng)的系統(tǒng)的潛在成本和復(fù)雜性也增長。
      [0009] 因此,持續(xù)需要改進(jìn)的文獻(xiàn)計(jì)量學(xué)的和其他文本和數(shù)據(jù)提取和分析系統(tǒng),并且更 具體地需要更有效、及時(shí)且高效的商業(yè)智能系統(tǒng)來解決競爭性市場的商業(yè)分析需要。 概述
      [0010] 可以在應(yīng)用多個(gè)規(guī)則并且生成為具體用戶的觀點(diǎn)量身定制的自定義輸出的文本 挖掘、分析和輸出(ΤΜΑ0)系統(tǒng)內(nèi)體現(xiàn)本發(fā)明。該系統(tǒng)可以使用預(yù)定義的輸入模板、輸入數(shù) 據(jù)請求裝置(如智能問卷)、分類、通用文本組合、以及通用數(shù)字呈現(xiàn)格式中的一項(xiàng)或多項(xiàng) 來組合輸出格式,這些輸出格式組合了自然語言呈現(xiàn)、提取的文本、提取的數(shù)據(jù)、多媒體輸 出、以及廣告數(shù)據(jù),如推薦、參照和附屬鏈接。公開這些規(guī)則、源數(shù)據(jù)、輸出數(shù)據(jù)、以及呈現(xiàn)格 式用于用戶反饋并且可以用于修改和改進(jìn)該分析系統(tǒng)。還可以公開所有或部分相同的數(shù)據(jù) 用于反饋至一用戶社區(qū),該社區(qū)可以包括新用戶、臨時(shí)用戶、相關(guān)【技術(shù)領(lǐng)域】中的有經(jīng)驗(yàn)的各 方和行業(yè)專家。此社區(qū)反饋還可以用于修改和改進(jìn)該分析系統(tǒng)。該系統(tǒng)進(jìn)一步包括用于激 勵(lì)、評審、評價(jià)、評級、優(yōu)先化和結(jié)合反饋的附屬和社區(qū)獎(jiǎng)勵(lì)組件以不斷改進(jìn)該系統(tǒng)。
      [0011] 這種類型的系統(tǒng)有效地使數(shù)據(jù)收集、處理和呈現(xiàn)邏輯的有意義部分自動(dòng)化以顯著 地增加分析輸出中可以成本有效地收集、評價(jià)、格式化和反映的源數(shù)據(jù)的量值。這在分析中 產(chǎn)生更大的一致性、在呈現(xiàn)中產(chǎn)生更高的質(zhì)量和對結(jié)果更大的置信度,同時(shí)降低了成本和 消除了對專家的依賴,從而實(shí)施特殊的自定義分析。
      [0012] 所產(chǎn)生的系統(tǒng)允許非專家創(chuàng)作實(shí)體實(shí)施能夠?qū)Κ?dú)立式圖形可視化或基于特殊分 析的單個(gè)專家的已編成文檔的論點(diǎn)產(chǎn)生優(yōu)越結(jié)果的自動(dòng)化數(shù)據(jù)分析方法。這是因?yàn)閷τ诜?專家用戶而言,復(fù)制將專家引向他們最初驗(yàn)證的推理的因素經(jīng)常非常困難,經(jīng)常用過于模 糊的概括或以精通難懂的詞語的方式解釋該推理。在其他情況下,可視化的解釋會(huì)是非常 主觀的,并且不同的查看器可以感知到不同的含意,尤其是在維度減少并且底層數(shù)據(jù)不可 用的可視化中。
      [0013] 不像常規(guī)方法,本發(fā)明使用基于計(jì)算機(jī)的系統(tǒng)通過在一個(gè)示例性實(shí)施例中應(yīng)用多 個(gè)規(guī)則來解決問題,這些規(guī)則被設(shè)計(jì)成用于在某些方面模擬一個(gè)或多個(gè)領(lǐng)域?qū)<业臄?shù)據(jù)收 集和推理。標(biāo)識相關(guān)數(shù)據(jù)來源(項(xiàng)目數(shù)據(jù))和收集規(guī)則并將其應(yīng)用于項(xiàng)目數(shù)據(jù)。可以通過 用戶和社區(qū)反饋來修改和補(bǔ)充項(xiàng)目數(shù)據(jù)、導(dǎo)入過濾器、規(guī)則集、輸出數(shù)據(jù)和呈現(xiàn)格式以迭代 地改進(jìn)該系統(tǒng)的所有方面。由此收集相關(guān)規(guī)則集并通過一段時(shí)間中接收到的反饋對其進(jìn)行 改進(jìn),以最終包含和更新標(biāo)識、提取、處理和呈現(xiàn)特定數(shù)據(jù)所需的規(guī)則集以便解決問題、做 出決定或傳送消息。在一個(gè)示例性實(shí)施例中,該TMAO系統(tǒng)包含用于通過提供對非專家而言 容易使用和理解的用戶界面模板的很大程度上計(jì)算機(jī)化的系統(tǒng)來處理數(shù)據(jù)和解決大量需 要的程序。
      [0014] 這些數(shù)據(jù)分析程序可以應(yīng)用例如以數(shù)據(jù)的處理開始以得出最終結(jié)論的正向鏈接 或數(shù)據(jù)驅(qū)動(dòng)推理、或以所希望的結(jié)論開始的反向鏈接或目標(biāo)驅(qū)動(dòng)推理。其他示例性推理類 型包括模糊邏輯、神經(jīng)網(wǎng)絡(luò)、和貝葉斯邏輯。基于模板的用戶界面使專家和非專家用戶以同 樣的方式標(biāo)識有待分析的數(shù)據(jù)集、指定分析的目標(biāo)、修改對輸出的風(fēng)格和內(nèi)容的偏好、以及 最終接收所公開的輸出。雖然在信息科學(xué)中,輸入模板不是新的,但本發(fā)明提供了一種使軟 件編程要求最小化以便使本身是領(lǐng)域?qū)<业?、或是領(lǐng)域?qū)<业暮献髡叩姆浅绦騿T能夠以比 僅將整個(gè)項(xiàng)目移交給專家(或程序員)的常規(guī)方法更成本有效的方式管理大部分開發(fā)工 作,從而等待結(jié)果并且希望最好的結(jié)果。
      [0015] 應(yīng)理解到,上述概括描述和以下詳細(xì)描述兩者均僅是示例性和說明性的,而不一 定是限制如所要求的本發(fā)明。結(jié)合在本說明書內(nèi)并且是其一部分的附圖展示了本發(fā)明的實(shí) 施例并且與概括描述一起用于解釋本發(fā)明的原理。 附圖簡要說明
      [0016] 參照附圖可以更好地理解本發(fā)明的許多優(yōu)點(diǎn),其中:
      [0017] 圖1為一個(gè)框圖,展示了文本挖掘、分析和輸出系統(tǒng)的操作環(huán)境。
      [0018] 圖2為一個(gè)過程圖,展示了文本挖掘、分析和輸出系統(tǒng)的操作。
      [0019] 圖3為一個(gè)用戶界面圖,展示了文本挖掘、分析和輸出系統(tǒng)生成的示例輸出顯示。
      [0020] 圖4為在文本挖掘、分析和輸出系統(tǒng)中使用的分類法規(guī)則集的數(shù)據(jù)組織圖。
      [0021] 圖5為用于文本挖掘、分析和輸出系統(tǒng)的系統(tǒng)架構(gòu)圖。
      [0022] 圖6為用于文本挖掘、分析和輸出系統(tǒng)的配置方法論圖。
      [0023] 圖7為用于文本挖掘、分析和輸出系統(tǒng)的操作方法論圖。
      [0024] 圖8為一個(gè)邏輯流程圖,展示了利用文本挖掘、分析和輸出系統(tǒng)的商業(yè)模型。
      [0025] 圖9為用于對文本挖掘、分析和輸出系統(tǒng)進(jìn)行配置的邏輯流程圖。
      [0026] 圖10為用于對文本挖掘、分析和輸出系統(tǒng)進(jìn)行配置的邏輯流程圖。
      [0027] 圖11為用于運(yùn)行文本挖掘、分析和輸出系統(tǒng)的邏輯流程圖。
      [0028] 圖12為用于獲得文本挖掘、分析和輸出系統(tǒng)中的用戶反饋的邏輯流程圖。
      [0029] 圖13為用于獲得文本挖掘、分析和輸出系統(tǒng)中的社區(qū)反饋的邏輯流程圖。
      [0030] 圖14為文本挖掘、分析和輸出系統(tǒng)中的觀點(diǎn)信息的圖形用戶界面顯示。
      [0031] 圖15為文本挖掘、分析和輸出系統(tǒng)中的規(guī)則信息的圖形用戶界面顯示。 說明性實(shí)施方案的詳細(xì)說明
      [0032] 可以在計(jì)算機(jī)化的或計(jì)算機(jī)輔助的商業(yè)模型以及相關(guān)聯(lián)的系統(tǒng)(被稱為文本挖 掘、分析和輸出(ΤΜΑ0)系統(tǒng))中體現(xiàn)本發(fā)明。本系統(tǒng)將多種類型的信息(例如,技術(shù)、財(cái) 務(wù)、法律、市場和廣告信息)組織成多種類型的輸出(例如,分析、視覺和敘述性決定-支持 內(nèi)容)_可以為一個(gè)或多個(gè)用戶的觀點(diǎn)量身定制這些輸出。該系統(tǒng)還包含基于來自一個(gè)或 多個(gè)用戶的反饋而可更新以供將來使用的規(guī)則。該ΤΜΑ0系統(tǒng)被設(shè)計(jì)成用于通過模仿該領(lǐng) 域內(nèi)的最相關(guān)專家的邏輯收集、準(zhǔn)備、組織、優(yōu)先化、量身定制、可視化和公開以下內(nèi)容的分 析:例如,技術(shù)文獻(xiàn)(例如,專利、科學(xué)論文、標(biāo)準(zhǔn));法律文獻(xiàn)(例如,訴訟歷史、專利審查歷 史);商業(yè)文獻(xiàn)(例如,新聞公開、金融匯報(bào)、市場研究報(bào)告、貿(mào)易雜志文章、新聞);營銷信 息(例如,社交網(wǎng)絡(luò)活動(dòng)、購買習(xí)慣、網(wǎng)絡(luò)瀏覽行為、購物者洞察);地理空間數(shù)據(jù)收集(例 如,地形圖、激光雷達(dá)拼貼)以及廣告機(jī)會(huì)(例如,購買全文文檔的報(bào)價(jià)、聯(lián)系專家的報(bào)價(jià)、 點(diǎn)擊付費(fèi)廣告鏈接的報(bào)價(jià)、升級結(jié)果質(zhì)量的報(bào)價(jià)),以便告知用戶。這些結(jié)果被組合成有意 義、交互式視覺和敘述性解釋。
      [0033] 在某些情況下,可從該ΤΜΑ0系統(tǒng)的輸出辨別出來的觀點(diǎn)將取決于一個(gè)或多個(gè)用 戶(也被稱為一個(gè)或多個(gè)創(chuàng)作實(shí)體、一個(gè)或多個(gè)系統(tǒng)管理員、以及可以評審和對ΤΜΑ0輸出 采取行動(dòng)的那些人,其可以是人類、計(jì)算機(jī)化的、這些類型實(shí)體中的多個(gè)或其多種組合)的 觀點(diǎn)而不同。舉例來講,與由例如為研究和開發(fā)的副總裁和正尋找適當(dāng)?shù)赝顿Y五年戰(zhàn)略計(jì) 劃的用戶運(yùn)行的同一源數(shù)據(jù)相比,可以對由例如在訴訟中為被告和尋求了解許可選項(xiàng)的用 戶運(yùn)行通過該ΤΜΑ0系統(tǒng)的同一源數(shù)據(jù)進(jìn)行不同解釋。"智能問卷"或其他輸入過程可以促 進(jìn)具體項(xiàng)目的觀點(diǎn)的系統(tǒng)的決定,創(chuàng)作實(shí)體可以通過該"智能問卷"或其他輸入過程來表 達(dá)對多個(gè)個(gè)性化因素的偏好,如商業(yè)需要、技術(shù)偏好、法律形勢、時(shí)間軸或緊急情況、財(cái)務(wù)目 標(biāo)、所希望的結(jié)果或輸出、所不希望的結(jié)果或輸出、所需交付成果、可選交付成果、優(yōu)選數(shù)據(jù) 來源、優(yōu)選搜索條件、優(yōu)選分類標(biāo)準(zhǔn)、成功的計(jì)量標(biāo)準(zhǔn)、關(guān)鍵利益攸關(guān)方的身份、或認(rèn)為重要 且由該系統(tǒng)收集的其他標(biāo)準(zhǔn)。
      [0034] 可能存在有待考慮的多個(gè)不同的觀點(diǎn)以便創(chuàng)建來自該ΤΜΑ0系統(tǒng)的輸出。可以為 單個(gè)用戶或?yàn)橐活愑脩簦ɡ?,風(fēng)險(xiǎn)投資者)確定觀點(diǎn)。代表可能不同觀點(diǎn)的用戶類別的示 例列表可以包括公司研發(fā)經(jīng)理人、公司發(fā)展經(jīng)理人、公司IP顧問、外部IP顧問、被告、原告、 法官、機(jī)構(gòu)投資者、風(fēng)險(xiǎn)投資者、私有實(shí)體投資者、大學(xué)技術(shù)轉(zhuǎn)讓和商業(yè)化經(jīng)理人、聯(lián)邦實(shí)驗(yàn) 室技術(shù)轉(zhuǎn)讓和商業(yè)化經(jīng)理人、專利審查員、大學(xué)教授、學(xué)生、專業(yè)研究人員、科學(xué)家、經(jīng)濟(jì)發(fā) 展官員、政府機(jī)構(gòu)經(jīng)理人、非政府組織經(jīng)理人、新聞工作者、市場研究人員、市場分析師、社 交媒體分析師、或?qū)Λ@得基于文本和數(shù)據(jù)標(biāo)識、提取、和分析的有用輸出感興趣的其他潛在 用戶。
      [0035] 該ΤΜΑ0系統(tǒng)的設(shè)想用途包括例如技術(shù)監(jiān)測、競爭格局、技術(shù)預(yù)測、技術(shù)道路測繪、 創(chuàng)新合作伙伴標(biāo)識、白色空間分析、產(chǎn)品過關(guān)、估值、投資組合估價(jià)、戰(zhàn)略規(guī)劃、經(jīng)濟(jì)發(fā)展、投 資管理、線索生成、預(yù)測營銷、市場研究、政策決策制定、員工招聘、路線規(guī)劃、社交網(wǎng)絡(luò)分 析、欺詐分析、信貸價(jià)值以及當(dāng)前存在和將來有待開發(fā)的許多其他機(jī)會(huì)。
      [0036] 重要的是,該ΤΜΑ0系統(tǒng)可以被配置成用于執(zhí)行除了這些特定示例以外的無數(shù)用 途,因?yàn)樵磾?shù)據(jù)、觀點(diǎn)、和所希望的輸出可以被設(shè)計(jì)成用于在幾乎任何類型的用戶(包括人 類用戶、合作用戶、社區(qū)用戶、以及計(jì)算機(jī)化用戶)的幾乎任何類型的數(shù)據(jù)上操作。此外, 該系統(tǒng)能夠分析的電子信息的量值和類型類似地沒有限制(即,僅在概念上受到全集用戶 在訪問和將數(shù)據(jù)結(jié)合到該ΤΜΑ0系統(tǒng)內(nèi)所具有的動(dòng)機(jī)和技能的范圍的限制)。因此,預(yù)期該 ΤΜΑ0系統(tǒng)使個(gè)人和組織能夠更快速地、高效地和以為一個(gè)或多個(gè)感興趣用戶的觀點(diǎn)量身定 制的專家水平視角更深入地對全球性競爭力量做出響應(yīng)。
      [0037] 因此,該ΤΜΑ0系統(tǒng)提出了一種用于在數(shù)據(jù)庫中發(fā)現(xiàn)知識的改進(jìn)方法。典型的輸出 可以包括從源數(shù)據(jù)挑選的大量信息的量身定制的列表,如作者或發(fā)明人、引文或參考、機(jī)構(gòu) 或人事關(guān)系、地理位置、公開來源、日期或年份、標(biāo)識碼、標(biāo)簽或類別、產(chǎn)品和市場等等。對于 TMAO系統(tǒng)而言,為了最好地理解和處理輸入數(shù)據(jù),可能需要某種預(yù)處理以便在應(yīng)用任何規(guī) 則之前對數(shù)據(jù)進(jìn)行調(diào)節(jié)。此預(yù)處理的結(jié)果將通常是一個(gè)或多個(gè)文本和/或數(shù)字值。
      [0038] 為了提供一個(gè)特定的示例,該ΤΜΑ0系統(tǒng)可以操作用于將預(yù)處理的數(shù)據(jù)轉(zhuǎn)換成 XML,從而為用戶指定查看數(shù)據(jù)所用的觀點(diǎn),處理和準(zhǔn)備數(shù)據(jù)用于基于規(guī)則的分析,根據(jù)系 統(tǒng)規(guī)則提取和使有關(guān)信息相關(guān)和將它們存儲在存儲器緩沖器內(nèi)。然后,該ΤΜΑ0系統(tǒng)將所 提取和存儲的信息插入到例如產(chǎn)生關(guān)于重要話題的敘述性起草的自然語言語句、問題、可 視化、數(shù)據(jù)呈現(xiàn)、數(shù)字呈現(xiàn)、多媒體內(nèi)容、門戶、超鏈接或數(shù)據(jù)提取的呈現(xiàn)或輸出的數(shù)據(jù)庫記 錄、電子文檔或交互模板內(nèi)。
      [0039] 系統(tǒng)生成的輸出的內(nèi)容可以通過超鏈接、門戶或其他活躍的組件交互地鏈接到整 體或部分存儲在其他地方的底層數(shù)據(jù)。實(shí)際上,特定可視化內(nèi)的特定敘述性話題和圖形的 文本可以鏈接到特定記錄組或關(guān)于那些記錄的元數(shù)據(jù)。每組記錄可以包含恰好最初預(yù)處 理用于那些相同記錄的源數(shù)據(jù),或者可替代地,可以根據(jù)RSS2. 0或Atoml. 0將那項(xiàng)源數(shù)據(jù) 轉(zhuǎn)換成一種更標(biāo)準(zhǔn)的形式,如XML。有利地,用戶可以在上下文中以與系統(tǒng)生成的輸出進(jìn)行 用戶交互的方式或除了此方式以外的方式查看、操縱和共享按照例如RSS可訪問的多組記 錄。
      [0040] 廣告可以是輸出的附加特征。例如,敘述性報(bào)告輸出可以為(優(yōu)選地,信任的和/ 或經(jīng)驗(yàn)證的)關(guān)于具體話題與從對有待引用的權(quán)利進(jìn)行支付的廣告商的列表選擇的某些 專家進(jìn)行聯(lián)系的專家提供書面建議。在另一個(gè)示例中,分析趨勢的圖形顯示可以伴有贊助 商提供的"教學(xué)(how-to) "視頻,其中作為贊助商支付點(diǎn)進(jìn)費(fèi)用的交換,那個(gè)視頻鏈接到贊 助商的網(wǎng)站。在又另一個(gè)示例中,分析中的底層記錄的文本(可從敘述下的超鏈接文本或 從條形圖中的圖形條訪問)可以進(jìn)一步超鏈接到用于銷售的全文文檔,其中文檔賣方為每 個(gè)文檔購買參照機(jī)會(huì)提供費(fèi)用。在又另一個(gè)示例中,該ΤΜΑ0系統(tǒng)可以生成敘述性建議文 本,然后該文本可以與其他文本、圖形部分或內(nèi)容配對,并且那個(gè)建議文本可以用另一個(gè)產(chǎn) 品或服務(wù)提供商將用戶連接到注冊機(jī)會(huì)。在本示例中,該產(chǎn)品或服務(wù)提供商將向該ΤΜΑ0系 統(tǒng)的服務(wù)商支付費(fèi)用或發(fā)行信貸或提供某種其他形式的受益補(bǔ)償(例如,聯(lián)合品牌、收入 共享、獎(jiǎng)金共享等)。在這些與廣告相關(guān)的示例實(shí)施例中,本發(fā)明的系統(tǒng)架構(gòu)的目標(biāo)在于當(dāng) 準(zhǔn)備數(shù)據(jù)、組織數(shù)據(jù)、考慮一個(gè)或多個(gè)用戶觀點(diǎn)、格式化數(shù)據(jù)和提供學(xué)習(xí)系統(tǒng)時(shí)能夠支持這 種廣告。
      [0041] 當(dāng)用戶或社區(qū)成員探索輸出時(shí),他們可以開始形成與以下內(nèi)容相關(guān)的觀點(diǎn):例如, 與例如該ΤΜΑ0系統(tǒng)的輸出中所描述的觀點(diǎn)、敘述、可視化、底層數(shù)據(jù)或廣告機(jī)會(huì)相關(guān)聯(lián)的 相關(guān)性、概率、精度或查全率。此外,該ΤΜΑ0系統(tǒng)生成的輸出可以顯示可以向用戶解釋與 具體敘述、視覺或解釋性內(nèi)容項(xiàng)目相關(guān)聯(lián)的確定性或相關(guān)性的置信區(qū)間、分?jǐn)?shù)、圖形或預(yù)測 測量。隨著用戶形成其自己的呈現(xiàn)觀點(diǎn),并且然后進(jìn)一步通過附加信息(如置信度)被告 知,當(dāng)下次請求從同一底層數(shù)據(jù)生成輸出時(shí),他們將能夠應(yīng)用其自己的專門知識來提高精 確度、置信度、相關(guān)性或其他成功指標(biāo)。該ΤΜΑ0系統(tǒng)還有一個(gè)目標(biāo)是鼓勵(lì)用戶通過使用例 如條件式如果/那么(conditional if/then)邏輯起草、修改或建議對規(guī)則的修改來調(diào)整系 統(tǒng)規(guī)則。該ΤΜΑ0系統(tǒng)的一個(gè)進(jìn)一步的目標(biāo)是使該ΤΜΑ0系統(tǒng)的一個(gè)或多個(gè)用戶能夠公開、 評審、修改、評論以及激勵(lì)參與系統(tǒng)規(guī)則和規(guī)則集。
      [0042] 用戶或用戶社區(qū)內(nèi)的用戶組看到和改進(jìn)基于規(guī)則的TMA0系統(tǒng)內(nèi)的規(guī)則的能力是 有利的??梢杂枚喾N方式修改該ΤΜΑ0系統(tǒng)的規(guī)則,例如,通過用戶反饋的多步驟方法(非 監(jiān)管的論壇、受監(jiān)管的論壇、維基百科(wiki)、電子郵件),該用戶反饋將得到版主審批(手 動(dòng)審批、排名審批、得分審批),然后該版主審批將得到(自動(dòng)化、半自動(dòng)化、或手動(dòng)的)對系 統(tǒng)規(guī)則的系統(tǒng)管理員修改。用戶還可以對作為挑戰(zhàn)性方法(例如,游戲、競賽、超越基準(zhǔn)目 標(biāo))的一部分的規(guī)則作出貢獻(xiàn),由此用戶公開在規(guī)則的某些或全部部分下,調(diào)整該規(guī)則的 至少某一部分,在系統(tǒng)數(shù)據(jù)上運(yùn)行該規(guī)則和將結(jié)果置信區(qū)間、分?jǐn)?shù)等與之前的結(jié)果、基準(zhǔn)結(jié) 果或其他標(biāo)準(zhǔn)進(jìn)行比較。在那時(shí),算法、其他用戶或其他用戶組可以確定新結(jié)果是否指示應(yīng) 改變該規(guī)則。如果應(yīng)改變,則該系統(tǒng)或系統(tǒng)管理員可以標(biāo)記該規(guī)則以便進(jìn)行改變或自動(dòng)地 更新該規(guī)則??梢詫Ω淖兒蟮囊?guī)則打上時(shí)間戳,并且獲得一項(xiàng)或多項(xiàng)成功的改變的那些用 戶可以接收它們對該ΤΜΑ0系統(tǒng)的貢獻(xiàn)的認(rèn)可??梢杂美缧抛u(yù)增強(qiáng)、獎(jiǎng)賞、獎(jiǎng)勵(lì)、積分、現(xiàn) 金或未來收益的形式激勵(lì)這種貢獻(xiàn)。
      [0043] 對該ΤΜΑ0系統(tǒng)特別有用的是基于規(guī)則的"標(biāo)簽"或"類別"。當(dāng)被結(jié)構(gòu)化成兩 個(gè)或更多個(gè)層級(例如,父子式(parent-child)、樹葉式(tree-leaf)或輪福中心式 (spoke-hub))的層次時(shí),這種標(biāo)簽或類別的集合可以被稱為分類法。開發(fā)、獲取分類元數(shù)據(jù) 或?qū)⑵浞峙浣o記錄經(jīng)常是有利的,尤其當(dāng)那些記錄來自不同的來源時(shí)。分類的力量在于,其 可以應(yīng)用同類組織邏輯,用該邏輯分析分類的記錄。分類的一個(gè)巨大挑戰(zhàn)在于,不同的技術(shù) 領(lǐng)域和不同的觀點(diǎn)可能需要不同的組織方法。此外,專家在如何組織單個(gè)領(lǐng)域上可能不同。 該ΤΜΑ0系統(tǒng)具有解決這些挑戰(zhàn)的能力。
      [0044] 在該ΤΜΑ0系統(tǒng)中,可以使用規(guī)則來應(yīng)用類別分配。專家或系統(tǒng)管理員可以對這些 規(guī)則進(jìn)行預(yù)編程。在另一個(gè)實(shí)施例中,社區(qū)內(nèi)的另一個(gè)用戶或用戶組可以根據(jù)上述方法調(diào) 整類別。凈效應(yīng)將在于鼓勵(lì)一個(gè)或多個(gè)用戶、或用戶組建立、維護(hù)和升級與分類相關(guān)的規(guī)則 并且發(fā)起、修改和不斷改進(jìn)該ΤΜΑ0系統(tǒng)所需的數(shù)據(jù)的分類。本領(lǐng)域的技術(shù)人員將認(rèn)識到, 分類有時(shí)可以是該系統(tǒng)的輸入,在其他時(shí)候可以是該系統(tǒng)的輸出,并且仍然在其他時(shí)候可 以是該系統(tǒng)的參數(shù),由此將輸入轉(zhuǎn)換成輸出。
      [0045] 關(guān)于系統(tǒng)輸出,重要的是指出該ΤΜΑ0系統(tǒng)的敘述性輸出將最佳地猶如由人類書 寫、和甚至更最佳地猶如在講述故事。這要求詞匯和語法結(jié)構(gòu)的使用和結(jié)構(gòu)化的觀念的結(jié) 合、以及與人類輸出相一致的詞匯、語義、和關(guān)系。因此,該ΤΜΑ0系統(tǒng)被配置成用于以與所 定義的語法規(guī)則相關(guān)聯(lián)的所希望的自然語言創(chuàng)建敘述性輸出。該ΤΜΑ0系統(tǒng)使用觀點(diǎn)、可選 分類、詞匯規(guī)則、語法規(guī)則、和系統(tǒng)規(guī)則來改變詞匯、措辭和句子結(jié)構(gòu)以便創(chuàng)建敘述性輸出。 可以進(jìn)一步努力利用許多現(xiàn)有資源,如字典、百科全書、類屬詞典、數(shù)據(jù)庫和網(wǎng)站、查找表和 人工智能。
      [0046] 在許多情況下,故事設(shè)計(jì)(為了提高用戶對系統(tǒng)輸出的理解)在該ΤΜΑ0系統(tǒng)的最 大挑戰(zhàn)之間。為了解決此需要,該ΤΜΑ0系統(tǒng)可以用更簡潔的文本結(jié)構(gòu)(如列表、短語、大標(biāo) 題、題注)和更魯棒的文本結(jié)構(gòu)(例如,句子、段落、概括-詳述和問答結(jié)構(gòu))創(chuàng)建輸出。例 如,可以用于匯編故事的一種魯棒的結(jié)構(gòu)可以基于以如作者芭芭拉明托(Barbara Minto) 倡導(dǎo)的金字塔原理(Pyramid Principle)為基礎(chǔ)的前提條件。簡言之,金字塔原理倡導(dǎo)如 下規(guī)則:通過這些規(guī)則,所組織的概念的結(jié)構(gòu)內(nèi)的任何層級處的觀念必須始終是在它們以 下分組的概念的概述。在該ΤΜΑ0系統(tǒng)中,可以通過利用分層數(shù)據(jù)加標(biāo)和分類結(jié)構(gòu)的數(shù)據(jù)分 類系統(tǒng)組織概念,這可以創(chuàng)建和將概念嵌套到實(shí)體、分類等中。該數(shù)據(jù)分類系統(tǒng)還可以包含 關(guān)于概念和類別的元數(shù)據(jù),如分類中的分層位置。當(dāng)例如該TMAO系統(tǒng)將要輸出敘述性文本 或有序圖像時(shí),此信息可以用于確定哪些類別的觀念應(yīng)被分組在另一類別的觀念以上或以 下。每個(gè)分組中的觀念通??梢允峭环N觀念(例如,家具的所有成果或所有項(xiàng)目)。 [0047] 數(shù)據(jù)分類系統(tǒng)還可以捕獲分類中的實(shí)體類型(例如,個(gè)人、地點(diǎn)或事物)。此信息 可以進(jìn)一步與關(guān)于例如基于時(shí)間、基于大小、基于行業(yè)的或語義關(guān)系的元數(shù)據(jù)相關(guān)。當(dāng)準(zhǔn)備 敘述性文本以保證一致地對觀念進(jìn)行分組時(shí),系統(tǒng)規(guī)則可以訪問此相關(guān)數(shù)據(jù)。因此,可以在 邏輯上(例如,演繹地、按年代地、在結(jié)構(gòu)上、比較地)對每個(gè)分組中的觀念進(jìn)行排序??梢?使用考慮數(shù)據(jù)分類、用戶觀點(diǎn)和預(yù)處理數(shù)據(jù)的組合的系統(tǒng)規(guī)則來創(chuàng)建分組觀念的排序,以 便首先選擇分組邏輯并且然后將該邏輯應(yīng)用于一組上,以便按照報(bào)告或呈現(xiàn)有效地傳送一 個(gè)或多個(gè)用戶請求的故事。可以將上述系統(tǒng)規(guī)則實(shí)現(xiàn)成該ΤΜΑ0系統(tǒng)的規(guī)則以便產(chǎn)生更可 能按照人類書寫的故事出現(xiàn)的敘述性文本。
      [0048] 另一種將該ΤΜΑ0系統(tǒng)的輸出組織成故事的方式是以邏輯的、有說服力的和/或建 議性的形式組織敘述性內(nèi)容。例如,該故事可以首先介紹用戶已知是真的或可能是真的信 息,并且然后漸漸前進(jìn)至用戶不太可能了解或不那么容易同意的信息。此風(fēng)格傾向于從用 戶獲得更多"買入(buy in)",因?yàn)樗麄兏赡芡鈹⑹龅牡谝徊糠郑瑥亩蛊涿τ谄鋬?nèi)容、 消息和/或意義。從金字塔原理之后,在一種示例性呈現(xiàn)模式中,從該ΤΜΑΙ0系統(tǒng)輸出的組 織敘述性元素的結(jié)構(gòu)包括一種情形和一種并發(fā)情形、可選問題(可以隱含這些問題而不一 定呈現(xiàn)給用戶)和然后要點(diǎn),包括多個(gè)回答,如一個(gè)或多個(gè)建議、解決方案或推薦。
      [0049] 通常描述的,情形可以是關(guān)于用戶可能認(rèn)識或積極地對其作出反應(yīng)的數(shù)據(jù)或話題 的陳述,因?yàn)殍b于用戶的觀點(diǎn),用戶已經(jīng)了解該數(shù)據(jù)或話題或其用語將引起用戶的興趣。這 可以通過應(yīng)用多種系統(tǒng)規(guī)則來確定,這些系統(tǒng)規(guī)則將與觀點(diǎn)相關(guān)的用戶輸入、為分析收集 的數(shù)據(jù)、和關(guān)于某些用戶將要了解或認(rèn)識實(shí)際上呈現(xiàn)的某種類型的信息有多大可能的專家 假設(shè)進(jìn)行比較。在一個(gè)示例性實(shí)施例中,該情形是該ΤΜΑ0系統(tǒng)生成的分析呈現(xiàn)或報(bào)告中的 幻燈片的大標(biāo)題。
      [0050] 并發(fā)情形通常是故事中的"轉(zhuǎn)折(turn) "。其描述了一種穩(wěn)定情形的變更,而不是 一種問題,盡管變更可以是一種問題。可以描述典型的并發(fā)情形并且然后系統(tǒng)規(guī)則可以被 設(shè)計(jì)成用于檢測輸入、準(zhǔn)備和/或分類的數(shù)據(jù)中的并發(fā)情形??梢曰谟脩舻挠^點(diǎn)量身定 制相關(guān)性的標(biāo)識、確定和/或并發(fā)情形的敘述性描述。典型的并發(fā)情形(和可以提取敘述 性起草并發(fā)情形所需的事實(shí)的規(guī)則類型)可以包括:例如,事情出現(xiàn)錯(cuò)誤(比較規(guī)則)、事 情會(huì)出現(xiàn)錯(cuò)誤(基于比較趨勢的預(yù)測規(guī)則集)、事情變了(時(shí)態(tài)規(guī)則)、事情會(huì)變化(基于 時(shí)態(tài)趨勢的預(yù)測規(guī)則集)、"這就是你可能期望找到的東西"(期望規(guī)則)、"這是持有不同觀 點(diǎn)的人"(突出規(guī)則)、或"在這種情形下,我們具有有限的替代方案"(建議規(guī)則)。
      [0051] 要點(diǎn)基于并發(fā)情形的類型和鑒于特定情形定義有待解決的需要。為了敘述性地開 發(fā)該ΤΜΑ0系統(tǒng)中的要點(diǎn),該要點(diǎn)將基于首先熟練地確定要問的與并發(fā)情形相關(guān)的一個(gè)或 多個(gè)問題的適當(dāng)類型。與并發(fā)情形相關(guān)的關(guān)鍵問題可以包括:"我們做什么?(what do we do ?) ";"我們可以如何預(yù)防它?(how can we prevent it ?) 我們應(yīng)該做什么?(what should we do ?) " ;"我們應(yīng)該如何反應(yīng)?(how should we react ?) " ;"我們是否找到它 了?(do we find it ?) ";"誰是對的?(who is right ?) 我們應(yīng)采取哪一個(gè)?(which one should we take ?),';等等。
      [0052] 描述要點(diǎn)的敘述性輸出可以或可以不包括一個(gè)或多個(gè)問題的文本。然而,該輸 出將通常包括至少一個(gè)答案。問題的答案創(chuàng)建出鑒于情形解決并發(fā)情形的要點(diǎn)。該ΤΜΑ0 系統(tǒng)將使用按照系統(tǒng)規(guī)則編程的專家假設(shè)得出答案,這些系統(tǒng)規(guī)則將應(yīng)用于處理的并且 可選地為一個(gè)或多個(gè)用戶的觀點(diǎn)量身定制的數(shù)據(jù)。典型的答案可以被敘述性地格式化為 例如:"下一步驟將是...(the next step would be to. ··) " ;"人們可以通過...來緩解 此風(fēng)險(xiǎn)(one can mitigate this risk by. ··) " ;"鑒于改變的概率,有關(guān)問題為...(given the probability of change, pertinent issues are. ··) " ;" 已經(jīng)標(biāo)識和推薦以下機(jī) 會(huì)...(the following opportunities have been identified and are recommended. ··),' ; "咨詢相關(guān)實(shí)現(xiàn)方式的專家可以是...(experts to consult regarding implementation may be. ··) ";"僅有某些值得考慮的選項(xiàng),其中·· .(there are only a few options worth considering, among them. ··),'。
      [0053] 除了要點(diǎn)以外,次要點(diǎn)使用從可選地為一個(gè)或多個(gè)觀點(diǎn)量身定制的數(shù)據(jù)提取的其 他事實(shí)進(jìn)一步敘述性地討論了問題與答案之間的關(guān)系。系統(tǒng)規(guī)則以及支持處理數(shù)據(jù)、類別 等等中可標(biāo)識的證據(jù)的相關(guān)性有條件地確定次要點(diǎn)的數(shù)量和敘述性構(gòu)造。ΤΜΑ0結(jié)構(gòu)符合提 供手動(dòng)分析的專家講述的故事的類型,通過該ΤΜΑ0系統(tǒng)使得其成為對用戶而言有利的輸 出。
      [0054] 該ΤΜΑ0系統(tǒng)較常規(guī)方法展現(xiàn)了多個(gè)重要的優(yōu)點(diǎn),包括開發(fā)和運(yùn)行速度:因?yàn)榉治?固有地是費(fèi)時(shí)的,尤其是如果在特殊基礎(chǔ)上或由跨功能團(tuán)隊(duì)執(zhí)行,ΤΜΑ0系統(tǒng)可以使技術(shù)和 商業(yè)數(shù)據(jù)庫分析的生產(chǎn)能力加速。該ΤΜΑ0系統(tǒng)還展現(xiàn)了改進(jìn)的一致性:通過將分析方法標(biāo) 準(zhǔn)化,可以跨不同的數(shù)據(jù)集和一段時(shí)間內(nèi)以比具有可變技能水平和嚴(yán)格程度的分析師或一 段時(shí)間內(nèi)或跨項(xiàng)目成員資格不斷變化的分析師團(tuán)隊(duì)可能期望的更大的一致性來應(yīng)用捕獲 用戶知識的規(guī)則。該系統(tǒng)還降低了人力資源成本。不是分配典型地高新專業(yè)人員的時(shí)間用 于例行分析,而是可以空出這些資源從而集中在組織的策略的上下文中使用系統(tǒng)輸出的后 繼分析上,或集中在在這些分析上設(shè)計(jì)高級策略和計(jì)劃。該ΤΜΑ0系統(tǒng)進(jìn)一步降低了隱藏成 本:可以顯著地最小化容易消化的(尤其對于執(zhí)行級決定制定者而言)敘述下的公開報(bào)告 的隱藏負(fù)擔(dān)。
      [0055] 改進(jìn)的質(zhì)量是該系統(tǒng)的最重要的益處之一。除非分析師和終端用戶了解實(shí)踐以挖 掘文獻(xiàn)中的擴(kuò)展話題-這將對于除了稀有的專業(yè)內(nèi)部/外部專家或咨詢組織以外的資源而 言是不可能的,否則他們將不能夠容易地可靠地將新興話題知識或其他專家的知識結(jié)合到 他們自己的數(shù)據(jù)庫發(fā)現(xiàn)方法中。
      [0056] 該系統(tǒng)可以通過使與新穎性、可防御性和研發(fā)商業(yè)化成功相關(guān)的機(jī)會(huì)和突出風(fēng)險(xiǎn) 的發(fā)現(xiàn)加速來增強(qiáng)基礎(chǔ)技術(shù)搜索和技術(shù)的學(xué)術(shù)調(diào)查。該ΤΜΑ0系統(tǒng)還可以促進(jìn)教育。使行 業(yè)專家從事于學(xué)術(shù)研究經(jīng)常是困難的或高不可及的。該系統(tǒng)可以為學(xué)生、教師和預(yù)測技術(shù) 趨勢或調(diào)查行業(yè)結(jié)構(gòu)的動(dòng)態(tài)的研究人員可以應(yīng)用用于發(fā)現(xiàn)的顯性知識呈現(xiàn)理想的資源。
      [0057] 國家競爭力是另一個(gè)重要的系統(tǒng)益處。來自該系統(tǒng)的結(jié)果的擴(kuò)散可以提高對技術(shù) 開發(fā)和商業(yè)化(區(qū)域和國家的競爭力的主要來源)中的全球戰(zhàn)略的理解。這還可以向整個(gè) 社會(huì)呈現(xiàn)多種益處,因?yàn)槎床炝蔀槭拐咧贫ㄕ吆蜕踔翆で笫古c創(chuàng)新相關(guān)聯(lián)的獎(jiǎng)勵(lì)與處 罰平衡的專利局機(jī)關(guān)的決定給予力量。
      [0058] 相應(yīng)地,應(yīng)認(rèn)識到,該ΤΜΑ0系統(tǒng)可以通過將關(guān)于商業(yè)信息的處理數(shù)據(jù)組織成以情 形-并發(fā)情形關(guān)系而呈現(xiàn)的敘述性文本來構(gòu)建輸出。可以動(dòng)態(tài)地將數(shù)據(jù)提要構(gòu)建成用于傳 送數(shù)據(jù)庫內(nèi)的文本或數(shù)字元素之間的關(guān)系變化。通過將基于規(guī)則的分析應(yīng)用于原始數(shù)據(jù)文 件,該系統(tǒng)輸出可以包括關(guān)于同一商業(yè)信息的敘述、圖像、和提要內(nèi)容。可以按照基于為項(xiàng) 目確定的觀點(diǎn)、專家規(guī)則以及根據(jù)從來自用戶的輸入接收的附加內(nèi)容進(jìn)一步量身定制的輸 出來構(gòu)建敘述性文本。廣告信息(如參照、推薦和附屬網(wǎng)站的鏈接)可以根據(jù)上下文被嵌 入在系統(tǒng)生成的敘述性文本或系統(tǒng)生成的可視化內(nèi)。
      [0059] 該ΤΜΑ0系統(tǒng)還可以協(xié)調(diào)一個(gè)或多個(gè)用戶提供的反饋,該反饋可以包括來自授權(quán) 實(shí)體和社區(qū)成員的反饋??梢酝ㄟ^對用戶反饋進(jìn)行評價(jià)在該ΤΜΑ0系統(tǒng)內(nèi)對變量進(jìn)行調(diào)整, 其中基于反饋的主要調(diào)整標(biāo)準(zhǔn)是基于用戶在一項(xiàng)或多項(xiàng)游戲、挑戰(zhàn)或社區(qū)活動(dòng)中的參與的 結(jié)果按照最佳確定的。還可以結(jié)合廣告公開、附屬網(wǎng)站的點(diǎn)進(jìn)、該ΤΜΑ0系統(tǒng)促進(jìn)的線索和 購買來實(shí)現(xiàn)補(bǔ)償模式。該系統(tǒng)的許多其他特征和優(yōu)點(diǎn)將從以下附圖的描述中對本領(lǐng)域的技 術(shù)人員變得明顯。
      [0060] 圖1為一個(gè)功能框圖,展不了一種用于文本挖掘、分析和輸出(ΤΜΑ0)系統(tǒng)12的操 作環(huán)境10。ΤΜΑ0系統(tǒng)12包括一個(gè)實(shí)現(xiàn)促進(jìn)與系統(tǒng)的用戶交互的用戶界面的客戶端系統(tǒng)14 和一個(gè)服務(wù)器系統(tǒng)16,該服務(wù)器系統(tǒng)包括一個(gè)數(shù)據(jù)處理器和實(shí)現(xiàn)該ΤΜΑ0系統(tǒng)的功能性的 其他電子元件??蛻舳讼到y(tǒng)14通常包括多個(gè)特征的選擇組合,如用于從用戶請求輸入的模 板、幫助來自信息商店的目標(biāo)數(shù)據(jù)的標(biāo)識和提取的導(dǎo)入過濾器、用于存儲包括使用導(dǎo)入過 濾器從信息商店提取的數(shù)據(jù)的項(xiàng)目數(shù)據(jù)的數(shù)據(jù)庫、用于處理存儲在數(shù)據(jù)庫內(nèi)的數(shù)據(jù)以產(chǎn)生 所希望的輸出的規(guī)則集、數(shù)據(jù)分析功能性、以及一個(gè)或多個(gè)輸出生成器。
      [0061] 盡管作為單獨(dú)元件示出了客戶端系統(tǒng)14和服務(wù)器系統(tǒng)16,但將認(rèn)識到,每個(gè)可以 被分成部署在單獨(dú)外殼和位置中的多個(gè)組件,并且認(rèn)識到可以部署許多實(shí)例。例如,位于不 同用戶位置上的瀏覽器可以實(shí)現(xiàn)客戶端系統(tǒng)的單獨(dú)實(shí)例,并且可以在不同許可的用戶位置 處實(shí)現(xiàn)服務(wù)器系統(tǒng)的分開的實(shí)例。
      [0062] 通常,服務(wù)器系統(tǒng)16的特征被設(shè)計(jì)成模塊化的和可選的,從而使得單獨(dú)用戶可以 選擇最適合具體項(xiàng)目的特征。例如,一個(gè)用戶可能已經(jīng)具有用于在具體項(xiàng)目中使用的開發(fā) 已知的規(guī)則集,而另一個(gè)用戶可能想要該規(guī)則集作為其項(xiàng)目的一部分,并且另一個(gè)用戶可 能想要使用社區(qū)反饋來幫助開發(fā)和改進(jìn)其規(guī)則集。類似地,一個(gè)用戶可能已經(jīng)具有用于在 具體項(xiàng)目中使用的已知的導(dǎo)入過濾器,而另一個(gè)用戶可能想要開發(fā)導(dǎo)入過濾器作為其項(xiàng)目 的一部分,并且另一個(gè)用戶可能想要使用社區(qū)反饋來幫助開發(fā)和改進(jìn)導(dǎo)入過濾器。作為另 一個(gè)示例,一個(gè)用戶可能已經(jīng)了解他們感興趣的用于具體項(xiàng)目的輸出的類型,而另一個(gè)用 戶可能想要開發(fā)、評審、選擇和細(xì)化輸出元素并格式化為該項(xiàng)目的一部分。因此,將理解到, 服務(wù)器系統(tǒng)16可以但不一定包括單個(gè)實(shí)施例中的所有可能的特征。沿著相同路線,還將認(rèn) 識到,可以在逐項(xiàng)目的基礎(chǔ)上選擇特征的各種組合,并且認(rèn)識到,可以隨著經(jīng)驗(yàn)的增加,一 段時(shí)間內(nèi)可以開發(fā)、評價(jià)和結(jié)合模型改進(jìn)。
      [0063] ΤΜΑ0系統(tǒng)12連接到網(wǎng)絡(luò)18 (如互聯(lián)網(wǎng))以提供一系列互連。具體地,該網(wǎng)絡(luò)通常 將ΤΜΑ0系統(tǒng)12與多個(gè)信息商店20連接,在這些信息商店內(nèi),該ΤΜΑ0系統(tǒng)可以標(biāo)識和提取 項(xiàng)目數(shù)據(jù)和規(guī)則數(shù)據(jù)以供使用。應(yīng)指出,項(xiàng)目數(shù)據(jù)可以由創(chuàng)作實(shí)體直接提供或通過網(wǎng)絡(luò)標(biāo) 識和訪問。不同項(xiàng)目內(nèi)所使用的信息商店可以從全結(jié)構(gòu)化的數(shù)據(jù)到良好定義的數(shù)據(jù)庫、到 搜索引擎結(jié)果、圖像檔案、視頻檔案等等涉及全部范圍。
      [0064] 該網(wǎng)絡(luò)還將ΤΜΑ0系統(tǒng)12與可能從事數(shù)據(jù)處理、規(guī)則或輸出評審、反饋和改進(jìn)的過 程的社區(qū)22連接。為了實(shí)現(xiàn)社區(qū)改進(jìn)特征,該ΤΜΑ0系統(tǒng)為該社區(qū)提供項(xiàng)目信息,如該系統(tǒng) 產(chǎn)生的項(xiàng)目數(shù)據(jù)、記錄和公開、觀點(diǎn)、規(guī)則集和輸出以從該社區(qū)請求反饋,可以對該反饋進(jìn) 行評價(jià)以改進(jìn)該系統(tǒng)。該ΤΜΑ0系統(tǒng)可以通過提供激勵(lì)(如認(rèn)可、補(bǔ)償、或積分)來鼓勵(lì)該社 區(qū)的成員提供反饋。例如,可以通過公開評審和接收對這些評審的社區(qū)反饋來創(chuàng)建信譽(yù)分 數(shù)或排名。然后這種分?jǐn)?shù)或排名可以引起累積:簡單的益處,例如,用戶配置文件上的徽章; 至更寬泛的益處,例如,免費(fèi)或打折訪問有價(jià)值的信息,如全文期刊文章;至更直接的益處, 例如,以物理或虛擬貨幣支付費(fèi)用。
      [0065] 該網(wǎng)絡(luò)還將ΤΜΑ0系統(tǒng)12與為該系統(tǒng)的運(yùn)營商提供廣告商業(yè)機(jī)會(huì)的附屬機(jī)構(gòu)24 連接。為了能夠?qū)崿F(xiàn)此機(jī)會(huì),該系統(tǒng)運(yùn)營商與商品和服務(wù)的信任的提供商形成多種附屬關(guān) 系。該ΤΜΑ0配置有附屬數(shù)據(jù)(例如,產(chǎn)品描述、廣告等)和附屬網(wǎng)站的鏈接。該系統(tǒng)還被 配置成用于標(biāo)識具體的附屬機(jī)構(gòu)的商品和服務(wù)何時(shí)與具體項(xiàng)目相關(guān)并且將參照、推薦、以 及附屬機(jī)構(gòu)的鏈接直接嵌入到ΤΜΑ0輸出內(nèi)。還可以用附屬機(jī)構(gòu)為該ΤΜΑ0系統(tǒng)提供的廣告 和線索提供補(bǔ)償或其他積分來監(jiān)測查看公開、點(diǎn)進(jìn)和購買線索。
      [0066] 客戶端系統(tǒng)14為一系列潛在用戶、最值得注意地創(chuàng)作實(shí)體26和系統(tǒng)管理員 28(其每個(gè)可以是人類或計(jì)算機(jī)化的)提供訪問。創(chuàng)作實(shí)體26通常被授權(quán)使用該ΤΜΑ0系 統(tǒng)來運(yùn)行項(xiàng)目,而系統(tǒng)管理員28通常被授權(quán)配置、配置和維護(hù)該ΤΜΑ0。創(chuàng)作實(shí)體一般通過 模板系統(tǒng)訪問該ΤΜΑ0系統(tǒng),該模板系統(tǒng)被設(shè)計(jì)成用于智能地請求輸入以定義特定的項(xiàng)目。 通常,除了項(xiàng)目數(shù)據(jù)、根據(jù)觀點(diǎn)對項(xiàng)目數(shù)據(jù)進(jìn)行處理的規(guī)則、以及向創(chuàng)作實(shí)體和可能向其他 人(如社區(qū))呈現(xiàn)項(xiàng)目的結(jié)果的輸出格式以外,項(xiàng)目定義還需要自定義、預(yù)選擇、或默認(rèn)的 觀點(diǎn)。
      [0067] 客戶端系統(tǒng)14還被配置成用于通常從創(chuàng)作實(shí)體和社區(qū)成員接收反饋。然后該反 饋用于創(chuàng)建、替換、更新和刪除系統(tǒng)的各種特征、規(guī)則、輸出和其他方面。具體地,反饋可以 用于對特定輸出和用于生成系統(tǒng)所呈現(xiàn)的輸出的特定規(guī)則進(jìn)行評級和評論。用戶可以批評 特定輸出、建議他們將發(fā)現(xiàn)更有用的其他輸出、指出校正等等。然后,這種類型的反饋可以 用于改進(jìn)系統(tǒng)的后續(xù)輸出和其他方面。獲得關(guān)于規(guī)則的有用反饋會(huì)是困難的,因?yàn)檫@些規(guī) 則是通過計(jì)算機(jī)代碼或算法格式實(shí)施的。為了能夠?qū)崿F(xiàn)規(guī)則細(xì)化,系統(tǒng)以自然語言或偽自 然語言(對非專家程序員而言是不可理解的)格式接受規(guī)則輸入和輸出被觸發(fā)的規(guī)則,通 過一個(gè)或多個(gè)模板呈現(xiàn)這些規(guī)則,并且然后接收用于修改規(guī)則模板的一個(gè)或多個(gè)版本的反 饋。
      [0068] 除了一般維護(hù)和配置以外,系統(tǒng)管理員28訪問客戶端系統(tǒng)14從而鍵入例如被結(jié) 合到系統(tǒng)所產(chǎn)生的輸出內(nèi)的廣告數(shù)據(jù)。廣告數(shù)據(jù)通常包括附屬機(jī)構(gòu)以及其網(wǎng)站的鏈接提供 的商品、服務(wù)、報(bào)價(jià)、請求或需要的實(shí)體、產(chǎn)品和服務(wù)定義。該ΤΜΑ0系統(tǒng)還被配置成用于標(biāo) 識具體的附屬機(jī)構(gòu)的商品或服務(wù)何時(shí)與具體項(xiàng)目相關(guān)并且可以將參照、推薦、以及附屬機(jī) 構(gòu)的鏈接直接嵌入到ΤΜΑ0輸出內(nèi)。
      [0069] 客戶端系統(tǒng)14所公開的模板提供結(jié)構(gòu)化、半結(jié)構(gòu)化和交互式用戶界面用于從創(chuàng) 作實(shí)體請求信息以定義項(xiàng)目。示例模板包括:"觀點(diǎn)";"項(xiàng)目描述";"項(xiàng)目數(shù)據(jù)";"規(guī)則"; "導(dǎo)入過濾器"以及"輸出格式"模板。取決于具體項(xiàng)目的需要,不同的創(chuàng)作實(shí)體可以利用不 同的模板集合,并且默認(rèn)值可以用于未指定的模板數(shù)據(jù)。
      [0070] "觀點(diǎn)"模板收集ΤΜΑ0系統(tǒng)用來選擇和量身定制以下各項(xiàng)中的一項(xiàng)或多項(xiàng)的輸入 數(shù)據(jù):故事結(jié)構(gòu)、語言修飾語、輸出類型、輸出格式、以及項(xiàng)目的最適合具體用戶和目的的其 他方面。觀點(diǎn)考慮了一個(gè)或多個(gè)因素,如作者的角色(例如,CEO、公司內(nèi)部代理人、外部顧 問等)、主題(例如,技術(shù)或科學(xué)領(lǐng)域)、目的、項(xiàng)目的關(guān)鍵問題或驅(qū)動(dòng)器(例如,競爭市場分 析、使用分析的專利自由度、現(xiàn)有技術(shù)水平分析等)。例如,營銷人員一般對看到以某些格 式呈現(xiàn)的某些類型的數(shù)據(jù)感興趣,而法律顧問一般對看到以替代性格式呈現(xiàn)的其他類型的 數(shù)據(jù)感興趣。類似地,通常在例如競爭市場分析vs例如專利景觀分析中呈現(xiàn)不同類型的 信息。還可以指定所希望的輸出內(nèi)容、設(shè)計(jì)和結(jié)構(gòu),如有待以圖形、圖表、視頻等等顯示的數(shù) 據(jù)。
      [0071] "項(xiàng)目描述"模板是可選的,但可以用于進(jìn)一步定義有待構(gòu)建的項(xiàng)目。可以指定一 系列可能的有關(guān)數(shù)據(jù),如與同一主題相關(guān)的之前的項(xiàng)目、有待結(jié)合入研究的反饋、項(xiàng)目中有 待考慮的特定因素、特定目標(biāo)觀眾等等。
      [0072] "項(xiàng)目數(shù)據(jù)"模板用于標(biāo)識源數(shù)據(jù),該源數(shù)據(jù)可以被直接提供至該系統(tǒng)、被標(biāo)識用 于訪問、或以任何其他合適的方式被定義。在許多情況下,創(chuàng)作實(shí)體將已經(jīng)標(biāo)識有待在項(xiàng)目 中考慮的特定信息。在其他情況下,可以指定可電子地訪問的數(shù)據(jù)庫或在線文檔儲存庫,并 且搜索引擎可以用于通過電子文檔的搜索、網(wǎng)頁的擦除、數(shù)據(jù)提要的收集、以及搜索引擎可 以標(biāo)引的其他數(shù)據(jù)源聚合的標(biāo)識項(xiàng)目數(shù)據(jù)。
      [0073] "規(guī)則"模板標(biāo)識有待在處理項(xiàng)目數(shù)據(jù)中使用的規(guī)則。分類是一類重要的規(guī)則集, 這些規(guī)則集包含基于利用例如行業(yè)詞匯和含義(例如,同義詞)的規(guī)則對數(shù)據(jù)進(jìn)行分類的 標(biāo)簽指令。用分類學(xué)分類規(guī)則列出和分組的項(xiàng)對項(xiàng)目數(shù)據(jù)內(nèi)的項(xiàng)(例如記錄或文檔)(其 可以是單獨(dú)的詞、詞性、專有名詞、名詞短語、聚類、η元語法、提取的實(shí)體、數(shù)字描述符、統(tǒng)計(jì) 描述符、時(shí)態(tài)描述符等等)加上標(biāo)簽,由此允許基于例如含義或模式匹配提取數(shù)據(jù)。還可以 指定一系列其他規(guī)則用于對數(shù)字或文本項(xiàng)進(jìn)行標(biāo)識、加標(biāo)簽、提取、清除、準(zhǔn)備、分組、分析、 評分、共享、以及呈現(xiàn)。
      [0074] "規(guī)則"模板還可以被配置成用于標(biāo)識規(guī)則、將規(guī)則轉(zhuǎn)化成(偽)自然語言描述(或 從元數(shù)據(jù)檢索描述),并且將呈現(xiàn)算法以供創(chuàng)作實(shí)體考慮。還可以將規(guī)則與該規(guī)則之前已 經(jīng)對其進(jìn)行操作的數(shù)據(jù)以及該規(guī)則之前在具體項(xiàng)目中產(chǎn)生的結(jié)果配對。這允許創(chuàng)作實(shí)體評 審、評論、編輯、版本化、以及擴(kuò)展單獨(dú)規(guī)則(此努力通常被稱為CRUD-創(chuàng)作、替換、更新、刪 除-反饋改進(jìn)過程。還可以在逐情況的基礎(chǔ)上向社區(qū)中的一個(gè)或多個(gè)用戶呈現(xiàn)規(guī)則以便社 區(qū)評審、評論、編輯、以及用新規(guī)則擴(kuò)展這些規(guī)則。這通過對特定項(xiàng)目和多面反饋的迭代經(jīng) 驗(yàn)供了一種用于發(fā)開發(fā)、評審和改進(jìn)規(guī)則集的有力機(jī)制。接收改進(jìn)的規(guī)則可以鏈接到對應(yīng) 的版本,從而使得后續(xù)創(chuàng)作實(shí)體、用戶和社區(qū)成員可以確定在具體項(xiàng)目或反饋活動(dòng)中利用 哪個(gè)版本。
      [0075] "導(dǎo)入過濾器"模板允許創(chuàng)作實(shí)體標(biāo)識現(xiàn)有的導(dǎo)入過濾器和/或設(shè)計(jì)新的過濾器。 導(dǎo)入過濾器為一類重要的規(guī)則集,當(dāng)所提取的項(xiàng)目數(shù)據(jù)被鍵入ΤΜΑ0系統(tǒng)內(nèi)時(shí),這些規(guī)則集 通常用于解析和準(zhǔn)備該數(shù)據(jù)。即,分類法規(guī)則集可以用于基于含義對源項(xiàng)目數(shù)據(jù)內(nèi)的數(shù)據(jù) 項(xiàng)進(jìn)行分類和加標(biāo)簽。然后,導(dǎo)入過濾器可以用于為提取選擇具體的含義(即,對數(shù)據(jù)進(jìn)行 過濾),將數(shù)據(jù)準(zhǔn)備成所希望的格式,以及以所希望的格式將所提取的數(shù)據(jù)鍵入到ΤΜΑ0數(shù) 據(jù)庫內(nèi)。在其他實(shí)施例中,導(dǎo)入過濾器模板可以被應(yīng)用于項(xiàng)目數(shù)據(jù)以便能夠提取數(shù)據(jù),并且 在任何分類法規(guī)則集之前或不包括其時(shí)使用。
      [0076] "輸出格式"模板允許創(chuàng)作實(shí)體標(biāo)識顯示或共享項(xiàng)目結(jié)果所用的輸出格式、以及設(shè) 計(jì)新的輸出格式。輸出格式為另一類重要的規(guī)則集,這些規(guī)則集通常用于指定ΤΜΑ0系統(tǒng)將 要如何呈現(xiàn)所處理的數(shù)據(jù)。創(chuàng)作實(shí)體可能已經(jīng)具有其想要看到的輸出格式和設(shè)計(jì),如具體 統(tǒng)計(jì)的條形圖、特定網(wǎng)站的門戶、視頻查看等等。設(shè)計(jì)選擇可以包括例如HTML5中的層疊樣 式表支持的所有那些設(shè)計(jì)選擇、以及任何其他圖形設(shè)計(jì)選擇,例如,故事板、線框、分頁、分 層、布局、柵格、運(yùn)動(dòng)規(guī)劃、動(dòng)畫、音頻/視頻集成、遮蔽、圖像映射等。它們還可以在逐項(xiàng)目 的基礎(chǔ)上在由例如(靜態(tài)的或移動(dòng)的)文本、光柵、向量或點(diǎn)云數(shù)據(jù)組成的一系列格式中設(shè) 計(jì)新的輸出格式。
      [0077] 客戶端系統(tǒng)14可以使用附加特征從創(chuàng)作實(shí)體收集輸入數(shù)據(jù),如結(jié)構(gòu)化和半結(jié)構(gòu) 化形式和智能問卷。智能問卷可以是用于當(dāng)創(chuàng)作實(shí)體移動(dòng)通過該問卷時(shí)漸增地請求特定數(shù) 據(jù)的交互式、分叉式問題和答案程序??梢栽谶M(jìn)行中的基礎(chǔ)上,通過用戶或社區(qū)成員反饋來 開發(fā)、存儲、檢索和以CRUD方式改進(jìn)主題特定的模板、結(jié)構(gòu)化和半結(jié)構(gòu)化形式、以及智能問 卷。
      [0078] 通過客戶端系統(tǒng)14,服務(wù)器系統(tǒng)16接收模板數(shù)據(jù)和對項(xiàng)目進(jìn)行定義的其他元素 并運(yùn)行ΤΜΑ0系統(tǒng)來以所希望的或觀點(diǎn)特定的格式產(chǎn)生和呈現(xiàn)輸出。雖然操作程序從項(xiàng)目 到項(xiàng)目可能不同,但典型的程序可以包括:應(yīng)用導(dǎo)入過濾器以提取具有特定標(biāo)簽或其他屬 性的數(shù)據(jù)項(xiàng);將所提取的數(shù)據(jù)準(zhǔn)備成數(shù)據(jù)庫就緒格式(例如,將數(shù)據(jù)項(xiàng)格式化成與數(shù)據(jù)庫 字段相對應(yīng)的結(jié)構(gòu));將主題特定分類法規(guī)則集應(yīng)用于項(xiàng)目數(shù)據(jù)內(nèi)的標(biāo)簽文本和/或數(shù)字 數(shù)據(jù)項(xiàng);將所提取的數(shù)據(jù)加載到數(shù)據(jù)庫內(nèi)(例如,一個(gè)用于在源項(xiàng)目數(shù)據(jù)內(nèi)處理的每個(gè)文 檔的數(shù)據(jù)庫記錄,和與每個(gè)所應(yīng)用的標(biāo)簽相對應(yīng)的每個(gè)記錄中的一個(gè)字段);按照觀點(diǎn)特 定的分析規(guī)則集(例如,對統(tǒng)計(jì)分析進(jìn)行分類、優(yōu)先化、計(jì)算-選擇性地應(yīng)用所有分析從而 集中在最可能與創(chuàng)建實(shí)體的觀點(diǎn)相關(guān)的數(shù)據(jù)上)處理該數(shù)據(jù)庫;以及向輸出生成器提供所 處理的數(shù)據(jù)以便基于該觀點(diǎn)進(jìn)行呈現(xiàn)(例如,顯示該系統(tǒng)所組合的自然語言文本、顯示統(tǒng) 計(jì)數(shù)據(jù)、鏈接網(wǎng)站的門戶、播放視頻)。輸出可以描述情形、建議選項(xiàng)、得出結(jié)論和嵌入按照 觀點(diǎn)確定的認(rèn)為可接受的廣告數(shù)據(jù),如參照、推薦和附屬機(jī)構(gòu)的鏈接。
      [0079] 然后創(chuàng)作實(shí)體(人類、計(jì)算機(jī)化的)對ΤΜΑ0輸出進(jìn)行評審以用于反饋,這可以引 起以一系列的細(xì)化運(yùn)行項(xiàng)目的一次或多次附加迭代。還可以公開創(chuàng)作實(shí)體以查看ΤΜΑ0項(xiàng) 目或輸出屏幕上嵌入的頂層級廣告數(shù)據(jù)(例如,具有徽標(biāo)按鈕的附屬推薦-取得一個(gè)第一 層級廣告公開資格),點(diǎn)擊查看ΤΜΑ0系統(tǒng)內(nèi)存儲的附加廣告(例如,簡要附屬描述、簡要產(chǎn) 品或服務(wù)描述、以及附屬網(wǎng)站的鏈接-取得一個(gè)第二層級廣告公開資格),然后點(diǎn)進(jìn)附屬網(wǎng) 站(現(xiàn)在取得點(diǎn)進(jìn)光告公開資格,其中然后用戶可以從事附加廣告公開(現(xiàn)在取得營銷線 索廣告公開資格),并且進(jìn)行購買(現(xiàn)在取得營銷購買廣告公開資格)。此后,這可以觸發(fā) 對ΤΜΑ0系統(tǒng)的運(yùn)營商的補(bǔ)償,這可以基于例如廣告公開的數(shù)量和類型來計(jì)算。
      [0080] 典型地,如創(chuàng)作實(shí)體所指定的,可以與用于評審和反饋的社區(qū)共享輸出和其他項(xiàng) 目數(shù)據(jù)(具體地,被觸發(fā)的規(guī)則和相關(guān)聯(lián)的結(jié)果),該反饋可以產(chǎn)生附加廣告公開和以一系 列細(xì)化運(yùn)行項(xiàng)目的一次或多次附加迭代。該系統(tǒng)還可以實(shí)施社區(qū)激勵(lì)以鼓勵(lì)和補(bǔ)償有用的 反饋。例如,評級系統(tǒng)可以用于為評審實(shí)體創(chuàng)建和更新信譽(yù)指標(biāo);可以提供積分(例如,用 于通過TMAO系統(tǒng)購買公開的點(diǎn))以便提供評審和對評審進(jìn)行評審以對評審員進(jìn)行評級;或 可以支付金錢賠償。
      [0081] 雖然可以實(shí)施一系列處理,包括通過ΤΜΑ0系統(tǒng)的使用而開發(fā)的功能性,但圖2為 一個(gè)過程圖,提供了 ΤΜΑ0系統(tǒng)執(zhí)行的處理的一個(gè)說明性示例。圖3為一個(gè)用戶界面圖,展 示了 ΤΜΑ0系統(tǒng)生成的示例輸出顯示,其示出了與圖2共有的某些元件。參照圖2,框32-44 展示了觀點(diǎn)特定文本渲染,并且框32和框46-60展示了觀點(diǎn)特定數(shù)字?jǐn)?shù)據(jù)渲染???2-44、 框50和框60展示了 ΤΜΑ0輸出70,圖3上展示了 ΤΜΑ0輸出的顯示。將認(rèn)識到,圖2和圖3 示出了用于展示本發(fā)明的原理的目的的簡單示例,并且將認(rèn)識到,實(shí)際ΤΜΑ0輸出將通常包 括許多輸出頁面或序列和不同文本組合、數(shù)據(jù)組合、或具有更大復(fù)雜性的多媒體插入項(xiàng)。
      [0082] 在框32中,從基于從項(xiàng)目確定的觀點(diǎn)的項(xiàng)目數(shù)據(jù)獲得所提取的數(shù)據(jù)集。例如,可 以使用一個(gè)或多個(gè)分類和導(dǎo)入過濾器提取數(shù)據(jù)以標(biāo)識、提取、分類、準(zhǔn)備、以及將所提取的 數(shù)據(jù)加載到ΤΜΑ0數(shù)據(jù)庫的定義記錄和字段內(nèi)。在框34中,基于觀點(diǎn)選擇通用文本結(jié)構(gòu)和語 法規(guī)則集。通用文本結(jié)構(gòu)通常包括帶有用于接收從所提取的數(shù)據(jù)挖掘的文本的"填空(fill in the blank)"接收字段的自然短語系統(tǒng)。這些"填空"接收字段可以包括通過選擇的最 適合于觀點(diǎn)的提取數(shù)據(jù)和表達(dá)有待填入的語法修飾語(例如,形容詞、副詞)以及語法名詞 (例如,主語、賓語)和語法動(dòng)詞(例如,動(dòng)作、過程)。例如,一個(gè)表達(dá)集合可以被認(rèn)為適 用于法律觀點(diǎn)(例如,非委婉語言或以另外的方式避免或使用如該觀點(diǎn)所指示的某些有法 律意義的詞語,如向于原告或向于被告),而另一表達(dá)集合可以被認(rèn)為適用于市場評價(jià)觀點(diǎn) (例如,更豐富多彩、機(jī)會(huì)性或面向未來的語言)、或人口統(tǒng)計(jì)評價(jià)(例如,使用已建立的人 口統(tǒng)計(jì)類別)。
      [0083] 為了提供一個(gè)簡單的示例,通用文本結(jié)構(gòu)可以是"此空格內(nèi)的[A]公開者為[B] ", 其中[A]為有待基于觀點(diǎn)插入的修飾語,并且[B]為數(shù)據(jù)挖掘文本插入項(xiàng)。修飾語[A]通 常包含在規(guī)則集內(nèi)并且基于為項(xiàng)目確定的觀點(diǎn)來選擇;而通常從項(xiàng)目數(shù)據(jù)提取數(shù)據(jù)挖掘文 本插入項(xiàng)[Β]。ΤΜΑ0系統(tǒng)從由創(chuàng)作實(shí)體通過用戶界面所公開的觀點(diǎn)鍵入的信息確定項(xiàng)目的 觀點(diǎn),該觀點(diǎn)可以通過附加輸入請求而被擴(kuò)展,如創(chuàng)作實(shí)體所完成的智能問卷和附加結(jié)構(gòu) 化或半結(jié)構(gòu)化輸入形式。通用文本結(jié)構(gòu)通常被一個(gè)或多個(gè)規(guī)則集引用(在一個(gè)實(shí)施例中) 或包含在其內(nèi)(在另一個(gè)實(shí)施例中)并且可以基于為項(xiàng)目確定的觀點(diǎn)來選擇。在大多數(shù)情 況下,通用文本結(jié)構(gòu)可以用于多個(gè)觀點(diǎn)并且可以基于為項(xiàng)目確定的特定觀點(diǎn)來進(jìn)一步選擇 或分配。在其他情況下,可以基于對例如標(biāo)簽、類別、規(guī)則的關(guān)系選擇通用文本結(jié)構(gòu)或基于 來自項(xiàng)目的觀點(diǎn)模板的特定字段值對其進(jìn)行修改。在任何情況下,通用文本結(jié)構(gòu)被配置成 用于準(zhǔn)備用于接收修飾語和數(shù)據(jù)挖掘文本插入項(xiàng),在ΤΜΑ0系統(tǒng)的相應(yīng)特征提供的句法中 提供這些插入項(xiàng),以便以自然語言句子和短語格式創(chuàng)建語法上格式化的組合的文本組合。
      [0084] 為了進(jìn)一步展示此過程,框36包含觀點(diǎn)特定的修飾語。在特定示例的上下文中, 為項(xiàng)目的特定觀點(diǎn)選擇的修飾語[A]為"黃金標(biāo)準(zhǔn)(gold standard)"??赡芤呀?jīng)從具有相 似含義的修飾語組中選擇了此具體修飾語,這些修飾語被認(rèn)為是更適合其他觀點(diǎn)。例如,用 于通用文本結(jié)構(gòu)上的此具體插入位置的可能修飾語集合可以是"黃金標(biāo)準(zhǔn)";"線索";"最多 產(chǎn)的";"最高數(shù)量",其中基于項(xiàng)目的特定觀點(diǎn)選擇"黃金標(biāo)準(zhǔn)"用于插入???8展示了項(xiàng) 目的數(shù)據(jù)挖掘文本插入項(xiàng)的集合,通常使用分類法規(guī)則集、導(dǎo)入過濾器、以及創(chuàng)作實(shí)體指定 的分析規(guī)則中的一項(xiàng)或多項(xiàng)通過用戶界面公開的模板來提取。在該特定示例中,從所提取 的數(shù)據(jù)選擇"頂點(diǎn)生成公司(Acme Generating Co.)"作為數(shù)據(jù)挖掘文本插入項(xiàng)[B],作為具 有從基于為項(xiàng)目確定的觀點(diǎn)的項(xiàng)目數(shù)據(jù)內(nèi)提取或標(biāo)識的最大數(shù)量的公開的公開者。然后組 合通用文本結(jié)構(gòu)、修飾語插入項(xiàng)[A]和數(shù)據(jù)挖掘文本插入項(xiàng)[B]來創(chuàng)建組合的文本組合40, 在本例中為"空格中的黃金標(biāo)準(zhǔn)公開者為頂點(diǎn)生成公司"。
      [0085] 框42包含用于基于項(xiàng)目的觀點(diǎn)創(chuàng)建故事結(jié)構(gòu)的預(yù)定義故事結(jié)構(gòu)和/或規(guī)則。例 如,可以通過以例如"情形、并發(fā)情形、問題"的格式創(chuàng)建故事的規(guī)則來創(chuàng)建故事結(jié)構(gòu),該格 式通過輸入請求而開發(fā),如隨著其分支通過與創(chuàng)作實(shí)體的問答交互而創(chuàng)建該故事結(jié)構(gòu)的智 能問卷。可以使用其他線性和非線性故事結(jié)構(gòu),包括情節(jié)、結(jié)構(gòu)描述、弧、原型,或以另外的 方式前提條件是可以系統(tǒng)地組織、有條件地填充、以及以根據(jù)本發(fā)明的方面的交際性組合 的形式輸出這種結(jié)構(gòu)???4展示了組合的文本組合40插入到觀點(diǎn)特定的故事結(jié)構(gòu)42內(nèi)。 參照圖3,示出了特定示例的ΤΜΑ0輸出70。顯示面板中所包括的文本、數(shù)據(jù)和多媒體項(xiàng)的 選擇、安排和格式中反映了觀點(diǎn)特定故事結(jié)構(gòu)42。組合的文本組合"空格中的黃金標(biāo)準(zhǔn)公 開者為頂點(diǎn)生成公司"已經(jīng)被插入作為項(xiàng)40a,其中示出了附加組合的文本組合40b-c作為 附加示例。通用文本結(jié)構(gòu)34a、修飾語插入項(xiàng)36a、以及組合的文本組合40a的數(shù)據(jù)挖掘插 入項(xiàng)38a也可以被調(diào)出,其中示出了附加通用文本結(jié)構(gòu)34b-c、修飾語3b-c、以及數(shù)據(jù)挖掘 文本插入項(xiàng)38b-c用于附加示例。
      [0086] 回到圖2,框32和框46-60展示了觀點(diǎn)特定的數(shù)字?jǐn)?shù)據(jù)渲染???6包含用于創(chuàng)建 從項(xiàng)目數(shù)據(jù)提取的數(shù)據(jù)挖掘文本插入項(xiàng)的原始數(shù)據(jù)。在本示例中,已經(jīng)從項(xiàng)目數(shù)據(jù)提取了 用于至少2010年、2011年和2012年頂點(diǎn)生成公司的公開的標(biāo)識符并將其加載到ΤΜΑ0數(shù)據(jù) 庫上。此時(shí),統(tǒng)計(jì)分析通常應(yīng)用于原始提取數(shù)據(jù),在這種情況下對按年份的公開進(jìn)行求和。 這通過將所提取的數(shù)據(jù)加載到ΤΜΑ0數(shù)據(jù)庫內(nèi)來促進(jìn),可以在該ΤΜΑ0數(shù)據(jù)庫內(nèi)按照所希望 的情況進(jìn)行分類、計(jì)數(shù)、統(tǒng)計(jì)分析和格式化???8展示了當(dāng)針對基于觀點(diǎn)特定的結(jié)構(gòu)42已 經(jīng)對其進(jìn)行分析和格式化的數(shù)據(jù)挖掘數(shù)字插入項(xiàng)。所示特定示例為以創(chuàng)建數(shù)據(jù)的觀點(diǎn)特 定數(shù)據(jù)挖掘組合50的相應(yīng)輸出發(fā)生器所需的格式(在這種情況下為條形圖)提供的公開 (2010 = 64, 2011 = 88,和2012 = 1140)的公開年份和數(shù)量。圖3示出了輸出發(fā)生器50, 以條形圖的形式(如為項(xiàng)目確定的觀點(diǎn)故事結(jié)構(gòu)42所指定的)展示了數(shù)據(jù)挖掘數(shù)字插入 項(xiàng)48。
      [0087] 再次回到圖2,框52展示了多媒體輸出發(fā)生器52,其通常鏈接到項(xiàng)目數(shù)據(jù)內(nèi)所包 含的多媒體數(shù)據(jù)。向多媒體插入項(xiàng)54提供了多媒體鏈接,該插入項(xiàng)對多媒體進(jìn)行格式化用 于在該位置和以觀點(diǎn)故事結(jié)構(gòu)42所指定的格式顯示。圖3示出了以網(wǎng)絡(luò)鏈接52a和門戶 查看器54a為形式的一個(gè)第一示例,該門戶查看器允許用戶查看位于各網(wǎng)站和其他存儲位 置上的實(shí)時(shí)數(shù)據(jù)。一個(gè)第二示例包括視頻鏈接52b和視頻查看器54b,該視頻查看器允許用 戶查看位于各網(wǎng)站或其他存儲位置上的視頻。在本示例中,已經(jīng)提取和顯示視頻的標(biāo)題作 為數(shù)據(jù)挖掘文本插入項(xiàng)38c。將認(rèn)識到,以此方式可以顯示或鏈接到可以被電子地訪問的幾 乎任何類型的多媒體數(shù)據(jù)。
      [0088] 圖2還示出了包含廣告數(shù)據(jù)的框58,該廣告數(shù)據(jù)可以包括一般來自信任的附屬機(jī) 構(gòu)(或信任的附屬機(jī)構(gòu)的附屬機(jī)構(gòu))的多種信息,ΤΜΑ0系統(tǒng)的運(yùn)營商已經(jīng)與這些附屬機(jī)構(gòu) 建立了關(guān)系。典型地,這些關(guān)系包括一個(gè)補(bǔ)償模型,在該補(bǔ)償模型下,ΤΜΑ0系統(tǒng)的運(yùn)營商可 以接收對ΤΜΑ0系統(tǒng)所促進(jìn)的商務(wù)的補(bǔ)償,例如,廣告公開可以包括現(xiàn)場公開、點(diǎn)進(jìn)附屬機(jī) 構(gòu)、從附屬機(jī)構(gòu)購買、用附屬機(jī)構(gòu)注冊等等???8進(jìn)一步呈現(xiàn)了包含參照、推薦和/或?qū)?于產(chǎn)品、服務(wù)和附屬機(jī)構(gòu)的數(shù)據(jù)的其他聲明和數(shù)據(jù)的文本和數(shù)據(jù)組合(其可以是組合的組 成)的生成。盡管可以將任何類型的廣告數(shù)據(jù)結(jié)合到TMAO輸出內(nèi),但框60展示了附屬網(wǎng) 站的鏈接60的顯示。圖3展示了廣告數(shù)據(jù)到TMAO輸出內(nèi)的結(jié)合,在本示例中,推薦58a包 含附屬鏈接60a。將再次認(rèn)識到,以此方式可以顯示或鏈接到包括可以被電子地訪問的多媒 體數(shù)據(jù)的幾乎任何類型的廣告數(shù)據(jù)。
      [0089] 圖4為在文本挖掘、分析和輸出系統(tǒng)中使用的分類法規(guī)則集的數(shù)據(jù)組織圖。創(chuàng)建 了特定分類法并且在一段時(shí)間內(nèi)可以基于例如觀點(diǎn)、項(xiàng)目數(shù)據(jù)、和從創(chuàng)作實(shí)體和可能從評 審員社區(qū)接收的反饋對其進(jìn)行修改。雖然分類法規(guī)則集可以包含多種多樣的規(guī)則,分類法 是用于對數(shù)據(jù)進(jìn)行分類的一類重要的規(guī)則集。每種分類法由分層數(shù)據(jù)和特定于一個(gè)或多個(gè) 具體話題的規(guī)則結(jié)構(gòu)組成。圖4示出了層次的一個(gè)說明性部分,該層次可以具有如所希望 的許多的層級。在本示例中,分類法的最高層級是話題,并且該示例中未示出的較高層級可 以包括例如話題的類別,如【技術(shù)領(lǐng)域】、人文學(xué)科、語言選擇等等。已經(jīng)用"能量存儲裝置"為 所選擇的話題定義了若干種話題(其可以被實(shí)現(xiàn)為例如用戶界面上的制表符)。用所選擇 的領(lǐng)域?yàn)?益處"在所選擇的話題下定義了若干領(lǐng)域。類似地,用"高速"為所選擇的類別 在所選擇的領(lǐng)域下定義若干類別。以該特定示例繼續(xù),用"同義詞"為所選擇的規(guī)則在所選 擇的類別下定義若干規(guī)則。然后在所選擇的同義詞規(guī)則下顯示用于所選擇的類別的同義詞 的列表。此規(guī)則將類別(高速)的元數(shù)據(jù)標(biāo)簽應(yīng)用于項(xiàng)目數(shù)據(jù),條件在于該數(shù)據(jù)內(nèi)存在這 些同義詞中的一個(gè)或多個(gè)同義詞。本領(lǐng)域的技術(shù)人員將理解到,此規(guī)則可以被進(jìn)一步指定 應(yīng)用于例如所有項(xiàng)目數(shù)據(jù)、項(xiàng)目數(shù)據(jù)的一部分、或項(xiàng)目數(shù)據(jù)內(nèi)的字段集合或子集。在一個(gè)實(shí) 施例中,這進(jìn)一步允許導(dǎo)入過濾器指定類別"高速"用于后續(xù)提取,這會(huì)引起例如從項(xiàng)目數(shù) 據(jù)提取加標(biāo)簽的同義詞、加標(biāo)簽的記錄或加標(biāo)簽的記錄的其他部分并且被加載到ΤΜΑ0數(shù) 據(jù)庫內(nèi),通常其中一條記錄為每個(gè)被處理的文檔和被加載到用類別"高速"標(biāo)簽的數(shù)據(jù)庫字 段內(nèi)的提取數(shù)據(jù)創(chuàng)建。將認(rèn)識到,可以用此方式定義帶有相應(yīng)導(dǎo)入過濾器的分類富集以便 以任何所希望的粒度水平實(shí)施完善的數(shù)據(jù)提取方案。此外,可以通過經(jīng)驗(yàn)和反饋開發(fā)分類 法以有效地學(xué)習(xí)和應(yīng)用當(dāng)前正在具體行業(yè)領(lǐng)域內(nèi)使用的詞匯,因?yàn)槟莻€(gè)詞匯可以在一段時(shí) 間內(nèi)變化。
      [0090] 圖5展示了用于ΤΜΑ0系統(tǒng)的示例系統(tǒng)架構(gòu)。數(shù)據(jù)獲取可以利用結(jié)構(gòu)化和半結(jié)構(gòu)化 的電子數(shù)據(jù)(其經(jīng)常代表文檔),例如,所公開的專利數(shù)據(jù)、技術(shù)文獻(xiàn)數(shù)據(jù)、所公開的新聞數(shù) 據(jù)、訴訟數(shù)據(jù)等等。如(1. 1)中所例證的,這種數(shù)據(jù)可供用于從全世界的許多來源進(jìn)行電子 檢索。若干工具和在線服務(wù)(例如,歐洲專利局?jǐn)?shù)據(jù)庫(Espacenet)(歐洲專利局的在線搜 索和數(shù)據(jù)檢索服務(wù)))從多個(gè)書目的、全文和元數(shù)據(jù)來源聚合數(shù)據(jù)并提供使服務(wù)的用戶能 夠從聚合數(shù)據(jù)語料庫提取用戶指定的數(shù)據(jù)子集的單個(gè)界面。在當(dāng)前ΤΜΑ0系統(tǒng)中,所獲取的 數(shù)據(jù)可以在與歐洲專利局?jǐn)?shù)據(jù)庫所提供的數(shù)據(jù)完全相同或相似的格式下。此外,本發(fā)明可 以利用來自太多而不能完全枚舉的來源陣列的相似類型的數(shù)據(jù)。雖然如此,半結(jié)構(gòu)化數(shù)據(jù) 的每個(gè)來源將根據(jù)以下結(jié)構(gòu)化標(biāo)準(zhǔn)交付格式化后的數(shù)據(jù),如CSV、加標(biāo)簽的文本、RSS/Atom 提要、或XML。所獲取的數(shù)據(jù)的格式被組織成(2)描繪的記錄列表,每條記錄代表半結(jié)構(gòu)化 數(shù)據(jù)的一個(gè)邏輯單元,例如,所公開的文章、所公開的內(nèi)容、法律登記等??梢赃M(jìn)一步用密鑰 或唯一標(biāo)識符對記錄進(jìn)行標(biāo)識以明確將一個(gè)邏輯單元與下一個(gè)邏輯單元區(qū)分開。在其他實(shí) 施例中,不需要呈現(xiàn)密鑰,并且如導(dǎo)入過濾器需要或在數(shù)據(jù)準(zhǔn)備過程中可以分配一個(gè)密鑰。
      [0091] 針對數(shù)據(jù)增強(qiáng),所提取的數(shù)據(jù)集(1. 2)可以保留半結(jié)構(gòu)化數(shù)據(jù)的整個(gè)語料庫的特 征。可替代地,可以清除現(xiàn)有結(jié)構(gòu)并應(yīng)用新結(jié)構(gòu),例如,對跨以前異類的記錄結(jié)構(gòu)的XML標(biāo) 簽進(jìn)行統(tǒng)一。優(yōu)先地,僅部分地結(jié)構(gòu)化數(shù)據(jù)集內(nèi)的數(shù)據(jù),并且因此,對于下游分析而言關(guān)鍵 的數(shù)據(jù)元素在不受約束的自由文本記錄部分內(nèi)。在某些情況下,該數(shù)據(jù)是"臟的",例如,包 含拼寫錯(cuò)誤、不一致性或過時(shí)的元素。例如,經(jīng)常不一致地格式化專有名稱,例如,可能在數(shù) 據(jù)集內(nèi)利用"賓夕法尼亞大學(xué)(University of Pennsylvania) "和"賓夕法尼亞大學(xué)(Univ. of Penn)"兩者指代同一所機(jī)構(gòu),并且可能不明確展示跨數(shù)據(jù)元素的語義關(guān)系,例如,多個(gè)專 利屬于完全相同的受讓人。
      [0092] (1. 3)中描繪的數(shù)據(jù)準(zhǔn)備系統(tǒng)被設(shè)計(jì)成用于解決所提取的數(shù)據(jù)集(1. 2)中存在的 這些缺陷。此系統(tǒng)可以將所有文本轉(zhuǎn)化成單種語言,如英語。其可以提取定量的信息,如 日期、年份、測量單位等等。其可以使用自動(dòng)化技術(shù)(模糊邏輯、正則表達(dá)式模式匹配和商 業(yè)規(guī)則)統(tǒng)一專有名詞(如名稱)以在分析之前增強(qiáng)數(shù)據(jù)集??梢岳缤ㄟ^校正拼寫錯(cuò) 誤或根據(jù)公知詞語字典驗(yàn)證名稱來統(tǒng)一專有名稱。此外,可以刪除數(shù)據(jù)集內(nèi)的重復(fù)記錄, 其中通過識別、比較和作用在數(shù)據(jù)集內(nèi)所包含的記錄內(nèi)的冗余數(shù)據(jù)來清除完全相同或相似 的記錄。進(jìn)一步地,可以使用優(yōu)選分類法凈化、歸一化或統(tǒng)一數(shù)據(jù)集內(nèi)的記錄??梢詰?yīng)用 類屬詞典-在一個(gè)實(shí)施例中,其可以包含與"父(parent) "詞語等價(jià)的基于正則表達(dá)的"子 (child)"詞語的列表-以便采用將代表與給定類屬詞典內(nèi)的每個(gè)規(guī)范詞語鏈接的一個(gè)同 義詞集合的規(guī)范詞語??梢栽诖藬?shù)據(jù)準(zhǔn)備過程中利用多個(gè)類屬詞典,其中每個(gè)類屬詞典應(yīng) 用于記錄內(nèi)的數(shù)據(jù)元素的適當(dāng)部分。例如,可以使用機(jī)構(gòu)類屬詞典來識別數(shù)據(jù)記錄集合或 子集的特定部分中出現(xiàn)的大學(xué)、公司等名稱的不同變化,并且然后用與每個(gè)機(jī)構(gòu)相關(guān)聯(lián)的 單個(gè)規(guī)范的優(yōu)選形式替換每種變化。附加數(shù)據(jù)準(zhǔn)備還可以包括語義、自然語言處理、實(shí)體提 取或其他庫的使用以利用詞匯、語法和統(tǒng)計(jì)技術(shù)來從不同記錄內(nèi)提取相關(guān)數(shù)據(jù)元素。分析 或解釋數(shù)據(jù)或數(shù)據(jù)使其成為可能的任何關(guān)系或映射不是數(shù)據(jù)準(zhǔn)備系統(tǒng)的作用;而數(shù)據(jù)準(zhǔn)備 系統(tǒng)的作用是明確地分配、調(diào)整和統(tǒng)一數(shù)據(jù)元素從而使得可以稍后展示關(guān)系,以便促進(jìn)下 游分析和解釋。
      [0093] (1. 4)描繪的數(shù)據(jù)準(zhǔn)備系統(tǒng)的輸出為更適用于完善分類、推理、分析和解釋的更 清潔、更好結(jié)構(gòu)化的數(shù)據(jù)集。這通過上述明確地展示之前僅潛伏地存在于所提取的數(shù)據(jù)集 (1. 2)內(nèi)的信息的各種方法來實(shí)現(xiàn)。所產(chǎn)生的外顯展示促進(jìn)了下游處理和直接從(10)描繪 的ΤΜΑ0系統(tǒng)輸出轉(zhuǎn)化成增加的值。
      [0094] ΤΜΑ0系統(tǒng)還可以對記錄進(jìn)行分類。經(jīng)常,凈化、增強(qiáng)后的記錄(1. 4)仍不能被充分 地組織成支持(1.9)中所描繪的用戶觀點(diǎn)所需的方言中的分析。在這些情況下,根據(jù)分類 法捕獲按語義或共同點(diǎn)(如與已知特征或益處的關(guān)聯(lián))協(xié)調(diào)一致的記錄組或聚類和將數(shù)據(jù) 集中的記錄歸類成一種或多種類別。這就是數(shù)據(jù)分類系統(tǒng)(1.5)的目的。例如,以下領(lǐng)域 列表可能已經(jīng)描述"鞋類"的景觀話題:"鞋子"、"運(yùn)動(dòng)鞋"、"拖鞋"、"靴子"和"平底人字拖 鞋"。類別集合可以進(jìn)一步描述每個(gè)領(lǐng)域。例如,可以按照"交叉訓(xùn)練鞋"、"網(wǎng)球"、"跑步"和 "競走"對"運(yùn)動(dòng)鞋"進(jìn)行分類。使用這種分類法可以用若干方式有益于分析。首先,更細(xì)粒 度的分類允許更細(xì)微的分析。例如,可以在"運(yùn)動(dòng)鞋"與其他類型的鞋類之間進(jìn)行區(qū)別。類 似地,可以在"交叉訓(xùn)練鞋"與"網(wǎng)球"運(yùn)動(dòng)鞋之間進(jìn)行區(qū)別。相關(guān)地,使用分類法分類可以 引入初始數(shù)據(jù)集內(nèi)僅不存在的數(shù)據(jù)組織的另一層面。此新的層面可以能夠?qū)崿F(xiàn)以另外的方 式不能執(zhí)行的附加分析。
      [0095] 可以半手動(dòng)地或自動(dòng)地對記錄進(jìn)行歸類。如果半手動(dòng)地,則其是通過用分類法針 對每個(gè)葉節(jié)點(diǎn)(即,底層類別)定義一個(gè)或多個(gè)規(guī)則或詞語集的(迭代過程)。規(guī)則或詞語 匹配的方法可以根據(jù)以下內(nèi)容而不同;文本數(shù)據(jù),布爾表達(dá)式-即,評價(jià)是"真"或"假一 系列正則表達(dá)式-即,靈活地與一系列文本變化匹配而不僅僅與單個(gè)文本文字實(shí)例匹配的 詞語(例如,正則表達(dá)式"foot (\s) ? wear"與"foot wear"和"footwear"兩種文字匹 配)??梢酝ㄟ^(如開發(fā)和細(xì)化這些詞語的管理者判斷的或如將對例如覆蓋的詞語的精度、 調(diào)用、唯一性或共同點(diǎn)的匹配強(qiáng)度、或?qū)σ粋€(gè)或多個(gè)用戶進(jìn)行的過去的匹配的匹配強(qiáng)度進(jìn) 行比較的評分算法所判斷的)越來越精確和敏感的搜索項(xiàng)開發(fā)來迭代地開發(fā)分類策略???以完成以上內(nèi)容以便對凈化后的數(shù)據(jù)集進(jìn)行更好地分類。如果自動(dòng)地對記錄進(jìn)行分類,則 可以使用一個(gè)或多個(gè)類屬詞典。這些類屬詞典可以包含基于以下一個(gè)或多個(gè)標(biāo)準(zhǔn)已經(jīng)被包 括到這些類屬詞典內(nèi)的正則表達(dá)式和/或同義詞規(guī)則:例如,通過單個(gè)用戶的偏好或觀點(diǎn) 確定;通過贏得多個(gè)用戶進(jìn)行的輪詢確定;通過當(dāng)與字典、傳統(tǒng)類屬詞典或特定的公知關(guān) 鍵詞語列表比較時(shí)存在或不存在詞語或相關(guān)詞語來確定;行業(yè)標(biāo)準(zhǔn)本體論中的存在;著名 文本中相關(guān)聯(lián)的頻率;通過由相關(guān)性的分析產(chǎn)生的分?jǐn)?shù)確定。
      [0096] 當(dāng)通過例如用戶決定、基準(zhǔn)分?jǐn)?shù)或以另外的方式認(rèn)為分類過程是充分的時(shí),已經(jīng) 將增強(qiáng)后的數(shù)據(jù)集轉(zhuǎn)換成可以支持附加分析的豐富結(jié)構(gòu)化的數(shù)據(jù)集(1.6)。在執(zhí)行豐富分 析之前,必須將豐富結(jié)構(gòu)化的數(shù)據(jù)集(1.6)轉(zhuǎn)換成數(shù)據(jù)庫格式。該數(shù)據(jù)庫可以被配置成用 于存儲包含根據(jù)所使用的數(shù)據(jù)提取方法所提取的數(shù)據(jù)的記錄。例如,可以通過使用特定于 與項(xiàng)目數(shù)據(jù)相關(guān)聯(lián)的主題的分類法按含義對項(xiàng)目數(shù)據(jù)進(jìn)行加標(biāo)簽和分類,并且導(dǎo)入過濾器 可以指定用于數(shù)據(jù)提取的標(biāo)簽。然后可以用包含用于導(dǎo)入過濾器所標(biāo)識的每個(gè)標(biāo)簽的字段 的每條記錄為每個(gè)文檔創(chuàng)建數(shù)據(jù)庫記錄。這種數(shù)據(jù)庫格式可以基于結(jié)構(gòu)化查詢語言(SQL), 例如來自甲骨文(Oracle)和微軟(Microsoft)公司的數(shù)據(jù)庫可以是例如"沒有SQL",如在 如Hadoop、MongoDB和其他數(shù)據(jù)庫中所使用的。無論利用什么數(shù)據(jù)庫格式,所產(chǎn)生的數(shù)據(jù)庫 必須維護(hù)關(guān)系完整性-數(shù)據(jù)庫內(nèi)的數(shù)據(jù)元素之間的關(guān)系必須忠于底層數(shù)據(jù)內(nèi)的關(guān)系。
      [0097] 可以使用數(shù)據(jù)格式化系統(tǒng)(1. 7)通過各種方法產(chǎn)生具有(1. 8)中所描繪的關(guān)系完 整性的數(shù)據(jù)庫。例如,數(shù)據(jù)分類系統(tǒng)(1.5)本身可以具有產(chǎn)生適當(dāng)格式化的XML數(shù)據(jù)的數(shù) 據(jù)導(dǎo)出功能。有時(shí),導(dǎo)出功能將被局限于對于通過數(shù)據(jù)庫查詢語言進(jìn)行的靈巧詢問而言不 充分的逗點(diǎn)隔開或制表符隔開的數(shù)據(jù)(例如,Excel電子表格)。在這些情況下,可以寫入 簡單的ETL (提取、轉(zhuǎn)換、加載)腳本,這些腳本將此數(shù)據(jù)轉(zhuǎn)換成具有關(guān)系完整性(1.8)的適 用于(1.9)中描繪的ΤΜΑ0系統(tǒng)進(jìn)行的分析的數(shù)據(jù)庫。
      [0098] ΤΜΑ0系統(tǒng)為那個(gè)項(xiàng)目確定觀點(diǎn)并使用該觀點(diǎn)使該項(xiàng)目成形,包括例如輸出的文本 和數(shù)字展示。一旦形成具有關(guān)系完整性(1.8)的數(shù)據(jù)庫,就準(zhǔn)備輸出到ΤΜΑ0系統(tǒng)(1.9)內(nèi)。 (1.9)中描繪的用戶的觀點(diǎn)向ΤΜΑ0系統(tǒng)提供詳述用戶角色、分析目標(biāo)和然后將成為ΤΜΑ0系 統(tǒng)執(zhí)行的分析的焦點(diǎn)的可選廣告偏好的指令。以此方式,觀點(diǎn)定義指導(dǎo)在具有關(guān)系完整性 的數(shù)據(jù)庫上操作的ΤΜΑ0系統(tǒng)內(nèi)的規(guī)則集的執(zhí)行以交付(1. 10)中描繪的解決了觀點(diǎn)定義中 闡述的分析目標(biāo)的具有專家分析的格式化報(bào)告。
      [0099] ΤΜΑ0系統(tǒng)通過能夠提供對底層數(shù)據(jù)的訪問的查詢語言以一種忠誠(例如,尊重底 層數(shù)據(jù)庫的關(guān)系完整性和語義)、可再生(例如,對同一數(shù)據(jù)的同一查詢返回同一結(jié)果)且 確定(例如,鑒于輸入,輸出是可預(yù)測的)的方式訪問具有關(guān)系完整性的數(shù)據(jù)庫。
      [0100] 在一個(gè)優(yōu)選實(shí)施例中,ΤΜΑ0系統(tǒng)具有映射到報(bào)告模板集合上的規(guī)則集。當(dāng)執(zhí)行 ΤΜΑ0系統(tǒng)規(guī)則集時(shí),這觸發(fā)了有待產(chǎn)生作為基于網(wǎng)絡(luò)、基于打印、或交互式輸出的有待以用 戶友好的格式產(chǎn)生的敘述性(和可選地有插圖或動(dòng)畫的)報(bào)告(即文本、數(shù)字、符號和/或 圖形元素)的創(chuàng)建和/或組合。通過模板描述觀點(diǎn)定義。觀點(diǎn)模板的元素被映射到ΤΜΑ0 系統(tǒng)內(nèi)的規(guī)則。因此,突出特定規(guī)則集的觀點(diǎn)定義可能在ΤΜΑ0系統(tǒng)內(nèi)適用。然后,可能相 關(guān)的ΤΜΑ0系統(tǒng)規(guī)則集可以被列出用于用戶審批或可以自動(dòng)地(無需進(jìn)一步審批)觸發(fā)產(chǎn) 生敘述性模板的部分所需的分析,這些敘述性模板的部分解決了觀點(diǎn)定義所請求的分析目 標(biāo)。例如,可以創(chuàng)建觀點(diǎn)定義,從而用戶或用戶集可以標(biāo)識"鞋類"競爭景觀中的新興組織。 此定義將觸發(fā)具有規(guī)則集的ΤΜΑ0系統(tǒng)模塊來分析那些最近(其在觀點(diǎn)模板中可以被定義 為"在過去五年中")已經(jīng)加速其在"鞋類"技術(shù)中的取得專利的組織的數(shù)據(jù)庫信息。
      [0101] 規(guī)則的示例如下: 輸入: a. 單個(gè)專利受讓人持有的記錄數(shù)量的同現(xiàn)統(tǒng)計(jì)和與每條記錄相關(guān)聯(lián)的申請年份 b. 單個(gè)專利受讓人持有的記錄數(shù)量的同現(xiàn)統(tǒng)計(jì)和與每條記錄相關(guān)聯(lián)的公開年份 c. 共享受讓人數(shù)據(jù)和技術(shù)類別數(shù)據(jù)的記錄之間的余弦交叉相關(guān)值 任務(wù): d. 相對于已選擇的技術(shù)領(lǐng)先者的焦點(diǎn)領(lǐng)域(受讓人X)標(biāo)識新興參與者(受讓人Y) 觀點(diǎn): e. 需要及早檢測在相似領(lǐng)域中具有顯著最近投資組合的參與者 一項(xiàng)或多項(xiàng)輸出: f. 相對于受讓人x,"受讓人Y有C%的可能性為顯著新興參與者。這是因?yàn)槭茏屓薡 在技術(shù)類別Μ和N上與受讓人X最相似"。 g. "該系統(tǒng)還沒有檢測到相對于受讓人X重要的新興參與者"。 算法: h. 如果受讓人X具有在1995年與2012年之間具有最大數(shù)量的授權(quán)專利, i. 并且如果受讓人Y具有在前20名授權(quán)專利投資組合大小, j. 并且如果受讓人X與Y之間的技術(shù)類別焦點(diǎn)相似度〉A(chǔ)%, k. 并且如果在2008與2012年之間創(chuàng)建受讓人Y的投資組合〉; l. 則受讓人Y為與受讓人X相關(guān)概率為C%的新興參與者。
      [0102] 實(shí)際規(guī)則會(huì)更復(fù)雜,或取決于其他規(guī)則的結(jié)果。還要注意的是,將編纂專家或其他 用戶的知識以幫助量化和表達(dá)經(jīng)常被認(rèn)為是主觀標(biāo)準(zhǔn)的事物,如以上使用的A、B和C參數(shù) 或措辭風(fēng)格。然后,結(jié)果分析可以被包括作為具有專家分析(1.10)的格式化報(bào)告,并且可 以例如包括關(guān)于組織(例如,制鞋商卡駱馳(Crocs)和雪靴(Uggs))的信息。在另一個(gè)示 例中,觀點(diǎn)定義可以指示用戶為需要在選擇新技術(shù)或需要在中國提交專利方面上的幫助的 新產(chǎn)品經(jīng)理人。然后,所產(chǎn)生的分析將包括例如凝膠鞋墊技術(shù)專家的或在中國具有例如專 利訴訟實(shí)踐的法律公司的名稱和聯(lián)系信息。
      [0103] 在一個(gè)優(yōu)選實(shí)施例中,具有專家分析的格式化報(bào)告由靜態(tài)地或動(dòng)態(tài)地使文本和圖 形相互影響以便用帶有圖形元素的文字和數(shù)字表達(dá)的分析結(jié)論一致的直觀報(bào)告或展示組 成,這些圖形元素描繪了正在被分析并且可選地包括對用戶的廣告或建議機(jī)會(huì)的現(xiàn)象。
      [0104] 如所希望的,包括來自創(chuàng)作實(shí)體和社區(qū)的反饋的用戶反饋可以用于在離散或連續(xù) 的基礎(chǔ)上改進(jìn)ΤΜΑ0系統(tǒng)。向自助服務(wù)報(bào)告創(chuàng)建系統(tǒng)(1. 11)提供具有專家分析(1. 10)的 格式化報(bào)告。此系統(tǒng)通過公開ΤΜΑ0系統(tǒng)內(nèi)的一個(gè)或多個(gè)底層機(jī)制(即,模板、規(guī)則、閾值、 參數(shù)、偏好、觀點(diǎn))使一個(gè)或多個(gè)用戶能夠修改具有專家分析(1.10)的格式化報(bào)告。在一 個(gè)實(shí)施例中,這允許在用戶會(huì)話期間修改和執(zhí)行ΤΜΑ0系統(tǒng)的本地、臨時(shí)副本,但其不允許 修改ΤΜΑ0系統(tǒng)本身。在另一個(gè)實(shí)施例中,僅具有可供使用的ΤΜΑ0系統(tǒng)的一個(gè)版本,盡管 該系統(tǒng)具有公開其底層機(jī)制和接受如一個(gè)或多個(gè)用戶輸入的變化的規(guī)則。在本實(shí)施例中, 然后,可以用這些新輸入重新運(yùn)行該ΤΜΑ0系統(tǒng),或者該系統(tǒng)可以用另外的方式保留這些輸 入直到人類仲裁人或后續(xù)規(guī)則批準(zhǔn)這些輸入中的一個(gè)或多個(gè)輸入才運(yùn)行。此功能性允許 一個(gè)或多個(gè)創(chuàng)作實(shí)體進(jìn)一步量身定制反映系統(tǒng)的輸出以及一個(gè)或多個(gè)用戶的專門知識和/ 或分析要求的包含專家和用戶分析(1. 12)的格式化報(bào)告的創(chuàng)建??梢酝ㄟ^對ΤΜΑ0系統(tǒng)的 實(shí)施例的底層機(jī)制進(jìn)行若干種類型的變化來增強(qiáng)格式化報(bào)告。例如,可以修改觀點(diǎn)定義與 ΤΜΑ0系統(tǒng)規(guī)則之間的映射。類似地,可以修改ΤΜΑ0系統(tǒng)規(guī)則到敘述性報(bào)告模板的元素之間 的映射。可以修改或擴(kuò)大模板本身。可以修改規(guī)則本身并且可以引入新規(guī)則。
      [0105] 以此方式,自助服務(wù)報(bào)告創(chuàng)建系統(tǒng)(1. 11)允許用戶將具有專家分析的格式化報(bào) 告轉(zhuǎn)換成進(jìn)一步反映用戶的專門知識和分析要求兩者的具有專家分析(1.12)的格式化報(bào) 告。在某些實(shí)施例中,用戶在自助服務(wù)創(chuàng)建系統(tǒng)內(nèi)執(zhí)行的ΤΜΑ0系統(tǒng)修改的審查跟蹤被捕獲 并且被默默地(例如,對用戶不可見)傳送作為到學(xué)習(xí)系統(tǒng)(1. 13)的輸入。
      [0106] 可以通過學(xué)習(xí)定義實(shí)施基于反饋的模型細(xì)化。學(xué)習(xí)系統(tǒng)(1. 13)的功能將用于通 過將上述變化的子集結(jié)合到主ΤΜΑ0系統(tǒng)的一個(gè)版本內(nèi)來利用在自助服務(wù)創(chuàng)建系統(tǒng)的使用 過程中表達(dá)的新專門知識。這使得ΤΜΑ0系統(tǒng)和其生成的格式化報(bào)告能夠在一段時(shí)間內(nèi)演 進(jìn),從而改進(jìn)深度、寬度、靈活性和表達(dá)性。
      [0107] 學(xué)習(xí)系統(tǒng)被設(shè)計(jì)成用于促進(jìn)ΤΜΑ0系統(tǒng)變化的評審和用于部分地使一個(gè)或多個(gè)用 戶的知識工程自動(dòng)化。在一個(gè)實(shí)施例中,該學(xué)習(xí)系統(tǒng)通過沿著主ΤΜΑ0系統(tǒng)的相關(guān)預(yù)先存在 的組件提供一個(gè)或多個(gè)用戶進(jìn)行的變化集合而能夠?qū)崿F(xiàn)人類仲裁人。然后,人類仲裁人執(zhí) 行評價(jià)并或者接受或者拒絕變化或變化集合,由此提供反饋。在另一個(gè)實(shí)施例中,該ΤΜΑ0 系統(tǒng)可以運(yùn)行后續(xù)規(guī)則(或者自動(dòng)地或者由人類仲裁人啟動(dòng))以或者接受或者拒絕變化或 變化集合。該學(xué)習(xí)系統(tǒng)通過將反饋?zhàn)鳛橐?guī)則庫更新(1. 14)導(dǎo)出回至該ΤΜΑ0系統(tǒng)內(nèi)來將已 接受的變化結(jié)合到主ΤΜΑ0系統(tǒng)內(nèi)。這些更新可以永久地影響ΤΜΑ0系統(tǒng),成為當(dāng)前或?qū)?用戶有待選擇的可選版本,或在其他實(shí)施例中,可以僅影響ΤΜΑ0系統(tǒng)一段有限的時(shí)間。在 某些實(shí)施例中,學(xué)習(xí)系統(tǒng)的輸出可以僅影響如單個(gè)用戶體驗(yàn)的或在其他實(shí)施例中特定集體 用戶體驗(yàn)的ΤΜΑ0系統(tǒng)。
      [0108] 圖6展示了用于ΤΜΑ0系統(tǒng)的配置方法。在定義數(shù)據(jù)準(zhǔn)備系統(tǒng)(2. 16)內(nèi),用戶標(biāo)識 包含他們希望分析的數(shù)據(jù)記錄的一個(gè)或多個(gè)數(shù)據(jù)來源、以及用于從那些來源提取數(shù)據(jù)記錄 的一種或多種方法。在一個(gè)實(shí)施例中,提取整個(gè)數(shù)據(jù)來源(或多個(gè)來源)以用于分析。在 另一個(gè)實(shí)施例中,可能需要數(shù)據(jù)來源的子集而不是整個(gè)數(shù)據(jù)來源)用于分析。在本實(shí)施例 中,用戶必須通過偏好的某種組合來指定該子集,例如,不含糊地標(biāo)識用于提取的記錄子集 的搜索項(xiàng)、過濾器、閾值和參數(shù)。
      [0109] 如在其他地方所描述的,一旦提取了數(shù)據(jù),可以利用字典、詞典、類屬詞典、優(yōu)選詞 語和受控詞匯來凈化和增強(qiáng)數(shù)據(jù)。
      [0110] 在記錄分類系統(tǒng)(2. 17)內(nèi),如果用戶選擇其中在準(zhǔn)備之后對數(shù)據(jù)進(jìn)行分類的實(shí) 施例,則用戶必須指定(發(fā)起、從選項(xiàng)列表中選擇、或修改)他們希望分析的數(shù)據(jù)集的分類 結(jié)構(gòu)、以及用于確定應(yīng)進(jìn)而分配哪個(gè)類別的每個(gè)數(shù)據(jù)記錄兩者??梢允褂靡环N或若干種方 法來執(zhí)行此功能,例如,為用戶提供規(guī)則建議或?qū)σ?guī)則的訪問,如與預(yù)定義分類法規(guī)則集的 恰好匹配、正則表達(dá)式、模糊(例如,大致)匹配、概率性匹配、布爾條件式等。
      [0111] 在定義數(shù)據(jù)庫結(jié)構(gòu)(數(shù)據(jù)模型)系統(tǒng)(2. 18)內(nèi),用戶必須使用數(shù)據(jù)模型、在數(shù)據(jù) 定義語言(如SQL或XML)定義的已接受的句法約束內(nèi)對那個(gè)數(shù)據(jù)模型進(jìn)行編碼、以及然后 用有待分析的數(shù)據(jù)集填充那個(gè)數(shù)據(jù)模型從而使得保存關(guān)系完整性。
      [0112] 在創(chuàng)建觀點(diǎn)問卷系統(tǒng)(2. 19)內(nèi),用戶必須采用對用戶進(jìn)行詢問的選擇性(例如, 多選擇、自由文本輸入、采訪)機(jī)制以便深挖出將在下游被用于指導(dǎo)ΤΜΑ0系統(tǒng)內(nèi)的專家分 析的用戶視角的一個(gè)或多個(gè)元素。用戶觀點(diǎn)可以從復(fù)雜的關(guān)注點(diǎn)集合抽出包括但不限于法 律問題、競爭問題、財(cái)務(wù)問題、營銷問題、物流問題、技術(shù)問題、科學(xué)問題、社會(huì)問題、政治問 題、經(jīng)濟(jì)問題、監(jiān)管和神學(xué)問題。
      [0113] 在某些實(shí)施例中,必須以使ΤΜΑ0系統(tǒng)能夠訪問持久性數(shù)據(jù)存儲內(nèi)的數(shù)據(jù)的方式 在此持久性數(shù)據(jù)上編碼和記錄觀點(diǎn)以便利用該觀點(diǎn)指導(dǎo)專家分析和報(bào)告。
      [0114] 在ΤΜΑ0系統(tǒng)的創(chuàng)建規(guī)則集合與報(bào)告模板(2. 21)內(nèi),用戶必須采用、開發(fā)和/或細(xì) 化規(guī)則集以交付從數(shù)據(jù)庫內(nèi)的數(shù)據(jù)導(dǎo)出的專家分析并通過用戶的觀點(diǎn)內(nèi)編碼的用戶要求 對專家分析進(jìn)行指導(dǎo)。這些規(guī)則可以采取一種或許多種形式。形式可以包括但不限于:在 沒有明顯事實(shí)/導(dǎo)出結(jié)論結(jié)構(gòu)的情況下的如果一則語句、概率性規(guī)則、模糊規(guī)則或程序代 碼??梢杂谜蜴溄?、反向鏈接、神經(jīng)網(wǎng)絡(luò)模式或這些模式的組合或通過其鑒于該數(shù)據(jù)可以 產(chǎn)生可預(yù)測結(jié)果的另一種模式來計(jì)算規(guī)則。規(guī)則可以具有或可以不具有與它們相關(guān)聯(lián)的置 信值。
      [0115] 在某些實(shí)施例中,用戶必須使用使具有規(guī)則集(2. 22)內(nèi)的密切相關(guān)規(guī)則的觀點(diǎn) (2.20)與報(bào)告模板(2.22)內(nèi)的密切相關(guān)元素之間的元素相關(guān)的映射。圖6中通過觀點(diǎn)與 報(bào)告模板(2. 23)之間的映射描繪了以上情況。
      [0116] 在定義報(bào)告公開機(jī)制系統(tǒng)(2.24)內(nèi),用戶必須采用、開發(fā)和/或細(xì)化用于公開輸 出的模板,例如,報(bào)告或展示。此模板中的元素可以被映射到規(guī)則庫內(nèi)的規(guī)則,并且可以包 含將被專家分析實(shí)例化的變量。報(bào)告模板可以包括同類型數(shù)據(jù),如您在幻燈片或PDF文檔 內(nèi)可以看到的文本和圖形,或其可以僅包含單種類型的數(shù)據(jù),如您可以在RSS提要中看到 的文本。
      [0117] 在創(chuàng)建自助服務(wù)報(bào)告創(chuàng)建系統(tǒng)(2.26)內(nèi),用戶必須指定以下內(nèi)容中的零項(xiàng)、或一 項(xiàng)或多項(xiàng):ΤΜΑ0系統(tǒng)規(guī)則和/或所公開的報(bào)告模板內(nèi)的元素的創(chuàng)建、替換、更新或刪除操 作。ΤΜΑ0系統(tǒng)規(guī)則集上的任何創(chuàng)建、替換、更新或刪除操作會(huì)具有下次運(yùn)行ΤΜΑ0系統(tǒng)時(shí)改 變該系統(tǒng)分析的效應(yīng)。類似地,所公開的報(bào)告模板內(nèi)的元素的任何變化會(huì)改變所公開的報(bào) 告的內(nèi)容,即,專家分析輸出。
      [0118] 在另一個(gè)實(shí)施例中,用戶可以選擇創(chuàng)建新的規(guī)則集變體、或新的所公開的報(bào)告模 板變體,在TMAO系統(tǒng)的后續(xù)使用過程中那成為用戶選擇選項(xiàng)。
      [0119] 定義學(xué)習(xí)系統(tǒng)(2. 27)需要訪問(2. 26)所創(chuàng)建的自助服務(wù)報(bào)告和展示并且可以通 過一個(gè)或多個(gè)報(bào)告或展示內(nèi)的一個(gè)或多個(gè)輸出或內(nèi)容元素的分析進(jìn)一步使ΤΜΑ0系統(tǒng)和報(bào) 告模板演進(jìn)。
      [0120] 操作所需的任何和所有軟件、數(shù)據(jù)庫、輔助文檔網(wǎng)絡(luò)訪問和其他組件必須被部署 (2.28)并且當(dāng)ΤΜΑ0系統(tǒng)需要那些元件時(shí)可供用戶使用。例如,在數(shù)據(jù)準(zhǔn)備過程中,規(guī)則集 不必可供使用,但在分析過程中必須可供使用。
      [0121] 圖7展示了用于ΤΜΑ0系統(tǒng)的操作方法。操作方法中的初始步驟為從該或這些用 戶捕獲(3.30)描繪的觀點(diǎn)定義。在某些實(shí)施例中,這可以通過自動(dòng)化過程來完成,而在 其他實(shí)施例中可以通過手動(dòng)過程來完成。例如,寫入到持久性數(shù)據(jù)存儲(例如,寫入到如 Microsoft Access或Oracle的數(shù)據(jù))的智能問卷或形式(執(zhí)行從創(chuàng)作實(shí)體知識獲取的自動(dòng) 化計(jì)算機(jī)程序)可以提供一種用于捕獲觀點(diǎn)定義的全自動(dòng)化方法。在另一個(gè)實(shí)施例中,可 以通過作者的人類采訪、之后進(jìn)行持久性存儲內(nèi)的觀點(diǎn)定義的人類編碼來捕獲觀點(diǎn)定義。 還可以使用利用自動(dòng)化和手動(dòng)過程兩者來從人類或計(jì)算機(jī)創(chuàng)作實(shí)體獲得觀點(diǎn)定義的混合 方法。
      [0122] 觀點(diǎn)定義對ΤΜΑ0系統(tǒng)的進(jìn)一步的下游操作是關(guān)鍵的,因?yàn)槠涓嬷^程中的多個(gè) 步驟,包括通過ΤΜΑ0系統(tǒng)(3.40)提取數(shù)據(jù)(3.32)和運(yùn)行結(jié)構(gòu)化數(shù)據(jù)。
      [0123] 該過程中的下一個(gè)步驟是提取數(shù)據(jù)(3. 32)。這經(jīng)常使用工具(如歐洲專利數(shù)據(jù) 庫)來執(zhí)行,其提供了對大部分半結(jié)構(gòu)化電子數(shù)據(jù)的訪問。該數(shù)據(jù)本身可以是異類的,即, 可以從書目參考、全文專利和申請、期刊中所公開的文獻(xiàn)、以及許多其他數(shù)據(jù)來源提取數(shù) 據(jù)。在下游專家分析過程中,用戶所提供的觀點(diǎn)定義在形成將產(chǎn)生與用戶的分析目標(biāo)密切 相關(guān)的數(shù)據(jù)記錄集的搜索細(xì)化和分析策略中起到重要的作用。這可能需要告知有待搜索的 來源、以及定義或量身定制將滿足搜索條件(正)的數(shù)據(jù)記錄與不滿足搜索條件的數(shù)據(jù)記 錄(負(fù))區(qū)分開中所使用的過濾器、閾值和參數(shù)。
      [0124] 所提取的數(shù)據(jù)(3. 33)提供下一步驟所需的數(shù)據(jù)輸入,下一步驟是通過凈化和增 強(qiáng)數(shù)據(jù)以便在下游專家分析過程中提高信噪比來準(zhǔn)備數(shù)據(jù)(3.34)。沒有此步驟,就會(huì)存在 所提取的數(shù)據(jù)將休閑、不可被ΤΜΑ0系統(tǒng)檢測的風(fēng)險(xiǎn)。為了保存ΤΜΑ0系統(tǒng)的關(guān)鍵功能和焦 點(diǎn)-即,執(zhí)行專家分析-優(yōu)選地提前執(zhí)行數(shù)據(jù)準(zhǔn)備,以便不稀釋焦點(diǎn)和使ΤΜΑ0系統(tǒng)的設(shè)計(jì) 受損,如果混合數(shù)據(jù)凈化和數(shù)據(jù)分析步驟,則會(huì)發(fā)生以上情況。
      [0125] -旦已經(jīng)凈化和增強(qiáng)(3. 35) 了數(shù)據(jù),就可以根據(jù)手動(dòng)、半自動(dòng)化或全自動(dòng)化過程 對數(shù)據(jù)進(jìn)行分類。在某些情況下,優(yōu)選觀點(diǎn)定義的性質(zhì)以及數(shù)據(jù)中已經(jīng)存在的結(jié)構(gòu)(例如, 僅專利數(shù)據(jù)集內(nèi)的IPC代碼)如此以至于不需要附加分類。在這種情況下,僅將已準(zhǔn)備的 數(shù)據(jù)傳遞到(3.37)上。當(dāng)需要離散分類步驟時(shí),執(zhí)行記錄的分類和歸類,并且將所產(chǎn)生的 分類數(shù)據(jù)傳輸?shù)剑?.37)上。
      [0126] 一旦已經(jīng)對數(shù)據(jù)進(jìn)行了分類,(3. 38)就將數(shù)據(jù)(3. 37)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)展示語 言,如XML或關(guān)系數(shù)據(jù)模式。此步驟的目的在于通過以一種使能夠用如XPATH和/或SQL 的語言查詢數(shù)據(jù)的格式來對關(guān)系完整性進(jìn)行編纂來促進(jìn)下游分析。當(dāng)已經(jīng)結(jié)構(gòu)化數(shù)據(jù)時(shí), 如(3. 39)中所體現(xiàn)的,準(zhǔn)備通過ΤΜΑ0系統(tǒng)運(yùn)行該數(shù)據(jù),如(3. 40)所體現(xiàn)的。
      [0127] ΤΜΑ0系統(tǒng)按照(2. 19)中所描繪的觀點(diǎn)定義中所述的分析目標(biāo)和用戶視角所指導(dǎo) 的在(3.39)所體現(xiàn)的結(jié)構(gòu)化數(shù)據(jù)上執(zhí)行分析。TMAO系統(tǒng)為自動(dòng)化計(jì)算機(jī)程序,該計(jì)算機(jī) 程序可以通過模仿人類專家的決定制定能力、通過將推理引擎(使用命題邏輯、模態(tài)邏輯、 時(shí)態(tài)邏輯、或模糊邏輯)與知識庫(包含以自然語言表達(dá)的一個(gè)或多個(gè)規(guī)則)配對來執(zhí)行 此分析。TMA0系統(tǒng)生成結(jié)構(gòu)化但原始分析輸出,經(jīng)常由與圖形配置的敘述性文本組成。這 如(3.41)所體現(xiàn)的那樣被傳輸,以便響應(yīng)于觀點(diǎn)定義而采取原始TMA0系統(tǒng)輸出和開發(fā)所 公開的輸出,如(3. 42)所體現(xiàn)的。
      [0128] 此觀點(diǎn)定義組件(3. 42)的作用為采取(3. 41)中的結(jié)構(gòu)化原始數(shù)據(jù)并將其轉(zhuǎn)換成 通過就優(yōu)選結(jié)構(gòu)和審美而言傳達(dá)分析結(jié)果以及保證數(shù)據(jù)格式符合適當(dāng)?shù)墓_代碼而準(zhǔn)備 向一個(gè)或多個(gè)用戶展示。此外,基于身份、陳述目標(biāo)、感知的需要、或表達(dá)相似觀點(diǎn)的一個(gè)或 多個(gè)用戶的相似需要,廣告、上下文商務(wù)和與將來購買或附屬消息相關(guān)的建議元素可以被 集成到結(jié)果展示或報(bào)告內(nèi)。例如,(3.42)可以從(3.41)采取數(shù)據(jù)并將此數(shù)據(jù)轉(zhuǎn)換成例如 網(wǎng)頁、移動(dòng)網(wǎng)頁、PowerPoint幻燈片、PDF文檔或RSS提要。除了創(chuàng)建審美、直覺展示,這些 展示格式中的每個(gè)格式具有需要被滿足的具體句法以便符合可以對這些格式進(jìn)行渲染的 應(yīng)用-如微軟辦公軟件(Microsoft Office)或網(wǎng)絡(luò)瀏覽器。(3.42)的作用是產(chǎn)生直觀的和 符合要求的數(shù)據(jù),如以上所述和(3.43)中的數(shù)據(jù)提要所體現(xiàn)的。
      [0129] 工作流程中的下一個(gè)步驟接受數(shù)據(jù)提要(3. 43)和為用戶提供執(zhí)行自助服務(wù)輸出 生成的能力(3. 44),在某些實(shí)施例中,通過允許用戶修改和運(yùn)行其自己的ΤΜΑ0系統(tǒng)本地副 本而能夠?qū)崿F(xiàn)。此組件(3. 44)輸出就像數(shù)據(jù)提要(3. 43) -樣的數(shù)據(jù)提要(3. 45),除了內(nèi)容 由用戶創(chuàng)建或在(3.44)對其做出貢獻(xiàn)的修改后的ΤΜΑ0系統(tǒng)生成。此外,數(shù)據(jù)提要(3.45) 可以包含隱藏或靜默數(shù)據(jù)(即,不完全可見、但可能對用戶部分可見的數(shù)據(jù)),該數(shù)據(jù)包含 用戶在(3.44)組件中對ΤΜΑ0系統(tǒng)做出或貢獻(xiàn)的變化集合。
      [0130] 可以將此數(shù)據(jù)饋送到對此隱藏或靜默數(shù)據(jù)進(jìn)行標(biāo)識的組件內(nèi)。此組件的目的在于 通過捕獲在自助服務(wù)輸出步驟(3.44)中一個(gè)或多個(gè)用戶做出的變化而使用戶反饋能夠增 強(qiáng)ΤΜΑ0系統(tǒng)(3.46)內(nèi)的專門知識。然后通過(3.47)將對用戶做出的變化進(jìn)行描述的此 隱藏?cái)?shù)據(jù)傳輸至(3.48)體現(xiàn)的對那些變化進(jìn)行評審和評價(jià)的組件。
      [0131] 此組件(3.48)可以是自動(dòng)化的、手動(dòng)和自動(dòng)化過程的組合、或完全是手動(dòng)的。一 個(gè)或多個(gè)仲裁人可以評審一個(gè)或多個(gè)用戶做出的變化和決定應(yīng)將哪些變化結(jié)合到主ΤΜΑ0 系統(tǒng)內(nèi)。將這些變化如(3.49)所體現(xiàn)的那樣傳送至(3.50)所體現(xiàn)的最后的系統(tǒng)組件內(nèi), 該系統(tǒng)組件將修正人批準(zhǔn)的那些變化結(jié)合到主ΤΜΑ0系統(tǒng)內(nèi)。
      [0132] 圖8為一個(gè)邏輯流程圖,展不了利用ΤΜΑ0系統(tǒng)的商業(yè)模型70。作為第一層級商 務(wù)實(shí)現(xiàn)方式,ΤΜΑ0系統(tǒng)的運(yùn)營商可以為創(chuàng)作實(shí)體提供對使用基于銷售、許可證、每次使用付 費(fèi)、或受任何其他合適補(bǔ)償形式影響的商務(wù)模式的系統(tǒng)的訪問。授權(quán)實(shí)體通常接收程序或 密碼的實(shí)例來訪問實(shí)現(xiàn)ΤΜΑ0系統(tǒng)的應(yīng)用服務(wù)。在步驟72,參照圖9對其進(jìn)行了進(jìn)一步描 述,對ΤΜΑ0系統(tǒng)進(jìn)行配置。步驟72之后為步驟74,參照圖10對其進(jìn)行了進(jìn)一步描述,在該 步驟中配置ΤΜΑ0系統(tǒng)。步驟74之后為步驟76,參照圖11對其進(jìn)行了進(jìn)一步描述,在該步 驟中運(yùn)行ΤΜΑ0系統(tǒng)。步驟76之后為步驟78,參照圖12對其進(jìn)行了更加詳細(xì)的描述,在該 步驟中向創(chuàng)作實(shí)體顯示ΤΜΑ0系統(tǒng)。這包括顯示ΤΜΑ0輸出(圖3中示出了其示例),并且 還可以包括在項(xiàng)目運(yùn)行過程中觸發(fā)的規(guī)則列表。如果所希望的話(例如,如創(chuàng)作實(shí)體所選 擇的那樣),將所觸發(fā)的規(guī)則從編譯格式轉(zhuǎn)化成(偽)自然語言格式(或從包含該描述的 元數(shù)據(jù)檢索)并將其向創(chuàng)作實(shí)體顯示用于評審和反饋,該評審和反饋可以包括新規(guī)則的創(chuàng) 建、用新規(guī)則定義替換現(xiàn)有規(guī)則、規(guī)則更新、以及刪除。
      [0133] 步驟78之后可以為步驟89,在該步驟中,創(chuàng)作實(shí)體向ΤΜΑ0系統(tǒng)提供反饋,該反饋 可以包括規(guī)則修改以及項(xiàng)目數(shù)據(jù)定義、觀點(diǎn)、所希望的輸出、或ΤΜΑ0系統(tǒng)的任何其他特征 的變化。然后,該過程從反饋步驟89循環(huán)到步驟74,其中創(chuàng)建實(shí)體指定的變化被結(jié)合到 ΤΜΑ0系統(tǒng)內(nèi)。然后,步驟74之后為步驟76和78,以便進(jìn)行另一次迭代。創(chuàng)作實(shí)體可以循 環(huán)通過如所希望的那么多的細(xì)化迭代以便開發(fā)該系統(tǒng)并對沿此方式產(chǎn)生的輸出進(jìn)行評審。
      [0134] 在創(chuàng)作實(shí)體判斷時(shí),步驟78之后可以為步驟80,在該步驟中,可以選擇、可選地格 式化和通常通過網(wǎng)絡(luò)連接(見圖1)與一個(gè)或多個(gè)用戶的社區(qū)共享來自ΤΜΑ0系統(tǒng)的項(xiàng)目信 息。例如,可以與社區(qū)共享觸發(fā)的規(guī)則和選擇的輸出用于反饋以便幫助開發(fā)規(guī)則集。還可 以與社區(qū)共享所有項(xiàng)目數(shù)據(jù)或其一部分(或項(xiàng)目數(shù)據(jù)的列表)和/或ΤΜΑ0輸出用于反饋 以幫助開發(fā)該系統(tǒng)的這些方面。
      [0135] 步驟80之后可以為步驟82,參照圖13對其進(jìn)行了更加詳細(xì)的描述,在該步驟中, 社區(qū)的成員通過例如私人或即時(shí)消息、所貼出的消息、小組討論、主持論壇、投票、調(diào)查、輪 詢等等提供反饋。步驟82之后為步驟89,在該步驟中,社區(qū)反饋用于修改ΤΜΑ0系統(tǒng),通常 在評審之后和創(chuàng)作實(shí)體或系統(tǒng)運(yùn)營商的判斷時(shí)。在某些實(shí)施例中,評審步驟可以是自動(dòng)化 的,在其他實(shí)施例中,為半自動(dòng)化的,并且在又其他實(shí)施例中,利用完全手動(dòng)評審。然后,該 過程從反饋步驟89循環(huán)到步驟74,其中創(chuàng)建實(shí)體指定的變化被結(jié)合到ΤΜΑ0系統(tǒng)內(nèi)。作為 一個(gè)第二層級商務(wù),步驟82之后還可以是步驟84,創(chuàng)作實(shí)體或ΤΜΑ0系統(tǒng)的運(yùn)營商為提供反 饋(或提供某些類型的反饋,或提供被認(rèn)為是有用的反饋)的那些社區(qū)成員提供:可以接收 某種類型的激勵(lì),如所公開的認(rèn)可(例如,評審員信譽(yù)評級,其可以包括評審員評審功能)、 積分(例如,用于購買通過ΤΜΑ0系統(tǒng)可獲得的公開的點(diǎn))、金錢支付、或其他任何合適類型 的激勵(lì)。可以保證該激勵(lì)反映評審員的狀態(tài)(例如,信譽(yù)評級)、所提供的反饋的類型、所提 供的反饋的有用性、或其他因素。應(yīng)注意到,作為社區(qū)反饋過程的一部分,社區(qū)成員可以被 公開在ΤΜΑ0輸出中嵌入的廣告信息下、點(diǎn)進(jìn)附屬網(wǎng)站、查看宣傳材料、購買產(chǎn)品或服務(wù)等 等。
      [0136] 作為第三層級商務(wù),步驟78和82之后是步驟88,在該步驟中,ΤΜΑ0系統(tǒng)跟蹤相 關(guān)聯(lián)的補(bǔ)償模型的廣告生產(chǎn)力。具體地,ΤΜΑ0系統(tǒng)可以監(jiān)測廣告公開、附屬網(wǎng)站的點(diǎn)進(jìn)、宣 傳材料的查看、產(chǎn)品或服務(wù)的購買等等。然后,創(chuàng)作實(shí)體和ΤΜΑ0系統(tǒng)運(yùn)營商可以從接收廣 告益處的附屬機(jī)構(gòu)接收補(bǔ)償。再次,該補(bǔ)償可以包括認(rèn)可、積分(如基于點(diǎn)的獎(jiǎng)勵(lì)系統(tǒng)中的 點(diǎn))、金錢支付或所涉及各方同意的任何其他合適的激勵(lì)。步驟88之后是步驟89,在該步 驟中,可以基于所接收到的補(bǔ)償或其他因素修改ΤΜΑ0系統(tǒng)的廣告模型特征。例如,那些提 供補(bǔ)償?shù)母綄贆C(jī)構(gòu)可以在ΤΜΑ0系統(tǒng)中的突顯性或優(yōu)先權(quán)上增量以反映廣告的成功。還可 以監(jiān)測顧客對附屬材料、產(chǎn)品和服務(wù)的滿意度并將其用于細(xì)化ΤΜΑ0系統(tǒng)的廣告模型特征。
      [0137] 圖9為一個(gè)邏輯流程圖,進(jìn)一步解釋了用于對ΤΜΑ0系統(tǒng)進(jìn)行配置的步驟72。通 常,系統(tǒng)配置由ΤΜΑ0系統(tǒng)的運(yùn)營商(業(yè)主)來執(zhí)行并且涉及到獲取和設(shè)置硬件、軟件、網(wǎng)絡(luò) 連接、以及實(shí)現(xiàn)ΤΜΑ0系統(tǒng)所需的關(guān)系。在步驟90,系統(tǒng)運(yùn)營商安裝計(jì)算機(jī)和網(wǎng)絡(luò)連接,這些 計(jì)算機(jī)和網(wǎng)絡(luò)連接通常包括至少一個(gè)客戶端系統(tǒng)、一個(gè)服務(wù)器系統(tǒng)、以及一個(gè)互聯(lián)網(wǎng)連接 (見圖1)。步驟90之后為步驟92,在該步驟中,系統(tǒng)運(yùn)營商創(chuàng)建并在用戶客戶端系統(tǒng)上部 署用戶界面。步驟92之后為步驟94,在該步驟中,系統(tǒng)運(yùn)營商能夠?qū)崿F(xiàn)多媒體輸出發(fā)生器, 如網(wǎng)絡(luò)門戶和視頻查看器(見圖3)。步驟94之后為步驟96,在該步驟中,系統(tǒng)運(yùn)營商安裝 TMAO系統(tǒng)使用的數(shù)據(jù)庫、規(guī)則集和其他本機(jī)應(yīng)用(例如,文字處理器、電子表格、網(wǎng)絡(luò)鏈接、 HTML瀏覽器、XML創(chuàng)作和/或編輯、制圖、繪圖等)。步驟96之后為步驟98,在該步驟中,系 統(tǒng)運(yùn)營商建立創(chuàng)作實(shí)體關(guān)系,該創(chuàng)作實(shí)體關(guān)系通常包括一個(gè)第一層級商務(wù)。步驟98之后為 步驟100,在該步驟中,系統(tǒng)運(yùn)營商建立附屬關(guān)系,該附屬關(guān)系可以包括一個(gè)第二層級商務(wù)。 步驟100之后為步驟102,在該步驟中,系統(tǒng)運(yùn)營商建立社區(qū)關(guān)系,該社區(qū)關(guān)系可以包括創(chuàng) 建或加入社交或商業(yè)對商業(yè)在線社區(qū)。步驟102之后為步驟104,在該步驟中,系統(tǒng)運(yùn)營商 例如使用點(diǎn)、積分、物理或虛擬貨幣建立一個(gè)或多個(gè)可以包括一個(gè)第三層級商務(wù)的社區(qū)激 勵(lì)程序。
      [0138] 一旦已經(jīng)配置ΤΜΑ0系統(tǒng),其就準(zhǔn)備如圖10中所示的配置。配置通常由ΤΜΑ0系 統(tǒng)的運(yùn)營商執(zhí)行并且涉及用系統(tǒng)特定的數(shù)據(jù)和特征進(jìn)行系統(tǒng)的初始數(shù)據(jù)加載、編程和初始 化。在步驟120,系統(tǒng)運(yùn)營商創(chuàng)建ΤΜΑ0系統(tǒng)所使用的自然語言或其他數(shù)據(jù)構(gòu)造以生成自然 語言組合文本和數(shù)據(jù)構(gòu)造。這通常包括以下系統(tǒng):通用文本組合、通用數(shù)據(jù)組合、通用數(shù)字 顯示格式、通用統(tǒng)計(jì)分析格式、故事結(jié)構(gòu)(預(yù)定義的和/或基于規(guī)則的)、數(shù)據(jù)庫格式、初始 規(guī)則集(包括語法、分類、導(dǎo)入過濾器規(guī)則、用于分析的規(guī)則等等)。步驟120之后為步驟 122,在該步驟中,系統(tǒng)運(yùn)營商創(chuàng)建輸入請求形式,這些輸入請求形式優(yōu)選地包括智能輸入 請求形式,如模板、結(jié)構(gòu)化和半結(jié)構(gòu)化輸入形式、智能問卷系統(tǒng)、以及用于提示來自創(chuàng)作實(shí) 體的詳細(xì)項(xiàng)目定義信息。
      [0139] 步驟122之后為步驟124,在該步驟中,系統(tǒng)運(yùn)營商將廣告嵌入ΤΜΑ0系統(tǒng)內(nèi),該廣 告通常包括有待嵌入到ΤΜΑ0輸出內(nèi)的廣告文本(在一個(gè)實(shí)施例中)、或在項(xiàng)目創(chuàng)建或探索 過程中有待顯示或公開在創(chuàng)作實(shí)體下的廣告文本(在另一個(gè)實(shí)施例中),如提出參照和推 薦的組合文本構(gòu)造、廣告圖像,如附屬徽標(biāo)、附屬鏈接等等。步驟124之后為步驟126,在該 步驟中,系統(tǒng)運(yùn)營商為在初始【技術(shù)領(lǐng)域】內(nèi)具有所期望的查看點(diǎn)的預(yù)期項(xiàng)目創(chuàng)建初始模板系 統(tǒng)。這涉及到用于每個(gè)預(yù)期項(xiàng)目的初始模板系統(tǒng),例如,每個(gè)模板集合可以包括專門量身定 制的觀點(diǎn)、項(xiàng)目描述、項(xiàng)目數(shù)據(jù)、規(guī)則、導(dǎo)入過濾器、以及輸出格式模板。步驟126之后為步 驟128,在該步驟中,系統(tǒng)運(yùn)營商初始化將由ΤΜΑ0系統(tǒng)使用的本地應(yīng)用,這可以涉及到創(chuàng)建 和將默認(rèn)數(shù)據(jù)加載到數(shù)據(jù)庫表格、導(dǎo)入過濾器、規(guī)則集、門戶查看器、以及其他輸出生成器 內(nèi)。
      [0140] 圖11為一個(gè)邏輯流程圖,進(jìn)一步解釋了用于運(yùn)行ΤΜΑ0系統(tǒng)的步驟76。步驟76通 常由ΤΜΑ0系統(tǒng)以來自創(chuàng)作實(shí)體的交互的方式實(shí)施。在步驟130中,ΤΜΑ0系統(tǒng)通過客戶端系 統(tǒng)使用公開的模板從創(chuàng)作實(shí)體接收項(xiàng)目定義信息。步驟130之后為步驟132,在該步驟中, ΤΜΑ0系統(tǒng)部署智能輸入請求形式,這通常涉及到步驟130與132之間的回路所反映的與創(chuàng) 作實(shí)體的迭代交互。一旦已經(jīng)完成了輸入請求過程(其通常由用戶輸入(例如,繼續(xù))指 示),步驟132之后為步驟134,在該步驟中,ΤΜΑ0系統(tǒng)確定項(xiàng)目的觀點(diǎn)。這一般涉及到基 于從創(chuàng)作實(shí)體接收到的輸入在預(yù)定義的觀點(diǎn)類型之間做出智能決定,該輸入一般包括創(chuàng)作 實(shí)體的類型、項(xiàng)目描述、當(dāng)前迭代之前的項(xiàng)目的狀態(tài)、分析的目的、戰(zhàn)略關(guān)注點(diǎn)、已知的導(dǎo)入 過濾器、已知的規(guī)則、所希望的輸出、以及所希望的社區(qū)涉及層級。一旦已經(jīng)為項(xiàng)目建立了 觀點(diǎn),那個(gè)決定就驅(qū)動(dòng)選擇故事結(jié)構(gòu)、分類法、導(dǎo)入過濾器、故事結(jié)構(gòu)、通用文本格式、文本 修飾語、數(shù)字?jǐn)?shù)據(jù)格式、輸出格式、以及系統(tǒng)的與觀點(diǎn)相關(guān)聯(lián)的任何其他特征。
      [0141] 基于所建立的觀點(diǎn),步驟134之后為步驟136,在該步驟中,ΤΜΑ0系統(tǒng)解析、提取、 準(zhǔn)備、組織和處理項(xiàng)目數(shù)據(jù)。這通常涉及到用于解析、提取、組織、格式化提取的項(xiàng)目數(shù)據(jù)和 將其加載到ΤΜΑ0系統(tǒng)內(nèi)的一種或多種觀點(diǎn)特定的分類法和導(dǎo)入過濾器的使用以及用于將 數(shù)據(jù)處理成創(chuàng)建觀點(diǎn)特定的文本和數(shù)字?jǐn)?shù)據(jù)挖掘插入項(xiàng)的規(guī)則集的使用。步驟136之后為 步驟138,在該步驟中,ΤΜΑ0系統(tǒng)將所提取的數(shù)據(jù)格式化成輸出生成器所需的數(shù)據(jù)格式并 根據(jù)ΤΜΑ0系統(tǒng)為項(xiàng)目選擇的觀點(diǎn)特定的故事結(jié)構(gòu)將正確格式化的提取的數(shù)據(jù)傳遞至輸出 生成器。步驟138之后為步驟140,在該步驟中,ΤΜΑ0系統(tǒng)生成輸出,這些輸出可以包括觀 點(diǎn)特定的組合的文本組合、數(shù)字?jǐn)?shù)據(jù)展示、門戶、可視化內(nèi)容、運(yùn)動(dòng)圖形、音頻組合、以及根 據(jù)ΤΜΑ0系統(tǒng)為項(xiàng)目選擇的故事結(jié)構(gòu)呈現(xiàn)的其他元素(見圖3的簡單示例)。
      [0142] 圖12為一個(gè)邏輯流程圖,進(jìn)一步解釋了用于獲得文本挖掘、分析和輸出系統(tǒng)中的 用戶反饋的步驟78。在步驟152中,ΤΜΑ0系統(tǒng)為授權(quán)實(shí)體提供格式化輸出。應(yīng)注意到,雖然 圖3中所示的示例輸出為多媒體報(bào)告,但可以提供其他類型的輸出,如數(shù)據(jù)提要、打印的報(bào) 告、音頻呈現(xiàn)、音樂、醫(yī)學(xué)數(shù)據(jù)(例如,螺旋CT掃描數(shù)據(jù))、點(diǎn)云數(shù)據(jù)(例如,激光雷達(dá))以及 用戶將其集成到系統(tǒng)內(nèi)的任何其他類型的輸出。規(guī)則的操作經(jīng)常是項(xiàng)目擔(dān)保檢查和(在許 多情況下)迭代反饋和修改的關(guān)鍵方面。步驟152之后為步驟154,在該步驟中,ΤΜΑ0系統(tǒng) 將項(xiàng)目觸發(fā)的規(guī)則轉(zhuǎn)化成(偽)自然語言格式(或從元數(shù)據(jù)檢索描述)并以界面格式(通 常為規(guī)則模板)公開用于該規(guī)則的(偽)自然語言和算法。圖15中示出了示例規(guī)則模板。 步驟154之后為步驟156,在該步驟中,ΤΜΑ0系統(tǒng)接收對規(guī)則的反饋并對規(guī)則集進(jìn)行修改。 圖13展示了用于社區(qū)反饋的相似過程。不同點(diǎn)僅在于從創(chuàng)作實(shí)體接收到的反饋通常在每 個(gè)實(shí)例中實(shí)現(xiàn),而創(chuàng)作實(shí)體的將所選擇的項(xiàng)目部分交給社區(qū)的決定一般在社區(qū)反饋之前, 并且至少創(chuàng)作實(shí)體進(jìn)行的查看、潛在變更以及批準(zhǔn)決定同樣在社區(qū)反饋到模型修改內(nèi)的任 何結(jié)合之前。
      [0143] 圖14為用于觀點(diǎn)信息的初始圖形用戶界面模板160的簡單示例。模板160為帶 有多個(gè)預(yù)定義輸入請求162a的結(jié)構(gòu)化或半結(jié)構(gòu)化格式(或混合格式),這些請求具有相應(yīng) 的輸入字段164a。為此簡化示例示出的具體預(yù)定義輸入請求包括"創(chuàng)作實(shí)體的角色";"主 題";"關(guān)鍵問題";"驅(qū)動(dòng)器"和"所希望的輸出"。對于結(jié)構(gòu)化形式而言,輸入字段具有一個(gè) 下拉菜單,可以從該下拉菜單選擇預(yù)定義的條目,并且半結(jié)構(gòu)化形式而言,輸入字段接受用 戶鍵入的自然語言文本。典型地,像這樣的初始面板開始觀點(diǎn)定義,之后基于通過模板160 接收到的輸入從多個(gè)預(yù)定義智能問卷之間選擇智能問卷。
      [0144] 圖15為用于規(guī)則信息的圖形用戶界面模板170。當(dāng)選擇和提供對規(guī)則的反饋時(shí), 某些信息項(xiàng)對實(shí)體而言是有用的。與觀點(diǎn)用戶模板160 -樣,用戶界面模板170為帶有多 個(gè)預(yù)定義輸入請求162b的結(jié)構(gòu)化或半結(jié)構(gòu)化格式(或混合格式),這些請求具有相應(yīng)的輸 入字段164b。在此面板中,輸入請求包括規(guī)則名稱、標(biāo)識符(其可以被系統(tǒng)用于觸發(fā)規(guī)則)、 規(guī)則的目的(規(guī)則的簡要描述);規(guī)則的作者(其可以是基于作者的信譽(yù)的有啟發(fā)性的)、 規(guī)則的歷史(其可以是基于對規(guī)則的版本化、之前的使用和經(jīng)驗(yàn)的有啟發(fā)性的);評級(通 常由使用該規(guī)則的相關(guān)社區(qū)分配);運(yùn)行規(guī)則所需的數(shù)據(jù)輸入、規(guī)則產(chǎn)生的數(shù)據(jù)輸出、規(guī)則 的自然語言描述、以及規(guī)則實(shí)施的可編輯來源代碼算法。此數(shù)據(jù)中的某些或全部優(yōu)選地被 結(jié)合到以編譯的規(guī)則實(shí)例存儲的元數(shù)據(jù)內(nèi),并且例行地被更新,從而使得每當(dāng)規(guī)則是所選 擇的考慮因素時(shí),可以將其加載到規(guī)則模板內(nèi)。規(guī)則模板還提供了一種用于當(dāng)創(chuàng)建新規(guī)則 時(shí)收集所希望的元數(shù)據(jù)、以及基于經(jīng)驗(yàn)和反饋對規(guī)則進(jìn)行更新的機(jī)制。
      [0145] 本發(fā)明可以由對目前現(xiàn)有系統(tǒng)進(jìn)行適配或重新配置組成(但不要求由其組成)。 可替代地,可以提供體現(xiàn)本發(fā)明的原始設(shè)備。
      [0146] 在此描述的所有方法可以包括將方法實(shí)施例的一個(gè)或多個(gè)步驟的結(jié)果存儲在存 儲介質(zhì)內(nèi)。這些結(jié)果可以包括在此描述的結(jié)果中的任何結(jié)果并且可以用本領(lǐng)域內(nèi)已知的任 何方式存儲。該存儲介質(zhì)可以包括在此描述的任何存儲介質(zhì)或本領(lǐng)域內(nèi)已知的任何其他合 適的存儲介質(zhì)。已經(jīng)存儲結(jié)果之后,這些結(jié)果可以在存儲介質(zhì)內(nèi)被訪問并且被在此描述的 任何方法或系統(tǒng)實(shí)施例使用、被格式化用于向用戶顯示、被另一個(gè)軟件模塊、方法、或系統(tǒng) 等使用。進(jìn)一步地,可以"永久地"、"半永久地"、"臨時(shí)地"或持續(xù)某一段時(shí)期存儲這些結(jié)果。 例如,該存儲介質(zhì)可以是隨機(jī)訪問存儲器(RAM),并且這些結(jié)果可以不一定無限期地存留在 該存儲介質(zhì)內(nèi)。
      [0147] 進(jìn)一步想到的是,上述方法的實(shí)施例中的每個(gè)實(shí)施例可以包括在此描述的任何其 他一種或多種方法中的任何其他一個(gè)或多個(gè)步驟。此外,上述方法的實(shí)施例中的每個(gè)實(shí)施 例可以由在此描述的系統(tǒng)中的任何系統(tǒng)執(zhí)行。
      [0148] 本領(lǐng)域的技術(shù)人員將認(rèn)識到,存在各種載體,在此描述的過程和/或系統(tǒng)和/或其 他技術(shù)可以由這些載體實(shí)現(xiàn)(例如,硬件、軟件、和/或固件),并且將認(rèn)識到,優(yōu)選載體將根 據(jù)這些過程和/或系統(tǒng)和/或其他技術(shù)部署在其中的上下文而不同。例如,如果實(shí)施者確定 速度和精度是最重要的,則實(shí)施者可以選擇主硬件和/或固件載體;可替代地,如果靈活性 是最重要的,則實(shí)施者可以選擇主軟件實(shí)現(xiàn)方式;或者又在此可替代地,實(shí)施者可以選擇硬 件、軟件、和/或固件的某種組合。因此,存在若干種可能的載體,在此描述的過程和/或系 統(tǒng)和/或其他技術(shù)可以由這些載體實(shí)現(xiàn),這些載體中的沒有哪一個(gè)比另一個(gè)更優(yōu),因?yàn)橛?待利用的任何載體是取決于載體將被部署在其中的上下文和實(shí)施者的特定關(guān)注點(diǎn)(例如, 速度、靈活性、或可預(yù)測性)的選擇,這些關(guān)注點(diǎn)中的任何關(guān)注點(diǎn)可以不同。本領(lǐng)域的技術(shù) 人員將認(rèn)識到,實(shí)現(xiàn)方式的光學(xué)方面將通常使用光學(xué)導(dǎo)向的硬件、軟件、和或固件。
      [0149] 本領(lǐng)域的技術(shù)人員將認(rèn)識到,以在此闡述的方式描述裝置和/或過程、并且之后 使用工程實(shí)踐將這種描述的裝置和/或過程集成到數(shù)據(jù)處理系統(tǒng)內(nèi)是本領(lǐng)域內(nèi)常見的。 艮P,在此描述的裝置和/或過程的至少一部分可以通過合理量的實(shí)驗(yàn)而被集成到數(shù)據(jù)處理 系統(tǒng)內(nèi)。本領(lǐng)域的技術(shù)人員將認(rèn)識到,典型的數(shù)據(jù)處理系統(tǒng)通常包括系統(tǒng)單元外殼、視頻顯 示裝置、存儲器(如易失性或非易失性存儲器)、處理器(如微處理器和數(shù)字信號處理器) 計(jì)算實(shí)體(如操作系統(tǒng))、驅(qū)動(dòng)器、圖形用戶界面、以及應(yīng)用程序中的一項(xiàng)或多項(xiàng)、一個(gè)或多 個(gè)交互式裝置(如觸摸板或觸摸屏)、和/或包括反饋回路和控制電機(jī)的控制系統(tǒng)(例如, 用于感測位置和/或速度的反饋;用于移動(dòng)和/或調(diào)整組件和/或數(shù)量的控制電機(jī))。可 以利用任何合適的可商購的組件(如那些通常在數(shù)據(jù)計(jì)算/通信和/或網(wǎng)絡(luò)計(jì)算/通信系 統(tǒng)中找到的組件)實(shí)現(xiàn)典型的數(shù)據(jù)處理系統(tǒng)。
      [0150] 在此描述的主題有時(shí)展示了不同的其他組件內(nèi)所包含的、或與其連接的不同組 件。應(yīng)理解到,這種所描繪的架構(gòu)僅是示例性的,并且實(shí)際上,可以實(shí)現(xiàn)達(dá)到相同功能性的 許多其他架構(gòu)。在概念意義上,用于執(zhí)行相同功能性的組件的任何安排是有效地"相關(guān)聯(lián) 的",從而使得實(shí)現(xiàn)所希望的功能性。因此,在此被組合用于實(shí)現(xiàn)具體功能性的任何兩個(gè)組 件可以被看到彼此"相關(guān)聯(lián)",從而使得實(shí)現(xiàn)所希望的功能性,而不論架構(gòu)或中間組件如何。 同樣,如此相關(guān)聯(lián)的任何兩個(gè)組件還可以被看到是彼此"連接"、或"偶聯(lián)"的以實(shí)現(xiàn)所希望 的功能性,并且能夠如此相關(guān)聯(lián)的任何兩個(gè)組件還可以被看到是彼此"可偶聯(lián)的"以實(shí)現(xiàn)所 希望的功能性??膳悸?lián)的特定示例包括但不限于物理可配合的和/或物理交互組件和/或 無線可交互的和/或無線交互組件和/或邏輯交互的和/或邏輯可交互的組件。
      [0151] 雖然已經(jīng)示出和描述了在此描述的本主題的具體方面,但對于本領(lǐng)域的技術(shù)人員 而言明顯的是,基于在此的教導(dǎo),在不脫離在此描述的主題及其更廣泛方面的情況下可以 進(jìn)行多種變化和修改,并且因此,所附權(quán)利要求書將要將如在在此描述的主題的真正精神 和范圍內(nèi)的所有這種變化和修改包含在其范圍內(nèi)。
      [0152] 此外,應(yīng)理解到,本發(fā)明由所附權(quán)利要求書定義。
      [0153] 盡管已經(jīng)展示了本發(fā)明的具體實(shí)施例,但明顯的是,在不脫離上述披露的范圍和 精神的情況下,本領(lǐng)域的技術(shù)人員可以做出本發(fā)明的各種修改和實(shí)施例。相應(yīng)地,本發(fā)明的 范圍應(yīng)僅受到其所附權(quán)利要求書的限制。
      [0154] 應(yīng)相信,將通過上述描述理解本披露以及其伴隨的優(yōu)點(diǎn)中的許多優(yōu)點(diǎn),并且將明 顯的是,在不脫離所披露的主題或不犧牲所有其材料優(yōu)點(diǎn)的情況下,可以用組件的形式、構(gòu) 造和安排做出各種變化。所述形式僅是解釋性的,并且其為以下權(quán)利要求書包含和包括這 種變化的意圖。
      【權(quán)利要求】
      1. 一種文本挖掘、分析和輸出(TMAO)系統(tǒng),包括: 一個(gè)用戶界面,被配置成用于從一個(gè)創(chuàng)作實(shí)體請求輸入,該創(chuàng)作實(shí)體對包括項(xiàng)目數(shù)據(jù) 的標(biāo)識的一個(gè)項(xiàng)目進(jìn)行定義; 一個(gè)數(shù)據(jù)處理器,被配置成用于基于通過該用戶界面從該創(chuàng)作實(shí)體接收到的該輸入為 該項(xiàng)目創(chuàng)建或選擇一個(gè)觀點(diǎn); 該數(shù)據(jù)處理器進(jìn)一步包括一個(gè)規(guī)則集合,該規(guī)則集合被配置成用于基于為該項(xiàng)目創(chuàng)建 或選擇的該觀點(diǎn)從該項(xiàng)目數(shù)據(jù)提取文本和數(shù)字?jǐn)?shù)據(jù)項(xiàng); 該數(shù)據(jù)處理器被進(jìn)一步配置成用于通過結(jié)合基于所提取的文本項(xiàng)中的一個(gè)或多個(gè)的 一個(gè)數(shù)據(jù)挖掘文本插入項(xiàng)基于為該項(xiàng)目創(chuàng)建或選擇的該觀點(diǎn)創(chuàng)建一個(gè)組合的文本組合; 該數(shù)據(jù)處理器被進(jìn)一步配置成用于基于為該項(xiàng)目創(chuàng)建或選擇的該觀點(diǎn)創(chuàng)建或選擇一 個(gè)故事結(jié)構(gòu),該故事結(jié)構(gòu)為該組合的文本組合提供一個(gè)上下文;以及 一個(gè)第一個(gè)輸出生成器,被配置成用于顯示該故事結(jié)構(gòu)的該上下文內(nèi)的該組合的文本 組合。
      2. 如權(quán)利要求1所述的TMA0系統(tǒng),其中: 該數(shù)據(jù)處理器被進(jìn)一步配置成用于通過結(jié)合基于所提取的數(shù)字?jǐn)?shù)據(jù)項(xiàng)中的一個(gè)或多 個(gè)的一個(gè)數(shù)據(jù)挖掘數(shù)字插入項(xiàng)基于為該項(xiàng)目創(chuàng)建或選擇的該觀點(diǎn)創(chuàng)建一個(gè)數(shù)字組合,基于 為該項(xiàng)目創(chuàng)建或選擇的該觀點(diǎn)創(chuàng)建一個(gè)組合的文本組合;以及 一個(gè)第二個(gè)輸出生成器,被配置成用于顯示該數(shù)字組合和該故事結(jié)構(gòu)的該上下文內(nèi)的 該組合的文本組合。
      3. 如權(quán)利要求1所述的TMA0系統(tǒng),其中,該組合的文本組合進(jìn)一步包括基于為該項(xiàng)目 確定的該觀點(diǎn)選擇的一個(gè)語法修飾語。
      4. 如權(quán)利要求1所述的TMA0系統(tǒng),其中,該用戶界面進(jìn)一步包括一個(gè)在結(jié)構(gòu)化或半結(jié) 構(gòu)化格式、或一種結(jié)構(gòu)化和半結(jié)構(gòu)化混合格式下的模板系統(tǒng),該模板系統(tǒng)被配置成用于顯 示該創(chuàng)作實(shí)體并與其交互。
      5. 如權(quán)利要求4所述的TMA0系統(tǒng),其中,這些模板包括一個(gè)觀點(diǎn)模板。
      6. 如權(quán)利要求4所述的TMA0系統(tǒng),其中,這些模板包括一個(gè)規(guī)則模板,該規(guī)則模板顯示 一個(gè)規(guī)則的和由該規(guī)則實(shí)施的一個(gè)可編輯算法的一種自然語言描述。
      8. 如權(quán)利要求7所述的TMA0系統(tǒng),其中,一個(gè)規(guī)則的和由該規(guī)則實(shí)施的該可編輯算法 的該自然語言描述存儲在附接到該規(guī)則的一個(gè)編譯版本上的元數(shù)據(jù)內(nèi)。
      9. 如權(quán)利要求1所述的TMA0系統(tǒng),進(jìn)一步包括一個(gè)用戶反饋處理器,該用戶反饋處理 器被配置成用于接收針對該項(xiàng)目的輸出的評審和基于這些評審對該TMA0系統(tǒng)實(shí)施多個(gè)改 變,其中可以從該創(chuàng)作實(shí)體或一個(gè)社區(qū)的一個(gè)或多個(gè)成員接收這些評審。
      10. 如權(quán)利要求1所述的TMA0系統(tǒng),進(jìn)一步包括一個(gè)用戶反饋處理器,該用戶反饋處理 器被配置成用于接收對用于該項(xiàng)目的一個(gè)規(guī)則的至少一項(xiàng)修改和基于該修改對該TMA0系 統(tǒng)實(shí)施多個(gè)改變,其中可以從該創(chuàng)作實(shí)體或一個(gè)社區(qū)的多個(gè)成員接收該修改。
      11. 如權(quán)利要求10所述的TMA0系統(tǒng),進(jìn)一步包括一個(gè)社區(qū)激勵(lì)程序,該社區(qū)激勵(lì)程序 被配置成用于向該社區(qū)的多個(gè)成員提供激勵(lì)以鼓勵(lì)來自該社區(qū)的這些成員的有用反饋。
      12. 如權(quán)利要求1所述的TMA0系統(tǒng),進(jìn)一步包括一個(gè)廣告程序,該廣告程序被配置成用 于將屬于一個(gè)附屬機(jī)構(gòu)的廣告信息嵌入該輸出內(nèi)并基于在該附屬機(jī)構(gòu)的廣告信息下的廣 告公開從該附屬機(jī)構(gòu)收集補(bǔ)償。
      13. 如權(quán)利要求12所述的TMAO系統(tǒng),其中: 這些廣告公開包括從該TMAO系統(tǒng)上的第一層級查看公開、該TMAO系統(tǒng)上的第二層級 查看公開、在一個(gè)附屬網(wǎng)站下的點(diǎn)進(jìn)公開、以及通過該附屬網(wǎng)站的購買公開選擇的一種或 多種公開類型,以及 該補(bǔ)償基于公開的數(shù)量及其相關(guān)聯(lián)的公開類型。
      14. 一種使用運(yùn)行TMAO系統(tǒng)的計(jì)算機(jī)來實(shí)施的商業(yè)模型,包括: 一個(gè)第一層級商務(wù),包括銷售、許可或?qū)ο騽?chuàng)作實(shí)體提供的該TMAO系統(tǒng)的每次使用付 費(fèi)訪問;以及 一個(gè)第二層級商務(wù),包括向多個(gè)社區(qū)成員提供的激勵(lì),以鼓勵(lì)用于改進(jìn)該TMAO系統(tǒng)的 反饋;以及 一個(gè)第三層級商務(wù),包括對該TMAO系統(tǒng)提供或促進(jìn)的廣告公開的補(bǔ)償。
      15. 如權(quán)利要求14所述的商業(yè)模型,其中: 這些廣告公開包括從該TMAO系統(tǒng)上的第一層級查看公開、該TMAO系統(tǒng)上的第二層級 查看公開、在一個(gè)附屬網(wǎng)站下的點(diǎn)進(jìn)公開、以及通過該附屬網(wǎng)站的購買公開選擇的一種或 多種公開類型,以及 該補(bǔ)償基于公開的數(shù)量及其相關(guān)聯(lián)的公開類型。
      16. 如權(quán)利要求14所述的商業(yè)模型,其中,該第一層級商務(wù)包括一個(gè)提供該TMAO作為 一種應(yīng)用服務(wù)的服務(wù)器系統(tǒng)和一個(gè)向授權(quán)創(chuàng)作實(shí)體提供對該TMAO的訪問的客戶端系統(tǒng)。
      17. -種用于提供文本挖掘、分析和輸出系統(tǒng)的方法,包括以下步驟: 顯示一個(gè)用戶界面,該用戶界面從一個(gè)創(chuàng)作實(shí)體請求輸入,該創(chuàng)作實(shí)體對包括項(xiàng)目數(shù) 據(jù)的標(biāo)識的一個(gè)項(xiàng)目進(jìn)行定義; 基于通過該用戶界面從該創(chuàng)作實(shí)體接收到的該輸入為該項(xiàng)目確定一個(gè)觀點(diǎn); 基于為該項(xiàng)目確定的該觀點(diǎn)從該項(xiàng)目數(shù)據(jù)提取多個(gè)文本和數(shù)字?jǐn)?shù)據(jù)項(xiàng); 通過結(jié)合基于所提取的文本項(xiàng)中的一個(gè)或多個(gè)的一個(gè)數(shù)據(jù)挖掘文本插入項(xiàng)基于為該 項(xiàng)目確定的該觀點(diǎn)創(chuàng)建一個(gè)組合的文本組合; 基于為該項(xiàng)目確定的該觀點(diǎn)創(chuàng)建或選擇一個(gè)故事結(jié)構(gòu),該故事結(jié)構(gòu)為該組合的文本組 合提供一個(gè)上下文;以及 顯示該故事結(jié)構(gòu)的該上下文內(nèi)的該組合的文本組合。
      18. 如權(quán)利要求17所述的方法,進(jìn)一步包括以下步驟: 通過結(jié)合基于所提取的數(shù)字?jǐn)?shù)據(jù)項(xiàng)中的一個(gè)或多個(gè)的一個(gè)數(shù)據(jù)挖掘數(shù)字插入項(xiàng)基于 為該項(xiàng)目確定的該觀點(diǎn)創(chuàng)建一個(gè)數(shù)字組合;以及 顯示該數(shù)字組合和該故事結(jié)構(gòu)的該上下文內(nèi)的該組合的文本組合。
      19. 如權(quán)利要求18所述的方法,進(jìn)一步包括以下步驟: 從該創(chuàng)作實(shí)體或一個(gè)社區(qū)的多個(gè)成員接收針對該項(xiàng)目的該輸出的反饋,以及 基于該反饋對該TMAO系統(tǒng)實(shí)施多個(gè)改變。
      20. 如權(quán)利要求18所述的方法,進(jìn)一步包括向該社區(qū)的多個(gè)成員提供激勵(lì)以鼓勵(lì)來自 該社區(qū)的這些成員的有用反饋。
      【文檔編號】G06F17/30GK104054075SQ201280067458
      【公開日】2014年9月17日 申請日期:2012年12月6日 優(yōu)先權(quán)日:2011年12月6日
      【發(fā)明者】貝里·A·布拉杰, 杰弗里·M·戴維森, 杰弗里·S·阿倫森, 克雷格·R·邁爾 申請人:派賽普申合伙公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1