根據(jù)片段圖像獲取完整資源的方法、系統(tǒng)與應(yīng)用的制作方法
【專(zhuān)利摘要】本發(fā)明涉及移動(dòng)互聯(lián)網(wǎng)技術(shù),公開(kāi)了一種根據(jù)片段圖像獲取完整資源的方法、系統(tǒng)與應(yīng)用。本發(fā)明中用圖像替代傳統(tǒng)的獲取網(wǎng)絡(luò)資源的媒介,例如URI和文字,根據(jù)從片段圖像中提取的粗略片段信息來(lái)獲取最終的完整資源,使用戶(hù)能夠更便捷地記錄和獲取網(wǎng)絡(luò)資源,提供了良好的用戶(hù)體驗(yàn)。運(yùn)用該方法和系統(tǒng),發(fā)明了一款以截屏為同一收藏方式的收藏閱讀應(yīng)用。由于截屏操作是被所有主流設(shè)備和平臺(tái)支持的操作,不受前端應(yīng)用的限制,省去了用戶(hù)在不同的應(yīng)用里找各自不同位置的收藏按鈕的學(xué)習(xí)成本;可以通過(guò)讀取系統(tǒng)維護(hù)的存儲(chǔ)空間中的所有截屏圖像,將不同前端應(yīng)用中的收藏集中到該收藏閱讀應(yīng)用中;同時(shí)可以連續(xù)截屏,不需要在應(yīng)用間來(lái)回切換。
【專(zhuān)利說(shuō)明】根據(jù)片段圖像獲取完整資源的方法、系統(tǒng)與應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)互聯(lián)網(wǎng)技術(shù),特別涉及根據(jù)片段圖像獲取完整資源的方法、系統(tǒng)與應(yīng)用。
【背景技術(shù)】
[0002]智能移動(dòng)設(shè)備的用戶(hù)往往在使用各種不同的前端應(yīng)用時(shí),比如使用手機(jī)瀏覽器、微博、微信、新聞客戶(hù)端閱讀到好文章,想要收藏,目前常見(jiàn)的兩種收藏閱讀的實(shí)現(xiàn)方式包括:使用各前端應(yīng)用提供的收藏功能;或者將URI以復(fù)制粘貼或者應(yīng)用間調(diào)用的方式從前端應(yīng)用傳遞給某個(gè)收藏閱讀應(yīng)用。
[0003]其中,URI(Uniform Resource Indentifier)包括 URL 和 URN 兩類(lèi),網(wǎng)頁(yè)資源主要以URL來(lái)識(shí)別和定位。前端應(yīng)用是指用戶(hù)正在通過(guò)圖形界面與之交互的應(yīng)用軟件。
[0004]但是這兩種實(shí)現(xiàn)方式都有明顯缺點(diǎn):
[0005]1、使用各前端應(yīng)用提供的收藏功能,主要缺點(diǎn)有:
[0006]需要前端應(yīng)用提供收藏功能;
[0007]無(wú)法滿(mǎn)足集中收藏到一處的要求;
[0008]功能細(xì)節(jié)和體驗(yàn)各不相同,包括收藏按鈕位置,增加了用戶(hù)的學(xué)習(xí)成本。
[0009]2、將URI以復(fù)制粘貼或者應(yīng)用間調(diào)用的方式從前端應(yīng)用傳遞給某個(gè)收藏閱讀應(yīng)用,主要缺點(diǎn)有:
[0010]復(fù)制粘貼在這個(gè)使用場(chǎng)景下體驗(yàn)差;
[0011]iOS系統(tǒng)不支持應(yīng)用間調(diào)用,所以絕大多數(shù)情況得使用復(fù)制粘貼URI的方式;
[0012]Android系統(tǒng)上除復(fù)制粘貼URI之外,如果前端應(yīng)用支持,用戶(hù)可以通過(guò)“分享”按鈕,調(diào)用收藏閱讀應(yīng)用并傳遞URI,但是仍然存在一些問(wèn)題,例如功能細(xì)節(jié)和體驗(yàn)各不相同需要學(xué)習(xí),以及應(yīng)用間來(lái)回切換的欠佳體驗(yàn);
[0013]無(wú)法實(shí)現(xiàn)進(jìn)階功能,比如記錄用戶(hù)在前端應(yīng)用中閱讀到的位置,或者用戶(hù)在前端應(yīng)用中做的聞売筆記。
[0014]基于上述缺點(diǎn),在移動(dòng)互聯(lián)網(wǎng)時(shí)代,圖像成為了比URI或文字更友好的記錄和傳播的媒介,原因體現(xiàn)在以下幾個(gè)方面的優(yōu)勢(shì):
[0015]I)可以連續(xù)截屏或拍照,再打開(kāi)目標(biāo)應(yīng)用一次性讀取;URI或文字卻不能連續(xù)復(fù)制,只能每次復(fù)制之后立刻打開(kāi)目標(biāo)應(yīng)用粘貼一次,在應(yīng)用間來(lái)回切換,很不方便。
[0016]2)用截屏或者拍照記錄,比選中、復(fù)制、粘貼一長(zhǎng)串URI或文字要便捷很多。
[0017]3)截屏或拍照是被所有主流設(shè)備和平臺(tái)支持的操作,不需要前端應(yīng)用支持。比如,無(wú)論用戶(hù)在用手機(jī)瀏覽器還是新聞客戶(hù)端看一篇新聞,用戶(hù)都可以截屏記錄自己閱讀的部分,而不需要手機(jī)瀏覽器或者新聞客戶(hù)端提供一個(gè)按鈕支持。而且統(tǒng)一的截屏操作也比在不同的App (智能移動(dòng)設(shè)備上的應(yīng)用軟件)里找各自不同位置的該按鈕省去了用戶(hù)的學(xué)習(xí)成本。
[0018]4)截屏或拍照所記錄的圖像,是保存在系統(tǒng)維護(hù)的存儲(chǔ)空間中,所有應(yīng)用軟件在得到用戶(hù)授權(quán)后都可讀取,不受前端應(yīng)用限制。比如,如果用戶(hù)使用新聞客戶(hù)端閱讀一篇新聞時(shí)使用了該新聞客戶(hù)端內(nèi)建的收藏功能,用戶(hù)無(wú)法在其他應(yīng)用軟件中讀取該收藏信息。
[0019]5)傳播到社交網(wǎng)絡(luò)中,圖像比一長(zhǎng)串URI或文字對(duì)更吸引閱讀者。并且比如微博無(wú)法容納超過(guò)140個(gè)字符的URI或文字。
[0020]但是,圖像所包含的信息往往只是某個(gè)完整資源的一部分,也就是“片段信息”,所以用圖像記錄和傳播完整資源還需要實(shí)現(xiàn)一定的前提。
【發(fā)明內(nèi)容】
[0021]本發(fā)明的目的在于提供一種根據(jù)片段圖像獲取完整資源及移動(dòng)終端收藏閱讀的方法與系統(tǒng),用圖像替代傳統(tǒng)的獲取網(wǎng)絡(luò)資源的媒介,從片段圖像中提取的粗略片段信息來(lái)獲取最終的完整資源,使用戶(hù)能夠更便捷地記錄和獲取網(wǎng)絡(luò)資源,提供了良好的用戶(hù)體驗(yàn)。將上述根據(jù)片段圖像獲取完整資源的方法應(yīng)用到移動(dòng)終端收藏閱讀中,以截屏圖像為統(tǒng)一收藏閱讀的方式,不受前端應(yīng)用的限制,省去用戶(hù)在不同的應(yīng)用里找各自不同位置的收藏按鈕的學(xué)習(xí)成本,可集中看到所有的閱讀資源,同時(shí)不需要在應(yīng)用間來(lái)回切換,使用方便。
[0022]為解決上述技術(shù)問(wèn)題,本發(fā)明的實(shí)施方式公開(kāi)了一種根據(jù)片段圖像獲取最終的完整資源的方法,包括步驟:
[0023]獲取片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分;
[0024]通過(guò)圖像識(shí)別從片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞;
[0025]根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源;
[0026]根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0027]本發(fā)明的實(shí)施方式還公開(kāi)了一種智能移動(dòng)終端上收藏閱讀的方法,包括以下步驟:
[0028]自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞;
[0029]根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源;
[0030]根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0031]本發(fā)明的實(shí)施方式還公開(kāi)了一種根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),包括:
[0032]片段圖像獲取模塊,用于獲取片段圖像,片段圖像是以圖像形式展示的最終的完整資源的至少一部分;
[0033]提取模塊,用于通過(guò)圖像識(shí)別從片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞;
[0034]查找模塊,用于根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源;
[0035]最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0036]本發(fā)明的實(shí)施方式還公開(kāi)了一種智能移動(dòng)終端上收藏閱讀的系統(tǒng),包括:
[0037]提取模塊,用于在自動(dòng)掃描圖像庫(kù)并從中篩選出片段圖像后,通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞;
[0038]查找模塊,用于根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源;
[0039]最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0040]本發(fā)明實(shí)施方式與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于:
[0041]本發(fā)明中用圖像替代傳統(tǒng)的獲取網(wǎng)絡(luò)資源的媒介,例如URI和文字,根據(jù)從片段圖像中提取的粗略片段信息來(lái)獲取最終的完整資源,使用戶(hù)能夠更便捷地記錄和獲取網(wǎng)絡(luò)資源,提供了良好的用戶(hù)體驗(yàn)。
[0042]由于截屏操作是被所有主流設(shè)備和平臺(tái)支持的操作,不受前端應(yīng)用的限制,省去了用戶(hù)在不同的應(yīng)用里找各自不同位置的收藏按鈕的學(xué)習(xí)成本;可以通過(guò)讀取系統(tǒng)維護(hù)的存儲(chǔ)空間中的所有截屏圖像,將不同前端應(yīng)用中的收藏集中到該收藏閱讀應(yīng)用中;同時(shí)可以連續(xù)截屏,不需要在應(yīng)用間來(lái)回切換。
[0043]進(jìn)一步地,查找候選完整資源時(shí)首先在自建的搜索引擎和資源庫(kù)中進(jìn)行查找,對(duì)于存在于自建搜索引擎和資源庫(kù)中的完整資源,可提高查找的速度。
[0044]進(jìn)一步地,去除粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞,可避免某個(gè)詞被識(shí)別錯(cuò)誤導(dǎo)致找不到結(jié)果的情況。
[0045]進(jìn)一步地,迭代地比對(duì)粗略片段信息和候選完整資源,并根據(jù)比對(duì)結(jié)果對(duì)粗略片段信息進(jìn)行修正,能夠使搜索到的完整資源更精確。
[0046]進(jìn)一步地,對(duì)于服務(wù)器端最終的完整資源可能會(huì)丟失的情況,存儲(chǔ)最終的完整資源保證了完整資源長(zhǎng)時(shí)間的可用性。
[0047]進(jìn)一步地,根據(jù)客戶(hù)端反饋的表示對(duì)最終的完整資源判斷結(jié)果的信息,對(duì)提取粗略片段信息的方法和/或查找候選完整資源的方法做相應(yīng)修正,可提高準(zhǔn)確率。
[0048]進(jìn)一步地,片段圖像在客戶(hù)端進(jìn)行預(yù)處理后上傳到服務(wù)器,可有效降低上傳的數(shù)據(jù)量和服務(wù)器的運(yùn)算負(fù)擔(dān)。
[0049]進(jìn)一步地,還原和記錄片段信息與最終的完整資源之間的關(guān)系并將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),提供了更好的用戶(hù)體驗(yàn)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0050]圖1是本發(fā)明第一實(shí)施方式中一種根據(jù)片段圖像獲取最終的完整資源的方法的流程示意圖;
[0051]圖2是本發(fā)明第三實(shí)施方式中一種智能移動(dòng)終端上收藏閱讀的方法的流程示意圖;[0052]圖3是本發(fā)明第六實(shí)施方式中一種根據(jù)片段圖像獲取最終的完整資源的系統(tǒng)的結(jié)構(gòu)示意圖;
[0053]圖4是本發(fā)明第八實(shí)施方式中一種智能移動(dòng)終端上收藏閱讀的系統(tǒng)的結(jié)構(gòu)示意圖;圖5是本發(fā)明第八實(shí)施方式中一種智能移動(dòng)終端上收藏閱讀應(yīng)用的界面示意圖。
【具體實(shí)施方式】
[0054]在以下的敘述中,為了使讀者更好地理解本申請(qǐng)而提出了許多技術(shù)細(xì)節(jié)。但是,本領(lǐng)域的普通技術(shù)人員可以理解,即使沒(méi)有這些技術(shù)細(xì)節(jié)和基于以下各實(shí)施方式的種種變化和修改,也可以實(shí)現(xiàn)本申請(qǐng)各權(quán)利要求所要求保護(hù)的技術(shù)方案。
[0055]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0056]首先,本發(fā)明中涉及到的專(zhuān)業(yè)術(shù)語(yǔ)有:
[0057]完整資源:完整的可以用URI識(shí)別的網(wǎng)頁(yè)資源。
[0058]文字資源:以文字為主體的完整資源,主要類(lèi)別有文章、論壇帖子、社交網(wǎng)絡(luò)帖子、或文章的引言。
[0059]片段圖像(blob image):完整資源的一部分或者全部,被以圖像的方式展現(xiàn)出來(lái)。具體形式包括用戶(hù)在手機(jī)瀏覽器里看一篇文章時(shí)的截屏、由文章自動(dòng)生成的被分享到微博中的圖像、看書(shū)時(shí)某一頁(yè)的拍照記錄。
[0060]粗略片段信息(rough blob information):片段圖像所包含的,經(jīng)過(guò)分析抽取得到的信息??砂摹?biāo)題、圖標(biāo)、網(wǎng)址等。
[0061]片段信息(blob information):粗略片段信息經(jīng)過(guò)與完整資源比對(duì)而修正或確認(rèn)后的信息。
[0062]移動(dòng)應(yīng)用/App:智能移動(dòng)設(shè)備上的應(yīng)用軟件。
[0063]前端應(yīng)用(被攝應(yīng)用):用戶(hù)正在通過(guò)圖形界面與之交互的應(yīng)用軟件。在智能移動(dòng)設(shè)備上,往往同時(shí)只有一個(gè)前端應(yīng)用,它占據(jù)了絕大部分屏幕面積。所以對(duì)該設(shè)備的拍照或者截屏,會(huì)將該前端應(yīng)用的界面記錄在圖像中,此時(shí)該前端應(yīng)用又稱(chēng)為被攝應(yīng)用。
[0064]圖像元數(shù)據(jù):不需要解碼像素信息即可讀出的圖像文件基本屬性,比如像素分辨率、創(chuàng)建時(shí)間、文件尺寸等。
[0065]標(biāo)識(shí)、記錄、傳播、獲取網(wǎng)絡(luò)資源是互聯(lián)網(wǎng)應(yīng)用的基礎(chǔ)。在桌面設(shè)備上,最普遍的使用資源的媒介是URI ;而在移動(dòng)設(shè)備上的許多場(chǎng)景中,圖像成為了比URI或文字對(duì)用戶(hù)更友好的記錄和傳播的媒介。
[0066]但是圖像所包含的信息往往只是某個(gè)完整資源的一部分,也就是“片段信息”。所以用圖像記錄和傳播完整資源的前提是:
[0067]I)通過(guò)分析圖像得到片段信息;
[0068]2)通過(guò)片段信息查找到完整資源;
[0069]3)還原片段信息與完整資源之間的關(guān)系。
[0070]本發(fā)明提出了一套方法和系統(tǒng)實(shí)現(xiàn)上述前提,并創(chuàng)造研發(fā)了一款主要以截屏圖像為媒介收藏閱讀的移動(dòng)應(yīng)用。這款應(yīng)用引導(dǎo)用戶(hù)(無(wú)論在使用任何一款前端應(yīng)用閱讀時(shí))以截屏為統(tǒng)一收藏方式,之后打開(kāi)該應(yīng)用即可集中看到所有自己收藏的文字資源,并且看到片段信息被突出顯示,解決了現(xiàn)有收藏閱讀的實(shí)現(xiàn)方式所存在的缺點(diǎn)。
[0071]本發(fā)明第一實(shí)施方式涉及一種根據(jù)片段圖像獲取最終的完整資源的方法,圖1是該根據(jù)片段圖像獲取最終的完整資源的方法的流程示意圖。
[0072]具體地說(shuō),該根據(jù)片段圖像獲取最終的完整資源的方法包括以下步驟:
[0073]在步驟101中,獲取片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分。
[0074]片段圖像的具體形式可以為用戶(hù)在手機(jī)瀏覽器里看一篇文章時(shí)的截屏、由文章自動(dòng)生成的被分享到微博中的圖像、看書(shū)時(shí)某一頁(yè)的拍照記錄或者選擇的已有圖像。
[0075]此外,可以理解,獲取片段圖像的方式可以包括拍照,截圖等。
[0076]拍照(往往只內(nèi)建于移動(dòng)設(shè)備)和截屏功能是由操作系統(tǒng)和設(shè)備默認(rèn)提供的功能,不依賴(lài)于第三方應(yīng)用軟件。而拍照或截屏所得到的圖像被存放于操作系統(tǒng)指定的位置,所有應(yīng)用軟件在得到用戶(hù)授權(quán)之后都可以訪(fǎng)問(wèn)。但是有些操作系統(tǒng)將拍照和截屏所得的圖像分開(kāi)(比如存放于不同位置),而有些操作系統(tǒng)需要應(yīng)用軟件自己檢查一些屬性來(lái)區(qū)分。
[0077]此后進(jìn)入步驟102,通過(guò)圖像識(shí)別從片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞。
[0078]粗略片段信息的具體形式可以包括正文、標(biāo)題、圖標(biāo)和網(wǎng)址等。
[0079]此后進(jìn)入步驟103,根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源。
[0080]此后進(jìn)入步驟104,根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0081]最終的完整資源為完整的可以用URI識(shí)別的web資源。
[0082]此后結(jié)束此流程。
[0083]優(yōu)選地,在根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源的步驟103中,根據(jù)查找的位置可以包括以下子步驟:
[0084]根據(jù)粗略片段信息在自建的搜索引擎和資源庫(kù)中搜索候選完整資源;
[0085]如果在自建的搜索引擎和資源庫(kù)中搜索不到候選完整資源,則調(diào)用第三方搜索的接口。
[0086]當(dāng)查找完整資源時(shí),可以通過(guò)URI或者API調(diào)用第三方搜索,也可基于開(kāi)源軟件自建搜索引擎。本實(shí)施方式中的實(shí)現(xiàn)是通過(guò)自建一個(gè)規(guī)模較小搜索引擎(包括資源庫(kù)),在自建的搜索引擎查不到結(jié)果時(shí),再調(diào)用第三方搜索的接口。在本實(shí)施方式中第三方搜索包括Google和Twitter站內(nèi)搜索等,可以理解,在本發(fā)明的其他實(shí)施方式中,也可以包括其他第
三方搜索。
[0087]在根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源的子步驟中,首先在自建的搜索引擎和資源庫(kù)中搜索候選完整資源,對(duì)于存在于自建搜索引擎和資源庫(kù)中的候選完整資源,可提高查找的速度。
[0088]優(yōu)選地,在根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源的步驟103中,根據(jù)查找的條件可以包括以下子步驟:
[0089]判斷粗略片段信息中字或單詞的詞頻是否低于預(yù)定值;
[0090]去除粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞。
[0091]查找候選完整資源時(shí),將粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞去除,可避免某個(gè)詞被識(shí)別錯(cuò)誤導(dǎo)致找不到結(jié)果的情況。
[0092]優(yōu)選地,在根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源的步驟103中,根據(jù)查找是否需要登錄或者授權(quán),可以包括以下子步驟:
[0093]對(duì)候選的完整資源直接進(jìn)行查找;
[0094]對(duì)于需要登錄或者授權(quán)的候選完整資源,嘗試以用戶(hù)設(shè)置的賬戶(hù)訪(fǎng)問(wèn)并進(jìn)行查找??梢岳斫猓陨先N查找候選完整資源子步驟的方法可以任意組合或者單獨(dú)進(jìn)行實(shí)施,也就是說(shuō),服務(wù)器可以根據(jù)查找的位置,查找的條件,或者查找是否需要登錄或者授權(quán)來(lái)探索式地執(zhí)行一次或多次查找,得到一個(gè)或多個(gè)候選完整資源。此外,查找的位置,查找的條件,或者查找是否需要登錄或者授權(quán)的順序并不固定,可以根據(jù)具體需要來(lái)安排。
[0095]本發(fā)明中用圖像替代傳統(tǒng)的獲取網(wǎng)絡(luò)資源的媒介,例如URI和文字,根據(jù)從片段圖像中提取的粗略片段信息來(lái)獲取最終的完整資源,使用戶(hù)能夠更便捷地記錄和獲取網(wǎng)絡(luò)資源,提供了良好的用戶(hù)體驗(yàn)。
[0096]本發(fā)明第二實(shí)施方式涉及一種根據(jù)片段圖像獲取最終的完整資源的方法。
[0097]第二實(shí)施方式在第一實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:
[0098]首先,在根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源的步驟103之后,還包括步驟:
[0099]迭代地比對(duì)粗略片段信息和候選完整資源,并根據(jù)比對(duì)結(jié)果利用候選完整資源對(duì)粗略片段信息進(jìn)行修正,根據(jù)修正后得到的片段信息查找更小范圍的候選完整資源。
[0100]迭代地比對(duì)粗略片段信息和候選完整資源,并根據(jù)比對(duì)結(jié)果對(duì)粗略片段信息進(jìn)行修正,能夠使搜索到的完整資源更精確。
[0101]其次,在根據(jù)候選完整資源確定最終的完整資源的步驟104之后,還包括步驟:
[0102]在服務(wù)器中存儲(chǔ)最終的完整資源。
[0103]可以理解,對(duì)于服務(wù)器端最終的完整資源可能會(huì)丟失的情況,存儲(chǔ)最終的完整資源保證了完整資源長(zhǎng)時(shí)間的可用性。
[0104]此外,可以理解,在本發(fā)明的其他實(shí)施方式中,此步驟并不是必須的,例如對(duì)于自建資源庫(kù)中的資源,則可以只存儲(chǔ)相關(guān)信息,而不是最終的完整資源。也可以將最終的完整資源發(fā)送到客戶(hù)端中存儲(chǔ)。
[0105]最后,在根據(jù)候選完整資源確定最終的完整資源的步驟104之后,還包括以下步驟:
[0106]在客戶(hù)端的顯示屏上顯示最終的完整資源;
[0107]從客戶(hù)端的輸入裝置接收表示對(duì)最終的完整資源判斷結(jié)果的輸入,并根據(jù)該輸入修改提取粗略片段信息的方法和/或查找候選完整資源的方法。
[0108]根據(jù)客戶(hù)端反饋的表示對(duì)最終的完整資源判斷結(jié)果的信息,對(duì)提取粗略片段信息的方法和/或查找候選完整資源的方法做相應(yīng)修正,可提高準(zhǔn)確率。
[0109]本發(fā)明第三實(shí)施方式涉及一種智能移動(dòng)終端上收藏閱讀的方法,圖2是該智能移動(dòng)終端上收藏閱讀的方法的流程示意圖。
[0110]具體地說(shuō),該智能移動(dòng)終端上收藏閱讀的方法包括以下步驟:
[0111]在步驟201中,自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞。
[0112]此后進(jìn)入步驟202,根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源。
[0113]此后進(jìn)入步驟203,根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0114]此后結(jié)束此流程。
[0115]優(yōu)選地,在上文所述的自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像的步驟201中,所述圖像庫(kù)中的片段圖像以截屏圖像為主要來(lái)源;
[0116]相應(yīng)地,在所述自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像的步驟201之前,還包括以下步驟:
[0117]智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分;
[0118]將截屏所得到的片段圖像存儲(chǔ)在智能移動(dòng)終端的操作系統(tǒng)指定的圖像庫(kù)中。由于截屏操作是被所有主流設(shè)備和平臺(tái)支持的操作,不受前端應(yīng)用的限制,省去了用戶(hù)在不同的應(yīng)用里找各自不同位置的收藏按鈕的學(xué)習(xí)成本;可以通過(guò)讀取系統(tǒng)維護(hù)的存儲(chǔ)空間中的所有截屏圖像,將不同前端應(yīng)用中的收藏集中到該收藏閱讀應(yīng)用中;同時(shí)可以連續(xù)截屏,不需要在應(yīng)用間來(lái)回切換。
[0119]可以理解,上述兩個(gè)優(yōu)選的步驟是由操作系統(tǒng)完成,而不是由收藏閱讀的應(yīng)用完成。此外,在本發(fā)明智能移動(dòng)終端上收藏閱讀的方法中,上述兩個(gè)步驟并不是必要的。在本發(fā)明的其他實(shí)施方式中,圖像庫(kù)中片段圖像除了以截屏圖像作為來(lái)源外,該收藏閱讀應(yīng)用的輸入也可以是拍照所得的照片。
[0120]優(yōu)選地,在從片段圖像中提取得到粗略片段信息的步驟201中,粗略片段信息包括以下之一或其任一組合:
[0121]前端應(yīng)用名稱(chēng)和類(lèi)型,前端應(yīng)用界面是否匹配已知模式,文字,鏈接,文字資源的來(lái)源網(wǎng)站,標(biāo)題,時(shí)間戳,作者。
[0122]優(yōu)選地,在從片段圖像中提取得到粗略片段信息的步驟201之后,還包括以下步驟:
[0123]判斷粗略片段信息的類(lèi)別,類(lèi)別包括文章的部分,論壇帖子的部分,社交網(wǎng)絡(luò)帖子的全部或部分,文章引言;
[0124]確定查找和獲取候選完整資源的方式。
[0125]此外,可以理解,針對(duì)片段資源類(lèi)別是文章引言的,還需判斷是否需要進(jìn)一步跟進(jìn)某個(gè)鏈接才能獲取最終的完整資源。
[0126]查找和獲取文字資源的方式包括如第一實(shí)施方式中所闡述的查找位置,查找條件,是否需要登錄或授權(quán)等。
[0127]優(yōu)選地,在上文所述的智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像的步驟之前,還包括步驟:
[0128]收藏閱讀的應(yīng)用請(qǐng)求讀取圖像庫(kù)的權(quán)限;
[0129]在上文所述的自動(dòng)掃描圖像庫(kù)的步驟201中,在用戶(hù)打開(kāi)所述收藏閱讀應(yīng)用之前,該收藏閱讀應(yīng)用在后臺(tái)自動(dòng)檢測(cè)是否有新的截屏。[0130]在本實(shí)施方式中,在得到讀取圖像庫(kù)的權(quán)限的條件下,閱讀收藏應(yīng)用獲取片段圖像就可以實(shí)現(xiàn)自動(dòng)檢測(cè)和篩選,不需要等待用戶(hù)打開(kāi)該閱讀收藏應(yīng)用,它爭(zhēng)取合適的時(shí)機(jī)自動(dòng)檢測(cè)到新的截屏圖像,初篩出有足夠信息的,進(jìn)行分析查找完整資源。
[0131]此外,可以理解,在本發(fā)明的其他實(shí)施方式中,除了自動(dòng)檢測(cè)和篩選片段圖像,也支持手動(dòng)選擇片段圖像。
[0132]核心的用戶(hù)體驗(yàn)主要包括以下四個(gè)步驟:
[0133]1.在第一次啟動(dòng)App時(shí)請(qǐng)求讀取本地照片的權(quán)限;
[0134]2.用戶(hù)在使用任何前端應(yīng)用時(shí)截屏;
[0135]3.不用等用戶(hù)打開(kāi)該閱讀收藏應(yīng)用,它爭(zhēng)取合適的時(shí)機(jī)自動(dòng)檢測(cè)到新的截屏,初篩出有足夠信息的,進(jìn)行分析并獲取完整資源(Web文章);
[0136]4.用戶(hù)打開(kāi)該閱讀收藏應(yīng)用時(shí),獲取的文章已經(jīng)都在列表里,點(diǎn)擊即可閱讀。在該步驟中,用戶(hù)可以看到之前收藏閱讀應(yīng)用獲取的比如100張片段圖像所對(duì)應(yīng)的完整資源的結(jié)果,而不用每輸入一張片段圖像,就得等待分析查找該張片段圖像所對(duì)應(yīng)的結(jié)果,也就是說(shuō)收藏閱讀應(yīng)用對(duì)片段圖像進(jìn)行分析查找,以及用戶(hù)對(duì)最終的完整資源進(jìn)行查詢(xún)這兩個(gè)過(guò)程是異步的。且列表中每一個(gè)片段圖像所對(duì)應(yīng)的最終的完整資源是明確的,不需要用戶(hù)進(jìn)行選擇。
[0137]本發(fā)明第四實(shí)施方式涉及一種智能移動(dòng)終端上收藏閱讀的方法,第四實(shí)施方式在第三實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:
[0138]首先,在自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息的步驟201中,根據(jù)以下任一項(xiàng)或其任一組合篩選出片段圖像:圖像元數(shù)據(jù),小部分區(qū)域特征,圖像整體特征。
[0139]其中,圖像元數(shù)據(jù)不需要解碼像素信息即可讀出的圖像文件基本屬性,圖像文件基本屬性包括像素分辨率、創(chuàng)建時(shí)間、文件尺寸等。
[0140]小部分區(qū)域特征主要是通過(guò)識(shí)別圖像頂部是否有狀態(tài)欄以及電池圖標(biāo)來(lái)判斷是否可能是手機(jī)截屏。
[0141]圖像整體特征則通過(guò)圖像分辨率尺寸判斷是否可能是手機(jī)截屏。通過(guò)查看圖像整體的顏色直方圖判斷是否有大段文字。
[0142]其次,在自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息的步驟201中,在提取得到粗略片段信息的步驟之前,還包括步驟:
[0143]對(duì)片段圖像進(jìn)行預(yù)處理,預(yù)處理包括識(shí)別和提取包含有效信息的區(qū)域,對(duì)文字區(qū)域做黑白二值化處理,以及進(jìn)行壓縮。
[0144]片段圖像在客戶(hù)端進(jìn)行預(yù)處理后上傳到服務(wù)器,有效降低上傳的數(shù)據(jù)量和服務(wù)器的運(yùn)算負(fù)擔(dān)。
[0145]最后,在自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息的步驟201中,圖像識(shí)別采用OCR文字識(shí)別。
[0146]文字識(shí)別(OpticalCharacter Recognition,簡(jiǎn)稱(chēng)“OCR”)。OCR 是本發(fā)明中圖像分析的重要組成部分。本領(lǐng)域有相對(duì)成熟的OCR方案,比如以英文OCR為主的Tesseract和漢王科技的中文OCR方案。本發(fā)明的OCR實(shí)現(xiàn)基于業(yè)界相對(duì)成熟的方案。[0147]本發(fā)明第五實(shí)施方式涉及一種智能移動(dòng)終端上收藏閱讀的方法,第五實(shí)施方式在第四實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:
[0148]在根據(jù)候選完整資源確定最終的完整資源的步驟203之后,還包括以下步驟:
[0149]還原和記錄片段信息與最終的完整資源之間的關(guān)系,關(guān)系包括位置關(guān)系;
[0150]將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),并且突出顯示片段信息。
[0151]可以理解,友好的格式包括自動(dòng)滑動(dòng)到片段信息的位置使用戶(hù)能接著上次的位置繼續(xù)閱讀,和/或選中片段信息。
[0152]還原和記錄片段信息與最終的完整資源之間的關(guān)系并將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),提供了更好的用戶(hù)體驗(yàn)。
[0153]本發(fā)明的各方法實(shí)施方式均可以以軟件、硬件、固件等方式實(shí)現(xiàn)。不管本發(fā)明是以軟件、硬件、還是固件方式實(shí)現(xiàn),指令代碼都可以存儲(chǔ)在任何類(lèi)型的計(jì)算機(jī)可訪(fǎng)問(wèn)的存儲(chǔ)器中(例如永久的或者可修改的,易失性的或者非易失性的,固態(tài)的或者非固態(tài)的,固定的或者可更換的介質(zhì)等等)。同樣,存儲(chǔ)器可以例如是可編程陣列邏輯(ProgrammableArrayLogic,簡(jiǎn)稱(chēng)“PAL”)、隨機(jī)存取存儲(chǔ)器(RandomAccess Memory,簡(jiǎn)稱(chēng)“RAM”)、可編程只讀存儲(chǔ)器(Programmable Read Only Memory,簡(jiǎn)稱(chēng) “PROM”)、只讀存儲(chǔ)器(Read-Only Memory,簡(jiǎn)稱(chēng)“ROM”)、電可擦除可編程只讀存儲(chǔ)器(Electrically Erasable Programmable ROM,簡(jiǎn)稱(chēng)“EEPR0M”)、磁盤(pán)、光盤(pán)、數(shù)字通用光盤(pán)(Digital Versatile Disc,簡(jiǎn)稱(chēng)“DVD”)等等。
[0154]本發(fā)明第六實(shí)施方式涉及一種根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),圖3是該根據(jù)片段圖像獲取最終的完整資源的系統(tǒng)的結(jié)構(gòu)示意圖。
[0155]具體地說(shuō),該根據(jù)片段圖像獲取最終的完整資源的系統(tǒng)包括:
[0156]片段圖像獲取模塊,用于獲取片段圖像,片段圖像是以圖像形式展示的最終的完整資源的至少一部分。片段圖像的具體形式可以為用戶(hù)在手機(jī)瀏覽器里看一篇文章時(shí)的截屏、由文章自動(dòng)生成的被分享到微博中的圖像、看書(shū)時(shí)某一頁(yè)的拍照記錄或者選擇的已有圖像。
[0157]可以理解,獲取片段圖像的方式包括拍照,截圖等。
[0158]提取模塊,用于通過(guò)圖像識(shí)別從片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞。粗略片段信息的具體形式可以包括正文、標(biāo)題、圖標(biāo)和網(wǎng)址等。
[0159]查找模塊,用于根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的候選完整資源。
[0160]最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0161]最終的完整資源可以為完整的可以用URI識(shí)別的web資源。
[0162]優(yōu)選地,查找模塊包括以下子模塊:
[0163]自建查找子模塊,用于根據(jù)粗略片段信息在自建的搜索引擎和資源庫(kù)中搜索候選完整資源;
[0164]第三方查找子模塊,用于如果在自建的搜索引擎和資源庫(kù)中搜索不到候選完整資源時(shí),調(diào)用第三方搜索的接口。
[0165]此外,可以理解,第三方搜索包括Google和Twitter站內(nèi)搜索等。[0166]對(duì)于存在于自建搜索引擎和資源庫(kù)中的最終的完整資源,可提高查找的速度。可避免某個(gè)詞被識(shí)別錯(cuò)誤導(dǎo)致找不到結(jié)果的情況。
[0167]優(yōu)選地,查找模塊包括以下子模塊:
[0168]詞頻判斷子模塊,用于判斷粗略片段信息中字或單詞的詞頻是否低于預(yù)定值;
[0169]刪減子模塊,用于去除粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞。
[0170]優(yōu)選地,查找模塊包括以下子模塊:
[0171]直接查找子模塊,用于對(duì)候選的完整資源直接進(jìn)行查找;
[0172]登陸查找子模塊,用于對(duì)需要登錄或者授權(quán)的候選完整資源,嘗試以用戶(hù)設(shè)置的賬戶(hù)訪(fǎng)問(wèn)并進(jìn)行查找。
[0173]本發(fā)明中用圖像替代傳統(tǒng)的獲取網(wǎng)絡(luò)資源的媒介,例如URI和文字,根據(jù)從片段圖像中提取的粗略片段信息來(lái)獲取最終的完整資源,使用戶(hù)能夠更便捷地記錄和獲取網(wǎng)絡(luò)資源,提供了良好的用戶(hù)體驗(yàn)。
[0174]第一實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第一實(shí)施方式互相配合實(shí)施。第一實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了減少重復(fù),這里不再贅述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第一實(shí)施方式中。
[0175]本發(fā)明第七實(shí)施方式涉及一種根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),第七實(shí)施方式在第六實(shí)施方式的基礎(chǔ)上進(jìn)行了改進(jìn),主要改進(jìn)之處在于:
[0176]首先,還包括迭代比對(duì)修正模塊,用于在查找模塊查找到片段圖像所對(duì)應(yīng)的候選完整資源之后,迭代地比對(duì)粗略片段信息和候選完整資源,并根據(jù)比對(duì)結(jié)果利用候選完整資源對(duì)粗略片段信息進(jìn)行修正,根據(jù)修正后得到的片段信息查找更小范圍的候選完整資源。
[0177]迭代地比對(duì)粗略片段信息和候選完整資源,并根據(jù)比對(duì)結(jié)果對(duì)粗略片段信息進(jìn)行修正,能夠使搜索到的完整資源更精確。
[0178]其次,還包括存儲(chǔ)模塊,用于在確定最終的完整資源之后,在服務(wù)器中存儲(chǔ)最終的完整資源。
[0179]對(duì)于服務(wù)器端最終的完整資源可能會(huì)丟失的情況,存儲(chǔ)最終的完整資源保證了資源長(zhǎng)時(shí)間的可用性。
[0180]此外,可以理解,在本發(fā)明的其他實(shí)施方式中,此模塊并不是必須的,例如對(duì)于自建資源庫(kù)中的資源,則可以只存儲(chǔ)相關(guān)信息,而不是最終的完整資源。
[0181]最后,還包括以下模塊:
[0182]顯示模塊,用于在客戶(hù)端的顯示屏上顯示最終的完整資源。
[0183]修正模塊,用于從客戶(hù)端的輸入裝置接收表示對(duì)最終的完整資源判斷結(jié)果的輸入,并根據(jù)該輸入修改提取粗略片段信息的方法和/或查找候選完整資源的方法。
[0184]根據(jù)客戶(hù)端反饋的表示對(duì)最終的完整資源判斷結(jié)果的信息,對(duì)提取粗略片段信息的方法和/或查找候選完整資源的方法做相應(yīng)修正,可提高準(zhǔn)確率。
[0185]第二實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第二實(shí)施方式互相配合實(shí)施。第二實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了減少重復(fù),這里不再贅述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第二實(shí)施方式中。
[0186]本發(fā)明第八實(shí)施方式涉及一種智能移動(dòng)終端上收藏閱讀的系統(tǒng),圖4是該智能移動(dòng)終端上收藏閱讀的系統(tǒng)的結(jié)構(gòu)示意圖。
[0187]具體地說(shuō),該智能移動(dòng)終端上收藏閱讀的系統(tǒng)包括:
[0188]提取模塊,用于在自動(dòng)掃描圖像庫(kù)并從中篩選出片段圖像后,通過(guò)圖像識(shí)別從篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞。
[0189]查找模塊,用于根據(jù)粗略片段信息查找片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源。
[0190]最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
[0191]優(yōu)選地,上文所述的圖像庫(kù)中的片段圖像以截屏圖像為主要來(lái)源,該收藏閱讀的系統(tǒng)還包括:
[0192]截屏圖像獲取模塊,用于在智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分;
[0193]圖像存儲(chǔ)模塊,用于將截屏所得到的片段圖像存儲(chǔ)在智能移動(dòng)終端的操作系統(tǒng)指定的圖像庫(kù)中。
[0194]由于截屏操作是被所有主流設(shè)備和平臺(tái)支持的操作,不受前端應(yīng)用的限制,省去了用戶(hù)在不同的應(yīng)用里找各自不同位置的收藏按鈕的學(xué)習(xí)成本;可以通過(guò)讀取系統(tǒng)維護(hù)的存儲(chǔ)空間中的所有截屏圖像,將不同前端應(yīng)用中的收藏集中到該收藏閱讀應(yīng)用中;同時(shí)可以連續(xù)截屏,不需要在應(yīng)用間來(lái)回切換。
[0195]可以理解,上述兩個(gè)優(yōu)選的步驟是由操作系統(tǒng)完成,而不是由收藏閱讀的應(yīng)用完成。此外,在本發(fā)明智能移動(dòng)終端上收藏閱讀的方法中,上述兩個(gè)步驟并不是必要的。此外,可以理解,在本發(fā)明的其他實(shí)施方式中,圖像庫(kù)中片段圖像除了以截屏圖像作為來(lái)源外,該收藏閱讀應(yīng)用的輸入也可以是拍照所得的照片。優(yōu)選地,該智能移動(dòng)終端上收藏閱讀的系統(tǒng)還包括預(yù)處理模塊,用于對(duì)片段圖像進(jìn)行預(yù)處理,預(yù)處理包括識(shí)別和提取包含有效信息的區(qū)域,對(duì)文字區(qū)域做黑白二值化處理,以及進(jìn)行壓縮。
[0196]片段圖像在客戶(hù)端進(jìn)行預(yù)處理后上傳到服務(wù)器,有效降低上傳的數(shù)據(jù)量和服務(wù)器的運(yùn)算負(fù)擔(dān)。
[0197]優(yōu)選地,該智能移動(dòng)終端上收藏閱讀的系統(tǒng)還包括以下模塊:
[0198]關(guān)系還原記錄模塊,用于還原和記錄片段信息與最終的完整資源之間的關(guān)系,關(guān)系包括位置關(guān)系;
[0199]呈現(xiàn)模塊,用于將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),并且突出顯示片段信息。
[0200]友好的格式包括自動(dòng)滑動(dòng)到片段信息的位置使用戶(hù)能接著上次的位置繼續(xù)閱讀,和/或選中片段信息
[0201]還原和記錄片段信息與最終的完整資源之間的關(guān)系并將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),提供了更好的用戶(hù)體驗(yàn)。
[0202]作為優(yōu)選例,如圖5所示為智能移動(dòng)終端上收藏閱讀應(yīng)用的界面,為用戶(hù)提供了友好的格式。具體地說(shuō),如圖5所示,在使用該收藏閱讀應(yīng)用的不同階段,分別會(huì)出現(xiàn)如圖所示的界面a,界面b,界面C,界面d。
[0203]其中,界面a中可以設(shè)置是否打開(kāi)自動(dòng)分析新截屏這一功能,如果設(shè)置為打開(kāi),則閱讀收藏應(yīng)用獲取片段圖像就可以實(shí)現(xiàn)自動(dòng)檢測(cè)和篩選,不需要等待用戶(hù)打開(kāi)該閱讀收藏應(yīng)用,它爭(zhēng)取合適的時(shí)機(jī)自動(dòng)檢測(cè)到新的截屏圖像,初篩出有足夠信息的,進(jìn)行分析查找完整資源。當(dāng)然,除了自動(dòng)檢測(cè)和篩選片段圖像,也支持手動(dòng)導(dǎo)入截屏圖像。如果點(diǎn)擊界面a中的手動(dòng)導(dǎo)入鍵,則會(huì)跳轉(zhuǎn)到界面b。
[0204]界面b提供多個(gè)截屏圖像的縮略圖,供用戶(hù)選擇。優(yōu)選地,用戶(hù)可選中多個(gè)截屏圖像。此后點(diǎn)擊導(dǎo)入鍵,則會(huì)回到界面a并提示用戶(hù)正在分析截屏。分析截屏完畢后,選中的截屏所找到的文章以列表形式列出,并配有文章配圖。此時(shí)點(diǎn)擊找到的文章,則進(jìn)入界面C。
[0205]界面c打開(kāi)查找到的文章,并優(yōu)化移動(dòng)設(shè)備閱讀體驗(yàn)。此外,在界面c中可以設(shè)置字體或者分享該文章,也可以截屏跳轉(zhuǎn)到界面d。
[0206]在界面d中,用戶(hù)可以反饋文章是否找錯(cuò)了。
[0207]從界面c和d均可以后退到界面a,以閱讀其它通過(guò)自動(dòng)分析或手動(dòng)導(dǎo)入的截屏圖像所找到的文章。
[0208]第三、四、五實(shí)施方式是與本實(shí)施方式相對(duì)應(yīng)的方法實(shí)施方式,本實(shí)施方式可與第三、四、五實(shí)施方式互相配合實(shí)施。第三、四、五實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)在本實(shí)施方式中依然有效,為了減少重復(fù),這里不再贅述。相應(yīng)地,本實(shí)施方式中提到的相關(guān)技術(shù)細(xì)節(jié)也可應(yīng)用在第三、四、五實(shí)施方式中。
[0209]需要說(shuō)明的是,本發(fā)明各設(shè)備實(shí)施方式中提到的各單元都是邏輯單元,在物理上,一個(gè)邏輯單元可以是一個(gè)物理單元,也可以是一個(gè)物理單元的一部分,還可以以多個(gè)物理單元的組合實(shí)現(xiàn),這些邏輯單元本身的物理實(shí)現(xiàn)方式并不是最重要的,這些邏輯單元所實(shí)現(xiàn)的功能的組合才是解決本發(fā)明所提出的技術(shù)問(wèn)題的關(guān)鍵。此外,為了突出本發(fā)明的創(chuàng)新部分,本發(fā)明上述各設(shè)備實(shí)施方式并沒(méi)有將與解決本發(fā)明所提出的技術(shù)問(wèn)題關(guān)系不太密切的單元引入,這并不表明上述設(shè)備實(shí)施方式并不存在其它的單元。
[0210]需要說(shuō)明的是,在本專(zhuān)利的權(quán)利要求和說(shuō)明書(shū)中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0211]雖然通過(guò)參照本發(fā)明的某些優(yōu)選實(shí)施方式,已經(jīng)對(duì)本發(fā)明進(jìn)行了圖示和描述,但本領(lǐng)域的普通技術(shù)人員應(yīng)該明白,可以在形式上和細(xì)節(jié)上對(duì)其作各種改變,而不偏離本發(fā)明的精神和范圍。
【權(quán)利要求】
1.一種根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,包括步驟: 獲取片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分; 通過(guò)圖像識(shí)別從所述片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞; 根據(jù)所述粗略片段信息查找所述片段圖像所對(duì)應(yīng)的候選完整資源; 根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
2.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)粗略片段信息查找所述片段圖像所對(duì)應(yīng)的候選完整資源的步驟中,包括以下子步驟: 根據(jù)所述粗略片段信息在自建的搜索引擎和資源庫(kù)中搜索候選完整資源; 如果在自建的搜索引擎和資源庫(kù)中搜索不到候選完整資源,則調(diào)用第三方搜索的接□。
3.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)粗略片段信息查找所述片段圖像所對(duì)應(yīng)的候選完整資源的步驟中,包括以下子步驟: 判斷粗略片段信息中字或單詞的詞頻是否低于預(yù)定值; 去除粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞。
4.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)粗略片段信息查找所述片段圖像所對(duì)應(yīng)的候選完整資源的步驟中,包括以下子步驟: 對(duì)候選的完整資源直接進(jìn)行查找; 對(duì)于需要登錄或者授權(quán)的候選完整資源,嘗試以用戶(hù)設(shè)置的賬戶(hù)訪(fǎng)問(wèn)并進(jìn)行查找。
5.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)所述粗略片段信息查找到所述片段圖像所對(duì)應(yīng)的候選完整資源的步驟之后,還包括步驟: 迭代地比對(duì)所述粗略片段信息和所述候選完整資源,并根據(jù)比對(duì)結(jié)果利用候選完整資源對(duì)粗略片段信息進(jìn)行修正,根據(jù)修正后得到的片段信息查找更小范圍的候選完整資源。
6.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)候選完整資源確定最終的完整資源的步驟之后,還包括步驟: 在服務(wù)器中存儲(chǔ)最終的完整資源。
7.根據(jù)權(quán)利要求1所述的根據(jù)片段圖像獲取最終的完整資源的方法,其特征在于,在所述根據(jù)候選完整資源確定最終的完整資源的步驟之后,還包括步驟: 在客戶(hù)端的顯示屏上顯示最終的完整資源; 從客戶(hù)端的輸入裝置接收表示對(duì)最終的完整資源判斷結(jié)果的輸入,并根據(jù)該輸入修改所述提取粗略片段信息的方法和/或查找候選完整資源的方法。
8.一種智能移動(dòng)終端上收藏閱讀的方法,其特征在于,包括以下步驟: 自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像,并通過(guò)圖像識(shí)別從所述篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞; 根據(jù)所述粗略片段信息查找所述片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源; 根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
9.根據(jù)權(quán)利要求8所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像的步驟中,所述圖像庫(kù)中的片段圖像以截屏圖像為主要來(lái)源; 在所述自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像的步驟之前,還包括以下步驟:智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分; 將截屏所得到的片段圖像存儲(chǔ)在智能移動(dòng)終端的操作系統(tǒng)指定的圖像庫(kù)中。
10.根據(jù)權(quán)利要求8所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述從片段圖像中提取得到粗略片段信息的步驟中,所述粗略片段信息包括以下之一或其任一組合: 前端應(yīng)用名稱(chēng)和類(lèi) 型,前端應(yīng)用界面是否匹配已知模式,文字,鏈接,文字資源的來(lái)源網(wǎng)站,標(biāo)題,時(shí)間戳,作者; 在所述從片段圖像中提取得到粗略片段信息的步驟之后,還包括以下步驟: 判斷粗略片段信息的類(lèi)別,所述類(lèi)別包括文章的部分,論壇帖子的部分,社交網(wǎng)絡(luò)帖子的全部或部分,文章引言; 確定查找和獲取候選完整資源的方式。
11.根據(jù)權(quán)利要求8所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述自動(dòng)掃描圖像庫(kù),從中篩選出片段圖像的步驟中,根據(jù)以下任一項(xiàng)或其任一組合篩選出片段圖像: 圖像元數(shù)據(jù),所述圖像元數(shù)據(jù)不需要解碼像素信息即可讀出的圖像文件基本屬性; 小部分區(qū)域特征; 圖像整體特征。
12.根據(jù)權(quán)利要求9所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像的步驟之前,還包括步驟:收藏閱讀的應(yīng)用請(qǐng)求讀取所述圖像庫(kù)的權(quán)限; 在所述自動(dòng)掃描圖像庫(kù)的步驟中,在用戶(hù)打開(kāi)所述收藏閱讀的應(yīng)用之前,該收藏閱讀的應(yīng)用在后臺(tái)自動(dòng)檢測(cè)是否有新的截屏。
13.根據(jù)權(quán)利要求8所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述通過(guò)圖像識(shí)別從所述片段圖像中提取得到粗略片段信息的步驟之前,還包括步驟: 對(duì)所述片段圖像進(jìn)行預(yù)處理,所述預(yù)處理包括識(shí)別和提取包含有效信息的區(qū)域,對(duì)文字區(qū)域做黑白二值化處理,以及進(jìn)行壓縮。
14.根據(jù)權(quán)利要求8所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述根據(jù)候選完整資源確定最終的完整資源的步驟之后,還包括以下步驟: 還原和記錄片段信息與最終的完整資源之間的關(guān)系,所述關(guān)系包括位置關(guān)系; 將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),并且突出顯示片段信息;所述友好的格式包括自動(dòng)滑動(dòng)到片段信息的位置使用戶(hù)能接著上次的位置繼續(xù)閱讀,和/或選中所述片段信息。
15.根據(jù)權(quán)利要求8至14中任一項(xiàng)所述的智能移動(dòng)終端上收藏閱讀的方法,其特征在于,在所述通過(guò)圖像識(shí)別從所述片段圖像中提取得到粗略片段信息的步驟中,所述圖像識(shí)別為OCR文字識(shí)別。
16.一種根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,包括: 片段圖像獲取模塊,用于獲取片段圖像,所述片段圖像是以圖像形式展示的最終的完整資源的至少一部分; 提取模塊,用于通過(guò)圖像識(shí)別從所述片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞; 查找模塊,用于根據(jù)所述粗略片段信息查找所述片段圖像所對(duì)應(yīng)的候選完整資源; 最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
17.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,所述查找模塊包括以下子模塊: 自建查找子模塊,用于根據(jù)所述粗略片段信息在自建的搜索引擎和資源庫(kù)中搜索候選完整資源; 第三方查找子模塊,用于如果在自建的搜索引擎和資源庫(kù)中搜索不到候選完整資源時(shí),調(diào)用第三方搜索的接口。
18.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,所述查找模塊包括以下子模塊: 詞頻判斷子模塊,用于判斷粗略片段信息中字或單詞的詞頻是否低于預(yù)定值; 刪減子模塊,用于去除粗略片段信息中隨機(jī)的或者詞頻低于預(yù)定值的字或單詞。
19.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,所述查找模塊包括以下子模塊: 直接查找子模塊,用于對(duì)候選的完整資源直接進(jìn)行查找; 登陸查找子模塊,對(duì)于需要登錄或者授權(quán)的候選完整資源,嘗試以用戶(hù)設(shè)置的賬戶(hù)訪(fǎng)問(wèn)并進(jìn)行查找。
20.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,還包括迭代比對(duì)修正模塊,用于在所述查找模塊查找到所述片段圖像所對(duì)應(yīng)的候選完整資源之后,迭代地比對(duì)所述粗略片段信息和所述候選完整資源,并根據(jù)比對(duì)結(jié)果利用候選完整資源對(duì)粗略片段信息進(jìn)行修正,根據(jù)修正后得到的片段信息查找更小范圍的候選完整資源。
21.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,還包括存儲(chǔ)模塊,用于在確定最終的完整資源之后,在服務(wù)器中存儲(chǔ)最終的完整資源。
22.根據(jù)權(quán)利要求16所述的根據(jù)片段圖像獲取最終的完整資源的系統(tǒng),其特征在于,還包括以下模塊: 顯示模塊,用于在客戶(hù)端的顯示屏上顯示最終的完整資源;修正模塊,用于從客戶(hù)端的輸入裝置接收表示對(duì)最終的完整資源判斷結(jié)果的輸入,并根據(jù)該輸入修改所述提取粗略片段信息的方法和/或查找候選完整資源的方法。
23.一種智能移動(dòng)終端上收藏閱讀的系統(tǒng),其特征在于,包括: 提取模塊,用于在自動(dòng)掃描圖像庫(kù)并從中篩選出片段圖像后,通過(guò)圖像識(shí)別從所述篩選出的片段圖像中提取得到粗略片段信息,該粗略片段信息包括從片段圖像中被識(shí)別出的至少兩個(gè)字或單詞; 查找模塊,用于根據(jù)所述粗略片段信息查找所述片段圖像所對(duì)應(yīng)的閱讀資源作為候選完整資源; 最終完整資源確定模塊,用于根據(jù)候選完整資源確定最終的完整資源,其中,如果候選完整資源的數(shù)量多于I個(gè),則從各候選完整資源中選擇一個(gè)最接近的作為最終的完整資源。
24.根據(jù)權(quán)利要求23所述的智能移動(dòng)終端上收藏閱讀的系統(tǒng),其特征在于,在所述提取模塊中,所述圖像庫(kù)中的片段圖像以截屏圖像為主要來(lái)源,所述收藏閱讀的系統(tǒng)還包括: 截屏圖像獲取模塊,用于在智能移動(dòng)終端檢測(cè)到截屏信號(hào)時(shí),獲取顯示屏上當(dāng)前顯示的閱讀內(nèi)容的截屏圖像作為片段圖像,該片段圖像是以圖像形式展示的最終的完整資源的至少一部分; 圖像存儲(chǔ)模塊,用于將截屏所得到的片段圖像存儲(chǔ)在智能移動(dòng)終端的操作系統(tǒng)指定的圖像庫(kù)中。
25.根據(jù)權(quán)利要求23所述的智能移動(dòng)終端上收藏閱讀的系統(tǒng),其特征在于,還包括: 預(yù)處理模塊,用于對(duì)所述片段圖像進(jìn)行預(yù)處理,所述預(yù)處理包括識(shí)別和提取包含有效信息的區(qū)域,對(duì)文字區(qū)域做黑白二值化處理,以及進(jìn)行壓縮。
26.根據(jù)權(quán)利要求23所述的智能移動(dòng)終端上收藏閱讀的系統(tǒng),其特征在于,還包括以下模塊: 關(guān)系還原記錄模塊,用于還原和記錄片段信息與最終的完整資源之間的關(guān)系,所述關(guān)系包括位置關(guān)系; 呈現(xiàn)模塊,用于將最終的完整資源以友好的格式呈現(xiàn)給用戶(hù),并且突出顯示片段信息; 所述友好的格式包括自動(dòng)滑動(dòng)到片段信息的位置使用戶(hù)能接著上次的位置繼續(xù)閱讀,和/或選中所述片段信息。
【文檔編號(hào)】G06K9/20GK104021174SQ201410240761
【公開(kāi)日】2014年9月3日 申請(qǐng)日期:2014年5月30日 優(yōu)先權(quán)日:2014年5月30日
【發(fā)明者】白天 申請(qǐng)人:北京合輝信息技術(shù)有限公司