本公開涉及音頻轉(zhuǎn)換的技術(shù)領(lǐng)域,尤其涉及一種音頻信息處理的方法及裝置。
背景技術(shù):
在采訪和演講會等活動中,需要將即時的將音頻信息轉(zhuǎn)換為文本信息。在將音頻信息轉(zhuǎn)換為文本信息的過程中,需要使用具體的文件來存儲所述文本信息,針對不同的應(yīng)用目的,可以使用不同類型的文本格式的文件來存儲文本信息。使用.txt文本格式類型的優(yōu)點在于同樣的存儲文本信息所占用的存儲空間較?。皇褂?doc文本格式類型的優(yōu)點在于便于后期的修改和撰寫;使用.pdf文本格式的優(yōu)點在于便于印刷和在不同終端展示效果的一致性。在將音頻信息轉(zhuǎn)換為文本信息的過程中,在某些情況下,從始到終的使用一種類型的文本格式是無法滿足用戶的使用需求的。在現(xiàn)有技術(shù)中,若在此過程中更改文本格式的類型,是需要用戶進入相應(yīng)的應(yīng)用軟件中進行相關(guān)的設(shè)置的。在很多情況下,將音頻信息轉(zhuǎn)換為文本信息的過程是發(fā)生在現(xiàn)場的采訪和演講會中的,這就需要用戶在進行邊進行采訪或者邊聽演講,邊進行相應(yīng)的繁瑣復(fù)雜的設(shè)置操作,這給用戶帶來不良的用戶體驗。如何以簡單便捷的方式來解決上述問題,就成為了業(yè)界亟待解決的問題。
技術(shù)實現(xiàn)要素:
本公開公開實施例提供音頻信息處理的方法及裝置。所述技術(shù)方案如下:
根據(jù)本公開實施例的第一方面,提供一種音頻信息處理的方法,包括:
接收輸入的音頻信息;
將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
實時監(jiān)測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:該技術(shù)方案在處理音頻信息的文檔格式轉(zhuǎn)換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,所述接收輸入的音頻信息之前,所述方法還包括:
設(shè)置默認的文件格式;
所述將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,所述方法還包括:
當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:設(shè)置默認的文件格式可以在用戶未能及時的設(shè)置文件格式的情況下,妥善的保存音頻信息轉(zhuǎn)化的文本信息。
在一個實施例中,所述實時監(jiān)測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息;
實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;
實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,可增強獲取終端的手勢信息的魯棒性,增強本技術(shù)方案在各種應(yīng)用情景下的適用度。
在一個實施例中,所述實時監(jiān)測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件;
當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:克服了因為人手握持時抖動所產(chǎn)生的運動狀態(tài)信息的干擾和無意中的觸控所產(chǎn)生的觸控狀態(tài)信息,降低了非用戶操作意圖而產(chǎn)生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,所述判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配,包括:
篩選出所述終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據(jù)本公開實施例的第二方面,提供一種音頻信息處理的裝置,包括:
接收模塊,用于接收輸入的音頻信息;
轉(zhuǎn)化模塊,用于將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
監(jiān)測模塊,用于實時監(jiān)測終端接收到的手勢信息;
判斷模塊,用于判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
第一存儲模塊,用于當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:該技術(shù)方案在處理音頻信息的文檔格式轉(zhuǎn)換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,還包括:
所述接收輸入的音頻信息之前,還包括:
設(shè)置模塊,用于設(shè)置默認的文件格式;
所述將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,還包括:
第二存儲模塊,用于當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:設(shè)置默認的文件格式可以在用戶未能及時的設(shè)置文件格式的情況下,妥善的保存音頻信息轉(zhuǎn)化的文本信息。
在一個實施例中,所述監(jiān)測模塊,包括:
所述手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息;
第一監(jiān)測子模塊,用于實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;
第二監(jiān)測子模塊,用于實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,可增強獲取終端的手勢信息的魯棒性,增強本技術(shù)方案在各種應(yīng)用情景下的適用度。
在一個實施例中,所述監(jiān)測模塊,包括:
獲取子模塊,用于實時獲取終端接收到的手勢信息;
第一判斷子模塊,用于判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件;
舍棄子模塊,用于當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
第二判斷子模塊,用于當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:克服了因為人手握持時抖動所產(chǎn)生的運動狀態(tài)信息的干擾和無意中的觸控所產(chǎn)生的觸控狀態(tài)信息,降低了非用戶操作意圖而產(chǎn)生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,所述判斷模塊,包括:
篩選子模塊,用于篩選出所述終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
確定子模塊,用于當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
存儲子模塊,用于當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據(jù)本公開實施例的第三方面,提供一種音頻信息處理的裝置,所述裝置包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為:
接收輸入的音頻信息;
將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
實時監(jiān)測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:該技術(shù)方案在處理音頻信息的文檔格式轉(zhuǎn)換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實施例示出的一種音頻信息處理的方法的流程圖;
圖2是根據(jù)另一示例性實施例示出的一種音頻信息處理的方法的流程圖;
圖3是根據(jù)一示例性實施例示出的一種音頻信息處理的方法的步驟s13流程圖;
圖4是根據(jù)另一示例性實施例示出的一種音頻信息處理的方法的步驟s13的流程圖;
圖5是根據(jù)一示例性實施例示出的一種音頻信息處理的方法的步驟s14的流程圖;
圖6是根據(jù)一示例性實施例示出的一種音頻信息處理的裝置的框圖;
圖7是根據(jù)另一示例性實施例示出的一種音頻信息處理的裝置的框圖;
圖8是根據(jù)一示例性實施例示出的一種音頻信息處理的裝置的監(jiān)測模塊63的框圖;
圖9是根據(jù)另一示例性實施例示出的一種音頻信息處理的裝置的監(jiān)測模塊63的框圖;
圖10是根據(jù)一示例性實施例示出的一種音頻信息處理的裝置的判斷模塊64的框圖;
圖11是根據(jù)另一示例性實施例示出的一種音頻信息處理的裝置的框圖。
具體實施方式
這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實施例示出的一種音頻信息處理方法的流程圖,如圖1所示,該音頻信息處理的方法,包括以下步驟s11-s15:
在步驟s11中,接收輸入的音頻信息;
在步驟s12中,將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
在步驟s13中,實時監(jiān)測終端接收到的手勢信息;
在步驟s14中,判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
在步驟s15中,當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
在一個實施例中,接收輸入的音頻信息之前,先設(shè)置默認的文件格式;接收輸入的音頻信息;將該音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;該將該音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,當未監(jiān)測到該手勢信息時、或者當該接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將該文本信息按照該默認的文件格式存儲。
實時監(jiān)測終端接收到的手勢信息;該手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息;實時監(jiān)測該終端的運動狀態(tài)信息包括:實時通過該終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測該終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的該終端的圖像,對該圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定該終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的該終端的回聲定位信息,對該終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定該終端的運動狀態(tài)信息。實時監(jiān)測該終端的觸控狀態(tài)信息包括:實時監(jiān)測該終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。當該接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息匹配時,將該文本信息按照該預(yù)設(shè)的文件格式存儲。
實時獲取終端接收到的手勢信息;判斷該手勢信息是否滿足預(yù)設(shè)啟動條件;當該手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄該手勢信息。篩選出該終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;當該匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定該手勢信息與該存儲操作信息相匹配;當該手勢信息與該存儲操作信息相匹配時,將該文本信息按照該預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:在處理音頻信息的文檔格式轉(zhuǎn)換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,如圖2所示,在執(zhí)行步驟s11之前,可執(zhí)行如下步驟s21:
在步驟s21中,設(shè)置默認的文件格式;
在執(zhí)行步驟s12之后,還可執(zhí)行如下步驟s22:
在步驟s22中,當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
舉例而言,在接收輸入的音頻信息之前,提前設(shè)置默認的文件格式,通過該默認的文件格式來存儲文本信息。在音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,當未監(jiān)測到手勢信息時、或者當接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將該文本信息按照所述默認的文件格式存儲。
例如,在開始接收輸入的音頻信息之前,提前設(shè)置默認的文件格式為pdf。在開始音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,在未檢測到手勢信息、或接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將該文本信息按照pdf的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:設(shè)置默認的文件格式可以在用戶未能及時的設(shè)置文件格式的情況下,妥善的保存音頻信息轉(zhuǎn)化的文本信息。
在一個實施例中,如圖3所示,步驟13包括步驟s31或s32:
在步驟s31中,實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息。
在步驟s32中,實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
在一個實施例中,該手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息。
實時監(jiān)測終端接收到的手勢信息的方式分為三種:實時監(jiān)測終端的運動狀態(tài)信息、實時監(jiān)測終端的觸控狀態(tài)信息、實時監(jiān)測終端的運動狀態(tài)信息和觸控狀態(tài)信息。
第一種實時監(jiān)測終端接收到的手勢信息的方式:實時監(jiān)測該終端的運動狀態(tài)信息可以根據(jù)終端內(nèi)置的感應(yīng)裝置比如重力傳感器和/或陀螺儀來進行監(jiān)測。陀螺儀可以根據(jù)測量終端相對慣性空間的轉(zhuǎn)動運動信息,可以測量終端的偏轉(zhuǎn)、傾斜時的轉(zhuǎn)動角速度。重力傳感器可以監(jiān)測軸向的線性動作信息,能夠感知到加速力的變化;獲取終端的運動狀態(tài)信息還可以根據(jù)外設(shè)的攝像頭來拍攝終端的運動狀態(tài)信息,根據(jù)圖像分析處理方法,首先通過終端的形狀特征、顏色特征、角點特征和紋理特征中的一種或多種,來分析出拍攝的整幅畫面中終端的圖像信息,根據(jù)拍攝到的多幀圖像中的終端的圖像信息,連續(xù)分析在多幀畫面中終端的位置變換信息,從而得到終端的運動狀態(tài)信息;獲取終端的運動狀態(tài)信息還可以根據(jù)外設(shè)的回聲定位設(shè)備,利用定位設(shè)備發(fā)射出超聲波,通過折回的聲音來定向,即通過空間定向的方法來獲得終端的位置信息,然后通過在一個連續(xù)時間內(nèi)的回聲定位信息來獲得終端的運動狀態(tài)信息。
第二種實時監(jiān)測終端接收到的手勢信息的方式:實時監(jiān)測終端的觸控狀態(tài)信息可通過實時監(jiān)控終端的預(yù)設(shè)按鍵和觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。觸控狀態(tài)信息包括:雙擊、長按和預(yù)設(shè)的滑動軌跡。例如,通過監(jiān)檢預(yù)設(shè)按鍵是否發(fā)生了雙擊事件或者是長按事件;通過該監(jiān)測觸摸屏幕上是否發(fā)生了“l(fā)”型的觸控滑動軌跡;在監(jiān)測到預(yù)設(shè)按鍵發(fā)了長按事件的同時,檢測觸摸屏幕上是否發(fā)生了“z”型的觸控滑動軌跡。
第三種實時監(jiān)測終端接收到的手勢信息的方式:通過對上述的第一種實時監(jiān)測終端接收到的手勢信息的方式和第二種實時監(jiān)測終端接收到的手勢信息的方式的有機結(jié)合,即可得到第三種實時監(jiān)測終端接收到的手勢信息的方式。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:可以通過多種方式來獲得終端的手勢信息,增強了獲取終端的手勢信息的魯棒性,提升了本技術(shù)方案在各種應(yīng)用情景下的適用度。
在一個實施例中,如圖4所示,步驟13包括如下步驟s41-s44:
在步驟s41中,實時獲取終端接收到的手勢信息;
在步驟s42中,判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件,當未滿足時,執(zhí)行步驟s43,當滿足時執(zhí)行步驟s44;
在步驟s43中,當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
在步驟s44中,當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟。
舉例而言,在一個實施例中,監(jiān)測終端獲得的運動狀態(tài)信息和終端的觸控狀態(tài)信息中包含了很多由于用戶握持終端時不自覺的微抖動所產(chǎn)生的運動狀態(tài)信息和用戶無意中的觸控所產(chǎn)生的觸控狀態(tài)信息,且用戶無法避免在握持終端時不發(fā)生輕微的抖動和發(fā)生無意中的觸控,這些微抖動和無意中的觸控所產(chǎn)生的手勢信息并非是由用戶的操作意圖所產(chǎn)生的。
目前在業(yè)界,廣泛應(yīng)用在拍攝設(shè)備上的防抖動功能就是針對人們在握持設(shè)備下的微抖動而設(shè)計的,通過各種方法來補償人在握持設(shè)備時抖動而產(chǎn)生的誤差,來達到克服微抖動所帶來的影響。在本方案中不需要專門設(shè)計一套防抖動功能來克服人們在握持設(shè)備時發(fā)生的微抖動,只需要合理設(shè)計預(yù)設(shè)啟動條件來排除因為微抖動而產(chǎn)生的運動狀態(tài)信息即可,例如:設(shè)置預(yù)設(shè)啟動條件為達到預(yù)設(shè)運動狀態(tài)信息閾值。當監(jiān)測得到終端的運動狀態(tài)信息未滿足預(yù)設(shè)啟動條件,舍棄該運動狀態(tài)信息。對于無意中發(fā)生的觸控也可以通過設(shè)置預(yù)設(shè)啟動條件,例如長按時長的合理區(qū)間、雙擊的間隔時長和預(yù)設(shè)的滑動距離。當監(jiān)測得到終端的觸控狀態(tài)信息未滿足預(yù)設(shè)啟動條件,舍棄該觸控狀態(tài)信息。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:克服了因為人手握持時抖動所產(chǎn)生的運動狀態(tài)信息的干擾和無意中的觸控所產(chǎn)生的觸控狀態(tài)信息,降低了非用戶操作意圖而產(chǎn)生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,如圖5所示,步驟14還包括如下步驟s51-s53:
在步驟s51中,篩選出所述終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
在步驟s52中,當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
在步驟s53中,當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
在預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中,根據(jù)該終端的手勢信息,進行匹配,篩選出匹配度最高的存儲操作信息,該存儲操作信息用來更改存儲文檔的文件格式。
根據(jù)系統(tǒng)預(yù)設(shè)的匹配度閾值來排除匹配度過低的存儲操作信息。當該匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,才確定該手勢信息與所述存儲操作信息相匹配。當該匹配度最高的存儲操作信息的匹配度的數(shù)值小于等于預(yù)設(shè)的匹配度閾值時,確定該手勢信息與所述存儲操作信息不匹配。
當該手勢信息與該存儲操作信息相匹配時,將該文本信息按照該預(yù)設(shè)的文件格式存儲。
在本技術(shù)方案中,可選的,當手勢信息與存儲操信息作相匹配后,將文本信息按照預(yù)設(shè)的文檔格式存儲。其中,該文本信息可包括所有的文本信息,還可包括在該手勢信息與該存儲操作信息相匹配之后產(chǎn)生的文本信息。
主要文檔格式包括:.txt(純文字文檔)、.rtf(豐富文本格式)、.doc(微軟word文檔)、.xls(微軟excel表格)、.ppt(微軟powerpoint演示文稿)、.htm/html(網(wǎng)頁)、.wpd(corelwordperfect文檔)以及.pdf(可移植文檔格式)等。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可提升終端的手勢信息的準確度。
在一個實施例中,圖6是根據(jù)一示例性實施例示出的一種音頻信息處理的框圖。如圖6所示,該裝置包括接收模塊61、轉(zhuǎn)化模塊62、監(jiān)測模塊63、第一存儲模塊64和第一存儲模塊65。
該接收模塊61被配置為接收輸入的音頻信息;
該轉(zhuǎn)化模塊62被配置為將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
該監(jiān)測模塊63被配置為實時監(jiān)測終端接收到的手勢信息;
該判斷模塊64被配置為判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
該第一存儲模塊65被配置為當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:本公開的實施例提供的技術(shù)方案可以包括以下有益效果:該技術(shù)方案在音頻信息處理的文檔格式轉(zhuǎn)換方面提供了更加便捷的方法,提升了文檔格式變換的操作的便捷性和效率值,從而提升了用戶的使用體驗。
在一個實施例中,如圖7所示,還包括設(shè)置模塊71和計算子模塊72:
該設(shè)置模塊71被配置為在所述接收輸入的音頻信息之前,設(shè)置默認的文件格式;
該第二存儲模塊72被配置為在將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:設(shè)置默認的文件格式可以在用戶未能及時的設(shè)置文件格式的情況下,妥善的保存音頻信息轉(zhuǎn)化的文本信息。
在一個實施例中,如圖8所示,該監(jiān)測模塊63包括第二獲取模塊81和第二判斷模塊82:
該第一監(jiān)測子模塊81被配置為實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息。
該第二監(jiān)測子模塊82被配置為實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:通過多種方式來獲得終端的手勢信息,增強了獲取終端的手勢信息的魯棒性,提升了本技術(shù)方案在各種應(yīng)用情景下的適用度。
在一個實施例中,如圖9所示,該第一存儲模塊64包括獲取子模塊91、第一判斷子模塊92、舍棄子模塊93和第二判斷子模塊94:
該獲取子模塊91被配置為實時獲取終端接收到的手勢信息;
該第一判斷子模塊92被配置為判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件;
該舍棄子模塊93被配置為當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
該第二判斷子模塊94被配置為當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:克服了因為人手握持時抖動所產(chǎn)生的運動狀態(tài)信息的干擾和無意中的觸控所產(chǎn)生的觸控狀態(tài)信息,降低了非用戶操作意圖而產(chǎn)生的手勢信息的干擾,提高了本方案的實用性和用戶的操作體驗。
在一個實施例中,如圖10所示,該第一存儲模塊64還包括篩選子模塊101、確定子模塊102和存儲子模塊103:
該篩選子模塊101被配置為篩選出所述終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
該確定子模塊102被配置為當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
該存儲子模塊103被配置為當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:排除匹配度過低的手勢信息的干擾,可以提升終端的手勢信息的準確度。
根據(jù)本公開實施例的第三方面,提供一種音頻信息處理的裝置,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,處理器被配置為:
接收輸入的音頻信息;
將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
實時監(jiān)測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
上述處理器還可被配置為:
所述接收輸入的音頻信息之前,所述方法還包括:
設(shè)置默認的文件格式;
所述將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,所述方法還包括:
當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
所述實時監(jiān)測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息;
實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;
實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
所述實時監(jiān)測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件;
當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟
所述當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲,包括:
篩選出所述終端的手勢信息與預(yù)設(shè)的存儲文件格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
圖11是根據(jù)一示例性實施例示出的一種用于音頻信息處理的裝置1200的框圖,該裝置適用于終端設(shè)備。例如,裝置1200可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
參照圖11,裝置1200可以包括以下一個或多個組件:處理組件1202,存儲器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(i/o)的接口1212,傳感器組件1214,以及通信組件1216。
處理組件1202通常控制裝置1200的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理元件1202可以包括一個或多個處理器1220來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個或多個模塊,便于處理組件1202和其他組件之間的交互。例如,處理部件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
存儲器1204被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備1200的操作。這些數(shù)據(jù)的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器1204可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(sram),電可擦除可編程只讀存儲器(eeprom),可擦除可編程只讀存儲器(eprom),可編程只讀存儲器(prom),只讀存儲器(rom),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件1206為裝置1200的各種組件提供電力。電源組件1206可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件1208包括在所述裝置1200和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(lcd)和觸摸面板(tp)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還監(jiān)測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件1208包括一個前置攝像頭和/或后置攝像頭。當設(shè)備1200處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件1210被配置為輸出和/或輸入音頻信號。例如,音頻組件1210包括一個麥克風(mic),當裝置1200處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器1204或經(jīng)由通信組件1216發(fā)送。在一些實施例中,音頻組件1210還包括一個揚聲器,用于輸出音頻信號。
i/o接口1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件1214包括一個或多個傳感器,用于為裝置1200提供各個方面的狀態(tài)評估。例如,傳感器組件1214可以監(jiān)測到設(shè)備1200的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置1200的顯示器和小鍵盤,傳感器組件1214還可以監(jiān)測裝置1200或裝置1200一個組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來在沒有任何的物理接觸時監(jiān)測附近物體的存在。傳感器組件1214還可以包括光傳感器,如cmos或ccd圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件1214還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件1216被配置為便于裝置1200和其他設(shè)備之間有線或無線方式的通信。裝置1200可以接入基于通信標準的無線網(wǎng)絡(luò),如wifi,2g或3g,或它們的組合。在一個示例性實施例中,通信部件1216經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信部件1216還包括近場通信(nfc)模塊,以促進短程通信。例如,在nfc模塊可基于射頻識別(rfid)技術(shù),紅外數(shù)據(jù)協(xié)會(irda)技術(shù),超寬帶(uwb)技術(shù),藍牙(bt)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,裝置1200可以被一個或多個應(yīng)用專用集成電路(asic)、數(shù)字信號處理器(dsp)、數(shù)字信號處理設(shè)備(dspd)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器1204,上述指令可由裝置1200的處理器820執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是rom、
一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的指令由裝置1200的處理器執(zhí)行時,使得裝置1200能夠執(zhí)行圖1所示的方法,所述方法包括:
接收輸入的音頻信息;
將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息;
實時監(jiān)測終端接收到的手勢信息;
判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配;
當匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
所述存儲介質(zhì)中的指令還可以包括:
所述接收輸入的音頻信息之前,所述方法還包括:
設(shè)置默認的文件格式;
所述將所述音頻信息轉(zhuǎn)化為相應(yīng)的文本信息之后,所述方法還包括:
當未監(jiān)測到所述手勢信息時或者當所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息不匹配時,將所述文本信息按照所述默認的文件格式存儲。
所述實時監(jiān)測終端接收到的手勢信息,包括:
所述手勢信息包括終端的運動狀態(tài)信息和/或終端的觸控狀態(tài)信息;
實時監(jiān)測所述終端的運動狀態(tài)信息包括:實時通過所述終端中內(nèi)置的重力傳感器、陀螺儀中的任一者多者監(jiān)測所述終端的運動狀態(tài)信息;或者實時獲取外部攝像頭攝取到的所述終端的圖像,對所述圖像中的終端進行位置分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;或者實時監(jiān)測外部回聲定位裝置得到的所述終端的回聲定位信息,對所述終端的回聲定位信息進行分析,根據(jù)分析結(jié)果確定所述終端的運動狀態(tài)信息;
實時監(jiān)測所述終端的觸控狀態(tài)信息包括:實時監(jiān)測所述終端的預(yù)設(shè)按鍵、觸摸屏幕中的任一者或多者的觸控狀態(tài)信息。
所述實時監(jiān)測終端接收到的手勢信息,包括:
實時獲取終端接收到的手勢信息;
判斷所述接收到的手勢信息是否滿足預(yù)設(shè)啟動條件;
當所述接收到的手勢信息未滿足預(yù)設(shè)啟動條件時,舍棄所述接收到的手勢信息;
當所述接收到的手勢信息滿足預(yù)設(shè)啟動條件時,繼續(xù)執(zhí)行判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配的步驟。
所述判斷所述接收到的手勢信息與預(yù)設(shè)的文件格式對應(yīng)的存儲操作信息是否匹配,包括:
篩選出所述終端的手勢信息與預(yù)設(shè)的存儲操作格式對應(yīng)的存儲操作信息庫中匹配度最高的存儲操作信息;
當所述匹配度最高的存儲操作信息的匹配度的數(shù)值大于預(yù)設(shè)的匹配度閾值時,確定所述手勢信息與所述存儲操作信息相匹配;
當所述手勢信息與所述存儲操作信息相匹配時,將所述文本信息按照所述預(yù)設(shè)的文件格式存儲。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。