專利名稱:一種實現(xiàn)文本短信語音播放的系統(tǒng)及方法
技術領域:
本發(fā)明涉及語音短信的實現(xiàn),尤其涉及的是,一種基于語音庫在終端實現(xiàn)文本短信語音播放的系統(tǒng)及方法。
背景技術:
隨著移動通信技術的發(fā)展,播放語音短消息成為手機終端的一個功能。目前,實現(xiàn)語音短信的方法有很多種,如直接錄制語音的方法發(fā)送,通過語音網(wǎng)關實現(xiàn)的方法等等。
這些實現(xiàn)方法由于在設計上和實現(xiàn)上都非常復雜,需要傳送大量的語音數(shù)據(jù),因此在實現(xiàn)上容易出現(xiàn)問題,如不能正確播放,播放語音不完整等等。因此給用戶的使用帶來了極大的不便。
因此,現(xiàn)有技術存在缺陷,需要改進。
發(fā)明內容
本發(fā)明的目的在于提供一種實現(xiàn)文本短信語音播放的系統(tǒng)及方法,發(fā)送端只需發(fā)送文字信息,就可以在接收端實現(xiàn)語音短消息的功能,不需要傳送大量的語音數(shù)據(jù)。
本發(fā)明的技術方案如下一種實現(xiàn)文本短信語音播放的方法,其包括步驟101、在終端中設置語音庫,在語音庫中組織有若干語音文件;102、發(fā)送方設置短消息的驅動碼,用于標識所述短消息為語音短消息;在終端內設立特征碼表,其中設置語音特征碼,指向所述語音庫的各個語音文件;103、接收方接收到短消息后,判斷其中是否包含所述驅動碼,如果包含,則執(zhí)行步驟104,否則按普通文本短消息處理;104、從所述語音庫中提取所述短消息對應的語音文件進行播放。
所述的方法,其中,步驟104具體包括201、解析所述短消息,得到所述語音特征碼;202、根據(jù)所述語音特征碼,在所述特征碼表中查詢得到其指向的語音文件;203、從所述語音庫中提取所述語音文件進行播放。
所述的方法,其中,步驟101中,所述語音庫中還設置語音基元文件;并且,步驟104還包括204、當終端在語音庫中無法匹配到語音文件,則按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件;205、合成語音并播放。
所述的方法,其中,步驟103之前還包括步驟發(fā)送短消息時,用戶輸入所述驅動碼,或者,用戶選擇發(fā)送語音短消息的功能,終端自動添加所述驅動碼。
一種實現(xiàn)文本短信語音播放的系統(tǒng),其包括短消息處理模塊和播放模塊,其中,所述系統(tǒng)還包括驅動碼模塊、判斷模塊、提取模塊、庫管理模塊和語音庫模塊;所述驅動碼模塊與所述判斷模塊相連接,用于設置和存儲標識所述短消息為語音短消息的驅動碼;所述判斷模塊還分別與所述短消息處理模塊、所述提取模塊相連接,用于判斷接收的短消息中包含所述驅動碼,則啟動所述提取模塊;所述庫管理模塊分別與所述語音庫模塊、所述提取模塊相連接,用于管理存儲在所述語音庫模塊的語音文件;所述提取模塊還與所述播放模塊相連接,用于通過所述庫管理模塊提取所述語音文件,并由所述播放模塊播放。
所述的系統(tǒng),其中,所述庫管理模塊設置錄音單元、查找單元、存儲單元、編輯單元中的一個或幾個,分別提供給用戶對語音庫進行操作,所述操作包括對語音文件的錄音、查找、存儲、編輯中的一個或幾個。
所述的系統(tǒng),其中,所述編輯至少包括增加、刪除、替換、修改語音文件其中之一。
所述系統(tǒng),其中,還包括特征碼模塊和解析模塊,所述特征碼模塊與所述解析模塊相連接,用于設置和存儲語音特征碼,所述語音特征碼指向所述語音庫模塊的各個語音文件;所述解析模塊設置在所述判斷模塊與所述提取模塊之間,用于解析所述短消息,得到所述語音特征碼,發(fā)送到所述提取模塊。
所述系統(tǒng),其中,所述播放模塊還包括語音合成單元,并且,所述語音庫還存儲有語音基元文件;所述提取模塊還用于按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件,發(fā)送到所述語音合成單元;所述語音合成單元用于將各個語音基元文件合成語音并播放。
采用上述方案,本發(fā)明通過在手機等終端上預存語音數(shù)據(jù)和語音短消息,在收到播放語音短消息的驅動短消息后,相應播放語音文件;這樣,發(fā)送端只需發(fā)送文字信息,就可以在接收端實現(xiàn)語音短消息的功能;因此具有播放方法簡潔、實現(xiàn)簡單、易于使用、擴展性好等優(yōu)點,不需要傳送大量的語音數(shù)據(jù),有效減輕了網(wǎng)絡負擔,易于推廣應用。
圖1為本發(fā)明方法的一種實施方式的流程圖;圖2為本發(fā)明系統(tǒng)的第一種實施方式的結構示意圖;圖3為本發(fā)明系統(tǒng)的第二種實施方式的結構示意圖;圖4為本發(fā)明系統(tǒng)的第三種實施方式的結構示意圖。
具體實施例方式
以下對本發(fā)明的較佳實施例加以詳細說明。
如圖1所示,本發(fā)明提供了一種基于語音庫在終端實現(xiàn)文本短信語音播放的方法,其包括步驟
101、在終端中設置語音庫,在語音庫中組織有若干語音文件;該語音文件可以包括預先錄好的真人發(fā)音的語句。例如,可以按照某種類別對各種短消息進行分類并且預先存儲,形成語音短消息庫。
語音庫是本發(fā)明必須的組成部分,其中存儲了語音文件,一份語音文件可以是一段樂曲、一首歌,也可以是用戶自定義的一個語音數(shù)據(jù)文件,例如一段用戶錄音等等;終端在出廠時可以預先執(zhí)行步驟101。語音庫中可以存儲了多個甚至是大量的語音文件。其中,步驟101還可以包括,用戶管理所述語音庫的語音文件。
102、發(fā)送方設置短消息的驅動碼,用于標識所述短消息為語音短消息。在發(fā)送短消息時,用戶可以自行輸入所述驅動碼;或者,用戶選擇發(fā)送語音短消息的功能時,終端自動添加所述驅動碼。對于不同的終端或者廠家,還可以設置不同的驅動碼進行識別。在終端內設立特征碼表,其中設置語音特征碼,指向所述語音庫的各個語音文件。
103、接收方接收到短消息后,判斷其中是否包含所述驅動碼,如果包含,則執(zhí)行步驟104,否則按普通文本短消息進行處理。當終端接收到的短消息包括了所述驅動碼時,終端就按照語音短消息進行處理,這樣就可以避免傳輸包含大量數(shù)據(jù)的語音文件。
104、從所述語音庫中提取所述短消息對應的語音文件進行播放;具體處理中,可以指定語音文件的位置或連接,由終端的播放系統(tǒng)直接調用語音文件進行播放;也可以把語音文件復制到終端的播放系統(tǒng)進行播放;本發(fā)明方法對此并無額外的限制。
步驟104具體包括201、解析所述短消息,得到所述語音特征碼;202、根據(jù)所述語音特征碼,在所述特征碼表中查詢得到其指向的語音文件;203、從所述語音庫中提取所述語音文件進行播放。
并且,在步驟101中,所述語音庫中還可以設置了語音基元文件;即為各個文字設置了對應的語音信息,可以用于將文字以語音形式播放。
當特征碼無法匹配到語音庫中的語音文件時,步驟104還包括204、當終端在語音庫中無法匹配到語音文件,則按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件;205、合成語音并播放。
簡單地說,語音合成的實施已經(jīng)進入文字-語音轉換(TTS)階段,其功能模塊可以簡單分為文本分析、韻律建模和語音合成。其中,語音合成的主要功能是根據(jù)文本分析、韻律建模的結果,從原始語音庫中取出相應的語音基元,利用特定的語音合成技術對語音基元進行韻律特性的調整和修改,最終合成出符合要求的語音。具體地語音合成屬于現(xiàn)有技術,本發(fā)明在此不再贅述。
在上述本發(fā)明方法的基礎上,如圖2所示,本發(fā)明還提供了一種基于語音庫在移動終端實現(xiàn)文本短信語音播放的系統(tǒng),其包括短消息處理模塊、播放模塊、驅動碼模塊、判斷模塊、提取模塊、庫管理模塊和語音庫模塊;短消息處理模塊接收短消息,判斷模塊判斷該短消息屬于語音短消息,則啟動提取模塊,通過庫管理模塊從語音庫模塊中找到并提取對應的語音文件,并由所述播放模塊進行播放。
其中,在所述驅動碼模塊設置和存儲了標識所述短消息為語音短消息的驅動碼;實際應用中,用戶或廠家可以自定義、調整所述驅動碼。所述驅動碼模塊也可以作為一個驅動碼功能單元,設置在所述判斷模塊中。
所述判斷模塊與所述驅動碼模塊連接,根據(jù)接收的短消息是否包含所述驅動碼,判斷該短消息是否屬于語音短消息。
所述庫管理模塊分別與所述語音庫模塊、所述提取模塊相連接,用于管理存儲在所述語音庫模塊的語音文件;語音庫模塊具體存儲的語音文件如本發(fā)明方法中所述,在此不再贅述。具體地說,所述庫管理模塊設置錄音單元、查找單元、存儲單元、編輯單元中的一個或幾個,分別提供給用戶對語音庫進行操作,所述操作包括對語音文件的錄音、查找、存儲、編輯中的一個或幾個。分別用于實現(xiàn)語音文件的錄音、查找、存儲、編輯等各種功能;其中,所述編輯至少包括增加、刪除、替換、修改語音文件其中之一,還可以在此基礎上實現(xiàn)各種擴充的編輯功能。
所述提取模塊還與所述播放模塊相連接,用于通過所述庫管理模塊提取存儲在所述語音庫模塊的語音文件,并由所述播放模塊播放。在實際應用中,所述提取模塊可以設置為所述播放模塊內部的提取單元,用于指向所述語音文件、由所述播放模塊調用所述語音文件并播放,這樣可以省略文件的提取、復制等開銷,提高系統(tǒng)效率。
上述系統(tǒng)的各種實施例中,所述系統(tǒng)還包括特征碼模塊和解析模塊,如圖3所示,所述特征碼模塊與所述解析模塊相連接,用于設置和存儲語音特征碼,所述語音特征碼指向所述語音庫模塊的各個語音文件;所述特征碼模塊可以管理一張?zhí)卣鞔a表,該表用于設置和存儲語音特征碼。在實際應用中,所述特征碼模塊可以設置為所述解析模塊的內部功能單元。
所述解析模塊設置在所述判斷模塊與所述提取模塊之間,用于解析所述短消息,得到所述語音特征碼,發(fā)送到所述提取模塊;所述提取模塊還用于根據(jù)所述語音特征碼,提取其指向的語音文件,并由所述播放模塊播放。
當然,也可以將所述解析模塊和所述判斷模塊一體設置,將判斷模塊作為解析模塊的一個功能單元,此時,當接收到普通短消息后,解析模塊對該條短消息的內容進行解析,分析該條短消息是否是播放語音短消息的驅動短消息,如果是,則交由播放模塊播放對應的語音短消息,否則交由短消息處理模塊作為普通短消息進行處理。
上述系統(tǒng)的各種實施例中,所述系統(tǒng)的播放模塊還包括語音合成單元,并且,所述語音庫還用于存儲語音基元文件;所述提取模塊還用于按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件,發(fā)送到所述語音合成單元;所述語音合成單元用于將各個語音基元文件合成語音并播放。
如圖4所示,是本發(fā)明所述系統(tǒng)的又一種實施方式,其中,所述判斷模塊內置了驅動碼單元,所述解析模塊內置了特征碼單元,所述播放模塊內置了提取單元和語音合成單元;分別實現(xiàn)各項上述功能。
以下對本發(fā)明的基于語音庫的語音短信方法和系統(tǒng)做出具體說明,主要包括以下步驟(1)目標終端用戶開機后庫管理模塊初始化,初始化語音庫。
(2)目標終端用戶收到驅動短消息后,由解析模塊對該條驅動短消息進行解析,解析出語音短消息的語音特征碼。語音特征碼主要是起到標示、索引作用,用來從語音庫中提取對應文件的。
例如,庫管理模塊可以維護這樣一張?zhí)卣鞔a表文件編號特征碼語音文件名語音文件1 xnkl newyearhappy nyh.mid2. Gnh gnh gnh.mp33. ......
當然,也可以不包括語音文件名的表項。
例如,庫文件組織如下Asdjfk.mp3bie.mid......
gnh.mp3......
nv.mmfnvh.mid......
如果解析出語音特征碼是gnh,那么查找過程可以是這樣的根據(jù)語音特征碼gnh去查找表文件,可以查到對應文件名為gnh.mp3,再從語音庫中提取該文件進行播放。
(3)庫管理模塊根據(jù)語音短消息特征碼,從語音庫中提取對應的短消息的語音文件。
(4)播放模塊對這個語音文件進行播放。
實施例A一臺進入CDMA服務網(wǎng)絡的終端,收到了一條短消息,內容是“yydxxnkl”,則首先由解析模塊對該條短消息進行解析,經(jīng)過解析模塊的分析,發(fā)現(xiàn)該條短消息的前綴為“yydx”,識別這條短消息是一條語音短消息的驅動短消息,并解析出這條語音短消息語音特征碼為“xnkl”。庫管理模塊根據(jù)“xnkl”這個語音特征碼從語音庫中找出對應的語音文件,播放模塊播放這個語音文件,用戶從終端中聽到了該條短消息的語音“新年快樂”。同時這條驅動短消息存儲在短消息處理模塊。是預先設置的,可以進行編輯,如刪除,增加,修改等,由庫管理模塊對語音文件和特征碼進行管理。比如說可以設想這樣一種實現(xiàn),語音庫的一條記錄可以采取下列形式存在編號特征碼語音文件名 語音文件1 xnkl newyearhappy nyh.mid2. Gnh gnh gnh.mp3另外,庫管理模塊可由用戶通過操作界面激活,然后對其內容進行操作,如修改語音文件名,將上述記錄2中的語音文件名gnh改為cjh,再如,可以整條刪除一條記錄,如把編號為1的記錄全部刪除掉。
實施例B一臺進入GSM服務網(wǎng)絡的終端,收到了一條短消息,內容是“祝您節(jié)日快樂”,則首先由解析模塊對該條短消息進行解析,經(jīng)過解析模塊的分析,發(fā)現(xiàn)該條短消息是一條普通短消息,則交由短消息處理模塊作為普通短消息進行處理。
實施例C一臺CDMA/GSM雙模終端在CDMA網(wǎng)絡服務內收到了一條短消息,內容是“yydx端午節(jié)快樂王二!”,則首先由解析模塊對該條短消息進行解析,經(jīng)過解析模塊的分析,發(fā)現(xiàn)該條短消息的前綴為“yydx”,識別這條短消息是一條語音短消息的驅動短消息,并解析出這條語音短消息語音特征碼為“端午節(jié)快樂王二”或“端午節(jié)快樂王二!”。
庫管理模塊根據(jù)“端午節(jié)快樂王二”這個語音特征碼,可以根據(jù)特征碼表,先從語音庫中去尋找對應的語音文件,在未能找到對應的語音文件的情況下,再從語音庫中提取語音基元文件,例如端午節(jié)、快樂、王、二的語音文件,或者提取每個字的語音基元文件,甚至可以包括標點符號“!”的語音基元文件,各個標點符號具體可以表現(xiàn)為不同時長的停頓等;并通過語音合成,將這些文件合成“端午節(jié)快樂王二”的語音文件,由播放模塊進行播放。
也可以直接從語音庫中提取語音基元文件,并通過語音合成,將這些文件合成“端午節(jié)快樂王二”的語音文件,由播放模塊進行播放。
在合成語音的時候,還可以根據(jù)用戶的具體選擇,增加各種個性化方案,例如男聲、女生、小孩聲等等;還可以配上背景音樂,例如重低音、爵士樂等等。對上面的實施例C而言,如果用戶自定義王二為男性,則收到其語音短消息時,采用男聲說出“端午節(jié)快樂王二”,同時可以配上一段樂曲。
在具體實施中,標點符號也可以不作為語音特征碼處理;還可以給語音文件,如一段音樂,設置與語音基元文件相區(qū)別的語音特征碼,便于終端判斷是否需要執(zhí)行語音合成的相關功能,便于提高系統(tǒng)效率,具體實現(xiàn)的方式很多,在此不再贅述。
在存儲設備硬件成本大為降低的情況下,采用本發(fā)明所述方法和系統(tǒng),將語音數(shù)據(jù)存放在終端中,為手機等終端設備播放語音短信提供一種途徑,例如可以通過電腦或電話發(fā)送文本短信,在手機終端設備接收到一條短消息后,首先分析該條短消息是普通短消息還是語音短消息的驅動短消息,如果該條短消息經(jīng)過解析確認是語音短消息的驅動短消息,則按照解析的內容從語音庫選擇該條短消息的對應語音進行播放。通過在手機終端上預存語音數(shù)據(jù)和語音短消息,在收到播放語音短消息的驅動短消息后,相應播放語音文件;這樣,發(fā)送端只需發(fā)送文字信息,就可以在接收端實現(xiàn)語音短消息的功能;因此具有播放方法簡潔、實現(xiàn)簡單、易于使用、擴展性好等優(yōu)點,不需要傳送大量的語音數(shù)據(jù),有效減輕了網(wǎng)絡負擔,易于推廣應用。
例如,采用本發(fā)明方法,當手機或其他終端設備接收到語音短消息的驅動短消息后,可以從短消息語音庫中取出該條短消息的語音文件進行播放。
應當理解的是,對本領域普通技術人員來說,可以根據(jù)上述說明加以改進或變換,而所有這些改進和變換都應屬于本發(fā)明所附權利要求的保護范圍。
權利要求
1.一種實現(xiàn)文本短信語音播放的方法,其包括步驟101、在終端中設置語音庫,在語音庫中組織有若干語音文件;102、發(fā)送方設置短消息的驅動碼,用于標識所述短消息為語音短消息;在終端內設立特征碼表,其中設置語音特征碼,指向所述語音庫的各個語音文件;103、接收方接收到短消息后,判斷其中是否包含所述驅動碼,如果包含,則執(zhí)行步驟104,否則按普通文本短消息處理;104、從所述語音庫中提取所述短消息對應的語音文件進行播放。
2.根據(jù)權利要求1所述的方法,其特征在于,步驟104具體包括201、解析所述短消息,得到所述語音特征碼;202、根據(jù)所述語音特征碼,在所述特征碼表中查詢得到其指向的語音文件;203、從所述語音庫中提取所述語音文件進行播放。
3.根據(jù)權利要求2所述的方法,其特征在于,步驟101中,所述語音庫中還設置語音基元文件;并且,步驟104還包括204、當終端在語音庫中無法匹配到語音文件,則按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件;205、合成語音并播放。
4.根據(jù)權利要求1至3任一所述的方法,其特征在于,步驟103之前還包括步驟發(fā)送短消息時,用戶輸入所述驅動碼,或者,用戶選擇發(fā)送語音短消息的功能,終端自動添加所述驅動碼。
5.一種實現(xiàn)文本短信語音播放的系統(tǒng),其包括短消息處理模塊和播放模塊,其特征在于,所述系統(tǒng)還包括驅動碼模塊、判斷模塊、提取模塊、庫管理模塊和語音庫模塊;所述驅動碼模塊與所述判斷模塊相連接,用于設置和存儲標識所述短消息為語音短消息的驅動碼;所述判斷模塊還分別與所述短消息處理模塊、所述提取模塊相連接,用于判斷接收的短消息中包含所述驅動碼,則啟動所述提取模塊;所述庫管理模塊分別與所述語音庫模塊、所述提取模塊相連接,用于管理存儲在所述語音庫模塊的語音文件;所述提取模塊還與所述播放模塊相連接,用于通過所述庫管理模塊提取所述語音文件,并由所述播放模塊播放。
6.根據(jù)權利要求5所述的系統(tǒng),其特征在于,所述庫管理模塊設置錄音單元、查找單元、存儲單元、編輯單元中的一個或幾個,分別提供給用戶對語音庫進行操作,所述操作包括對語音文件的錄音、查找、存儲、編輯中的一個或幾個。
7.根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述編輯至少包括增加、刪除、替換、修改語音文件其中之一。
8.根據(jù)權利要求5至7任一所述系統(tǒng),其特征在于,還包括特征碼模塊和解析模塊,所述特征碼模塊與所述解析模塊相連接,用于設置和存儲語音特征碼,所述語音特征碼指向所述語音庫模塊的各個語音文件;所述解析模塊設置在所述判斷模塊與所述提取模塊之間,用于解析所述短消息,得到所述語音特征碼,發(fā)送到所述提取模塊。
9.根據(jù)權利要求8所述系統(tǒng),其特征在于,所述播放模塊還包括語音合成單元,并且,所述語音庫還存儲有語音基元文件;所述提取模塊還用于按照所述短消息各文字的順序,從所述語音庫中提取對應的各個語音基元文件,發(fā)送到所述語音合成單元;所述語音合成單元用于將各個語音基元文件合成語音并播放。
全文摘要
本發(fā)明公開了一種實現(xiàn)文本短信語音播放的系統(tǒng)及方法,所述方法包括步驟101、在終端中設置語音庫,其中組織有若干語音文件;102、發(fā)送方設置短消息的驅動碼,用于標識短消息為語音短消息;103、接收方接收到短消息后,判斷其中包含驅動碼,則執(zhí)行步驟104;104、從語音庫中提取短消息對應的語音文件進行播放。據(jù)此,通過在手機終端上預存語音數(shù)據(jù)和語音短消息,在收到播放語音短消息的驅動短消息后,相應播放語音文件;這樣,發(fā)送端只需發(fā)送文字信息,就可以在接收端實現(xiàn)語音短消息的功能;因此具有播放方法簡潔、實現(xiàn)簡單、易于使用、擴展性好等優(yōu)點,不需要傳送大量的語音數(shù)據(jù),有效減輕了網(wǎng)絡負擔,易于推廣應用。
文檔編號H04W4/14GK101094445SQ20071007619
公開日2007年12月26日 申請日期2007年6月29日 優(yōu)先權日2007年6月29日
發(fā)明者吳傳喜 申請人:中興通訊股份有限公司