專利名稱:語音顯示系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種語音顯示系統(tǒng)及方法,特別是關(guān)于一種在播放語音文件時(shí),以音波方式顯示播放進(jìn)度,并配合字幕滾動(dòng)同步顯示語音文件中文字的一種語音顯示系統(tǒng)及方法。
背景技術(shù):
目前一般具備語音顯示功能的顯示單元的電子設(shè)備或應(yīng)用在顯示單元的輸出軟件,大多只提供逐句引導(dǎo)的功能,少數(shù)搭配有音波顯示播放進(jìn)度的設(shè)計(jì),但都未能同步配合字幕滾動(dòng)的方式與文字互動(dòng)顯示(如同卡拉OK字幕顯示),更沒有實(shí)時(shí)轉(zhuǎn)譯及編輯的接口,因而導(dǎo)致使用者不易配合字幕的互動(dòng)進(jìn)行相應(yīng)的練習(xí)。
因此,如何提供一種在播放語音文件時(shí),字幕顯示區(qū)塊的語音文件內(nèi)容的文字會(huì)按句子進(jìn)行高亮提示,并按照播放(朗讀模式)的速度反白每個(gè)字母,具備逐字逐句引導(dǎo)功能,以便使用者配合字幕進(jìn)行練習(xí)的一種語音顯示系統(tǒng)及方法,是本發(fā)明要實(shí)現(xiàn)的目標(biāo)。
發(fā)明內(nèi)容
為克服上述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的主要目的在于提供一種用于在語音文件播放時(shí),能以音波顯示播放進(jìn)度,并配合字幕滾動(dòng)同步顯示語音文件中文字的一種語音顯示系統(tǒng)及方法。
本發(fā)明的另一目的在于提供一種當(dāng)語音文件在播放時(shí),在字幕顯示區(qū)塊的語音文件內(nèi)容的文字會(huì)按句子高亮提示,并按照播放(朗讀模式)的速度反白每個(gè)字母,具備逐字逐句引導(dǎo)功能,方便使用者配合字幕進(jìn)行練習(xí)的一種語音顯示系統(tǒng)及方法。
為達(dá)上述目的,本發(fā)明提供一種語音顯示系統(tǒng)及方法,該系統(tǒng)包括加載模塊,用于加載語音文件;斷句判斷模塊,用于判別語音文件文章的內(nèi)容,并將其拆分為多個(gè)斷句節(jié)點(diǎn),產(chǎn)生至少具備有斷句索引、斷句播放時(shí)間及斷句索引字幕其中一種字段的斷句列表及其數(shù)據(jù)庫,并儲(chǔ)存到該語音文件中;斷句編輯模塊,供逐條編輯斷句索引字幕并儲(chǔ)存到該語音文件中;譯文模塊,用于將斷句索引字幕的文字翻譯成其它國家語言的文字,并同時(shí)將原文及譯文字幕儲(chǔ)存在語音文件內(nèi);復(fù)讀模塊,用于復(fù)讀該語音文件的內(nèi)容;字幕反白速度計(jì)算模塊,用于計(jì)算出該行斷句索引字幕每個(gè)字母反白顯示的速度;字幕滾動(dòng)模塊,用于顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,將斷句索引字幕按句子以明顯顏色提示,并且按照播放(朗讀)的速度反白每個(gè)字母;以及音波顯示模塊,用于顯示語音文件的完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放的進(jìn)度。
其中該字幕滾動(dòng)模塊及音波顯示模塊同步在顯示單元上顯示出語音信息。
該語音顯示的方法,適用上述語音顯示系統(tǒng)中,它包括下列步驟(1)令加載模塊加載數(shù)字語音文件;(2)令斷句判斷模塊判斷語音文件文章內(nèi)容,并將其拆分為多個(gè)斷句節(jié)點(diǎn),且產(chǎn)生記錄語音文件內(nèi)容被拆分后的斷句索引、斷句播放時(shí)間及斷句索引字幕其中一種信息的斷句列表及其數(shù)據(jù)庫,并將其儲(chǔ)存在該語音文件中;(3)令使用者選擇是否開啟斷句編輯模塊,若是,則彈出編輯窗口,供使用者在編輯窗口中逐條輸入要編輯的字幕及選擇裝入已準(zhǔn)備好的字幕文件,并進(jìn)行下一步驟;如否,則將編輯后的斷句列表內(nèi)容儲(chǔ)存至語音文件中,并跳至步驟(5);(4)令使用者選擇是否開啟譯文模塊,若是則供使用者選擇將斷句索引字幕的文字翻譯成其他國家語言的文字,并將編輯后的斷句索引字幕原文及譯文字幕一并儲(chǔ)存至語音文件中,并進(jìn)行下一步驟;若否則進(jìn)行步驟(5);(5)開啟復(fù)讀模塊復(fù)讀該語音文件內(nèi)容,并比較該語音文件播放時(shí)間與斷句列表的斷點(diǎn)時(shí)間以得到斷句索引,并顯示出該行斷句索引字幕;(6)令字幕反白速度計(jì)算模塊依據(jù)斷句列表內(nèi)兩個(gè)斷點(diǎn)之間的時(shí)間間隔除以該行斷句索引字幕的文字字母個(gè)數(shù),計(jì)算出該行斷句索引字幕文字勻速的字母反白速度;(7)令字幕滾動(dòng)模塊顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,在語音文件播放時(shí),斷句索引字幕按句了以明顯標(biāo)記提示,并按照播放(朗讀)的速度反白每個(gè)字母,它也可切換至譯文資料,轉(zhuǎn)換成譯文字幕同步滾動(dòng)顯示狀態(tài),以及(8)令音波顯示模塊顯示該語音文件的完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放的進(jìn)度。
借由該語音顯示系統(tǒng)及方法,提供使用者在語音文件播放時(shí),在顯示單元上以音波方式顯示播放進(jìn)度,并同時(shí)配合字幕滾動(dòng)同步顯示語音文件文字,以逐字逐句的引導(dǎo)及譯文對(duì)照功能供使用者方便的配合字幕進(jìn)行練習(xí)。
圖1是本發(fā)明語音顯示系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖;圖2是本發(fā)明語音顯示方法的實(shí)施例流程圖。
具體實(shí)施例方式
實(shí)施例以下通過特定的具體實(shí)施例詳細(xì)說明本發(fā)明的實(shí)施方式。
圖1是本發(fā)明語音顯示系統(tǒng)100的系統(tǒng)結(jié)構(gòu)示意圖,如圖所示,本發(fā)明的語音顯示系統(tǒng)100包括加載模塊101、斷句判斷模塊102、斷句編輯模塊103、譯文模塊104、復(fù)讀模塊105、字幕反白速度計(jì)算模塊106、字幕滾動(dòng)模塊107及音波顯示模塊108。
該加載模塊101用于加載數(shù)字語音文件,數(shù)字語音文件可以是MP3(MpegLayer3)格式。
該斷句判斷模塊102用于判斷語音文件文章的內(nèi)容,并將其拆分為多個(gè)斷句節(jié)點(diǎn),并產(chǎn)生斷句列表及其數(shù)據(jù)庫,該斷句列表記錄有語音文件的文章內(nèi)容拆分后的斷句索引、斷句播放時(shí)間及斷句索引字幕等信息,并可將其數(shù)據(jù)庫存入該語音文件中,供下次加載該語音文件時(shí),即具備斷句索引信息可供利用。
該斷句編輯模塊103可彈出一編輯窗口,使用者可在該編輯窗口中逐條編輯斷句索引字幕,也可選擇裝入已準(zhǔn)備好的字幕文件替代該斷句索引字幕。
該譯文模塊104根據(jù)使用者的選擇,將斷句索引字幕的文字內(nèi)容翻譯成其它國家語言的文字,如將英文語音文件的英文斷句索引字幕翻譯成中文字幕,并同時(shí)在該語音文件內(nèi)儲(chǔ)存原文及譯文字幕。
該復(fù)讀模塊105用于復(fù)讀該語音文件內(nèi)容,并比較語音文件播放時(shí)間與斷句列表斷點(diǎn)時(shí)間,從而得到該句子的斷句索引字幕信息。
該字幕反白速度計(jì)算模塊106用于計(jì)算該行斷句索引字幕每個(gè)字母反白顯示的速度,該字幕反白速度計(jì)算模塊是根據(jù)斷句列表內(nèi)兩個(gè)斷點(diǎn)之間的時(shí)間間隔除以斷句索引字幕的文字字母個(gè)數(shù),計(jì)算出該行斷句索引字幕文字勻速的字母反白速度。
該字幕滾動(dòng)模塊107用于顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,在播放語音文件時(shí),斷句索引字幕會(huì)按句子以明顯顏色進(jìn)行提示,并按照播放(朗讀)速度反白每個(gè)字母,它也可切換至譯文資料,轉(zhuǎn)換成譯文字幕同步滾動(dòng)顯示狀態(tài)。
該音波顯示模塊108用于顯示該語音文件完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放的進(jìn)度。
其中該字幕滾動(dòng)模塊107及音波顯示模塊108同步在顯示單元200上顯示語音信息。
圖2是本發(fā)明語音顯示方法的較佳實(shí)施例的流程圖,如圖所示,首先進(jìn)行步驟S202,由使用者加載英文數(shù)字語音文件,該數(shù)字語音文件可以是MP3(MpegLayer3)格式,接著進(jìn)至步驟S204。
在步驟S204中,斷句判斷模塊102將對(duì)該加載的英文數(shù)字語音文件進(jìn)行自動(dòng)斷句判斷,判斷語音文件文章內(nèi)容并將其拆分為多個(gè)斷句節(jié)點(diǎn),接著進(jìn)至步驟S206。
在步驟S206中,該斷句判斷模塊102產(chǎn)生斷句列表及其數(shù)據(jù)庫,該斷句列表記錄有語音文件文章內(nèi)容被拆分后的斷句索引、斷句播放時(shí)間及斷句索引字幕等信息,并可將其數(shù)據(jù)庫存入該語音文件中,供下次加載該語音文件時(shí),即具備斷句索引的信息可供利用,然后進(jìn)入步驟S208,詢問是否對(duì)已產(chǎn)生的斷句列表內(nèi)容進(jìn)行編輯修正的動(dòng)作。
在步驟S208中,若使用者選擇要編輯斷句列表內(nèi)容,則接著進(jìn)至步驟S210,如否,則進(jìn)至步驟S218開始復(fù)讀語音文件內(nèi)容。
在步驟S210中,斷句編輯模塊103會(huì)彈出一個(gè)編輯窗口,供使用者在編輯窗口中逐條編輯斷句索引字幕,也可以選擇裝入已準(zhǔn)備好的字幕文件替代該斷句索引字幕,并詢問是否轉(zhuǎn)譯斷句索引字幕內(nèi)容,若是則進(jìn)至步驟S214,如否,則進(jìn)至步驟S216,在語音文件內(nèi)儲(chǔ)存編輯好的資料,并進(jìn)至步驟S218接著開始復(fù)讀語音文件內(nèi)容。
在步驟S214中,譯文模塊104根據(jù)使用者的選擇將斷句索引字幕的文字內(nèi)容翻譯成其它國家語言的文字,在此實(shí)施例中是將英文語音文件的英文斷句索引字幕翻譯成中文字幕,再進(jìn)至步驟S216同時(shí)在語音文件內(nèi)儲(chǔ)存原文及譯文字幕,接著進(jìn)至步驟S218開始復(fù)讀語音文件內(nèi)容。
在步驟S218中,開始復(fù)讀該語音文件內(nèi)容,并進(jìn)至步驟S220去比較語音文件播放時(shí)間與斷句列表斷點(diǎn)時(shí)間,再接著進(jìn)至步驟S222,得到該句子的斷句索引字幕信息,并顯示該行斷句索引的字幕,接著進(jìn)至步驟S224。
在步驟S224中,字幕反白速度計(jì)算模塊106計(jì)算出該行斷句索引字幕每個(gè)字母反白顯示的速度,該字幕反白速度計(jì)算模塊106是根據(jù)斷句列表內(nèi)兩個(gè)斷點(diǎn)之間的時(shí)間間隔除以斷句索引字幕的文字字母個(gè)數(shù),計(jì)算出該行斷句索引字幕文字勻速的字母反白速度;該兩個(gè)斷點(diǎn)是指兩個(gè)斷句索引的時(shí)間,例如斷句索引1的時(shí)間斷點(diǎn)是00:02.855秒,斷句索引2的時(shí)間斷點(diǎn)為00:06.278秒,則字幕反白速度計(jì)算模塊106將依據(jù)公式代入其數(shù)值,算出斷句索引2的斷句索引字幕顯示時(shí)間為3.42秒,并將該顯示時(shí)間除以斷句索引2的斷句索引字幕的字母個(gè)數(shù),計(jì)算出該行斷句索引字幕文字勻速的字母反白速度,例如斷句索引2的斷句索引字幕文字字母個(gè)數(shù)是10個(gè),則該行斷句索引字幕文字的勻速顯現(xiàn)時(shí)間則為3.42/10=0.342秒,也就是說,該行斷句索引字幕文字的每個(gè)字母反白的反應(yīng)時(shí)間是0.342秒;在計(jì)算出該行斷句索引字幕的反白速度后,再接至步驟S226中,并將該計(jì)算值傳遞至步驟S230中(細(xì)詳肉容后述)。
在步驟S226中,則由字幕滾動(dòng)模塊107處理,并用于顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,在播放語音文件時(shí),斷句索引字幕會(huì)按句子以明顯顏色提示,并按照播放(朗讀)的速度反白每個(gè)字母,反白每個(gè)字母的反應(yīng)時(shí)間,則正是在步驟S224中由字幕反白速度計(jì)算模塊106計(jì)算出的計(jì)算值獲得;在此步驟中,若使用者執(zhí)行了步驟S214,并在該步驟中轉(zhuǎn)譯斷句索引字幕文字內(nèi)容的話,也可切換至譯文資料,轉(zhuǎn)換成譯文字幕同步滾動(dòng)顯示狀態(tài)。
另在步驟S218中復(fù)讀語音文件內(nèi)容時(shí),會(huì)隨時(shí)將斷句列表斷點(diǎn)信息傳遞至步驟S228中,在步驟S228中會(huì)產(chǎn)生出該語音文件的完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置,再進(jìn)至步驟S230中。
在步驟S230中,音波顯示模塊108接收在步驟S224中由字幕反白速度計(jì)算模塊106傳遞的計(jì)算值,計(jì)算出該行斷點(diǎn)音波段的勻速直線運(yùn)動(dòng)速度,以配合與字幕滾動(dòng)模塊107的字幕顯示達(dá)到同步顯示的效果,接著進(jìn)至音波顯示模塊108的完整音波圖顯示的步驟S232中。
其中字幕滾動(dòng)模塊107及音波顯示模塊108在步驟S226、步驟S232中同步在顯示單元200上顯示出語音信息。
綜上所述,本發(fā)明的語音顯示系統(tǒng)及方法,主要是當(dāng)使用者通過加載模塊加載一段語音文件后,在播放語音文件時(shí),能夠在顯示單元上以音波方式顯示播放進(jìn)度,并同時(shí)配合同步字幕滾動(dòng),提供逐字逐句的引導(dǎo)功能,方便使用者配合字幕進(jìn)行練習(xí)。
權(quán)利要求
1.一種語音顯示系統(tǒng),其特征在于,該系統(tǒng)至少包括加載模塊,用于加載語音文件;斷句判斷模塊,用于判別語音文件文章的內(nèi)容,并將其拆分為多個(gè)斷句節(jié)點(diǎn),產(chǎn)生至少具備有斷句索引、斷句播放時(shí)間及斷句索引字幕其中一種字段的斷句列表及其數(shù)據(jù)庫,并儲(chǔ)存到該語音文件中;斷句編輯模塊,供逐條編輯斷句索引字幕并儲(chǔ)存到該語音文件中;譯文模塊,用于將斷句索引字幕的文字翻譯成其它國家語言的文字,并同時(shí)將原文及譯文字幕儲(chǔ)存在語音文件內(nèi);復(fù)讀模塊,用于復(fù)讀該語音文件的內(nèi)容;字幕反白速度計(jì)算模塊,用于計(jì)算出該行斷句索引字幕每個(gè)字母反白顯示的速度;字幕滾動(dòng)模塊,用于顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,將斷句索引字幕按句子以明顯顏色提示,并且按照播放(朗讀)的速度反白每個(gè)字母;以及音波顯示模塊,用于顯示語音文件的完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放的進(jìn)度。
2.如權(quán)利要求1所述的語音顯示系統(tǒng),其特征在于,該字幕反白速度計(jì)算模塊是依據(jù)斷句列表內(nèi)兩個(gè)斷點(diǎn)之間的時(shí)間間隔除以斷句索引內(nèi)容的文字字母個(gè)數(shù),計(jì)算出該行斷句索引字幕每個(gè)字母的反白顯示速度。
3.如權(quán)利要求1所述的語音顯示系統(tǒng),其特征在于,該字幕滾動(dòng)模塊也可切換至譯文數(shù)據(jù),轉(zhuǎn)換成譯文字幕同步滾動(dòng)顯示狀態(tài)。
4.如權(quán)利要求3所述的語音顯示系統(tǒng),其特征在于,該譯文字幕是中文字幕。
5.如權(quán)利要求1所述的語音顯示系統(tǒng),其特征在于,該音波顯示模塊具備多條斷點(diǎn)線及顯示播放速度與進(jìn)度的勻速線。
6.一種語音顯示方法,適用于語音顯示系統(tǒng)中,其特征在于,該方法包括(1)令加載模塊加載數(shù)字語音文件;(2)令斷句判斷模塊判斷語音文件文章內(nèi)容,并將其拆分為多個(gè)斷句節(jié)點(diǎn),且產(chǎn)生記錄語音文件內(nèi)容被拆分后的斷句索引、斷句播放時(shí)間及斷句索引字幕其中一種信息的斷句列表及其數(shù)據(jù)庫,并將其儲(chǔ)存在該語音文件中;(3)令使用者選擇是否開啟斷句編輯模塊,若是,則彈出編輯窗口,供使用者在編輯窗口中逐條輸入要編輯的字幕及選擇裝入已準(zhǔn)備好的字幕文件,并進(jìn)行下一步驟;如否,則將編輯后的斷句列表內(nèi)容儲(chǔ)存至語音文件中,并跳至步驟(5);(4)令使用者選擇是否開啟譯文模塊,若是則供使用者選擇將斷句索引字幕的文字翻譯成其他國家語言的文字,并將編輯后的斷句索引字幕原文及譯文字幕一并儲(chǔ)存至語音文件中,并進(jìn)行下一步驟;若否則進(jìn)行步驟(5);(5)開啟復(fù)讀模塊復(fù)讀該語音文件內(nèi)容,并比較該語音文件播放時(shí)間與斷句列表的斷點(diǎn)時(shí)間以得到斷句索引,并顯示出該行斷句索引字幕;(6)令字幕反白速度計(jì)算模塊依據(jù)斷句列表內(nèi)兩個(gè)斷點(diǎn)之間的時(shí)間間隔除以該行斷句索引字幕的文字字母個(gè)數(shù),計(jì)算出該行斷句索引字幕文字勻速的字母反白速度;(7)令字幕滾動(dòng)模塊顯示斷句列表內(nèi)斷句索引及斷句索引字幕的文字,在語音文件播放時(shí),斷句索引字幕按句了以明顯標(biāo)記提示,并按照播放(朗讀)的速度反白每個(gè)字母,它也可切換至譯文資料,轉(zhuǎn)換成譯文字幕同步滾動(dòng)顯示狀態(tài),以及(8)令音波顯示模塊顯示該語音文件的完整語音資料的音波圖,且在該音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放的進(jìn)度。
7.如權(quán)利要求6所述的語音顯示方法,其特征在于,步驟(3)的譯文字幕是中文字幕。
8.如權(quán)利要求6所述的語音顯示方法,其特征在于,該音波顯示模塊具備多條斷點(diǎn)線及顯示播放速度及進(jìn)度的勻速線。
全文摘要
一種語音顯示系統(tǒng)及方法,該系統(tǒng)至少包括加載模塊、斷句判斷模塊、斷句編輯模塊、譯文模塊、復(fù)讀模塊、字幕反白速度計(jì)算模塊、字幕滾動(dòng)模塊及音波顯示模塊;使用者通過加載模塊加載一段語音文件,該斷句判斷模塊將該語音文件內(nèi)容拆分為多個(gè)斷句節(jié)點(diǎn),由字幕反白速度計(jì)算模塊計(jì)算每個(gè)字母反白顯示的速度,通過字幕滾動(dòng)模塊顯示斷句列表內(nèi)容,并標(biāo)記正在播放的字幕,按照播放速度反白每個(gè)字母,搭配音波顯示模塊在音波圖上以線條標(biāo)記斷句節(jié)點(diǎn)位置及播放進(jìn)度,使語音文件在播放時(shí),在顯示單元上以音波顯示播放進(jìn)度,并配合同步字幕滾動(dòng),提供逐字逐句引導(dǎo)功能,使用者配合字幕進(jìn)行練習(xí)。
文檔編號(hào)G06F3/14GK1770262SQ20041008714
公開日2006年5月10日 申請(qǐng)日期2004年11月1日 優(yōu)先權(quán)日2004年11月1日
發(fā)明者徐曉燕, 邱全成 申請(qǐng)人:英業(yè)達(dá)股份有限公司