WEB开发网      婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柛娑橈功缁犻箖鏌嶈閸撴氨鎹㈠☉娆愬闁告劕寮堕幖鎰棯閸撗勫殌闁宠鍨块幃鈺冣偓鍦Т椤ユ繈姊哄Ч鍥р偓妤呭磻閹捐桅闁告洦鍨扮粻娑㈡煕椤愶絾绀冩い搴$Ч濮婅櫣绮欏▎鎯у壋闂佸摜濮甸崝娆愪繆閻㈢ǹ绀嬫い鏍ㄨ壘閸炪劑姊洪棃娴ゆ稒鎷呴幓鎺嶅闂佸湱鍎ら〃鍡涘煕閹烘鐓曢柡鍥ュ妼娴滄粍銇勮箛锝呭籍闁哄备鈧磭鏆嗛悗锝庡墰閺嗙娀鏌ф导娆戝埌闁靛棙甯掗~婵嬫偂鎼达絼鐢荤紓浣诡殕閸ㄥ灝顫忕紒妯诲缂佹稑顑呭▓顓炩攽椤旀枻鍏紒鐘虫崌閵嗕礁顫濋幇浣光枌婵犵數濮崑鎾趁归敐鍥┿€婇柡鈧禒瀣厽婵☆垱顑欓崵瀣偓瑙勬偠閸庤精鐏冮梺缁樏鍫曞疮閻愮數纾奸柛灞炬皑鏁堥悗瑙勬礃缁繘藝鐎靛摜妫柟顖嗕礁浠悗娈垮枛閻栫厧鐣烽悡搴樻婵☆垯璀﹂悗宕囩磽閸屾瑧鍔嶆い銊ユ閻f繈骞栨担姝屾憰闂佺粯妫冮ˉ鎾诲汲鐎n喗鐓熸俊銈傚亾闁绘妫楅埢鎾澄旈崨顔规嫼闁荤姴娲犻埀顒冩珪閻忊偓闂備礁鎼幊鎰叏閹绢喗鍋╅柣銈庡灛娴滃綊鏌熼悜妯肩畺闁哄懏绻堝娲濞戞艾顣哄┑鈽嗗亝閻熲晠銆佸▎鎺旂杸闁哄啫鍊婚惁鍫ユ⒑濮瑰洤鐏叉繛浣冲嫮顩烽柨鏇炲€归悡鏇㈡煏婵炲灝鍔ら柛鈺嬬稻椤ㄣ儵鎮欓弶鎴濐潚濡ょ姷鍋為敃銏ゃ€佸▎鎾村殐闁冲搫顑囬獮銏ゆ⒒閸屾瑦绁版い顐㈩槸閻e嘲螣閼测晝鐓嬪銈嗘閿熴儲绂嶈ぐ鎺撶厵闁绘垶蓱鐏忣厼霉濠婂啰绉烘慨濠呮缁辨帒螣閾忛€涙闂備焦瀵уú宥夊疾濞戞粎浜遍梻浣告啞濞诧箓宕归柆宥呯厱闁硅揪闄勯悡娆撴煠濞村娅呭ù鐘崇矊閳规垿鍨鹃悙钘変划闂佽鍠楅〃鍛村煡婢舵劕绠抽柟鎯ь嚟瑜板洨绱撻崒娆戣窗闁哥姵鐗犻、鏍川閹碱厽鏅i梺绋跨箳閸樠呮閻愮繝绻嗘い鏍ㄧ矌鐢稒绻涢崨顓熷枠婵﹦绮幏鍛存偡闁箑娈濈紓鍌欐祰椤曆囧磹閸噮鍤曠紓浣贯缚缁♀偓闂佹悶鍎崝宥呪枍閸ヮ剚鈷戠紒瀣濠€鎵磼鐎n偅宕岀€规洏鍨介幃浠嬪川婵犲嫬骞楅梺鐟板悑閻n亪宕规繝姘厐闁哄洢鍨洪悡銉︽叏濡灝鐓愰柣鎾跺枛閻擃偊宕堕妷銉ュБ缂備礁顑堝畷鐢垫閹烘梻纾兼俊顖濆亹閻h櫣绱撴担铏瑰笡缂佽鐗嗛悾宄邦潨閳ь剚淇婂宀婃Ш缂備浇椴哥换鍫濐潖缂佹ɑ濯寸紒娑橆儏濞堟劙姊洪幖鐐插闁告鍟块悾鐑筋敍閻愯尙楠囬梺鐟邦嚟婵潧鈻撴ィ鍐┾拺缂備焦蓱閳锋帡鏌嶅畡鎵ⅵ鐎殿噮鍋婂畷鎺楁倷鐎电ǹ骞堥梻浣瑰▕閺侇噣宕戦幘缁樼厸闁告侗鍠氶幊鍛繆閸欏濮囬摶锝夋偠濞戞帒澧查柡鍌楀亾闂傚倷鑳剁划顖炲礉閺囩倣鐔哥節閸パ冩優闂佺粯鏌ㄩ惃婵嬪绩閼恒儯浜滈柡鍐ㄦ处椤ュ鏌涢弬璇测偓婵嬪箺閸洘鍊烽柣鎴炨缚閸橀亶姊洪崫鍕偍闁告柨鏈弲鍫曨敍閻愬鍘卞┑鐐叉缁绘帞绮绘繝姘厸閻忕偟鏅晥閻庤娲﹂崑濠傜暦閻旂⒈鏁嗛柍褜鍓欓埢宥夋晲閸モ晝锛濇繛杈剧稻瑜板啯绂嶉悙顒傜瘈闁靛骏绲剧涵鐐亜閹存繃宸濈紒顔剧帛閵堬綁宕橀埡鍐ㄥ箥闂佽瀛╃粙鎺戠幓鐠恒劎涓嶆慨妞诲亾闁哄被鍔岄埥澶娢熸径鐧哥稻閵囧嫰濡搁敐鍛Е闂佽鍠楅悷鈺呫€侀弮鍫濈妞ゆ挻绻勭粈鍕⒒閸屾瑦绁版い鏇熺墵瀹曚即寮介銈囶槸婵犵數濮撮崐濠氬汲閿曞倹鐓欐い鏍仜娴滅増淇婇懠棰濆殭闁宠鍨块崺鍕礃閵娧呫偡婵$偑鍊ら崢楣冨礂濡警鍤曢悹鍥ㄧゴ濡插牓鏌曡箛鏇烆潔闁冲搫鎳忛悡蹇擃熆鐠鸿櫣澧曢柛鏃€鎸抽弻娑㈠棘濞嗙偓楔缂備浇椴搁幐濠氬箯閸涱垳鐭欓幖瀛樻尭娴滈箖鏌涘┑鍕姢闁活厽鎸鹃幉鎼佹偋閸繄鐟ㄩ梺鍝勵儎缁舵岸寮婚悢鐓庣鐟滃繒鏁☉銏$厸闁告侗鍠楅崐鎰版煛鐏炶濮傞柟顔哄€濆畷鎺戔槈濮楀棔绱� ---闂傚倸鍊搁崐鎼佸磹閹间礁纾归柣鎴eГ閸婂潡鏌ㄩ弮鍫熸殰闁稿鎸剧划顓炩槈濡搫绠诲┑鐐叉▕娴滄粓鎮″☉銏$厱婵炴垵宕獮妯汇亜閺傛寧顥㈡慨濠呮閹瑰嫰濡搁妷锔惧綒闂備胶鎳撻崵鏍箯閿燂拷
开发学院WEB开发ASP.NET 在ASP.NET程序中实现语音合成 阅读

在ASP.NET程序中实现语音合成

 2006-03-02 17:03:43 来源:WEB开发网 闂傚倸鍊搁崐鎼佸磹閹间礁纾瑰瀣椤愯姤鎱ㄥ鍡楀幊缂傚倹姘ㄩ幉绋款吋閸澀缃曢梻鍌欑濠€閬嶆惞鎼淬劌绐楅柡宥庡亞娑撳秵銇勯弽顐沪闁绘挶鍎甸弻锝夊即閻愭祴鍋撻崷顓涘亾濮樼偓瀚�闂傚倸鍊搁崐鎼佸磹閹间礁纾瑰瀣捣閻棗銆掑锝呬壕濡ょ姷鍋涢ˇ鐢稿极閹剧粯鍋愰柟缁樺笧閳ь剦鍙冨鍝勑ч崶褏浠奸梺璇茬箲閼归箖鎮鹃悜钘夎摕闁靛濡囬崢鐢告⒑鐟欏嫷鍟忛柛鐘崇墵閵嗗倹绺介崨濠勫幈闁硅壈鎻槐鏇熺墡闂備線娼уú銈団偓姘嵆閻涱噣骞掑Δ鈧粻锝嗙節闂堟稑鏆欏ù婊堢畺閺岋綁濮€閳惰泛婀辨竟鏇熺節濮橆厾鍘甸梺缁樺姦閸撴岸鎮樻潏銊ょ箚闁圭粯甯炴晶娑氱磼缂佹ḿ娲寸€规洖宕灃闁告劕鍟犻崜婵堟崲濞戞ḿ鏆嗗┑鐘辫兌閺佹牜绱撴担浠嬪摵闁圭懓娲ら悾鐑藉箳閹搭厽鍍甸梺鐟板悁閻掞箓鎮楅幖浣光拻濞达絿鍎ら崵鈧梺鎼炲€栭悧鐘荤嵁韫囨稒鏅搁柨鐕傛嫹婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柛娑橈攻閸欏繑銇勯幘鍗炵仼缂佺媭鍨堕弻娑㈠箛闂堟稒鐏堥悗鐟版啞缁诲啴濡甸崟顖氱閻庨潧鎽滈悾濂告⒑绾拋娼愭繛鑼枎椤繒绱掑Ο鑲╂嚌闂侀€炲苯澧畝锝堝劵椤︽煡鎮¢妶澶嬬厪闁割偅绻冮崑顏呯箾瀹割喕绨婚幆鐔兼⒑鐎圭姵銆冮柤鍐茬埣瀹曟繈鏁冮埀顒勨€旈崘顔嘉ч柛鈩冾殘閻熸劙姊洪悡搴℃毐闁绘牕銈稿畷鐑樼節閸パ冨祮闂侀潧楠忕槐鏇㈠储椤忓牊鈷戦柟鑲╁仜閸旀鏌¢崨顔锯姇缂佸倹甯熼ˇ瀵哥磼鏉堛劌绗氭繛鐓庣箻閸┾剝鎷呴柨瀣垫綗闂傚倷娴囧銊╂倿閿曞倸绠查柛銉墮閺嬩線鏌熼崜褏甯涢柡鍛倐閺屻劑鎮ら崒娑橆伓闂傚倸鍊搁崐鎼佸磹閹间礁纾瑰瀣椤愯姤鎱ㄥ鍡楀幊缂傚倹姘ㄩ幉绋款吋閸澀缃曢梻鍌欑濠€閬嶆惞鎼淬劌绐楅柡宥庡亞娑撳秵銇勯弽顐沪闁绘挶鍎甸弻锝夊即閻愭祴鍋撻崷顓涘亾濮樼偓瀚�  闂傚倸鍊搁崐鎼佸磹閹间礁纾归柣鎴eГ閸ゅ嫰鏌ら崫銉︽毄濞寸姵姘ㄧ槐鎾诲磼濞嗘帒鍘$紓渚囧櫘閸ㄥ爼濡撮崘顔煎窛闁哄鍨归崢娲倵楠炲灝鍔氭い锔诲灦瀹曪繝骞庨懞銉у帾闂婎偄娲﹀ú鏍ㄧ墡闂備浇顕х€垫帡宕滈悢濂夋綎闁惧繐婀辩壕鍏间繆椤栨碍鎯堟い顐㈢Т椤啴濡堕崱妤€顫庨梺鍛婎焼閸パ呭弨婵犮垼娉涜癌闁绘柨鍚嬮悡銉╂倵閿濆骸鍘撮柛瀣尰缁绘繂顫濋娑欏闁荤喐绮庢晶妤冩暜閹烘挾顩插ù鐓庣摠閻撴洟鏌熼幆褜鍤熼柍钘夘樀閺屽秶绱掑Ο鑽ゅ弳濡炪値鍋呯换鍫ュ箠濠婂懎鏋堟俊顖濐嚙椤忓綊姊婚崒娆戭槮闁硅绱曠划娆撳箣閿斿搫浜奸梺鍝勵槹閸ㄧ喖寮搁弮鍫熺厸闁告劧绲芥禍鍓х磽娴h櫣甯涚紒瀣尰缁傛帡鏁冮崒姘憋紲濠殿喗锕╅崜锕傛倵閹惰姤鈷掑ù锝呮憸閿涘秶绱掗鍛仸妤犵偞鍨垮畷鍫曨敆閸屾氨銈﹂梺璇插嚱缂嶅棙绂嶉弽顓炵哗濞寸姴顑嗛悡娆撴⒑椤撱劎鐣卞褜鍨遍妵鍕棘閸喒鍋撶憴鍕攳濠电姴娲﹂崐閿嬨亜韫囨挸顏ら柛瀣崌瀵€燁檨婵炲吋鐗曢埞鎴︽偐鐎圭姴顥濋梺绋胯閸斿酣骞夊宀€鐤€婵炴垶岣块悿鍛存⒑閸︻叀妾搁柛鐘愁殜瀵煡骞栨担鍦弳闂佺粯娲栭崐鍦偓姘炬嫹
核心提示:你可能已经注意到,如今语音合成越来越普遍,在ASP.NET程序中实现语音合成,成百上午的电动玩具和小器具都能够以机器的声音向它们的主人讲话,不管它是一个讲话的婴儿玩偶,我主张你改变元素值并且用每一个控件生成的方式进行试验,SASDK提供给开发者关于该TTS引擎怎样生成文本的良好控件,一个会谈话的计步器或是一新的自动电话
你可能已经注意到,如今语音合成越来越普遍。成百上午的电动玩具和小器具都能够以机器的声音向它们的主人讲话。不管它是一个讲话的婴儿玩偶,一个会谈话的计步器或是一新的自动电话系统,现在几乎每天都会有一种使用文本来发音的产品发行。

  文本-到-语音(TTS)技术,也称为语音合成,是把输入的文本转换成音频语音的过程。这种方式会优于预先录制好的文本-它必须对要说的内容提前了解。而使用TTS,却有可能加入动态的信息,该动态的信息可以来自于一个数据库;或是用户不断重复的话。

  一、 TTS试验

  如果你看到或听说过实际的TTS,那么你可能想下载一个免费版本的ReadPlease 2003。该产品能够读取Windows剪贴板中的文本。要使用它,你只需要简单地把一些文本粘贴到ReadPlease编辑器中(见图1)-并且假定你的PC扬声器打开了,那么你会听到文本的播放。当前,该产品仅能工作在所有的Windows桌面OS版本中,但是他们还计划发行针对Mac,Unix,Palm和Windows CE系统的版本。

  ReadPlease令人感兴趣的地方在于,你可以使用ReadPlease编辑器来试验你的TTS参数选择。例如,你可以通过上下移动如图1所示的Speed滑动块控件来调整发音速度。你还可以通过点击在小脸图标下方的箭头按钮来改变所用的语音。


图1.ReadPlease 2003应用程序:这个Windows应用程序可能读任何从剪贴板中粘贴到编辑字段中的文本。

  你需要什么呢?Visual Studio.NET 2003,微软语音应用程序SDK 1.1

  点击"Tools"菜单,然后选择"Options"允许你进一步用该TTS编辑器进行试验,例如,你可以调整在段落之间的语音引擎的暂停时间长度。升级到ReadPlease Plus版本将可以使你存取另外的一个发音编辑器选项,它让你指定怎样读一个特别的词。ReadPlease Plus还包括一个你可以停靠在你的Windows桌面顶部的任务条。因此,你可以快速地从任何基于文件的应用程序拖动文本到任务栏上并让它读给你听。

  缺省状态下,该ReadPlease应用程序使用内置的微软语音(Mark,Mike,Sam或Marilyn)。但是,你可以选择性地购买更高质量的AT&T Natural Voices,例如在AT&T Natural Voices Starter Pack中提供的语音。该Starter包包括8K版本的"Mike"和"Crystal",它们二者听起来都优于缺省的微软声音。

  作者注: 术语8K意味着,该抽样频率用于创建发生在每秒8000位的WAV文件。另外一种格式是16k,它可以产生一种更清晰和更为自然的听觉效果。基本上,样本率越高,声音质量好越。

  二、 微软语音应用程序开发包SDK 1.1

  在2004年,微软发行了 Microsoft Speech Server,还有一个免费的SDK允许你开发基于Web的运行于Speech Server上的语音程序。可以使用SDK来构建电话或只发声的应用程序-其中的计算机对用户的交互是使用电话来实现的。同时你还可以构建多模态应用程序,其中由用户选择使用语音还是传统型Web控件作为输入。

  微软TTS引擎通过把单词拆分成音素来合成文本。音素是人类语言的基本单位。它们代表一组"音",正是由它们构成单词的声音。然后由该TTS引擎分析提取的音素并且把它们转换成符号用来生成数字音频语音。

  你可以使用随同本文的可下载的示例应用程序(ExploringTextToSpeech.csPRoj)来试验微软TTS引擎可配置的方面。该多模态应用程序包含一个Web页面(见图2),你可以在其中输入一些文本。然后,可以点击一个按钮来以下面方式听取文本。

  作者注:在要被播放的文本无法提前知道的情况下,使用一TTS引擎是不可避免的;然而,你可以由录制音频来得到更好的音质。当音频质量是关键的时,你可以使用微软语音应用程序软件开发工具箱(SASDK)来录制音频。例如,你可能想使用录制的音频来提示用户信息。被记录的音频可以被分解成一系列的提示,它们在运行时刻再被连接起来。

  · Speak Text Normally-提供一种测试基准

  · Say as an Acronym-文本"asp"被发作"A.S.P."

  · Say as Name-Mr.John Doe被发作"Mister John Doe"

  · Say As Date-在这种情况中,日期格式化为:月,日,年

  · Say as Web Address-在这种情况中,文本格式化为一个统一资源标识符(URI)

  · Say as Digits-作为文本输入的数字被发作一系列的位

  · High Pitch/Slow Rate-文本以高音调慢速发出。

  · Rate Fast/Volume Loud-文本以快速高音发出。

  · Low Pitch/Volume Soft-文本以低音调适中音量发出。


图2.示例应用程序-你可以使用这个程序来听一下以多种方式说出的文本。

  该多模态应用程序使用一提示控件来指定将被播放给用户的音频。该提示控件包含InlineContent属性——它可以包含一个或者是Content型或者是Value型的基本Speech控件。该Content控件指定一特定的包含存储的音频记录的提示文件。该Value控件指定一个HTML Web页面中的元素。该示例应用程序使用一Value控件——它参考一个名为txtText的输入元素(在图2中的"Type some text here:"域)。下面是描述了用于一个提示的标注的HTML:

<speech:prompt id="prmText" runat="server">
<InlineContent>
<speech:Value runat="server"
TargetElement="txtText"
TargetAttribute="value">
</speech:Value>
</InlineContent>
</speech:prompt>

  三、 语音合成标注语言

  该TTS引擎在怎样播放由属性InlineContent参考的文本时作出某些缺省的假设,但是开发者能通过使用语音合成标注语言(SSML)元素来控制该TTS引擎生成音频的方式。根据W3C协会的推荐,SSML是一基于xml的标注语言。表1列举出由SASDK所支持的SSML元素。

  表1.被支持的SSML元素:表中列出由SASDK所支持的SSML元素并且用于控制TTS引擎生成文本的方式。

SSML元素 描述
ssml:paragraph/ssml:sentence 用于把文本分解成语句或段落。
ssml:say-as 用于指定播放文本的方式。它能够接受若干不同的属性来指定文本的类型。
ssml:phoneme 用于控制一个单词的发音方式。
ssml:sub 用于指定一个替代单词或词组来代替指定的文本。
ssml:emphasis 用于提高放到一单词或词组中的重音。
ssml:break 用于在文本的某些单词间插入一些暂停。
ssml:prosody 用于控制音调,速率和音量。
ssml:audio 用于插入被录制的音频文件。
ssml:mark 用于在文本的某个位置插入一个标记。然后可以使用这个标记来表示一事件或触发一个行为。

  该示例应用程序说明了say-as和prosodySSML元素的使用。在该Default.aspx页面上的每个按钮都相应于一个提示控件。这些提示控件在InlineContent元素中包括一ssml:say-as或一个ssml:prosody元素。下面示例显示了针对这些元素之一的HTML标注:

<speech:prompt id="prmSayAsAcronym" runat="server">
<InlineContent>
<ssml:say-as type="acronym">
<speech:Value runat="server"
TargetElement="txtText"
TargetAttribute="value"></speech:Value>
</ssml:say-as>
</InlineContent>
</speech:prompt>

  当用户点击这些按钮之一,它执行如下所示的javaScript:

function SayAsAcronym() {
 prmSayAsAcronym.Start();
}

  在上面的示例中,名为prmSayAsAcronym的提示包括了ssml:say-as元素,它指定任何包含在txtText输入元素中的文本都应该被以每个单词的第一个字母方式发出。因此,如果你输入"ASP"到文本元素中并且点击"Say As Acronym",那么该TTS引擎将读每个字母。

  为了用该示例应用程序进行试验,你可以输入一些文本片断,然后点击每一个按钮来看一下该TTS引擎是怎样解释文本的。我主张你改变元素值并且用每一个控件生成的方式进行试验。SASDK提供给开发者关于该TTS引擎怎样生成文本的良好控件,因此试验可能会导致出现一种更为自然的基于语音的应用程序。

Tags:ASP NET 程序

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接