纱卡厂家
免费服务热线

Free service

hotline

010-00000000
纱卡厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

InterPhonic中英文混读TTS22版本新增特性介绍

发布时间:2020-02-03 05:58:20 阅读: 来源:纱卡厂家

InterPhonic语音合成系统是面向中、高端应用的语音合成系统,以先进的大语料语音合成技术和语音韵律描述体系为基础,提供面向任意文本、任意篇章的连续语音合成功能,合成音质可媲美真人发音。目前,InterPhonic系列产品已经成为市场上的主流语音合成系统,在电信客服、语音门户、证券客服等领域都有了广泛的应用,不论是效果还是系统稳定性都得到用户的肯定。 科大讯飞以人为本,致力于创造人类信息时代信息获取和沟通的最佳方式。InterPhonic CE 2.2作为其InterPhonic系列的最新产品,在合成效果方面,除了继续提高中文与英文的合成效果之外,还在两者之间如何更加流畅的衔接,以及如何更加方便快捷的实现效果定制方面取得了显著的改进。除此之外,在系统的实用性、易用性等方面又有了进一步的提高,在此基础上,InterPhonic C&E2.2还新增了很多新的特性,如推出功能更加强大和完善的TTS Server Express语音合成服务器软件,并且首次加入了CSSML编辑器和TTS Doctor技术支持工具。 一、 技术改进 为了体现讯飞以人为本的宗旨,为了使用户感受到专业语音科技给他们带来的便利。InterPhonic CE v2.2在合成效果方面,主要增加了CE2.1系统中缺少的语气词合成、改进了短语、短句效果,同时改进了前端文本处理过程: ·语气词处理 语气的应用,例如“是吗?”“为什么呢?”“啊!”等。在InterPhonic CE2.2以前的合成系统中不包含语气词的合成,对这些语气的处理都按照陈述语在一些语音应用中存在者一些非陈述气进行,这种处理影响了语音应用的效果。InterPhonic CE 2.2引进了语气词合成的处理,能够处理疑问、感叹等语气效果。这样使得这些生活中常用的语句真正做到人性化,让用户体验到亲切感。 ·短语合成效果改进 InterPhonic CE 2.2在音库中补充了一定的短句语料,扩大短句语料的覆盖面,同时在前端文本分析中加入了短语语境的判断和处理。改进之后的系统在合成一些包含大量短句、短语的文本时效果上有比较明显的提升,例如人名、地名、短语合成。这种特性让系统的使用范围得到进一步加强。 ·前端韵律算法改进 InterPhonic CE v2.2中通过对词类调整和未登录词算法的改进,提高了韵律树生成准确率,改进了合成自然度。可以使合成的声音更加和谐,愉悦听众的耳朵。 ·多音字处理改进 新的多音字处理算法提高了多音字识别的准确率。减少了系统的误读率,更容易让用户接受。 2. 产品架构方面 ·桌面版 InterPhonic CE 2.2系统提供了全新意义的桌面版,这种桌面版系统在保证与企业版相同的合成效果以外,有以下特点: 1. 系统尺寸小系统占用硬盘空间小,减少资源消耗,用户可以灵活安装,安装后占用硬盘空间比以往版本更小; 2. 系统响应时间桌面版合成系统能够快速启动,而且合成时也不会出现停顿,可以达到桌面软件应用要求; 提供与企业版相同的开发接口,改进后的TTS COM控件可以提供多个应用的并发使用。 · TTS COM v1.1 TTS COM组件是TTS SDK中一个重要的组成部分,提供该组件的目的是适应多种开发环境、简化开发过程。不少用户倾向于使用TTSCOM组件开发TTS应用程序,支持的开发工具非常广泛、语言类型多种多样。改进的TTS COM组件已经能够实现几乎所有的TTS功能,满足一般的开发需要,并在可用性、易用性方面得到进一步完善。 ·TTS Server Express v1.2 TTS Server Express提供了对基于网络的TTS服务支持,是企业版合成系统的重要组成部分,TTS网络应用的核心。TTS Server Express v1.2在功能、易用性等各方面进行了一次全面的提升。 ·CSSML Editor v1.0 通常情况下,TTS系统会根据上下文语法、语义来自动确定文本的合成方式,但由于文本的复杂性和多样性,这种自动处理难以避免会出现错误,造成合成错误,效果不理想的情况。CSSML(中文语音合成标记语言)集成了XML的优秀特性,与VoiceXML中包含的SSML兼容,可以用来指定文本合成方式,是通过标记方式改进合成效果的最佳途径。 从InterPhonic CE v2.1版本以后,CSSML规范已经成为科大讯飞合成系统的一个重要部分,后期系统还将不断扩大CSSML规范的支持范围。CSSM具有兼容VoiceXML的严谨语法格式,并提供了功能丰富的标记。CSSML Editor提供了简单易用的CSSML可视化编辑环境,使得用户可以快速高效地生成CSSML标记文本。 ·数字规则 CE22系统在数字策略定制方面将进一步改进,允许用户设置数字策略匹配规则,设置对数字串如何处理的规则。这些设置都将提供在资源管理中心界面中,增加一种全新的资源类型,这种资源从属于资源包,在资源管理中心新建“数字规则”页集中对该资源包的数字规则进行设置。使得用户可以按照自己的要求设置,进一步满足个性化的需求。 例如,可以设置这样的一条手机号码处理规则。 规则描述:手机号码的处理规则 匹配条件:数字串长度为11,前三位数字为130/133/135/136/137/138/139; 处理策略:“1”读“幺”,韵律为335。 ·CSSML支持的改进 CE22继续增强合成系统对CSSML规范的支持: 1. 支持UTF-8、UTF16格式的CSSML文本,自动识别具有文件头签名的Unicode(UTF-16 LE)文本和Utf-8文本; 2. mark标记,支持命名事件和未命名事件,这个特性同时体现在TTS SDK中; 3. audio标记支持所有合成系统能够识别的音频格式; 4. 5. sayas标记增加对人名地名的支持; 6. meta标记的支持; ·字符集转化的增强 InterPhonic CE2.2系统在字符集转化方面进行了增强: 1. 增加了对目前比较流行的编码方式UTF-8的支持; 2. 改进后的合成系统可以自动识别UNICODE文本,并且自动转化合成。支持UTF-8、UTF16格式的文本,自动识别具有文件头签名的Unicode(UTF-16 LE)文本和Utf-8文本; 合成系统的技术支持工作存在着非常雷同而繁杂的步骤——确定用户的应用环境:合成系统名称版本、操作系统名称版本、加密锁路数、资源状况等等。借助产品中提供的TTS Doctor技术支持工具,可以在便于进行远程的信息搜集和支持,更加快速的定位问题发生的可能原因,提供专业的技术支持和服务。 二、 接口改进 ·增强对CSSML文本的支持 XML因其优秀的的可扩展性和强大的数据表达能力已经成为未来Internet上数据表达和传输的标准技术,基于XML和VXML技术的CSMML规范也将成为中文语音合成的标准。CSSML规范是一套完备的中文语音合成标记规范,用户可以通过CSSML标记文本来指定文本的合成方式,这种方法能够解决一些语音合成系统难以处理的问题。 InterPhonic CE 2.2系统保持处理CSSML格式的文本的特性。在后续的版本,讯飞依然会加强对CSMML规范的支持力度。用户可以对需要合成的文本进行编辑,将其编辑为CSSML格式的文本,对一些特殊用法、发音习惯进行单独标记,用以指导合成系统的合成,就可以提高合成效果、解决合成系统无法正确合成的多种问题。 ·网络接口的改进 相应于TTS Server的升级,CE2.2对TTS SDK中的网络版标准接口进行了改进,改进之后的网络接口: 1. 支持目前本地运行库的所有参数; 2. 在连接的时侯可以指定超时时间、指定使用的网络端口; 3. 支持运行日志,便于问题解决和调试; ·TTS SDK改进 除了TTS COM v1.1、网络接口,CE2.2还对TTS SDK做了以下改进: 1.新的接口支持进程内的多次初始化; 2.SAPI接口增加了日志功能; 3.增加了多个示例程序; 4.增加了对其他开发语言的支持,如C#、。 以上无论是对合成效果的提升还是对系统架构和产品性能的优化,乃至对接口的改进,文档的修正,讯飞始终以专业的态度和高度的责任感去面对每一个问题,尽可能的考虑到实际应用的每一个细节。想得更多,做得更多,我们将继续尽心尽力,提供最优秀的产品和最完善的服务。 科大讯飞公司供稿 CTI论坛编辑

极品番号欣赏

林由奈番号

桃乃木香奈资料