多音字,英文字,可以使用同音词替换。
1.多音字可以用同音字代替(例如“执政为民”中,“为”是第四声,主播可能会读成第二声,多音字可以用同音字代替哒,例如“为”可以用“味”来代替,效果一模一样)
如果主播读的英文别扭,或者不是单音可能不太好,举个例子,目前找不到案例。哈哈,打个比方(其实主播读的是对的 ),只是提供过一种思路。有些英文 hi 可以用 嗨 来代替。
数字读错,或者日期,时间等读不对
如果主播数字读错,或者日期,时间等读不对(当然大部分是没问题的)。可能不太好,举个例子,目前找不到案例。哈哈,打个比方(其实主播读的是对的 ),,只是提供过一种思路。
1.数字读法可以直接转换成文字(例如“90年”可直接输入中文“九零年”)
<break>停顿 标签
方法一、[0.05秒]小马配音[0.03秒] 可以这样随便你写
<break time="1000ms"/> 单位是毫秒。1000ms =1s 也可以写成 1s <break time="1s"/>
<break
time="2s"/>
阴崖老木苍苍烟
<break time="700ms"/>
雨声犹在竹林间
<break time="700ms"/>
绵蕝固知裨国计
<break time="700ms"/>
绵州风物总堪怜
<break time="2s"/>
<w>标签使用:
防止歧义,或者文字/词语组合,不被分开。
实例: 南京市长<w>江大桥</w>今天发表了演讲。
其中 "市长" 是连在一起,防止歧义 其中 "江大桥" 是个人名 。所以如果需要连起来使用 这里是连起来的字如果不去处理 就会理解错。人也没法知道意思。
<phoneme> 标签使用:
标签使用 ,多音字,音调标注,方言土话都可以标注 :例如:黑色 "he4 se4" 其中的数字就是 声调 1 2 3 4 分别代表 1 2 3 4声
实例,方法一:
[0.05秒]小马配音[0.03秒],真是[行=hang2]业第一,可真[行=xing2]啊
[行=hang2] [行=xing2]
实例,方法二:
去<phoneme alphabet="py" ph="dian3 dang4 hang2">典当行</phoneme>把这个玩意<phoneme alphabet="py" ph="dang4 diao4">当掉</phoneme>
其中 "当掉" 对应的 拼音和音调 "dang4 diao4" 告诉机器您要怎么读
<sub>别名标签
描述
使用别名来替换标签内文本。 有些单词缩写读出来很不好,
可以用中文代替。例如CTO 首席技术官
CEO 首席执行官 WTO 世界贸易组织 等等
11.11 双十一
11.11
示例
<sub alias="网络协议标准">W3C</sub>
5.标签关系
<say-as>标签仅包括文本。
6.示例
cardinal(读钱的数字)
-
<say-as interpret-as="cardinal">12345</say-as>
digits(读普通数字)
<say-as interpret-as="digits">12345</say-as>
telephone(读电话号码)
<say-as interpret-as="telephone">12345</say-as>
name(人名姓氏)
她的曾用名是<say-as interpret-as="name">曾小凡</say-as>
address(地图地址住址)
<say-as interpret-as="address">富路国际1号楼3单元304</say-as>
id(用户id)
<say-as interpret-as="id">myid_1998</say-as>
characters
<say-as interpret-as="characters">希腊字母αβ</say-as>
punctuation(标点符号)
<say-as interpret-as="punctuation"> -./:;</say-as>
date(年月日)
<say-as interpret-as="date">1000-10-10</say-as>
time(<几点几分>几点几分>)
<say-as interpret-as="time">5:00am</say-as>
currency(财务银行会计钱)
<say-as interpret-as="currency">13,000,000.00RMB</say-as>
measure(单位)
<say-as
interpret-as="measure">
100m12cm6mm</say-as>
以上示例属性说明
属性名称 | 属性类型 | 属性值 | 是否必需 | 描述 |
interpret-as | String | cardinal digits telephone name address id characters punctuation date time currency measure
| 是 | 指示出标签内文本的信息类型: • cardinal: 按整数或小数发音; • digits: 按数字发音; • telephone: 按电话号码常用方式发音; • name: 按主播发音; • address: 按地址发音。 • id: 适用于账户名、昵称等。 • characters: 将标签内的文本按character一一读出。 • punctuation: 将标签内的文本按标点符号的方式读出来。 • date: 按日期发音。 • time: 按时间发音。 • currency: 按金额发音。 • measure: 按计量单位发音。 |
每种say-as类型支持的范围
- cardinal
格式 | 例子 | 输出 | 说明 |
数字串 | 145 | 一百四十五 | 整数输入范围:20位以内的正负整数,-99999999999999999999~99999999999999999999 小数输入范围: 对小数点后小数的位数没有特殊限制,但建议不超过10位 |
负号+数字串 | -145 | 负一百四十五 |
以逗号分隔3位数字串 | 10,000 | 一万 |
负号+以逗号分隔3位数字串 | -10,124 | 负一万一百二十四 |
数字串+小数点+2个零 | 10.00 | 十 |
负号+数字串+小数点+2个零 | -110.00 | 负一百一十 |
数字串+小数点+数字串 | 79.090 | 七十九点零九零 |
符号+数字串+小数点+数字串 | -79.001 | 负七十九点零零一 |
- digits
格式 | 例子 | 输出 | 说明 |
数字串 | 129090909 | 一二九零九零九零九 | 对数字串的长度没有特殊限制,但建议不超过20位;且当数字串超过10位时,每个数字后插入停顿 |
telephone
格式 | 例子 | 输出 | 说明 |
座机号 | 4930286 | 四九三 零二八六 | 支持7~8位座机号,支持空格和’-‘作为分隔符。其中: 7位座机号支持3-4的数字分隔方式。 8位座机号支持4-4的数字分隔方式 |
493 0286 | 四九三 零二八六 |
493-0286 | 四九三 零二八六 |
62552560 | 六二五五 二五六零 |
6255 2560 | 六二五五 二五六零 |
6255-2560 | 六二五五 二五六零 |
座机号+分机号 | 4930286-109 | 四九三 零二八六 转幺零九 | 支持1~4位分机号 |
4930286转109 | 四九三 零二八六 转幺零九 |
4930286分机109 | 四九三 零二八六 分机幺零九 |
4930286分机号109 | 四九三 零二八六 分机号幺零九 |
区号+座机号 | 01062552560 | 零幺零 六二五五 二五六零 | 支持区号010,02x,03xx,04xx,05xx,07xx,08xx,09xx |
010 62552560 | 零幺零 六二五五 二五六零 |
010 6255 2560 | 零幺零 六二五五 二五六零 |
010 6255-2560 | 零幺零 六二五五 二五六零 |
010-62552560 | 零幺零 六二五五 二五六零 |
010-6255-2560 | 零幺零 六二五五 二五六零 |
(010)62552560 | 零幺零 六二五五 二五六零 |
03198907098 | 零三幺九 八九零 七零九八 |
0319-8907098 | 三幺九 八九零 七零九八 |
区号+座机号+分机号 | 010 62552560-109 | 零幺零 六二五五 二五六零 转幺零九 | |
010-62552560-109 | 零幺零 六二五五 二五六零 转幺零九 |
(010)62552560-109 | 零幺零 六二五五 二五六零 转幺零九 |
(010)62552560转109 | 零幺零 六二五五 二五六零 转幺零九 |
(010)62552560分机109 | 零幺零 六二五五 二五六零 分机幺零九 |
(010)62552560分机号109 | 零幺零 六二五五 二五六零 分机号幺零九 |
国家代码+区号+座机号 | 86-010-62791627 | 八六 零幺零 六二七九 幺六二七 | 支持国家代码:86, (86), +86,(+86), 0086, 并统一读为“八六” |
(86)10-62791627 | 八六 幺零 六二七九 幺六二七 |
+86-010-62791627 | 八六 零幺零 六二七九 幺六二七 |
0086-10-62791627 | 八六 幺零 六二七九 幺六二七 |
(+86)-10-6279 1627 | 八六 幺零 六二七九 幺六二七 |
国家代码+区号+座机号+分机号 | (86)21-58118818-207 | 八六 二幺 五八幺幺 八八幺八 转二零七 | |
(86)021-5811-8818-207 | 八六 零二幺 五八幺幺 八八幺八 转二零七 |
(86)021-58118818转207 | 八六 零二幺 五八幺幺 八八幺八 转二零七 |
(86)21-5811-8818分机207 | 八六 二幺 五八幺幺 八八幺八 分机二零七 |
+86-021-58118818分机号207 | 八六 零二幺 五八幺幺 八八幺八分机号二零七 |
手机号 | 151 9099 0987 | 幺五幺 九零九九 零九八七 | 支持11位手机号,支持3-3-5,3-4-4两种数字分隔方式 |
151-909-90987 | 幺五幺 九零九 九零九八七 |
151 909 90987 | 幺五幺 九零九 九零九八七 |
国家代码+手机号 | +86-15190990987 | 八六 幺五幺 九零九九 零九八七 | |
(+86)-151-9099-0987 | 八六 幺五幺 九零九九 零九八七 |
+8615190990987 | 八六 幺五幺 九零九九 零九八七 |
0086-151 909 90987 | 八六 幺五幺 九零九 九零九八七 |
服务号 | 110 | 幺幺零 | 1.支持常用的服务号如110 2.支持以400/800开头的10位服务号,支持以3-3-4的数字分隔方式 3.支持以12530,17951,12593开头的16位号码 |
95566 | 九五五六六 |
4008110510 | 四零零 八幺幺 零五幺零 |
800-810-8888 | 八零零 八幺零 八八八八 |
1253013520638377 | 幺二五三零 幺三五 二零六三 八三七七 |
其他 | (86)(21)9899-80800-0909 | 八六 二幺 九八九九 八零八零零 零九零九 | 支持数字串+分隔符(左右括号,-) |
address
格式 | 例子 | 输出 | 说明 |
常用地址格式 | 元和镇嘉元30-9 | 元和镇嘉元三十杠九 | 支持常用地址格式。这里的地址指标准的邮寄地址。 |
市台路388弄1107-1108号 | 市台路三八八弄幺幺零七杠幺幺零八号 |
华润二十四城六期锦云府3-1-3205 | 华润二十四城六期锦云府三杠一杠三二零五 |
圣华名都大厦2幢2006室 | 圣华名都大厦二幢二零零六室 |
五常街道庭院5幢4单元201 | 五常街道庭院五幢四单元二零幺 |
芙蓉江路150弄19号 | 芙蓉江路幺五零弄十九号 |
id
格式 | 例子 | 输出 | 说明 |
字符串 | dell0101 | D E L L 零 一 零 一 | 大小写英文字符,阿拉伯数字0~9,下划线。 输出的空格表示每个字符之间插入停顿,即字符一个一个的读 |
myid_1998 | M Y I D 下划线 一 九 九 八 |
AiTest | A I T E S T |
characters
格式 | 例子 | 输出 | 说明 |
字符串 | ISBN 1-001-099098-1 | I S B N 一 杠 零 零 一 杠 零 九 九 零 九 八 杠 一 | 支持中文汉字,大小写英文字符,阿拉伯数字0~9,以及部分全角和半角字符。 输出的空格表示每个字符之间插入停顿,即字符一个一个的读。 标签内的文本如果包含XML的特殊字符,需要做字符转义。常用的共有5个:< > & " ' ,分别对应< > & " ' |
x10b2345_u | x 一 零 b 二 三 四 五 下划线 u |
v1.0.1 | v 一 点 零 点 一 |
版本号2.0 | 版本号二 点 零 |
苏M MA000 | 苏M M A 零 零 零 |
空中客车A330 | 空中客车A 三 三 零 |
型号s01 s02和s03 | 型号s 零 一 s 零二 和s 零 三 |
空中客车A330 | 空中客车A 三 三 零 |
αβγ | 阿尔法 贝塔 伽玛 |
punctuation
格式 | 例子 | 输出 | 说明 |
标点符号 | … | 省略号 | 支持常见中英文标点,具体参见详细表格。 输出的空格表示每个字符之间插入停顿,即字符一个一个的读。 标签内的文本如果包含XML的特殊字符,需要做字符转义。常用的共有5个:< > & " ' ,分别对应< > & " ' |
…… | 省略号 |
!"#$%& | 叹号 双引号 井号 dollar 百分号 and |
‘()*+ | 单引号 左括号 右括号 星号 加号 |
,-./:; | 逗号 杠 点 斜杠 冒号 分号 |
<=>?@ | 小于 等号 大于 问号 at |
[\]^_ | 左方括号 反斜线 右方括号 脱字符 下划线 |
date
格式 | 例子 | 输出 | 说明 |
xx年 | 71年 | 七一年 | xx年支持2位和4位年份,其中: 2位年份支持:60~99年, 00~09年, 10~19年 4位年份支持:1000~1999年, 2000~2099年 |
04年 | 零四年 |
19年 | 一九年 |
1011年 | 一零一一年 |
1998年 | 一九九八年 |
2008年 | 二零零八年 |
xx年xx月 | 98年4月 | 九八年四月 | 当月份为1到9月时,支持开头带”0”和不带”0”两种写法,例如”1908年4月”和”1908年04月”都可以 |
1998年04月 | 一九九八年四月 |
08年8月 | 零八年八月 |
2008年8月 | 二零零八年八月 |
xx年xx月xx日 xx年xx月xx号 | 98年4月23日 | 九八年四月二十三日 | 当日期为1到9日时,支持开头带”0”和不带”0”两种写法,例如”1908年4月8日”和”1908年04月08日”都可以 |
1998年04月23日 | 一九九八年四月二十三日 |
08年8月8号 | 零八年八月八号 |
2008年08月08号 | 二零零八年八月八号 |
xx年xx月xx日 xx年xx月xx号 | 98年4月23日 | 九八年四月二十三日 | 当日期为1到9日时,支持开头带”0”和不带”0”两种写法,例如”1908年4月8日”和”1908年04月08日”都可以 |
1998年04月23日 | 一九九八年四月二十三日 |
08年8月8号 | 零八年八月八号 |
2008年08月08号 | 二零零八年八月八号 |
xx月xx号 | 3月20日 | 三月二十日 | |
08月07号 | 八月七号 |
年月缩写 | 2018/08 | 二零一八年八月 | 支持”/“”-“”.”作为缩写的分隔符 |
2018-08 | 二零一八年八月 |
2018.08 | 二零一八年八月 |
年月日缩写 | 2018/08/08 | 二零一八年八月八日 |
2018-8-8 | 二零一八年八月八日 |
2018.08.08 | 二零一八年八月八日 |
xx年xx月xx日~xx年xx月xx日 xx年xx月xx号~xx年xx月xx号 | 04年9月1日~30日 | 零四年九月一日至三十日 | 支持”~””-“作为”至”的缩写标志 |
2004年09月01号-2008年06月08号 | 二零零四年九月一号至二零零八年六月八号 |
xx年xx月xx日~xx日 xx年xx月xx号~xx号 | 04年9月1日~30日 | 零四年九月一日至三十日 |
2004年09月01号-2008年06月08号 | 二零零四年九月一号至二零零八年六月八号 |
xx年xx月~xx年xx月 | 01年04月~10年04月 | 零一年四月至一零年四月 |
2001年04月~2010年04月 | 二零零一年四月至二零一零年四月 |
xx月xx日~xx月xx日 xx月xx号~xx月xx号 | 10月1日~10月7日 | 十月一日至十月七日 |
10月01号~10月07号 | 十月一号至十月七号 |
xx月xx日~xx日 xx月xx号~xx号 | 10月1日~7日 | 十月一日至七日 |
10月01号~07号 | 十月一号至七号 |
年月日缩写~年月日缩写 | 2018/03/03~2019/01/01 | 二零一八年三月三日至二零一九年一月一日 | 支持”/“”.”作为缩写的分隔符,支持”~””-“作为”至”的缩写标志 |
1997.9.9~1998.9.9 | 一九九七年九月九日至一九九八年九月九日 |
月日缩写~月日缩写 | 10/20~10/31 | 十月二十日至十月三十一日 |
xx~xx月 xx月~xx月 | 1~10月 | 一至十月 |
1月~10月 | 一月至十月 |
月日年缩写 | 10/20/2018 | 二零一八年十月二十日 | 仅支持4位的年份,仅支持“/”作为日期的分隔符,仅支持”月/日/年”的书写方式 |
time
格式 | 例子 | 输出 | 说明 |
时刻 | 12:00 | 十二点 | 支持常用的时间和时间范围格式 |
12:00:00点 | 十二点 |
10:20分 | 十点二十分 |
10:20:30 | 十点二十分三十秒 |
09:18:14 | 九点十八分十四秒 |
时刻~时刻 | 11:00~12:00 | 十一点到十二点 |
09:00-14:00 | 九点到十四点 |
11:00~11:30 | 十一点到十一点三十分 |
11:00-12:18 | 十一点到十二点十八分 |
10:30~11:00 | 十点三十分到十一点 |
09:28-10:00 | 九点二十八分到十点 |
10:20~11:20 | 十点二十分到十一点二十分 |
06:00~08:00 | 六点到八点 |
上午10:20~下午13:30 | 上午十点二十分到下午十三点三十分 |
时间缩写 | 5:00am | 凌晨五点整 |
5:30am | 凌晨五点半 |
5:20:12am | 凌晨五点二十分十二秒 |
7:00am | 上午七点整 |
7:30AM | 上午七点半 |
7:20:12a.m. | 上午七点二十分十二秒 |
07:08:12A.M. | 上午七点零八分十二秒 |
5:00pm | 下午五点整 |
5:30PM | 下午五点半 |
5:20:12p.m. | 下午五点二十分十二秒 |
05:09:12P.M. | 下午五点零九分十二秒 |
9:00pm | 晚上九点整 |
9:30pm | 晚上九点半 |
9:20:12PM | 晚上九点二十分十二秒 |
9:02:12P.M. | 晚上九点零二分十二秒 |
12:00pm | 中午十二点整 |
12:30p.m. | 中午十二点半 |
12:20:12PM | 中午十二点二十分十二秒 |
currency
格式 | 例子 | 输出 | 说明 |
数字+金额标识符 | 12.00RMB | 十二人民币 | 支持AUD(澳元) CAD(加元) HKD(港币) JPY(日元) USD(美元) CHF(瑞士法郎) NOK(挪威克朗) SEK(瑞典克朗) GBP(英镑) RMB(人民币) CNY(元) EUR(欧元)。 支持的数字格式包括:整数,小数,以及以逗号分隔的国际写法 |
12.50RMB | 十二点五零人民币 |
12,000,000RMB | 一千二百万人民币 |
12,000,000.00RMB | 一千二百万人民币 |
12,000.35RMB | 一万两千点三五人民币 |
金额标识符+数字 | $12 | 十二美元 | 支持 CAD(加元) $(美元) $(美元) Fr(法郎) kr(丹麦克朗) £(英镑)¥(元) ¥(元) €(欧元)。 支持的数字格式包括:整数,小数,以及以逗号分隔的国际写法 |
$12.00 | 十二美元 |
$12.12 | 二点一二美元 |
$12,000 | 一万两千美元 |
$12,000.00 | 一万两千美元 |
$12,000.99 | 一万两千点九九美元 |
其他默认读法 | 1213 | 一千二百一十三 | |
1213KML | 一千二百一十三K M L |
1213.00KML | 一千二百一十三K M L |
1213.9KML | 一千二百一十三点九K M L |
1,000KML | 一千K M L |
1,000.00KML | 一千K M L |
1,000.98KML | 一千点九八K M L |
12,000 | 一万两千 |
measure
格式 | 例子 | 输出 | 说明 |
数字+中文单位 | 2片 | 两片 | 支持常见中文单位,单位缩写,具体请参考表格meausre |
120公顷 | 一百二十公顷 |
100多毫克 | 一百多毫克 |
100来米 | 一百来米 |
100余人 | 一百余人 |
1厘米20毫米 | 一厘米二十毫米 |
120.00平方公里 | 一百二十平方公里 |
数字+单位缩写 | 120.56cm² | 一百二十点五六平方厘米 |
120㎡56cm² | 一百二十平方米五十六平方厘米 |
100m12cm6mm | 一百米十二厘米六毫米 |
范围 | 10~15kg | 十至十五千克 |
10.24~789.82亩 | 十点二四至七百八十九点八二亩 |
10米~15米 | 十米至十五米 |
10.24cm~19.08cm | 十点二四厘米至十九点零八厘米 |
数字+单位+"/"+单位 | 10元/斤 | 十元每斤 |
199~299元/件 | 一百九十九至二百九十九元每件 |
299.99元/g~399.99元/g | 二百九十九点九九元每克至三百九十九点九九元每克 |
其他默认读法 | 12扎 | 十二扎 |
30rm | 三十r m |
4万万同胞 | 四万万同胞 |
12.897微克 | 十二点八九七微克 |
其中say-as chartable如下表所示:
符号 |
读法 |
! |
叹号 |
“ |
双引号 |
# |
井号 |
$ |
dollar |
% |
百分号 |
& |
and |
‘ |
单引号 |
( |
左括号 |
) |
右括号 |
* |
星 |
+ |
加 |
, |
逗号 |
- |
杠 |
. |
点 |
/ |
斜杠 |
: |
零冒号 |
; |
分号 |
< |
小于 |
= |
等号 |
> |
大于 |
? |
问号 |
@ |
at |
[ |
左方括号 |
\ |
反斜线 |
] |
右方括号 |
^ |
脱字符 |
_ |
下划线 |
` |
反引号 |
{ |
左花括号 |
| |
竖线 |
} |
右花括号 |
~ |
波浪线 |
! |
叹号 |
“ |
左双引号 |
” |
右双引号 |
‘ |
左单引号 |
’ |
右单引号 |
( |
左括号 |
) |
右括号 |
, |
逗号 |
。 |
句号 |
— |
杠 |
: |
冒号 |
; |
分号 |
? |
问号 |
、 |
顿号 |
… |
省略号 |
…… |
省略号 |
《 |
左书名号 |
》 |
右书名号 |
¥ |
人民币符号 |
≥ |
大于等于 |
≤ |
小于等于 |
≠ |
不等于 |
≈ |
约等于 |
± |
加减 |
× |
乘 |
π |
派 |
Α |
阿尔法 |
Β |
贝塔 |
Γ |
伽玛 |
Δ |
德尔塔 |
Ε |
艾普西龙 |
Ζ |
捷塔 |
Ε |
依塔 |
Θ |
西塔 |
Ι |
艾欧塔 |
Κ |
喀帕 |
∧ |
拉姆达 |
Μ |
缪 |
Ν |
拗 |
Ξ |
克西 |
Ο |
欧麦克轮 |
∏ |
派 |
Ρ |
柔 |
∑ |
西格玛 |
Τ |
套 |
Υ |
宇普西龙 |
Φ |
fai |
Χ |
器 |
Ψ |
普赛 |
Ω |
欧米伽 |
α |
阿尔法 |
β |
贝塔 |
γ |
伽玛 |
δ |
德尔塔 |
ε |
艾普西龙 |
ζ |
捷塔 |
η |
依塔 |
θ |
西塔 |
ι |
艾欧塔 |
κ |
喀帕 |
λ |
拉姆达 |
μ |
缪 |
ν |
拗 |
ξ |
克西 |
ο |
欧麦克轮 |
π |
派 |
ρ |
柔 |
σ |
西格玛 |
τ |
套 |
υ |
宇普西龙 |
φ |
fai |
χ |
器 |
ψ |
普赛 |
ω |
欧米伽 |
其中say-as measure unit table如下表所示:
格式 | 类别 | 举例 |
缩写 | 长度 | nm(纳米) μm(微米) mm(毫米)cm(厘米) m(米) km(千米) ft(英尺) in(英寸) |
面积 | cm²(平方厘米) ㎡(平方米)km2(平方千米) SqFt(平方英尺) |
体积 | cm³(立方厘米) m³(立方米)km3(立方千米) mL(毫升) L(升) gallon(加仑) |
重量 | μg(微克) mg(毫克) g(克)kg(千克) |
时间 | min(分) sec(秒) ms(毫秒) |
电磁 | μA(微安) mA(毫安) Ω(欧姆)Hz(赫兹) KHz(千赫兹) MHz(兆赫兹) GHz(吉赫兹) V(伏) kV(千伏) kWh(千瓦时) |
声音 | dB(分贝) |
气压 | Pa(帕)kPa(千帕) Mpa(兆帕) |
中文单位 | 支持不限于上述类别的中文单位,例如“米”“秒”“美元”“毫升每瓶”等,以及中文量词,例如“架”“场”“头”“部”“盆”等 |