Page 1

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
XF-S3111
语音合成芯片数据手册
Rev1.0
ANHUI USTC iFLYTEK CO.,LTD 第 1 页 共 21 页
Page 2

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
版本历史
版本 日期 修改记录 作 者
Rev1.0 2003-9-24 科大讯飞
ANHUI USTC iFLYTEK CO.,LTD 第 2 页 共 21 页
Page 3

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
★ 本手册所用到的术语及缩写的解释说明:
① TTS:即 Text-To-Speech,通俗地说就是文本到语音的转换,通常称之为语音合成。
② InterSound:是科大讯飞公司推出的嵌入式语音合成软件的名称。
③ 任意文本合成方式:是指按照普通合成算法处理任何形式的中文文本(包括英文字母)的语音合
成方式。
④ 受限文本:是指特殊场合下所使用的文本,比如电话号码、日期时间及一些专用术语等。
⑤ 定制合成方式:是针对受限文本所制定的专门的合成方式,它和普通合成算法相比,合成效果更
为准确和自然。它包括号码定制合成、数值定制合成、日期时间定制合成。
⑥ 提示音:通俗地说就是“预录音”,它可以根据不同的用户需求,对一些固定的文本内容或者简单
的提示音乐,事先录制,当合成系统遇到这些固定文本或者音乐代号的时候,直接使用预先录制
的自然语音进行回放,达到较好的语音效果;如果提示音配合其他定制合成一起使用,可以在一
些特定领域下接近真人播报的效果。
⑦ 文本内码:是指文本的编码格式,常用的有 GB2312、GBK、BIG5 和 UNICODE。其中中国大陆
地区常用的文本内码是 GB2312;台湾地区常用的文本内码是 BIG5;中文网页上的文本大部分是
用 GBK 的编码格式;UNICODE 编码是一种国际通用的编码格式。
⑧ 控制标识:是指简短的文本标记,能够控制合成系统的最终表现形式。例如,通过“数字读法”
的控制标识,用户可以任意制定遇到数字串的时候,是按数值方式还是号码方式来念,当然,也
可以选择让系统自动判断。
ANHUI USTC iFLYTEK CO.,LTD 第 3 页 共 21 页
Page 4

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
目录
目录........................................................................................................................................................................... 4
图表目录................................................................................................................................................................... 5
1 概述................................................................................................................................................................... 6
2 特点................................................................................................................................................................... 6
3 主要应用领域................................................................................................................................................... 6
4 系统框图........................................................................................................................................................... 7
5 引脚定义........................................................................................................................................................... 7
6 功能描述........................................................................................................................................................... 8
7 串口通讯协议................................................................................................................................................. 10
7.1 通讯格式......................................................................................................................................... 10
7.1.1 通讯波特率............................................................................................................................. 10
7.1.2 通讯传输字节格式 ................................................................................................................. 10
7.1.3 通讯传输数据帧格式 ............................................................................................................. 10
7.2 命令数据描述................................................................................................................................. 10
7.2.1 发送给 XF-S3111 的命令数据............................................................................................... 10
7.2.2 XF-S3111 回传的数据............................................................................................................ 11
7.3 协议使用示例................................................................................................................................. 11
8 工作方式......................................................................................................................................................... 11
8.1 串口数据交互................................................................................................................................. 11
8.2 状态电平查询................................................................................................................................. 11
9 电气特性......................................................................................................................................................... 12
9.1 极限参数......................................................................................................................................... 12
9.2 直流特性......................................................................................................................................... 12
9.3 直流特性(续)............................................................................................................................. 12
10 信号时序图 ............................................................................................................................................. 13
11 文本使用范例......................................................................................................................................... 14
11.1 数字、号码文本............................................................................................................................. 14
11.1.1 系统能够识别的格式 ............................................................................................................. 14
11.1.2 控制标识使用示例 ................................................................................................................. 14
11.2 数值文本......................................................................................................................................... 15
11.2.1 系统支持的格式说明 ............................................................................................................. 15
11.2.2 使用示例................................................................................................................................. 15
11.3 日期时间文本................................................................................................................................. 16
11.3.1 日期时间常用格式说明 ......................................................................................................... 16
11.3.2 使用示例................................................................................................................................. 16
11.4 提示音............................................................................................................................................. 16
11.4.1 提示音乐................................................................................................................................. 17
11.4.2 提示音使用示例..................................................................................................................... 17
11.5 多内码识别..................................................................................................................................... 17
11.5.1 内码控制标识......................................................................................................................... 17
ANHUI USTC iFLYTEK CO.,LTD 第 4 页 共 21 页
Page 5

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
11.5.2 使用示例................................................................................................................................. 18
12 封装结构图 ............................................................................................................................................. 18
附录......................................................................................................................................................................... 19
图表目录
图表 1 系统框图......................................................................................................................................... 7
图表 2 XF-S3111 引脚定义表.................................................................................................................... 7
图表 3 控制标识详细列表......................................................................................................................... 9
图表 4 通讯传输字节格式....................................................................................................................... 10
图表 5 通讯传输数据帧格式................................................................................................................... 10
图表 6 发送的命令数据说明................................................................................................................... 10
图表 7 回传的数据说明........................................................................................................................... 11
图表 8 电气极限参数............................................................................................................................... 12
图表 9 直流特性(VDD = 3.0V T
图表 10 直流特性(VDD = 3.3V T
图表 11 信号时序图 ................................................................................................................................... 13
图表 12 封装平面图................................................................................................................................. 18
图表 13 常用的系统能自动识别的电话号码及数字.............................................................................. 19
图表 14 系统能自动识别的数值书写格式及单位.................................................................................. 20
图表 15 系统能识别的常用日期时间书写格式...................................................................................... 20
图表 16 系统目前预存的提示音一览表 ................................................................................................. 21
= 25℃)............................................................................... 12
A
= 25℃)............................................................................... 12
A
ANHUI USTC iFLYTEK CO.,LTD 第 5 页 共 21 页
Page 6

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
1 概述
XF-S3111 中文语音合成芯片,是安徽中科大讯飞信息科技有限公司(科大讯飞)推出的基于科大讯飞
在嵌入式中文语音合成领域的最新研究成果――InterSound3.0 中文语音合成系统,而设计的一款中文语音
合成芯片。它通过异步串口接收待合成的文本,直接合成为语音输出,体积较小,使用方便;主要是面向
中低端应用,为其提供一套完整的物美价廉的语音解决方案。
2 特点
清晰、流畅、自然的中文语音合成效果
多文本内码支持,包括 GB2312、GBK、BIG5 和 UNICODE
内嵌多种合成方式,包括任意中文文本合成方式(支持英文字母),号码定制、数值定制、日期
时间定制合成方式和提示音
通用异步串行数据通讯接口,波特率 9600bps
10bit DAC 模拟音频输出
提供合成控制命令,可任意控制输入数据的合成与停止
工作状态指示输出
低工作电压:2.7V~3.6V
COB(Chip-On-Board)封装,较小封装尺寸
3 主要应用领域
车载 GPS 语音导航系统
车载电话号码、短信播报系统
公交车语音报站、公告播报系统
智能仪表
智能玩具
自动售货
语音导游
ANHUI USTC iFLYTEK CO.,LTD 第 6 页 共 21 页
Page 7

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
4 系统框图
图表 1 系统框图
5 引脚定义
图表 2 XF-S3111引脚定义表
引脚序号 引脚名称 功能描述 备注
1 NC
2 TXD
3 RXD
4
5 NC
6 NC
7 RST
8 AUDIO
9 VDD
10 GND
11~20
RDY/BSY
NC
Not Connect
异步串行数据发送引脚
异步串行数据接收引脚
工作状态指示输出信号。低电平表示芯片处于数据接收就绪状态,可
以接收数据和命令;高电平表示芯片处于数据合成状态,此时仍然能
响应接收到的数据和命令,如果接收到新的合成数据,则会停止先前
的合成,转而合成接收到的最新的数据
Not Connect
Not Connect
芯片复位信号引脚,低电平有效
DAC 模拟声音输出信号
电源输入+3.3V
电源地
Not Connect
ANHUI USTC iFLYTEK CO.,LTD 第 7 页 共 21 页
Page 8

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
6 功能描述
XF-S3111 语音合成芯片是科大讯飞公司推出的又一款中文语音合成产品,它采用了科大讯飞公司最新
的嵌入式语音合成系统 InterSound3.0 的内核,在文本处理前端集成了多种智能的文本分析算法,将规则和
统计等处理方法进行了有机的结合,具备了较强的分词、多文本内码识别、多音字识别、姓氏识别、韵律
环境预测能力,以及自动识别和处理日期时间、数值金额、电话号码等文本的能力。
XF-S3111 内嵌多种合成方式,包括任意中文文本(支持英文字母)合成方式、定制合成方式以及提示
音,其中定制合成又包括号码、数值、日期时间定制合成。下面对各种合成方式之间的关系给予详细说明。
在默认情况下,对于所有的文本,XF-S3111 是调用任意文本合成方式进行合成。
对于特殊的数字串文本,例如电话号码、数值、日期时间等,在一定的书写格式或者特定的前后
语境下(详见附录),系统是能够自动识别的。但是由于中文的复杂性,导致在某些情况下系统
不能够准确无误地识别文本类型(是数值还是号码),这时就必须在这些文本前面加一些控制标
识(详见图表 3 控制标识详细列表),以此来告知系统文本的类型,从而保证合成结果的正确性。
详情请见“11.文本使用范例”。
在一些特殊的使用场合,例如车载电话、证券市场等,对于待合成的文本有很好的控制性的条件
下,如果对任意文本合成方式的合成效果不太满意,可以通过加一些控制标识(详见图表 3 控制
标识详细列表)让系统调用定制合成方式来合成。用户可以选择让系统自动识别并调用相应的定
制来合成,也可以选择强制把某些文本送到某个定制去合成。详情请见“11.文本使用范例”。
提示音,也叫做“预录音”,主要是对用户在那些特殊场合使用的相对固定的短语(比如“您好”、
“欢迎光临”等),或者一段简单的提示音乐提供的一种解决方案,如果配合其他的定制合成方
式来使用能够接近真人播报的效果,详情请见“11.4 提示音”。从某种意义上说,它能够代替录
音芯片,但是所具有的随意更改合成文本的灵活性是录音芯片远远不可比拟的。
XF-S3111 在文本分析中增加了对多文本内码的识别,支持的文本编码格式有 GB2312、GBK、BIG5
和 UNICODE。其中中国大陆地区常用的文本编码格式是 GB2312;台湾地区常用的文本编码格式
是 BIG5;中文网页常用的编码格式是 GBK;UNICODE 编码是国际通用的编码格式。系统默认
情况下识别 GB2312 编码格式的文本,如果用户想合成其他编码格式的文本,需要在文本前加控
制标识(详见图表 3 控制标识详细列表)。详细使用情况请见“11.5 多文本内码识别”。
ANHUI USTC iFLYTEK CO.,LTD 第 8 页 共 21 页
Page 9

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
图表 3 控制标识详细列表
作用 控制标识 详细说明 系统默认
当“?”为 0 时,系统自动判断究竟是读号码还是读数值
阿拉伯数字
的读法
[n?]
当“?”为 1 时,系统强制把数字读成号码
[n0]自动
识别
当“?”为 2 时,系统强制把数字读成数值
当“?”为 0 时,不使用定制,全部使用任意文本合成方式
是否自动使
用定制合成
方式
[a?]
合成
当“?”为 1 时,根据自动识别的文本类型使用相应的定制
来合成,如日期就用“日期时间定制”、
[a0] 不使
用定制合
成方式
数值就用“数值定制”来合成等
[LS]文本[] 把文本强制送到“号码定制”去合成
指定某个定
制
[LV]文本[] 把文本强制送到“数值定制”去合成
[LT]文本[] 把文本强制送到“日期、时间定制”去合成
号码中“1”
的读法
静音控制
恢复默认设
置
[y?]
[p?]
[d] 能够把以上的所有设置全部还原为默认值
当“?”为 0 时,合成号码时“1”读成“幺”
当“?”为 1 时,合成号码时“1”读成“一”
“?”为一个正整数,代表静音多少毫秒。
[y0]默认
读“幺”
无静音
当“?”为 0 时,表示使用 GB2312 编码格式的文本
多文本内码
的识别
[c?]
当“?”为 1 时,表示使用 GBK 编码格式的文本
当“?”为 2 时,表示使用 BIG5 编码格式的文本
当“?”为 3 时,表示使用 UNICODE 编码格式的文本
注:
1)、所有的控制标识均为半角字符。
2)、除了“[LS]…[]”、“[LV]…[]”、“[LT]…[]”这三个控制标识为局部控制标识(也就是只对标识内
部的文本生效)以外,其他的控制标识为全局控制标识,也就是只要用了一次,在不对芯片复位
或者断电的条件下,其后发送给芯片的所有文本都会处于它的控制之下,除非用相应的[?0]或者
[d]恢复默认设置。所以,用户在使用的时候,一定要注意控制标识的作用范围。
3)、“[d]”控制标识不能还原文本内码的默认设置,即文本内码的默认值恢复只能用[c0]。
[c0]
ANHUI USTC iFLYTEK CO.,LTD 第 9 页 共 21 页
Page 10

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
7 串口通讯协议
XF-S3111 是通过异步串口(UART)接收数据的,发送给 XF-S3111 的所有命令和数据都是通过封装好
的“帧”的形式传送的,每一帧数据所包含的待合成文本的最大长度为 140 个字节;而 XF-S3111 回传的
数据只是单个字节的数据。
7.1 通讯格式
7.1.1 通讯波特率
9600bps
7.1.2 通讯传输字节格式
图表 4 通讯传输字节格式
串口数据传输字节格式:1 bit 起始位,8 bit 数据位,1 bit 停止位。
7.1.3 通讯传输数据帧格式
图表 5 通讯传输数据帧格式
Byte0 Byte1 Byte2 Byte3 Byte4…Byte n(n ≤ 143)
帧头标志 命令字 数据区长度(2 Byte) 数据区(<=140 Byte)
0xFE 0x×× 网络字节序 Data
7.2 命令数据描述
7.2.1 发送给XF-S3111 的命令数据
发送给 XF-S3111 的所有命令数据都是通过“帧”的形式发送,详细说明如下。
图表 6 发送的命令数据说明
名称 发送的数据 说明
帧头标志 0xFE
命令字
数据区长度 0x00,0x××
0x01 合成命令,后面带需要合成的文本
0x02 停止合成命令,没有参数
占两个字节,字节序是网络字节序,即发送时,
ANHUI USTC iFLYTEK CO.,LTD 第 10 页 共 21 页
Page 11

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
高字节在前,低字节在后
数据区
7.2.2 XF-S3111 回传的数据
芯片 XF-S3111 通过串口回传的数据只是单个字节的数据,说明如下:
图表 7 回传的数据说明
当芯片正确接收到命令/数据(包括合成命令 0x01 和停止命令 0x02)时 0x41(“A”)
当芯片收到不能识别的命令时 0x45(“E”)
当一帧数据合成完以后 0x4F(“O”)
Data 数据区的最大长度是 140 个字节
状 态 回传数据
7.3 协议使用示例
为了方便用户使用,在此给出一个文本发送的具体示例。
例如需要合成的文本为:
欢迎使用科大讯飞语音合成芯片!(GB2312 码:BB B6 D3 AD CA B9 D3 C3 BF C6 B4 F3 D1 B6 B7 C9 D3 EF
D2 F4 BA CD B3 C9 D0 BE C6 AC A3 A1)
则发送的命令数据帧为:
0xFE 0x01 0x00 0x1E 0x BB 0xB6 0xD3 0xAD 0xCA 0xB9
0xD3 0xC3 0xBF 0xC6 0xB4 0xF3 0xD1 0xB6 0xB7 0xC9
0xD3 0xEF 0xD2 0xF4 0xBA 0xCD 0xB3 0xC9 0xD0 0xBE
0xC6 0xAC 0xA3 0xA1
如果想停止当前正在合成的文本,则发送的停止命令帧为:
0xFE 0x02
特别说明:当芯片 XF-S3111 正在合成文本的时候,如果又接收到一帧有效的数据,芯片会立即停止
当前正在合成的文本,转而合成所接收到的最新的文本。
8 工作方式
在实际使用中,XF-S3111 有两种工作方式,一种是串口数据交互,另一种是状态电平查询。
8.1 串口数据交互
这种工作方式,是通过异步串口接收 XF-S3111 回传的数据,根据这个回传的数据来判断 XF-S3111 所
处的工作状态。当芯片正确接收到一帧数据后,会立即回传“0x41”;当遇到不识别的命令时,会立即回
传“0x45”;当合成完一帧数据后,会回传“0x4F”。
8.2 状态电平查询
在这种工作方式下,是通过查询 XF-S3111 的状态输出引脚/RDY 的电平,来判断芯片工作的状态的。
ANHUI USTC iFLYTEK CO.,LTD 第 11 页 共 21 页
Page 12

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
当/RDY 处于高电平时,表明芯片处于合成文本状态;当/RDY 处于低电平状态时,表明芯片处于就绪状态,
可以接收命令和数据。
9 电气特性
9.1 极限参数
图表 8 电气极限参数
参 数 符 号 极 限 值
电源电压 VDD 3.6V
引脚输入电压范围 V
工作温度 TA 0℃ to +60℃
储存温度 T
注:超出表中所列的极限参数,将导致操作错误或器件损坏。
9.2 直流特性
-0.5V to VDD+0.5V
IN
STO
-45℃ to +100℃
图表 9 直流特性(VDD = 3.0V TA = 25℃)
参 考 值
参 数 符 号
单位 测试条件
最小 典型 最大
工作电压 VDD 2.7 3.3 3.6 V
工作电流 I
输入高电平 V
输入低电平 V
输出电流 I
吸收电流 I
DAC 输出电流 I
-- 20 -- mA
OP
0.7VDD -- -- V
IH
-- -- 0.3VDD V
IL
-- -2.0 -- mA
OH
-- 4.4 -- mA
OL
-- -2.0 -- mA
DAC
9.3 直流特性(续)
图表 10 直流特性(VDD = 3.3V TA = 25℃)
参 数 符 号
工作电压 VDD 2.7 3.3 3.6 V
工作电流 I
输入高电平 V
输入低电平 V
输出电流 I
吸收电流 I
DAC 输出电流 I
-- 26 -- mA
OP
0.7VDD -- -- V
IH
-- -- 0.3VDD V
IL
-- -2.9 -- mA
OH
-- 6.7 -- mA
OL
-- -3.0 -- mA
DAC
参 考 值
最小 典型 最大
单位 测试条件
ANHUI USTC iFLYTEK CO.,LTD 第 12 页 共 21 页
Page 13

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
10 信号时序图
XF-S3111 的主要信号时序示意图如下。
图表 11 信号时序图
注:T
的典型时间是 10ms;当 T
RST
上升到高电平以后,需要等到 50ms 以后才能开始给芯片发送命令/
RST
数据,以保证芯片可靠复位。
ANHUI USTC iFLYTEK CO.,LTD 第 13 页 共 21 页
Page 14

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
11 文本使用范例
XF-S3111 语音合成芯片可以支持任意的中文文本到语音的转换,对于一些特殊的数字串(例如电话号
码、数值、日期时间等)在一定的书写格式及特定的语境下,也能够自动识别。但是由于中文语境和书写
形式的复杂性,导致了系统不可能在任何情况下都能准确无误的识别,所以对于这些特殊的文本,必须进
行特殊处理,通过在前面加一些控制标识(详见图表 3)来告诉系统其正确的合成方式。XF-S3111 有多种
合成方式,默认情况下,使用任意文本合成方式来合成文本。对于号码、数值、日期时间等,用户也可以
选用定制合成方式来合成。
下面分别举例子说明。
11.1 数字、号码文本
11.1.1 系统能够识别的格式
对于是号码数字串,在一定的书写格式下(比如没有小数点并且第一个数字为0,则按号码的方式念)
和语境下,系统能够自动识别,从而按照人们通常的习惯合成出语音,例如:
“(0551)5331800-1838”合成出来的语音为“零五五幺 五三三幺八零零转幺八三八”;
“邮政编码:230088”合成出来的语音为“邮政编码二三零零八八”。
系统能够自动识别的常用书写格式及语境,详见附录“图表 13”。
11.1.2 控制标识使用示例
例句一:“公司的咨询电话是(086)0551-5331800-1838。”
使用说明:
(1)、系统能够自动识别该段文本中的电话号码的格式,所以只需要直接通过串口发送即可,系
统默认通过任意文本合成方式合成。合成出来的语音为:
“公司的咨询电话是 零八六 零五五幺 五三三幺八零零转幺八三八”
(2)、如果希望用定制合成方式合成号码时,则发送的文本及其所加的标识为:
“[a1]公司的咨询电话是 (086)0551-5331800-1838。[a0]”念法同上,只是声音略有不同。
如果希望用定制合成方式合成号码,并且“1”不念作“幺”,而念“一”,则为
“[a1][y1]公司的咨询电话是 (086)0551-5331800-1838。[d]”合成出来的语音为
“公司的咨询电话是 零八六 零五五一 五三三一八零零转一八三八”。
注:[a0]、[d]的作用都是为了恢复默认设置,下同。
例句二:“小明的手机号是 13956002507。”
使用说明:
(1)、这也是系统根据前后语境能够识别的格式,任意文本合成方式合成出来的语音为:
“小明的手机号是幺三九五六零零二五零七”
ANHUI USTC iFLYTEK CO.,LTD 第 14 页 共 21 页
Page 15

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
(2)、当需要用定制合成方式合成号码时,发送的文本为:
“[a1]小明的手机号是 13956002507。[d]”
或者“[n1]小明的手机号是 [LS]13956002507[]。[n0]”在这里之所以要加“[n1]”,是因为
加了控制标识“[LS]”把前后语境分开,系统可能认为“13956002507”是数值,所以必须
加“[n1]”让系统按照电话号码的方式合成。
例句三:“小明的手机号是(86)13956002507。”
使用说明:
(1)、该例句里面尽管有“手机号是”的语境,但是由于“(86)”把前后分开,系统会认为
“13956002507”为数值,所以为了正确合成,必须加“[n1]”来强制系统按号码合成,正
确发送的文本为:
“[n1]小明的手机号是(86)13956002507。[n0]”
合成出的语音为:
“小明的手机号是八六幺三九五六零零二五零七”
(2)、当需要用定制合成方式合成号码时,发送的文本为:
“[n1][a1]小明的手机号是(86)13956002507。[d]”
或者“[n1]小明的手机号是[LS](86)13956002507[]。[d]”
11.2 数值文本
11.2.1 系统支持的格式说明
XF-S3111 能够识别的最大整数位数为 12 位、小数不限,当一个数字串超过了 12 位,系统会默认按照
号码来合成。系统支持的常见数值的书写格式,如“123.56”、“12,345,678”、“0.56%”等等;同时,也支
持常见的度量衡单位,例如长度单位 m、cm、km,重量单位 g、kg,美元$,摄氏度℃等等,详见附录“图
表 14”。
11.2.2 使用示例
例句一:“上证指数 1,474.41 点,涨幅 0.21%,成交量 367.39 亿元。”
使用说明:
(1)、可以直接发送给芯片,使用任意文本合成方式合成,输出的语音为:
“上证指数一千四百七十四点四一点 涨幅百分之零点二一 成交量三百六十七点
三九亿元”
(2)、对数值,当需要用定制合成方式合成时,发送的文本变为:
“[a1]上证指数 1,474.41 点,涨幅 0.21%,成交量 367.39 亿元。[a0]”
例句二:“上半场的比分是 110:98”
使用说明:
(1)、也可以直接发送给芯片,使用任意文本合成方式合成。输出的语音为:
“上半场的比分是一百一十比九十八”
(2)、对数值,当需要使用定制合成方式合成时,发送的文本变为:
“[a1]上半场的比分是 110:98[d]”
ANHUI USTC iFLYTEK CO.,LTD 第 15 页 共 21 页
Page 16

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
注意:由于“[LV]110:98[]”会强制“110:98”用数值定制合成方式去合成,而数
值定制合成不能合成“比”这个字,所以在这里不能用“[LV…[]”控制标识”。
之所以能用“[a1]”是因为它能够自动把“比”用任意文本合成方式合成输出。
11.3 日期时间文本
11.3.1 日期时间常用格式说明
XF-S3111 支持常见的日期时间的书写格式,例如
“2003-9-7”会念为“二零零三年九月七日”;
“8:30AM”会念为“上午八点三十分”;
“MAR.10,2003”会念为“二零零三年三月十日”;
系统支持的最大年份为“2099 年”、最大月份为“12 月”、最大日期为“31 日”;最大小时数为“23
点”、最大分钟和秒均为“59”。
系统支持的更多的格式,请见附录“图表 15”。
11.3.2 使用示例
例句一:“2003-9-2 下午 4:22。”
使用说明:
(1)、直接发送给芯片,采用任意文本合成方式合成,输出的语音为:
“二零零三年九月二日下午四点二十二分”
(2)、对日期时间,需要采用日期时间定制合成方式合成时,发送的文本变为:
“[a1]2003-9-2 下午 4:22。[a0]”
或者“[LT]2003-9-2[]下午[LT]4:22[]。”
例句二:“2003 年 9 月 2 日星期二”
使用说明:
(1)、直接发送给芯片,采用任意文本合成方式合成,输出的语音为:
“二零零三年九月二日星期二”
(2)、对日期时间,需要采用日期时间定制方式合成时,发送的文本变为:
“[a1]2003 年 9 月 2 日星期二[d]”
11.4 提示音
提示音,也就是“预录音”,主要是针对那些在特殊场合下使用的相对固定的短语(如“您好”、“来
电号码”等),或者简单的提示音乐,进行预先录制,然后当系统在合成过程中一旦发现该提示音,就会
直接回放出来,从而增强合成效果。它在使用上没有特殊性,就是按照普通的文本使用,只要能够单独成
为一个分句,系统就会自动识别,所以使用很方便。从某种意义上说,它能够代替录音芯片,但是所具有
的随意更改合成文本的灵活性是录音芯片远远不可比拟的。
系统当前支持的定制语表见附录“图表 16”。
ANHUI USTC iFLYTEK CO.,LTD 第 16 页 共 21 页
Page 17

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
11.4.1 提示音乐
简单的提示音乐,主要是为了方便在车站、机场、码头以及其他一些公共的场合播放信息时给听众一
种提醒,告诉听众有新的信息要播报。目前放了两种音乐在系统中,代号分别为“waveone”和“ wavetwo”,
举例如下:
使用例子:“wavetwo,[p500]开往深圳方向的 T1505 次列车开始检票了,请买好了车票的旅客迅速到
检票口检票上车”
注:[p500]为静音控制标识,是为了增加间隔时间。
11.4.2 提示音使用示例
例句:“来电号码:13856002505;来电时间:2003-9-2。”
使用说明:
(1)、直接通过串口发送给芯片,它会自动识别定制语句,结合语境,也能够自动识别电话
号码。输出的语音为:
“来电号码 幺三八五六零零二五零五 来电时间 二零零三年九月二日”
(2)、对于号码和时间,如果希望通过定制合成方式来合成,则发送的文本变为:
“[a1]来电号码:13856002505;来电时间:2003-9-2。[d]”
或者“来电号码:[n1][LS]13856002505[][n0];来电时间: [LT]2003-9-2[]。”
注意:在这里需要多加一个“[n1]”控制标识的原因,是因为控制标识“[LS]…[]”把
把前后语句断开,系统无法根据前后语境来识别“13856002505”为号码,会
把它作为数值来合成,所以需要加“[n1]”来告诉系统后面的数字按号码合成;
由于“[n1]”的作用域是全局的,所以需要在使用完后通过加“[n0]”来还原系
统的设置,避免系统把以后的数值或者时间都当作号码来合成。
11.5 多文本内码识别
11.5.1 控制标识
XF-S3111 支持 GB2312、GBK、BIG5 和 UNICODE 的文本内码的识别,默认情况下识别 GB2312 编
码格式的文本,当需要使用其他编码格式的文本时,需要在前面加如下表所示的控制标识,这些控制标识
都是对下一句文本有效的,即在一帧数据里,如果有几种编码格式的文本,必须在每一种编码格式的文本
前加控制标识,同时在每一个控制标识后面加上半角的冒号和引号“:””。
编码格式 控制标识
GB2312
GBK
BIG5
UNICODE
[c0]
[c1]
[c2]
[c3]
ANHUI USTC iFLYTEK CO.,LTD 第 17 页 共 21 页
Page 18

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
11.5.2 使用示例
例句一:“以下是台湾地区使用的 BIG5 编码文本[c2]:”タ絋粄醚㎝癸 硂琿菌 懦 ゼ
ㄓ[c0]:”科大讯飞。”
合成出来的语音为:
“以下是台湾地区使用的BIG五编码文本,正确认识和对待这段历史,以史为鉴,面向未
来,科大讯飞”
例句二:“诗词 GBK 编码[c1]:”故人西辭黃鶴樓,煙花三月下揚州。孤帆遠影碧空盡,惟見長江天際
流[c0]”
注意:在例子里,每一个控制标识后面都加了一个半角的冒号和引号,目的是为了把控制标识和后面
的语句区分出来,以此来告诉系统,下面的文本是另一种编码格式的文本;如果用户使用的所有文本只是
一种编码格式的文本,不需要频繁切换时,可以首先把相应的控制标识“[c?]”单独作为一帧数据发下去,
以后就不需要在每一帧的开始都加控制标识了;如果要恢复 GB2312 编码格式的文本合成方式,必须用
“[c0]”,而不能用“[d]”。
12 封装结构图
图表 12 封装平面图
ANHUI USTC iFLYTEK CO.,LTD 第 18 页 共 21 页
Page 19

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
附录
图表 13 常用的系统能自动识别的电话号码及数字
类 别 书 写 形 式
能自动识别
的电话号码
格式
086-0551-5331800-1838
(086)0551-5331800-1838
086/0551/5331800/1838
(010)88235690,1234
(010)88235690,,,1234
010-88235690-1234
(010)88235690/1234
086-0551-5331800
(086)(0551)5331800
086/0551/5331800
(0551)5331863/5331890
(0551)5331863,5331890
0551-5331863/5331890
0551-5331863,5331890
结合前后语
境,能够识别
为号码的常
用文本
特殊应用场
合
(0551)5331800
0551-5331800
83185878-1234
ID:3601363
sn:3601363
MB:3601363
FAX:3601363
TEL:3601363
NUM:3601363
密码 123456
邮编 230088
编码 88562389
代码 346
赛扬 566
皖 A00001
5 楼 102
‘96 财富论坛
013856002500
138-56002500
电话 3601363
热线 3601363
传真 83185749
传呼 1298956756
手机 13856002507
号 123456789
请拨 5331800
致电 05515331838
垂询 01086562378
拨打 13856002507
9·11
17909
211.162.5.93
ANHUI USTC iFLYTEK CO.,LTD 第 19 页 共 21 页
Page 20

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
图表 14 系统能自动识别的数值书写格式及单位
类 别 格式说明 类 别 格 式 说 明
支持的最大
整数位数
支持的数值
的书写格式
12 位(小数位数
不限)
1,234,567,890
12,234,567,890
123,234,567,890
123456.123
123,456.456
45%
56‰
支持常用的
度量衡单位
特殊书写格
式的合成
特殊数值的
识别
¥<人民币>、$<美元>、£<英镑>、¢<欧元>
“°”<度>、”℃”<摄氏度>、”.” <点>
km<公里>、m<米>、dm<分米>、cm<厘米>、
mm<毫米>、in<英寸>、ft<英尺>、hz<赫兹>、
W<瓦>、KW<千瓦>、M<兆>、
mg<毫克>、g<克>、kg<千克>等等
32 米/秒 ——读作“三十二米每秒”
23.56-56.23 公斤——“-”读作“至”
12kg-56kg
比分是 12:23
比例是 12:23
比分为 12:23:4
(通过前面加语境,用以区分是时间还是比分)
图表 15 系统能识别的常用日期时间书写格式
类 别 格式说明 类 别 格式说明
1978.10.19
1978/10/19
1978-10-19
1978·10.19
日 期
1978·10/19
10.19.1978
10/19/1978
10-19-1978
2003 年 9 月 1 日(号)
1979-2003 年
ANHUI USTC iFLYTEK CO.,LTD 第 20 页 共 21 页
78.10.19
78/10/19
78-10-19
78·10.19
78·10/19
1978.10.
1978/10/
1978.10
03 年 09 月 01 日(号)
79-03 年
时 间
12:30:34
09:07AM
09:07PM
09:07 AM
09:07 PM
9:00:00
02:45-4:50
23 点 45 分 32 秒
23 时 45 分 32 秒
2003 年 9 月 1 日 16 时 25 分 34 秒
Page 21

XF-S3111
安徽中科大讯飞信息科技有限公司 语音合成芯片数据手册 Rev1.0
带英文
字母的
日期
注 释
March10,2003
MAR.10,2003
10december,2003
february10
日期中的“号”,都读作“日”;支持的最
大合成年份为 2099 年、最大的合成月份为 12
月、最大的合成日期为 31 日
march10,03
MAR.10,03
10december,03
FEB.10
注释
时间中支持“九点整”的读法;
所有的“时”均读作“点”;
支持的最大小时数为 23 点;
支持的最大分钟和秒数均为 59;
对于“12:30”这种书写格式的
文本,当超过范围后就会按照比
例来读。
图表 16 系统目前预存的提示音一览表
序号 语 句 序号 语 句 序号 语 句 序号 语 句
1 第一条 9 第九条 17 吃饭 25 南京
2 第二条 10 第十条 18 下班 26 广州
3 第三条 11 有来电 19 赶飞机 27 深圳
4 第四条 12 现在时间 20 赴会 28 武汉
5 第五条 13 现在是 21 打电话 29 地区来电
6 第六条 14 时间到 22 北京 30 来电号码
7 第七条 15 上班 23 上海 31 来电时间
8 第八条
16 开会 24 合肥
地址:中国安徽省合肥市长江西路 669 号合肥软件园 2 号楼
电话:(0551)5331887 5331838
传真:(0551)5331801 5331862
网址:www.iflytek.com
技术支持邮件:speechic@iflytek.com
ANHUI USTC iFLYTEK CO.,LTD 第 21 页 共 21 页