读取中,请稍候

00-00 00:00:00
--.--
0.00 (0.000%)
昨收盘:0.000今开盘:0.000最高价:0.000最低价:0.000
成交额:0成交量:0买入价:0.000卖出价:0.000
市盈率:0.000收益率:0.00052周最高:0.00052周最低:0.000
8-1北京海天瑞声科技股份有限公司及华泰联合证券关于审核问询函的回复 下载公告
公告日期:2019-06-12

8-1-1

关于北京海天瑞声科技股份有限公司

首次公开发行股票并在科创板上市申请文件

第三轮审核问询函的回复

保荐机构(主承销商)

(深圳市福田区中心区中心广场香港中旅大厦)

上海证券交易所:

根据贵所于2019年6月6日印发的上证科审(审核)〔2019〕231号《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件的第三轮审核问询函》(以下简称“问询函”)的要求,华泰联合证券有限责任公司(以下简称“华泰联合”或“保荐机构”)作为北京海天瑞声科技股份有限公司(以下简称“海天瑞声”、“发行人”或“公司”)首次公开发行股票并在科创板上市的保荐机构(主承销商),会同发行人及发行人律师北京市天元律师事务所(以下简称“天元律师”)和瑞华会计师事务所(特殊普通合伙)(以下简称“瑞华会计师”)等相关各方,本着勤勉尽责、诚实守信的原则,就问询函所提问题逐项进行认真讨论、核查与落实,并逐项进行了回复说明。具体回复内容附后。

说明:

1、如无特别说明,本回复中使用的简称或名词释义与《北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市招股说明书(申报稿)》(以下简称“招股说明书”)一致。涉及招股说明书补充披露或修改的内容已在招股说明书中以楷体加粗方式列示。

2、本回复中若出现总计数尾与所列值和不符的情况,均为四舍若出现总计数尾与所列值和不符的情况,均为四舍若出现总计数尾与所列值和不符的情况,均为四舍五入所致。

3、本回复中涉及的我国、我国经济以及行业的事实、预测和统计,包括本公司的市场份额等信息,来源于一般认为可靠的各种公开信息渠道。本公司从上述来源转载或摘录信息时,已保持了合理的谨慎,但是由于编制方法可能存在潜在偏差,或市场管理存在差异,或基于其他原因,此等信息可能与国内或国外所编制的其他资料不一致。

8-1-3

目 录

问题1、关于核心技术 ...... 4

问题2、关于共同控制 ...... 21

问题3、关于发行人股份支付 ...... 28

问题4、关于发行人采购成本 ...... 37

问题5、关于发行人的营业收入 ...... 46

问题6、关于发行人毛利率 ...... 71

8-1-4

问题1、关于核心技术

回复材料称,发行人的核心技术具备较高技术壁垒、较难为同行业公司或上下游行业突破。发行人注重在相关领域的核心技术积累构建及核心技术保护,但并不单纯依赖以申请专利的形式对核心技术进行保护。

请发行人说明:(1)发行人已提交的8项发明专利申请的主要内容、发明人及截至目前所处的阶段,与发行人核心技术的关系,是否与“并不单纯依赖以申请专利的形式对核心技术进行保护”相矛盾;(2)进一步说明发行人的核心技术具备较高技术壁垒、较难为同行业公司或上下游行业突破的依据;(3)与澳大利亚上市公司Appen等可比公司的可比业务在市场地位、技术实力、衡量核心竞争力的关键业务数据、主要财务指标的比较分析;(4)列表说明发行人设计的数据库较同行业竞争对手或下游客户自身的训练数据库之间的差异,如何体现发行人数据库设计的优势;(5)以主要类型项目为例,说明发行人提供定制服务和数据库开发的业务流、数据流和财务流的流转情况。

请保荐机构核查并发表明确意见。

答复:

(1)发行人已提交的8项发明专利申请的主要内容、发明人及截至目前所处的阶段,与发行人核心技术的关系,是否与“并不单纯依赖以申请专利的形式对核心技术进行保护”相矛盾;

一、发明专利申请的主要内容、发明人、所处阶段、与核心技术的关系

截至本问询函答复出具日,发行人已提交8项发明专利申请,其中5项已进入实质审核阶段。上述专利申请中,7项对应于发行人核心技术下的细分技术及研发成果,1项虽未涵盖在核心技术范围内,但也应用于发行人的具体业务和服务环节中。

相关专利申请的发明人、所处阶段、主要内容及其对应的核心技术/业务 情况具体如下:

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-5

序号申请号专利名称专利权人发明人申请日截至目前所处的阶段主要内容专利对应的核心技术/业务
1201810449585.3语音对齐方法及装置发行人邵志明、郝玉峰2018.05.11实质审查提供一种语音对齐方法,通过计算多个语音特征向量的自相关系数,解决了多个音频文件起始点自动对齐的问题,有效提升了数据库质量和数据处理效率。数据同步技术——音频对齐技术
2201810827500.0音素误标注的检测方法和装置发行人孟君、廖晓玲、郝玉峰2018.07.25实质审查提供一种音素误标注的检测方法和装置,该技术通过采用预先设置的音素置信度模型,获取音素标注结果的置信度,从而快速、准确地获取误标注音素。分布式高性能自动校验技术——音素标注正确率校验技术
3201810883930.4语音检测方法和装置发行人邵志明、 曹琼、宋琼、郝玉峰2018.08.06实质审查提供一种特定的语音检测方法和装置,可检出语音数据库中同一人的所有语音,提高了数据检验效率和准确度。分布式高性能自动校验技术——相似说话人自动筛查技术
4201810988973.9韵律标注方法、装置和设备发行人孟君、曹琼、廖晓玲、郝玉峰2018.08.28实质审查提供了一种韵律标注方法、装置和设备,该技术基于语音识别模型对音素进行自动切分,计算得到语音中静音段的时长,根据停顿时长预标韵律信息,结合基于文本的韵律预测结果修正预测结果,提高了韵律预标的准确率,提升了韵律标注的效率和准确性。大数据驱动的高效数据处理技术——基于语音特征的韵律预测技术
5201910022453.7中英混语料生成办法、装置、电子设备及存储介质发行人杨福星、曹琼、郝玉峰2019.01.10申请受理提供一种中英混合语料的生成方法、装置、设备及存储介质,可根据中文语料生成中英混合语料,有效扩充中英混合语料库,为中英混合语音识别的模型训练提供充足的训练数据,从而提高模型的准确性。多语种多模态数据库设计技术——混合语言语料设计技术
6201910072150.6语料选取处理方法、装置、设备及计算机可读存储介质发行人杨福星、曹琼、郝玉峰2019.01.25申请受理提供一种语料选取处理方法、装置、设备及计算机可读存储介质,该方法可根据原始句长分布从原始语料中选取句数、句长、分布符合要求的语料作为初始模型,并对前述模型进行修正处理,得到接近原始句长分布要求的最终句长分布模型,满足语料设计中对于句长分布的要求。多语种多模态数据库设计技术——多语种音素均衡语料设计技术

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-6

7201910073390.8音频质量评估方法、装置、电子设备及存储介质发行人刘永辉、曹琼、郝玉峰2019.01.25申请受理提供一种音频质量评估方法、装置、电子设备及存储介质。该发明专利提供的方法根据发音人语速预设规则进行工程性的自动化分析,能够有效提高音频质量评估效率,且有效提高检测样本的覆盖率。实时采集质控技术——语音信号质量检测技术
8201710539306.8基于麦克风的音频处理方法和装置中瑞智(发行人全资子公司)黄大伟; 李虹辰2017.07.04实质审查提供一种基于麦克风的音频处理方法和装置,该方法可根据每一麦克风采集的音频的变化量确定待处理的音频数据;在多个麦克风同时采集音频时可确定当前待收音的麦克并确定相应待处理的音频数据,为后续播放、语音识别等处理奠定基础。“数据资源相关的应用服务”相关业务

8-1-7

二、不与“并不单纯依赖以申请专利的形式对核心技术进行保护”相矛盾

(一)发行人构建了综合性的核心技术保护体系

发行人综合考虑核心技术类型、申请专利对核心技术的保护效果等,从制度角度、技术角度、法律保护角度出发,采取多重手段对核心技术进行综合保护。

1、制度角度:制定完善的保密管理制度,防止核心技术泄密

发行人制定了完善的保密管理制度,对包括核心技术机密在内的各类保密信息及材料制定了具体的保密要求,并同步制定了保密教育、泄密惩治机制等相关管理制度,提升员工的保密意识、降低核心技术泄密风险。发行人与全体员工均签署了《保密协议》,与核心技术人员均签署了《竞业禁止协议》,明确员工的保密义务,对包括核心技术在内的信息进行保护,防止技术流失和外泄。

2、技术角度:采取有效的技术手段对核心技术进行保护

对于核心技术体系中与数据资源设计开发相关的系统、平台、软件、开发工具等计算机程序,发行人从代码管理、可执行文件管理两个角度出发,采取技术手段防止核心技术泄密,主要包括:引入GIT、SVN等代码管理系统,将核心技术相关代码部署于内部服务器中;对核心代码设置访问权限管理制度,限制访问范围;使用B/S(浏览器/服务器)架构方案,将关键技术隐藏于服务器端;对于无法使用B/S架构的客户端软件,则加入时间戳功能进行生命周期管理,降低特定客户端软件在项目结束后被擅自复用、泄露技术的风险。

3、法律保护角度:申请专利保护、计算机软件著作权等保护措施

发行人对于专利保护可覆盖的、生产研发受专利申请公开的影响可控的核心技术类型,申请专利保护;对于与数据资源设计开发相关的系统、平台、软件、开发工具的计算机程序等,通过登记计算机软件著作权的形式加以保护。

(二)专利申请仅覆盖特定技术,与“并不单纯依赖以申请专利的形式对核心技术进行保护”不存在矛盾

发行人已提交的8项发明专利申请所保护的对象仅为专利保护可覆盖的部分特定细分技术、技术研发成果,与“并不单纯依赖以申请专利的形式对核心技

8-1-8

术进行保护”不存在矛盾。

综上,发行人对核心技术采取了综合性保护措施,已提交的8项发明专利申请所保护的对象仅为专利保护可覆盖的部分特定细分技术、技术研发成果,与“并不单纯依赖以申请专利的形式对核心技术进行保护”不存在矛盾。

(2)进一步说明发行人的核心技术具备较高技术壁垒、较难为同行业公司或上下游行业突破的依据;

发行人语音语言学基础研究、多语种多模态数据库设计技术、数据同步技术、大数据驱动的高效数据处理技术及分布式高性能自动校验技术等5项核心技术具备较高技术壁垒、较难为同行业公司或上下游行业突破,依据具体如下:

1、上述核心技术积累需要大量时间、资源积累

上述5项核心技术主要发源并根植于发行人多年积累的语种/方言覆盖能力、数据资源开发经验和资源,上下游企业、同行业公司在短期内难以较易突破,具体如下:

发行人多年自主开展语音语言学基础研究,并辅以与语言学家合作,在数据资源设计、开发方面积累了较多语音语言学基础研究成果,在语种/方言覆盖能力上形成了突出优势。语种/方言覆盖能力也体现在发行人的多语种多模态数据资源设计技术中,使该项技术也具备较强的技术壁垒。

此外,发行人在国内起步较早,在各类语种 /方言、应用场景、领域的 数据资源相关的设计、采集、处理(标注)、质检方面具备先发优势、经验优势,使得发行人有能力将积累的资源、经验应用于其数据同步技术、大数据驱动的高效数据处理技术及分布式高性能自动校验技术之中,使得这些技术具备较强的技术壁垒。

慧听科技、标贝科技等境内同行业企业也专业从事数据资源开发,并掌握一定的类似技术,但与发行人相比,在语种/方言覆盖能力、经验资源积累、数据量处理积累方面相比发行人存在一定差距,弥补前述差距需要其投入较多时间、资源,难以在短期内突破发行人通过上述优势构建的核心技术壁垒。

8-1-9

下游行业主要为人工智能技术层及应用层相关企业,其因自身算法模型开发、训练所需,亦掌握一定的语音语言学基础研究知识、数据库设计技术、数据处理技术、数据质检技术等,但相关技术通常侧重于其算法模型所覆盖的特定语种/方言、应用领域,与发行人等专业从事数据资源开发的企业相比,因在产业链专业化分工侧重性不同,其在数据资源开发处理领域的专业化程度、全面性、数据处理量、实践经验、流程把控能力等方面存在一定差距,难以在短期内突破发行人通过上述优势构建的核心技术壁垒。

上游供应商主要为人力资源服务公司、技术服务公司等,发行人主要向其采购生数据采集、标记服务。前述企业主要参与发行人数据资源开发过程的生数据采集(使用发行人提供的采集工具进行录音、拍照、编写文字等)和数据标记的具体执行(使用发行人自主研发的标注软件、工具集和平台对已分配的数据包进行数据属性及特征标记等)等非核心环节,不掌握发行人所具备的数据资源开发相关核心技术,难以突破发行人构建的核心技术壁垒。

2、核心技术的应用构建了发行人的产品/服务优势

发行人将上述核心技术应用于数据资源开发等产品服务生产、提供流程中,使最终提供的产品/服务在数量、语种/方言及场景领域覆盖能力等方面具备较为突出的优势,具体如下:

项目海天瑞声Appen慧听科技标贝科技
出售的自有产权数据库数量500余个85个 (包含73个语音类数据库数量及12个自然语言类数据库;其他类别数据库数量未公开披露)23个23个
数据库种类智能语音、计算机视觉、自然语言智能语音、计算机视觉、自然语言智能语音、计算机视觉、自然语言、音乐智能语音、计算机视觉、自然语言、音乐
语种/方言130余个180个18个4个

8-1-10

3、核心技术的应用使得发行人广受认可

发行人通过运用上述核心技术提升了自身的产品服务品质,获取了合作伙伴、行业机构的认可。发行人所获合作伙伴、行业机构奖项具体如下:

序号荣誉颁发机构颁发时间
12019中国信息技术人工智能行业优秀产品中国信息协会2019年
22019中国信息技术人工智能数据服务领军企业中国信息协会2019年
3菜鸟网络“驼峰计划”突出贡献奖菜鸟网络2019年
4腾讯2019年服务类供应商“杰出贡献奖”深圳市腾讯计算机系统有限公司2019年
5信息化影响中国·2018年人工智能行业最佳产品中国信息协会2018年
62018“中国声谷”杯智能语音创新大赛行业先锋奖中国语音产业联盟2018年
72017中国信息技术年度人工智能数据服务领域领军企业奖中国信息协会2017年
8Oriental COCOSDA 2016 ITN Best Paper AwardOriental COCOSDA2016年
9百度 API Store 2015年度大奖评选最佳合作伙伴百度 API Store2015年
项目海天瑞声Appen慧听科技标贝科技
市场地位
成立 年份2005年1996年2011年2016年
市场地位概述我国领先的人工智能数据资源产品服务专业提供商,是我国最早从事数据资源产品服务研发销售的企业之一较早从事数据资源开发的数据资源产品服务提供商,经营历史较长,规模、体量较大--
行业机构评价参见本问询函答复1(2)-“慧听中文重口音语音数据库”曾获中国语音产业联盟“2015中国语音创新产品”中国语音产业联盟会员单位

8-1-11

技术实力、关键业务相关指标情况
技术实力概述海天瑞声自主开发了一体化人工智能数据处理技术支撑平台,在基础研究、平台工具、数据资源开发三个维度下均积累核心技术,有机搭建起发行人的人工智能数据资源开发一站式解决方案,将多项具体核心技术整合为发行人特有的核心技术体系。未公开披露采用全程质量监控流程,执行完善的标注流程,配合保密管理手段,提供质量上乘的数据服务。拥有语音合成模型和算法,通过算法+专业的人工数据处理方式,为客户提供优质的语音合成服务。拥有TOBI 标注体系,通过自主研发的TTS评测系统,为客户提供高质量的数据服务。
出售的自有产权数据库数量500余个85个 (包含73个语音类数据库数量+12个自然语言类数据库;其他类别数据库数量未公开披露)23个23个
数据库种类智能语音、计算机视觉、自然语言智能语音、计算机视觉、自然语言智能语音、计算机视觉、自然语言、音乐智能语音、计算机视觉、自然语言、音乐
语种/方言覆盖能力130余个180个18个4个
正在申请/已授权的专利数量8项中国境内专利 (均正在申请中)2项 (均已授权)2项中国境内专利(均正在申请中)2项中国境内专利(均正在申请中)
计算机软件著作权数量98项未公开披露12项10项
其他经营指标
员工 数量127人513人未公开披露未公开披露
合作伙伴/主要客户大型科技公司,如阿里巴巴、腾讯、百度、微软、三星等;人工智能企业,如科大讯飞、商汤科技、云知声、海康威视等;科研机构,如中国科学院、清华大学等微软等大型科技公司、汽车厂商及政府未公开披露大型科技公司,如阿里巴巴、腾讯、百度、网易、京东等;人工智能企业,如出门问问、旷视等;科研机构,如北京大学等。
主要财务指标(2018年度/2018年末)
营业 收入19,265.8万元36,428.9万澳元未公开披露未公开披露

8-1-12

营业收入增长率61.80%117.43%未公开披露未公开披露
净利润6,714.2万元4,172.8万澳元未公开披露未公开披露
综合毛利率64.77%37.32%未公开披露未公开披露

8-1-13

其次,就数据资源定制服务而言,根据Appen公开披露资料显示,其大部分收入(报告期内平均占比超过80%)来源于文本相关度标注业务。发行人同类业务的毛利率水平仅为20-30%,显著低于其他智能语音类和计算机视觉类业务。报告期内,发行人已很少从事该类业务,而Appen收入结构中低毛利率的文本相关度标注业务占比仍旧较高,也使得发行人毛利率水平高于Appen。

除上述业务结构原因外,Appen作为海外公司,其主营业务所需的人员、场地均主要分布在美国和澳大利亚,劳务成本和人工成本与我国境内相比较高,也在一定程度上拉低了其的毛利率。

因此,发行人主营业务毛利率高于Appen具备合理性。

综上,与Appen相比,发行人在市场地位、体量规模、数据资源覆盖的语种/方言数量、收入利润规模等方面存在一定劣势 ,但数据库产品资源积累等业务结构的差异使发行人的毛利率高于Appen;而与慧听科技、标贝科技相比,发行人在自有数据库积累、数据资源覆盖的语种/方言数量、计算机软件著作权数量、在申请专利数量等方面具备显著优势,除在数据资源种类上暂未涵盖音乐类数据资源外不存在明显劣势。

(4)列表说明发行人设计的数据库较同行业竞争对手或下游客户自身的训练数据库之间的差异,如何体现发行人数据库设计的优势;

对于数据资源行业而言,数据库的设计能力主要体现在不同种类数据库的数

量、覆盖语种/方言、场景、采集方案复杂度等方面。

一、与同行业竞争对手数据库

的差异及体现的数据库设计优势:

项目海天瑞声Appen慧听科技标贝科技
1、智能语音类数据库
数据库数量407731915
覆盖语种/方言数量7746184
录音场景类别5542
采集设备种类8353

注:Appen、慧听科技、标贝科技的数据库数量等相关信息仅包含其官方网站或公开信息披露所列举的数据库相关信息;发行人的数据库信息为截至2018年12月31日之情况。

8-1-14

采集通道覆盖数5341
2、自然语言类数据库
数据库数量721224
覆盖语种/方言数量33921
3、计算机视觉数据库
数据库数量37-23

8-1-15

方面更有优势。

此外,下游客户也常提供其获取的各类生数据给予发行人进行专业化处理,形成可供算法模型训练使用的数据资源,这也反映了发行人在数据处理方面的全面性、专业性优势。

三、与开源训练数据库之间的差异及体现的数据库设计优势

发行人的有采集的单一化标注数据库主要用于训练语音识别模型。对于语音识别算法模型而言,使用不同训练数据库将实现不同的模型训练效果(识别率),进而决定算法模型所属语音识别引擎的优劣。

根据发行人的测试结果,以发行人的King-ASR-216数据库为例,其与开源数据库相比可提供更好的语音识别算法模型训练效果(更高的识别率、更低的字错误率),反映了发行人在设计优质训练数据库、优化算法模型训练效果方面的能力和优势。

前述算法模型训练对比情况具体如下:

1、模型训练情况概述

发行人从中文开源语音识别数据库(下称数据库1

,共160小时)、自有产品库King-ASR-216(随机选取160小时)中各随机选取150小时数据作为训练数据,分别对同一语音识别开源软件Kaldi进行训练得到模型1及模型2,并采用不同的测试集测试模型1、模型2 的识别率,以验证数据库质量差异。

其中,在测试数据集中:对于模型1、模型2,集内测试集分别为数据库1、King-ASR-216(随机选取160小时)扣除用以训练的150小时数据后剩余的10小时数据;集外测试集1、2均为与数据库1、King-ASR-216(随机选取160小时)无关的开源数据集。

2、模型训练效果对比:

测试数据集测试结果(字错误率)注

数据库1说明:来源:http://openslr.org/33/。开源数据库1选取自行业通用的语音识别开源数据集网站openslr.org,该网站由语音识别领域行业专家、知名语音识别开源软件Kaldi的主要开发者Daniel Povey运营;此处选取的开源数据库1为该网站上所提供的最大的中文语音识别开源数据集。

8-1-16

模型1(注2) (使用发行人数据库产品King-ASR-216训练数据训练所得)模型2 (使用开源数据库1(注3)训练所得)
集内测试集11.4%14.7%
集外测试集1321.9%30.3%
集外测试集2421.0%26.8%

集外测试集1:http://openslr.org/38/,来源于行业通用的语音识别开源数据集网站openslr.org的中文开源语音识别数据集,时长10小时。

集外测试集2:http://openslr.org/18/,来源于行业通用的语音识别开源数据集网站openslr.org的中文开源语音识别数据集,时长6.24小时。

8-1-17

2、发行人业务流、数据流和财务流的流程图

以智能语音为例,对发行人提供定制服务和数据库开发的业务流、数据流和财务流的流转情况说明如下:

(1)有采集的单一化标注项目、多样化标注项目:

(2)无采集的单一化标注项目:

*注:部分项目由标记人员在客户提供的标注平台上完成。

以有采集的单一化标注项目为例,对发行人主要业务环节、数据流转、业务管理系统流程、财务流程,以列表形式进行如下进一步详细说明:

8-1-18

业务环节数据流转业务管理系统流程财务流程
对于定制服务:签订合同/获得订单 对于数据库产品:确定产品开发决策? 无? 根据合同分解履约订单,一一对应建立项目,并将项目信息录入业务管理系统;对于数据库产品开发项目,根据产品开发决策建立项目并将项目信息录入业务管理系统 ? 核对履约订单与书面合同的核心内容一致性包括客户名称、销售量、销售单价等,确保录入业务管理系统内的项目信息真实、准确 ? 项目立项(履约订单与项目之间是一一对应关系,确保可按项目对收入、支出进行独立归集和核算) ? 项目预算申请及审核,为成本完整性、准确性的重要控制点(一般项目为三级审批制,重大项目为五级审批制): ? 核对预计采集数据量、标记数据量注,与履约订单的交付量之间进行核对,保证预算采购量的真实、完整、准确 ? 对比同类项目间的采集产出比、标注产出比,保证预计采集数据量、标记工作量的合理、完整 ? 对比业务采购价格体系,保证预算中采集、标记单价的合理性 ? 测算预算毛利率,复核项目盈利能力的合理性? 无
数据库设计? 生成“数据库设计文档”,包括预设文本、发音人特征分布表(如年龄段、性别、口音区等),以及发音词典。 ? 预设文本是发音人的说话素材 ,每个发音人的预设文本均不同,设计多少个发音人,就有多少个预设文本? 无? 无
数据采集? 发音人根据设计的文本及场景,在发行人提供的设备及软件上进行 录音,发音人的原始声音生成“生数据” ? 每个发音人对应一组声音文件? 与供应商进行生数据采集与标记工作验收,确认生数据采集量、标记工作量注及其价格 ? 把实际生数据采集量、标记工作量录入业务管理系统,进行支出申请 ? 系统根据支出申请生成验收结算单,并发送给供应商,供应商确认生数据采集量、标记工作量及对应价格和金额? 核算财务岗根据“支出汇总表”每月将项目支出录入用友财务管理系统 ? 全部录入完毕后,运营财务岗将财务系统中记录的项目支出导出,与“支出汇总表”进行反向核对 ? 根据核对无误的结果,确
数据处理? 标记人员在发行人标注

8-1-19

工具上,对“生数据 ”进行检查和标记,生成“标签数据” ? 对“标签数据”进行标记质量抽查? 人工复核采集、标注量,确保系统中数据服务采购量的完整、准确,重点包括以下信息的交叉比对: ? 设计文档数量对比生数据采集量 ? 生数据文件个数对比生数据采集量 ? 标记数据量对比生数据采集量 ? 生数据采集量、标记量对比供应商验收结算单记载数量 ? 生数据采集量、标记量对比预算 ? 采集产出比、标注产出比对比预算 ? 采集、标记单价对比预算 ? 支出申请审批通过后,系统生成“支出汇总表”认存货或研发费用 ? 根据核对无误的结算金额向供应商付款
质检? 对“标签数据”进行全面检查,形成质检结论,使“标签数据”成为通过质检的、可交付的“成品数据”? 提交质检报告至业务管理系统? 无
交付/验收 /决算? 向客户交付“成品数据”,客户对其进行验收确认? 获取客户验收报告 ? 将验收信息录入业务管理系统 ? 提交项目决算,即结项申请 ? 复核验收、决算信息,保证验收金额的真实、准确,项目支出的准确、完整。复核内容主要包括: ? 验收量对比验收报告 ? 验收量对比履约订单中的销售量 ? 验收单价对比履约订单中销售单价 ? 对比预算,整体复核项目决算中覆盖的环节、各环节的数量是否完整 ? 决算支出对比预算支出,偏离±10%需提交项目决算分析表 ? 验收与决算审批通过后,系统生成“财务确认表”,生成收入、成本。? 核算财务岗根据“财务确认表”将收入、成本信息录入财务管理系统。 ? 全部录入完毕后,运营财务人员将财务系统中记录的收入、成本导出,与“财务确认表”进行反向核对 ? 根据核对无误的结果,确认营业收入、营业成本

8-1-20

2、通过公开信息查询、客户访谈、行业专家访谈等手段核查发行人及其同行业主要竞争对手的市场地位、技术实力、关键业务数据、主要财务指标相关信息。

3、通过公开信息查询等方式查询同行业主要竞争对手、下游行业的数据库产品情况并与发行人数据库产品情况进行对比分析;获取发行人数据集与开源数据集对比测试结果。

4、访谈发行人业务、财务相关人员,了解发行人定制服务及数据库开发的具体过程;并登陆发行人的业务管理系统,核查其上述流程中业务流、数据流和财务流的具体流转情况。

为使投资者更好地理解发行人的业务模式及业务流、数据流、财务流的流转情况,发行人已在招股说明书“第六节 业务和技术\一、发行人主营业务、主要产品或服务的情况\(三)主要经营模式\2、生产或服务模式”补充披露上述本问询函答复1(5)相关内容。

经核查,保荐机构认为:

1、发行人针对各项核心技术采取了综合性保护措施,已提交的8项发明专利申请所保护的对象仅为专利保护可覆盖的部分特定细分技术、技术研发成果,与“并不单纯依赖以申请专利的形式对核心技术进行保护”不存在矛盾。

2、发行人的5项核心技术具备较高技术壁垒、较难为同行业公司或上下游行业突破的依据主要为:上述技术需要投入大量时间、资源;发行人通过运用上述核心技术构建了产品/服务优势、获得了合作伙伴、行业机构的广泛认可。

3、与Appen相比,发行人在市场地位、体量规模、数据资源覆盖的语种/方言数量、收入利润规模等方面存在一定劣势,但数据库产品资源积累等业务结构的差异使发行人的毛利率高于Appen;而与慧听科技、标贝科技相比,发行人在自有数据库积累、数据资源覆盖的语种/方言数量、计算机软件著作权数量、在申请专利数量等方面具备显著优势,除在数据资源种类上暂未涵盖音乐类数据资源外不存在明显劣势。

4、与竞争对手在公开信息渠道列举的数据库产品相比,发行人设计的数据

8-1-21

库产品的差异之处主要体现在:数据库数量更多、覆盖语种/方言数量更多、采集方案复杂度更高,表明发行人有能力设计覆盖多语种/方言、多场景、多领域的,采集方案更为复杂的数据库产品,体现了发行人在数据库设计领域的全面性、专业性优势。与下游客户自身的训练数据库相比,发行人在多场景、多领域、多语种/方言数据资源的全面性、综合性设计能力方面更有优势。与开源数据库相比,发行人的数据库产品可提供更佳的语音识别算法模型训练效果,充分验证了发行人在设计优质训练数据库、优化算法模型训练效果方面的能力和优势。

问题2、关于共同控制

请发行人进一步说明:结合发行人最近2年内公司章程、协议或其他安排以及发行人历次股东大会(股东出席会议情况、表决权过程、审议结果、董事会提名和任命等)、董事会(重大决策的提议和表决过程等)、监事会及发行人经营管理的实际运作情况等,以列表形式说明发行人是否由贺琳、唐涤飞二人共同控制。

请保荐机构及发行人律师核查并发表明确意见。

答复:

(1)发行人最近2年内公司章程、协议或其他安排

根据发行人最近2年内公司章程规定,发行人股东(大)会、董事会审议事项不存在表决权的特殊安排,关于发行人实际控制权不存在特殊约定。公司章程规定,股东(大)会审议表决事项时,股东以其所代表的有表决权的出资金额/股份数额行使表决权,出席会议股东所持有效表决权过半数或三分之二以上同意方可通过表决事项;董事会审议表决事项时,一人一票,董事会作出决议必须经全体董事过半数通过。

发行人股东之间包括贺琳、唐涤飞之间不存在一致行动协议或共同控制的其他安排。

8-1-22

(2)最近2年内发行人历次股东大会(股东出席会议情况、表决权过程、审议结果、董事会提名和任命等)、董事会(重大决策的提议和表决过程等)、监事会及发行人经营管理的实际运作情况

最近2年内,发行人公司治理结构健全且运行良好,发行人股东(大)会、董事会、监事或监事会及经营管理根据相关法律法规规定以及发行人《公司章程》等内部治理制度实际运作,关于发行人实际控制权并不存在特殊安排。最近2年内,贺琳直接及通过中瑞安控制发行人的股份比例在40%以上,实际控制发行人的股份数量远高于唐涤飞,所享有的表决权足以对股东大会的决议、人员的任免、重大事项提案的提出和审议通过产生重大影响。

1、股东(大)会

最近2年内,关于历次股东(大)会,全体股东包括贺琳、唐涤飞均亲自或授权代表出席会议并按其各自意愿投票表决,全体股东一致同意通过表决事项(关联股东回避表决除外);关于股东(大)会审议议题,其中选举股东代表监事、监事会工作报告等由监事或监事会审议通过并提交股东(大)会审议,其他股东(大)会审议议题均由董事会审议通过并提交股东(大)会审议;股份公司董事由海天瑞声有限董事会或发行人董事会提名委员会提名,具体人选由贺琳提出,有限公司董事贺琳、唐涤飞、志鹏由贺琳提名。

会议届次会议 时间主要审议议题出席情况表决情况
海天瑞声有限股东会2017年4月20日(1)杭州银杏数、杭州士兰、天津金星、上海兴富对海天瑞声有限投资 (2)中瑞立将部分出资转让给上海兴富、上海丰琬全体股东出席全体股东一致同意
海天瑞声有限股东会2017年7月13日(1)梳理公司自2015年至今的分红事项 (2)对公司截至2017年6月30日可供分配利润中的1,500万元进行分配全体股东出席全体股东一致同意
海天瑞声有限股东会2017年11月9日公司整体变更为股份有限公司全体股东出席全体股东一致同意
股份公司创立大会2017年11月9日(1)设立北京海天瑞声科技股份有限公司并制定股份有限公司章程 (2)选举股份有限公司第一届董事会董事 (3)选举股份公司第一届监事会股东代表出任的监事 (4)聘请审计机构全体股东出席全体股东一致同意

8-1-23

2017年第一次临时股东大会2017年12月15日(1)制定《股东大会议事规则》等规范治理制度 (2)第一届董事会董事、监事会监事报酬事项 (3)设立董事会专门委员会全体股东出席全体股东一致同意
2018年第一次临时股东大会2018年2月8日(1)2018年财务预算 (2)公司使用自有资金进行现金管理 (3)变更公司法定代表人并修改公司章程全体股东出席全体股东一致同意
2017年度股东大会2018年6月12日(1)2017年度董事会工作报告 (2)2017年度监事会工作报告 (3)2017年度财务决算报告 (4)2017年度利润分配方案 (5)聘任审计机构全体股东出席全体股东一致同意
2018年第二次临时股东大会2018年11月30日(1)修改公司经营范围 (2)更换公司独立董事全体股东出席全体股东一致同意
2019年第一次临时股东大会2019年2月13日(1)2019年度财务预算 (2)使用自有资金进行现金管理全体股东出席全体股东一致同意
2019年第二次临时股东大会2019年3月19日(1)修订公司章程、《股东大会议事规则》等规范治理制度 (2)制定公司上市后适用的《股东大会议事规则》等规范治理制度全体股东出席全体股东一致同意
2019年第三次临时股东大会2019年3月22日(1)申请首次公开发行人民币普通股股票并在科创板上市 (2)公司上市后未来三年股东分红回报规划 (3)制定《北京海天瑞声科技股份有限公司章程(草案)》全体股东出席全体股东一致同意
(4)确认公司报告期内关联交易事项关联方贺琳、唐涤飞、中瑞安、中瑞立回避表决,其余股东一致同意
2018年年度股东大会2019年4月20日(1)2018年度董事会工作报告 (2)2018年度监事会工作报告 (3)2018年度财务决算报告 (4)2018年度利润分配方案 (5)聘任审计机构全体股东出席全体股东一致同意

8-1-24

并按其各自意愿投票表决,全体董事一致同意通过表决事项(关联董事回避表决除外);董事会审议议题由董事长贺琳、总经理唐涤飞、董事会专门委员会根据其权限提出,涉及重大决策的由董事长贺琳提出;总经理、董事会秘书由董事长贺琳提名,其他高级管理人员由总经理唐涤飞提名。

会议 届次会议时间主要审议议题提案主体出席情况表决情况
2017年第1次董事会2017年4月17日(1)杭州银杏数、杭州士兰、天津金星、上海兴富对海天瑞声有限投资 (2)中瑞立将部分 出资转让给上海兴富、上海丰琬董事长贺琳全体董事出席全体董事一致同意
2017年第2次董事会2017年5月25日2016年年度财务报告总经理唐涤飞全体董事出席全体董事一致同意
2017年第3次董事会2017年7月13日(1)梳理公司自2015年至今的分红事项 (2)对公司截至2017年6月30日可供分配利润中的1,500万元进行分配董事长贺琳全体董事出席全体董事一致同意
2017年第4次董事会2017年11月6日(1)公司整体变更设立股份有限公司 (2)制定股份有限公司章程 (3)选举股份有限公司第一届董事会董事 (4)聘请审计机构 (5)召开股东会会议及股份有限公司创立大会会议董事长贺琳全体董事出席全体董事一致同意
第一届董事会第一次会议2017年11月9日(1)选举贺琳为公司第一届董事会董事长 (2)聘任唐涤飞为公司总经理 (3)聘任吕思遥为公司董事会秘书董事长贺琳全体董事出席全体董事一致同意
(4)聘任李科、程显峰为公司副总经理 (5)聘任吕思遥为公司财务负责人 (6)聘任郝玉峰为技术总监总经理唐涤飞
第一届董事会第二次会议2017年11月30日(1)制定《股东大会议事规则》等规范治理制度 (2)第一届董事会董事、监事会监事的报酬事项 (3)第一届高级管理人员报酬事项 (4)聘任审计部负责人 (5)设立董事会专门委员会 (6)召开2017年第一次临时股东大会会议董事长贺琳全体董事出席全体董事一致同意
第一届董事会第三次会议2017年12月18日(1)董事会专门委员会议事规则 (2)董事会专门委员会组成人员董事长贺琳全体董事出席全体董事一致同意
第一届董事会第四2018年1月23日(1)2018年财务预算总经理唐涤飞全体董事出席全体董事一致同意
(2)公司使用自有资金进行现金管理总经理唐涤飞

8-1-25

会议 届次会议时间主要审议议题提案主体出席情况表决情况
次会议(3)聘任公司副总经理提名委员会(总经理唐涤飞提名具体人选)
(4)《高级管理人员薪酬与考核管理办法》薪酬与考核委员会
(5)变更公司法定代表人并修改公司章程董事长贺琳
(6)召开2018年第一次临时股东大会董事长贺琳
第一届董事会第五次会议2018年3月9日向香港海天瑞声增资战略委员会(董事长贺琳提出具体方案)全体董事出席全体董事一致同意
第一届董事会第六次会议2018年4月13日2017年度母公司单体审计报告审计委员会全体董事出席全体董事一致同意
第一届董事会第七 次会议2018年5月22日(1)2017年度董事会工作报告董事长贺琳全体董事出席全体董事一致同意
(2)2017年度总经理工作报告总经理唐涤飞
(3)2017年度财务决算报告审计委员会
(4)2017年度利润分配方案董事长贺琳
(5)2017年度合并审计报告审计委员会
(6)2017年度内部控制评价报告审计委员会
(7)聘任审计机构会计师事务所审计委员会
(8)召开2017年年度股东大会董事长贺琳
第一届董事会第八次会议2018年8月15日公司2018年半年度财务报告审计委员会全体董事出席全体董事一致同意
第一届董事会第九次会议2018年11月15日(1)修改公司经营范围董事长贺琳全体董事出席全体董事一致同意
(2)更换公司独立董事提名委员会(董事长贺琳提名具体人选)
(3)召开2018年第二次临时股东大会董事长贺琳
第一届董事会第十次会议2019年1月28日(1)2019年财务预算总经理唐涤飞全体董事出席全体董事一致同意
(2)聘任公司首次公开发行股票并上市保荐机构董事长贺琳
(3)聘任公司技术总监提名委员会(总经理唐涤飞提名具体人选)
(4)使用自有资金进行现金管理总经理唐涤飞
(5)召开2019年第一次临时股东大会董事长贺琳

8-1-26

会议 届次会议时间主要审议议题提案主体出席情况表决情况
第一届董事会第十一次会议2019年3月4日(1)修订公司章程、《股东大会议事规则》等规范治理制度 (2)制定公司上市后适用的《股东大会议事规则》等规范治理制度 (3)召开2019年第二次临时股东大会董事长贺琳全体董事出席全体董事一致同意
第一届董事会第十二次会议2019年3月6日(1)申请首次公开发行人民币普通股股票并在科创板上市战略委员会(董事长贺琳提出具体方案)全体董事出席全体董事一致同意
(2)公司上市后未来三年股东分红回报规划董事长贺琳全体董事一致同意
(3)制定《北京海天瑞声科技股份有限公司章程(草案)》董事长贺琳全体董事一致同意
(4)确认公司报告期内关联交易事项董事长贺琳关联董事贺琳、唐涤飞回避表决,其他董事一致同意
(5)召开2019年第三次临时股东大会董事长贺琳全体董事一致同意
第一届董事会第十三次会议2019年3月18日2018年度母公司单体审计报告审计委员会全体董事出席全体董事一致同意
第一届董事会第十四次会议2019年3月31日(1)2018年度董事会工作报告董事长贺琳全体董事出席全体董事一致同意
(2)2018年度总经理工作报告总经理唐涤飞
(3)2018年度财务决算报告总经理唐涤飞
(4)2018年度利润分配方案董事长贺琳
(5)批准报出2016-2018年度审计报告审计委员会
(6)2018年度内部控制评价报告审计委员会
(7)聘任审计机构审计委员会
(8)召开2018年年度股东大会董事长贺琳

8-1-27

最近2年内,发行人经营管理的实际运作情况为:

(1)贺琳担任公司董事长,具体负责公司战略规划制订、重大决策研究、重要外部关系管理、融资管理、公司治理机制完善等重大事项,并对高级管理人员的履职情况进行监督,对重大经营管理事项提出意见。除了上述贺琳向董事会提出的提案以外,关于发行人重大经营管理事项,包括发行人2016年组建美国销售团队、2017年加大计算机视觉业务发展力度等,均由贺琳主导决策。

(2)唐涤飞担任公司总经理,主要负责公司日常经营管理事项,包括日常业务运营、项目管理、人员管理等。发行人管理团队,除了总经理唐涤飞之外,发行人副总经理李科主要分管业务开拓和产品开发,技术总监郝玉峰主要分管语言拓展和数据质检,技术总监黄宇凯主要分管技术研发,副总经理、财务负责人、董事会秘书吕思遥主要分管财务管理、公共关系管理及证券事务。上述高级管理人员分工合作,共同管理公司日常经营管理事务。

(3)贺琳为发行人创始股东,在发行人公司创立、业务和技术形成、发展上起到重大作用。在公司发展过程中,鉴于贺琳所持发行人的股权比例及贺琳作为创始股东、董事长在公司的重要地位,贺琳对公司业务和技术发展方向、重大事项决策判断等一直具有重要影响力。具体内容见第二轮审核问询函回复问题2(1)所述。

请保荐机构及发行人律师核查并发表明确意见。

针对上述事项,保荐机构及发行人律师执行的核查程序如下:

1、审阅发行人最近2年内公司章程和内部治理制度、历次股东(大)会、董事会、监事会相关会议资料;

2、对贺琳、唐涤飞就其会议提案及表决、职责分工等事项进行访谈;

3、获取发行人股东包括贺琳、唐涤飞关于不存在一致行动协议或安排的确认文件;

4、审阅发行人的工商资料,核查设立以来的董事、高级管理人员及其变更情况,核查贺琳、唐涤飞持有股权的相关情况。

8-1-28

经核查,保荐机构和发行人律师认为:

1、最近2年内发行人公司章程对股东大会、董事会审议事项不存在表决权的特殊安排,关于发行人实际控制权不存在特殊约定;发行人股东之间包括贺琳、唐涤飞之间不存在一致行动协议或共同控制的其他安排。

2、最近2年内,发行人公司治理结构健全且运行良好,贺琳实际控制的股份所享有的表决权足以对股东大会的决议、人员的任免、重大事项提案的提出和审议通过产生重大影响。关于历次股东(大)会,全体股东包括贺琳、唐涤飞均亲自或授权代表出席会议并按其各自意愿投票表决,全体股东一致同意通过表决事项(关联股东回避表决除外);关于股东(大)会审议议题,其中选举股东代表监事、监事会工作报告等由监事或监事会审议通过并提交股东(大)会审议,其他股东(大)会审议议题均由董事会审议通过并提交股东(大)会审议;股份公司董事由海天瑞声有限董事会或发行人董事会提名委员会提名,具体人选由贺琳提出,有限公司董事贺琳、唐涤飞、志鹏由贺琳提名。关于历次董事会,全体董事包括贺琳、唐涤飞均亲自出席会议并按其各自意愿投票表决,全体董事一致同意通过表决事项(关联董事回避表决除外),董事会审议议题均由董事长贺琳、总经理唐涤飞、董事会专门委员会根据其权限提出,涉及重大决策的由董事长贺琳提出;总经理、董事会秘书由董事长贺琳提名,其他高级管理人员由总经理唐涤飞提名。关于历次监事会,全体监事均亲自出席会议并按其各自意愿投票表决,全体监事一致同意通过表决事项。

3、贺琳、唐涤飞按照分工对公司进行管理,贺琳作为董事长对高级管理人员的履职情况进行监督,对经营管理重大事项提出意见。贺琳作为创始股东在发行人公司创立、业务和技术形成、发展上起到重大作用,贺琳对公司业务和技术发展方向、重大事项决策判断等一直具有重要影响力。

因此,发行人并非由贺琳、唐涤飞二人共同控制,发行人实际控制人为贺琳。

问题3、关于发行人股份支付

回复材料显示:(1)张蕊因职务调整为审计部经理,2016年度张蕊向创世

8-1-29

联合转让13.3333万元实缴出资额,占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%,对应的海天瑞声有限出资金额为9.6万股,转让后张蕊持有中瑞安全部出资额的5.00%;(2)唐涤飞原持有中瑞立21.05%的实缴出资额,2016年3月唐涤飞向创慧科瑞转让上述实缴出资额,转让时创慧科瑞的股东分别为唐涤飞和贺琳,2016年12月贺琳将其持有创慧科瑞的股权转让给志鹏。

请发行人进一步说明:(1)张蕊向创世联合转让实缴出资额的原因及合理性,未在2015年度按照13.89%的出资比例计算股份支付费用的原因及依据,是否符合企业会计准则的相关规定;(2)唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权一系列交易安排的原因及合理性;(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况。

请保荐机构和申报会计师核查并发表明确意见。

答复:

(1)张蕊向创世联合转让实缴出资额的原因及合理性,未在 2015 年度按照 13.89%的出资比例计算股份支付费用的原因及依据,是否符合企业会计准则的相关规定;

一、张蕊向创世联合转让实缴出资额的原因及合理性

发行人在2015年8月开始筹划股权激励事宜时,综合考虑了激励对象的入职年限、岗位分工、贡献程度等因素来确定核心员工激励份额。张蕊加入海天瑞声时间较早,历任海天瑞声财务经理、综合部总监等职务。截至2015年末,公司财务负责人岗位处于空缺状态。因此,在设计持股平台的股东结构及持股比例时,综合考虑张蕊的入职年限、岗位分工、贡献程度,以及未来拟担任财务负责人职务的情形,决定授予张蕊认缴中瑞安138.8889万元,占平台内出资比例为13.89%,对应海天瑞声有限的出资比例为2.50%。张蕊实缴出资20.8333万元。

2016年8月,随着新投资人的进入以及公司业务快速发展,发行人的上市准备工作也开始提上日程,各项工作对财务负责人的能力提出了更高的要求。考虑到张蕊在拟上市公司的会计核算体系建设、内部控制体系搭建等方面缺乏一定

8-1-30

的经验,发行人董事会决定重新选聘请财务负责人,并对张蕊的职务进行调整,同时同步调整了向张蕊授予的股权。实施方案上,由张蕊先行转让给普通合伙人创世联合,后续授予明确的激励对象时再由创始联合转出。

经张蕊本人同意,其于2016年8月向创世联合转让88.8889万元的出资(其中实缴13.3333万元),占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%。

综上,张蕊向创世联合转让实缴出资额是在发行人公司业务发展及完善公司内部治理的背景下,基于张蕊岗位调整等因素综合考虑而进行的。经公司、张蕊协商一致,对张蕊授予股权激励份额调整为向创世联合认缴50万元出资额(其中实缴7.5万元),占中瑞安全部出资额的5%,对应海天瑞声有限的出资比例为0.9%。综合考虑所有激励对象的入职年限、岗位分工、贡献程度等因素,对张蕊授予股权激励份额进行调整以及调整后的授予份额具备合理性。

二、2015年未按13.89%的出资比例计算张蕊股份支付费用的原因及依据

发行人在2016年进行以前年度财务核算进行规范时,对2015年的股份支付事项进行了追溯确认。

鉴于在股份支付事项追溯确认时,相关管理人员的职责已经明确到位,持股平台的股权结构已经调整到位,因此,发行人按照调整到位的出资金额确认2015年股份支付费用,对张蕊按照持有中瑞安5%的出资份额(对应海天瑞声有限的出资比例为0.90%)确认股份支付费用。

综上,发行人于2016年及时对激励方案进行了调整并整体追溯确认、调整了2015年末的股权激励,因此,从调整后的报表来看,2015年未按持有中瑞安13.89%的出资比例计算张蕊股份支付费用。对张蕊确认的股份支付金额与其向发行人提供的服务相匹配,符合企业会计准则的相关规定。

三、假设2015年按13.89%的出资比例模拟测算张蕊股份支付费用的影响

2015年12月,发行人授予张蕊认缴中瑞安138.8889万元,占持股平台中瑞安的出资比例为13.89%,对应海天瑞声有限的出资比例为2.50%,对应发行人的出资金额15万元。经张蕊同意,其于2016年8月向创世联合转让88.8889万

8-1-31

元的出资(其中实缴13.3333万元),占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%,对应发行人的出资金额9.6万元。

2015年按13.89%的出资比例模拟测算张蕊股份支付费用的影响如下:

1、模拟测算股份支付费用计算表:

计算公式项目金额(元)
转让注册资本96,000.00
每1元注册资本对应的公允价值22.18
受让成本/每1元注册资本1.00
④=①×(②-③)测算确认股份支付费用2,033,280.00
影响科目2015-12-31/ 2015年影响金额 (万元)2015-12-31/2015年 (模拟确认后)
资本公积2,427.23203.332,630.56
盈余公积72.4472.44
未分配利润-789.00-203.33-992.33
管理费用3,278.81203.333,482.13
净利润-1,225.14-203.33-1,428.47
扣除股份支付后净利润1,202.091,202.09

8-1-32

(2)唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权一系列交易安排的原因及合理性

一、唐涤飞转让中瑞立实缴出资额的背景

中瑞立系作为员工持股平台而设立。设立之初,拟以贺琳、唐涤飞共同投资设立创慧科瑞作为中瑞立的GP。2015年12月18日,中瑞立设立时,创慧科瑞尚未办理完毕工商登记手续,贺琳、唐涤飞经协商后决定暂以唐涤飞作为GP,待创慧科瑞设立后,唐涤飞再将相应的出资额转让给创慧科瑞。中瑞立设立时,唐涤飞以货币认缴出资210.5263万元并实际缴纳21.0526万元,占中瑞立出资总额的21.05%,占穿透后海天瑞声股权比例为2%。2015年12月23日,创慧科瑞设立时,贺琳、唐涤飞分别持有其50%、50%的股权。2016年3月,唐涤飞向创慧科瑞转让上述210.5263万元的出资(其中实缴21.0526万元出资)。

二、贺琳向志鹏转让创慧科瑞股权的背景

贺琳与志鹏于2015年12月15日正式签署《顾问服务协议》,约定贺琳聘请志鹏作为顾问协助其向投资人转让海天瑞声有限股权,贺琳向志鹏转让海天瑞声有限1%股权作为服务费用。

经贺琳与志鹏协商一致,2016年12月贺琳、志鹏签署《转让协议》,贺琳将所持创慧科瑞50%股权(占穿透后海天瑞声的股权比例为1%)转让给志鹏。

三、小结

综上,唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权等一系列交易安排符合实际情况,具有合理性。上述股权转让价款均已结清,不存在争议或纠纷。

(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况

一、中瑞立历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况

中瑞立于2015年12月作为员工持股平台而设立,除设立时各合伙人合计实

8-1-33

缴100万元出资外,不存在其他出资情形。自设立以来,中瑞立存在两次股权转让情形。中瑞立出资或股权转让的价格、定价依据、资金来源和支付情况、完税具体情况如下:

事项出资或股权转让情况出资/股权转让价格(万元)定价依据资金来源出资/股权转让价款支付情况完税情况
2015年12月,设立合伙人认缴/实缴出资(万元)
贺琳(LP)421.0526/42.105342.1053出资原值自有资金已实缴部分出资不涉及
唐涤飞(GP)210.5263/21.052621.0526
黄大伟(LP)115.7895/11.578911.5789
宋琼(LP)94.7368/9.47379.4737
廖晓玲(LP)94.7368/9.47379.4737
辛晓峰(LP)31.5790/3.15793.1579
葛兴彤(LP)31.5790/3.15793.1579
小计1,000/100100
2016年3月,第一次股权转让转让方受让方转让的认缴/实缴出资额(万元)出资/股权转让价格(万元)定价依据资金来源出资/股权转让价款支付情况完税情况
唐涤飞创慧科瑞210.5263/21.052621.0526出资原值股东贺琳、唐涤飞以自有资金向创慧科瑞提供借款已支付完毕不涉及
贺琳陈琪94.7368/9.47379.4737出资原值自有资金已支付完毕不涉及
2017年6月,第二次股权转让注贺琳创慧科瑞83.5914/8.3591不涉及
黄大伟45.9752/4.5975
宋琼37.6161/3.7616
廖晓玲37.6161/3.7616
陈琪37.6161/3.7616
辛晓峰12.5387/1.2539
葛星彤12.5387/1.2539

8-1-34

中瑞安于2015年12月作为员工持股平台而设立,除设立时各合伙人合计实缴150万元出资外,不存在其他出资情形。自设立以来,中瑞安存在三次股权转让情形。中瑞安出资或股权转让的价格、定价依据、资金来源和支付情况、完税具体情况如下:

事项出资或股权转让情况出资/股权转让价格(万元)定价依据资金来源出资/股权转让价款支付情况完税情况
2015年12月,设立合伙人认缴/实缴出资(万元)
程显峰(LP)361.1111/54.166754.1667出资原值自有资金已实缴部分出资不涉及
李科(LP)277.7778/41.666741.6667
郝玉峰(LP)194.4444/29.166729.1667
张蕊(LP)138.8889/20.833320.8333
贺琳(GP)27.7778/4.16674.1667
小计1,000/150150
2016年3月,第一次股权转让转让方受让方转让的认缴/实缴出资额(万元)出资/股权转让价格定价依据资金来源出资/股权转让价款支付情况完税情况
贺琳创世联合27.7778/4.16674.1667出资原值创世联合自有资金及股东贺琳以自有资金提供的借款已支付完毕不涉及
2016年8月,第二次股权转让程显峰吕思遥72.2222/10.833310.8333出资原值自有资金已支付完毕不涉及
创世 联合吕思遥11.1111/1.66671.6667出资原值自有资金已支付完毕不涉及
创世 联合李科27.7778/4.16674.1667出资原值自有资金已支付完毕不涉及
张蕊创世联合88.8889/13.333313.3333出资原值创世联合自有资金及股东贺琳以自有资金提供的借款已支付完毕不涉及
2019年1月,第三次股权转让程显峰创世联合288.8889/43.333443.3334出资原值股东贺琳以自有资金向创世联合提供借款已支付完毕不涉及

8-1-35

如下:

事项出资或股权转让情况出资价格 (万元)定价依据资金来源出资/股权转让价款支付情况完税情况
股东出资金额 (万元)
2015年12月,设立贺琳11出资原值自有资金已实缴全部出资不涉及
2018年1月,增资贺琳2929出资原值自有资金已实缴全部出资不涉及
小计3030
事项出资或股权转让情况出资价格(万元)定价依据资金来源出资/股权转让价款支付情况完税 情况
股东出资金额 (万元)
2015年12月,设立贺琳0.50.5出资原值自有资金已实缴全部出资不涉及
唐涤飞0.50.5
2018年6月,增资唐涤飞19.519.5出资原值自有资金已实缴全部出资不涉及
志鹏19.519.5
小计4040
2017年1月,股权转让转让方受让方转让的出资金额(万元)出资/股权转让价格定价依据资金来源出资/股权转让价款支付情况完税 情况
贺琳志鹏0.50.5出资原值自有资金已支付完毕不涉及

8-1-36

2、中瑞立、中瑞安、创世联合和创慧科瑞历次实缴出资已缴纳完毕,资金来源于合伙人/股东的自有资金;历次股权转让价款已支付完毕,资金来源于受让方自有资金或受让方股东以自有资金提供的借款;

3、中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让不涉及缴纳个人所得税。

请保荐机构和申报会计师核查并发表明确意见。

针对上述事项,保荐机构及申报会计师执行的核查程序如下:

1、对贺琳、张蕊进行访谈,了解股权激励份额调整的原因;审阅中瑞安关于该次出资变更的工商登记档案,获取张蕊向创世联合转让出资份额的协议及价款支付凭证;获取张蕊的个人履历、及其出具的关于持有发行人股份真实性的确认文件。

2、审阅中瑞立、创慧科瑞的工商登记档案资料;获取唐涤飞向创慧科瑞转让中瑞立出资额相应价款支付凭证;获取贺琳与志鹏签署的《顾问服务协议》以及贺琳向志鹏转让创慧科瑞股权转让价款支付凭证;核查确认中瑞立受让海天瑞声股权及股份支付确认情况;分别对贺琳、唐涤飞、志鹏进行访谈,确认上述交易安排的背景;获取贺琳、唐涤飞、志鹏关于持有发行人股份真实性的确认文件。

3、审阅中瑞立、中瑞安、创世联合和创慧科瑞的工商登记档案资料;获取前述机构的实际缴纳出资凭证,审阅其财务报表。获取中瑞立、中瑞安、创慧科瑞的出资/股权转让相关的价款支付凭证,核实个人所得税缴纳事项,并与相关方就转让原因、价款支付情况等进行访谈。对贺琳、唐涤飞进行访谈,获取股东借款相关往来凭证,核查创世联合、创慧科瑞设立及受让出资的资金来源。获取中瑞安、中瑞立合伙人及创世联合、创慧科瑞股东出具的关于持有出资/股权真实性的确认文件。

经核查,保荐机构及申报会计师认为:

1、张蕊向创世联合转让实缴出资额是在发行人公司业务发展及完善公司内部治理的背景下,基于张蕊岗位调整等因素综合考虑进行的;前述激励份额调整考虑了激励对象的入职年限、岗位分工、贡献程度等因素,具备合理性。未在 2015

8-1-37

年度按照13.89%的出资比例计算股份支付费用具备合理性,符合企业会计准则的相关规定。假设2015年度按照13.89%的出资比例计算张蕊的股份支付费用,仅影响报告期期初的所有者权益结构,对报告期内利润表项目不构成影响。

2、综上,唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权等一系列交易安排符合实际情况,具有合理性。

3、(1)除中瑞立2017年6月第二次股权转让以外,中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让均按照出资原值确定价格;中瑞立2017年6月第二次股权转让系因中瑞立将所持海天瑞声有限的股权转让价款全部分配给贺琳,为使除贺琳外的其他合伙人通过中瑞立间接持有海天瑞声有限的股权保持不变,贺琳将所持部分中瑞立出资转让给其他合伙人,不需支付对价。(2)中瑞立、中瑞安、创世联合和创慧科瑞历次实缴出资已缴纳完毕,资金来源于合伙人/股东的自有资金;历次股权转让价款已支付完毕,资金来源于受让方自有资金或受让方股东以自有资金提供的借款;(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让不涉及缴纳个人所得税。

问题4、关于发行人采购成本

回复材料显示:(1)发行人被采集人关系网络或发行人员工的人际关系网络寻找合适的境外数据被采集人,采集完成后通过Speech Ocean Ltd.向境外数据被采集人支付数据服务费用;(2)对于境内数据服务提供商,根据组织和管理被采集人员、标记人员的数量规模和管理难度,发行人与供应商分别约定采用10-11.5%的服务费率,采购定价具有公允性和合理性,处于境内同类公司的市场报价区间;(3)北京零点、北京天创共盈科技发展有限公司、北京中惠商客科技有限公司由北京博睿、恩泽尔实际控制人王驰受托统一进行经营管理,信阳市晨曦电子科技有限公司由信阳联智实际控制人洪琪受托统一进行经营管理;(4)发行人通过一体化人工智能数据处理技术支持平台对标注服务实施管理。

请发行人:(1)说明报告期内发行人寻找境外数据采集人的方式及供应商的具体名称、采购金额和被采集人的具体情况,该等的供应商的服务费率与

8-1-38

SpeechOcean的毛利率的比较情况及差异原因;(2)发行人报告期各期前五大劳务服务企业的服务费率及变动情况,结合采购额变化、人员数量规模和各采集项目的具体情况,进一步说明发行人如何确定相关的服务费率,发行人如何量化劳务服务企业的管理难度并反映在服务费率中;(3)进一步说明报告期内是否出现返工的情况,发行人与劳务服务企业的服务费用调整机制,因返工而导致的服务费用调整金额、原因和依据;(4)发行人向同一人控制或管理的多家劳务服务企业进行采购的原因及合理性,发行人未直接向王驰和洪琪直接持股的企业进行采购劳务服务的原因及合理性。

请保荐机构和申报会计师提供发行人主要的业务信息系统的情况,对发行人一体化人工智能数据处理技术支持平台等核心业务系统进行信息系统专项核查并出具专项核查报告,对系统控制、运营日志和运营数据的真实性、准确性和完整性进行核查、对财务数据和业务数据的衔接和是否存在运营数据缺失或被违规修改的情形进行核查,并对与信息系统相关的内部控制有效性发表明确意见。

请保荐机构和申报会计师对上述事项进行核查并发表明确意见。

答复:

(1)说明报告期内发行人寻找境外数据采集人的方式及供应商的具体名称、采购金额和被采集人的具体情况,该等的供应商的服务费率与SpeechOcean的毛利率的比较情况及差异原因

报告期内,初期发行人通过被采集人关系网络或发行人员工的人际关系网络寻找境外数据被采集人。随着业务规模增长,发行人2016年即已开始逐步转变为由具备资源优势的人力资源服务企业或劳务服务企业等供应商负责被采集人的匹配和组织,其通过境外华人群体资源为发行人提供境外生数据采集服务。该等境内外供应商数量较多,共计62个,其中主要涉及的供应商为除信阳联智、睿祥文乂以外的发行人报告期各期前五大数据服务供应商,即广州善世、芜湖善慧、北京博睿、北京零点、北京冠华等境内供应商和恩泽尔、TWIN STUDIOS、THINKWILD STUDIOS, S.L.、SAKURA JAPAN LLC、CHUSHOUKIGYOU,CONSULTING, CENTER., LTD.等境外供应商。报告期内,为发行人寻找境外数据被采集人的供应商涉及的采购金额和采集人数情况如下:

8-1-39

年度采购金额(万元)采集人数(人)
2018年度1,364.5513,506
2017年度726.979,583
2016年度652.3312,550
2018年度
序号供应商名称采购金额(万元)服务费率
1广州善世人力资源服务有限公司1,755.6711.5%
芜湖善慧人力资源服务有限公司1,541.9111.5%
2北京博睿驰信人力资源有限公司1,681.5711.5%
恩泽尔商贸有限公司249.096%
3北京冠华英才国际经济技术有限公司905.6110%、11.5%
4TWIN STUDIOS229.9710%
5THINKWILD STUDIOS, S.L.129.859%
2017年度
序号供应商名称采购金额(万元)服务费率
1芜湖善慧人力资源服务有限公司1,064.3611.5%
广州善世人力资源服务有限公司658.3411.5%

8-1-40

2北京博睿驰信人力资源有限公司529.8011.5%
恩泽尔商贸有限公司244.786%
北京零点起航营销策划有限公司55.3310%
3北京冠华英才国际经济技术有限公司539.82部分采购由10%提高至11.5%
4SAKURA JAPAN LLC189.6810%
5信阳市联智网络科技有限公司89.0810%
2016年度
序号供应商名称采购金额(万元)服务费率
1广州善世人力资源服务有限公司948.8210%提高至11.5%
2北京零点起航营销策划有限公司401.1310%
北京博睿驰信人力资源有限公司267.8710%提高至11.5%
恩泽尔商贸有限公司34.206%
3北京冠华英才国际经济技术有限公司644.2510%
4北京睿祥文乂技术服务有限公司224.6310%
5CHUSHOUKIGYOU,CONSULTING, CENTER.,LTD.109.339%

8-1-41

协商约定采用6-10%的服务费率,其中发行人长期境外供应商恩泽尔报告期内服务费率为6%,未发生变化。其他境外数据服务提供商地处日本、欧洲等地区,人工成本、日常管理成本均较高,服务费率也相对较高。

(3)进一步说明报告期内是否出现返工的情况,发行人与劳务服务企业的服务费用调整机制,因返工而导致的服务费用调整金额、原因和依据

发行人在标注过程中对标记人员进行技术指导,并对数据质量进行定期和不定期检查,检查不合格的数据,发行人要求数据服务提供商及时修改数据,以保证项目进度。该等数据修改均处于标记人员提供劳务的过程中,是发行人对供应商进行采购管理的一项内部控制措施,此时发行人尚未对其提供的劳务服务进行验收并与劳务服务企业进行结算,因此不涉及服务费用调整。

报告期内,发行人对所采购的劳务服务进行验收后,即代表数据质量已经合格,因此不存在验收并结算后需要返工的情形。

(4)发行人向同一人控制或管理的多家劳务服务企业进行采购的原因及合理性,发行人未直接向王驰和洪琪直接持股的企业进行采购劳务服务的原因及合理性

发行人主要供应商中,存在多家劳务服务企业受同一人控制或管理的情况,主要是由于供应商实际控制人出于针对不同地域特征划分区域管理等因素而形成的,属于其个人商业考虑。例如,广州善世和芜湖善慧受同一人控制,分别负责华南地区和华东地区业务;北京博睿和恩泽尔受同一人控制,分别负责境内和境外业务,发行人向其进行采购时需要根据所属业务的地域特点与供应商不同主体签约,具备合理性。

同时,发行人除直接向王驰直接持股的北京博睿、恩泽尔和洪琪直接持股的信阳联智采购劳务服务外,还存在向王驰受托经营的北京零点采购劳务服务的情形。保荐机构对北京零点唯一股东进行了访谈,经核查,北京零点股东因家庭原因难以确保足够的精力和时间继续经营北京零点,由于公司尚有员工和部分业务,为妥善安排,北京零点股东与长期相识的北京博睿股东王驰达成委托经营协议,由王驰统一对北京零点进行经营管理,后因王驰经营成果较好,该等委托经营关

8-1-42

系一直持续至今。

发行人已合并计算和披露了向同一人控制或管理的劳务服务企业进行采购的金额等情况。由于该等劳务服务供应商提供的服务主要为根据客户需求进行劳务人员的匹配、组织和管理,其签约主体本身的安排对于发行人采购不构成实质影响。

请保荐机构和申报会计师提供发行人主要的业务信息系统的情况,对发行人一体化人工智能数据处理技术支持平台等核心业务系统进行信息系统专项核查并出具专项核查报告,对系统控制、运营日志和运营数据的真实性、准确性和完整性进行核查、对财务数据和业务数据的衔接和是否存在运营数据缺失或被违规修改的情形进行核查,并对与信息系统相关的内部控制有效性发表明确意见。

保荐机构和申报会计师针对公司报告期信息安全治理环境、信息系统管理和信息系统运行情况的测试,结合对公司业务模块运营模式的理解,从主营业务收入、主要成本等对其业务运营、财务报告有较大影响的业务和管理流程出发,通过穿行相关业务及管理流程,选取其业务主体及管理流程,筛选出支撑这些业务流程运营的主要信息系统,信息系统具体情况如下:

序号系统名称系统介绍
1一体化数据处理技术支撑平台是由公司自主研发的技术支持平台,整合并贯通了数据库设计、数据采集、数据处理、质量检测、质量控制和数据安全管理等各个环节,嵌入了项目管理、质量控制、数据安全的流程管理和工具,主要支持业务人员进行人工智能数据资源开发相关工作的软件系统。
2业务管理平台是由公司自主研发的,以支撑公司项目管理工作、串联公司主要业务及财务流程,解决公司业务内部管理分析、对外信息披露、业务财务映射符合财务原则和标准、业务数据细分及内部控制管理各环节数据统计口径不一致、不及时、不准确等痛点问题为目标,加强合同及项目管理,提高日常工作效率,进行更准确的项目核算而开发的管理系统。该平台于2017年1月1日上线使用,实现了公司合同及项目管理等基本功能。
3用友财务系统是公司外购、主要由财务部使用的财务管理软件,其以总账系统为核心,包括往来、现金、项目、税务、工资管理、固定资产等模块,负责支撑公司会计核算、财务管理和财务决策等职能。

8-1-43

行了信息系统一般性控制测试,评估公司信息系统管理水平及主要信息系统对业务运行的支撑能力和存在的风险,以确定信息系统稳定性和业务财务相关数据运行环境和来源的可靠性。

保荐机构和申报会计师采取必要的评估程序和方法对报告期内支撑公司主要业务运营和财务入账流程的信息系统及相关业务数据及财务数据进行了专项核查,涉及公司信息科技治理、主要信息系统一般性控制管理,并对存在于公司主要信息系统中的相关业务运营数据及财务数据进行了验证和分析,以评估和验证公司相关信息系统在运行管理和应用控制方面的有效性。保荐机构和申报会计师分别出具了关于发行人主要信息系统的专项核查报告。

经核查,保荐机构、申报会计师认为:公司目前对主要信息系统的控制总体有效,未发现重大或重要的控制缺陷。同时综合整体的风险排查和信息系统应用控制测试、业务运营数据及财务数据验证和分析结果,公司报告期内的主营业务和财务报告流程中涉及的信息系统处理及应用控制总体有效,未见明显异常。

除上述信息系统专项核查外,保荐机构和申报会计师针对数据服务费相关采购支出的真实性、准确性和完整性,主要执行了以下核查程序:

1、获取了发行人的采购业务相关管理制度,了解了发行人数据服务采购的管理流程,并选取样本,就其重要内部控制环节(立项和预算管理、采购申请及审批、合同签订、质检验收、过程控制、供应商对账、结算付款等)执行控制测试,核查采购内控管理的有效性;

2、针对发行人报告期内数据服务费执行采购核查程序,从账面记录的数据服务费采购出发,获取采购框架合同、采购订单资料、经双方盖章确认的验收结算单、收到的发票、支付采购结算款项的银行回单,检查供应商名称、验收服务的内容、验收时间、结算数量、结算单价、结算金额、支付金额等信息与发行人记录是否一致,核查采购交易的真实性、准确性;

3、抽取发行人部分业务项目,从发行人后台系统导出采集、标注环节的人员服务记录,与验收结算单所记载的采购服务数量核对,核查采购交易的真实性、准确性、完整性;实地参与了采集项目的采集过程、对标记人员进行了访谈;

8-1-44

4、分析了发行人报告期内向数据服务采购数量、采购单价的变动原因及其合理性,以及采购数量和产出情况的配比关系及其合理性,核查发行人数据服务费采购是否存在异常波动,并调查分析造成波动的原因,对其合理性进行分析复核;

5、获取了发行人董事、监事、高级管理人员及相关财务人员的银行账户资金流水,核查是否存在与主要数据服务供应商及其关键人员存在资金往来并为发行人代垫成本费用的行为,核查发行人成本费用的完整性;

6、对发行人报告期内主要数据服务供应商进行函证,核查采购金额和往来余额的真实性和准确性,报告期内各年发函金额占当年采购金额的比例分别达到79.25%、78.41%和84.77%,所发函证均取得回函,回函金额不存在差异;

7、对发行人报告期内主要数据服务供应商进行了实地走访,所走访的数据服务供应商的对应各年数据服务采购金额占各年数据服务采购总金额的比例超过90%,访谈过程中,主要就双方合作时间、合作方式、提供服务类型、各年交易规模、发行人采购占其同类销售占比、验收结算方式、与外部劳务人员签订协议情况等情况进行详细了解,核查采购交易的真实性、合理性,以及采购模式的可持续性;

8、获取了发行人报告期内主要数据服务供应商的工商资料和报告期内税务合规证明,并穿透获得其股东和其他关键人员、关联公司名单,检查与发行人、发行人关联方及其董事、监事、高级管理人员等关键人员是否存在关联关系;

9、获取了发行人报告期内主要数据服务供应商出具的说明和提供的财务数据,核查其与发行人之间采购定价是否公允,采购交易是否符合商业实质并为供应商带来商业收益,确认双方之间及双方股东、董事、监事、高级管理人员、关键经办人员之间是否存在关联关系,是否存在提供劳务服务以外的其他交易和资金往来并为发行人代垫成本费用的行为,核查发行人成本费用的完整性;

10、查询了互联网上发布的采集、标注服务价格信息,与发行人向终端被采集人和标记人员的采购单价进行比较,核查发行人采购单价是否公允;复核了发行人对数据服务供应商类似的市场同类人力资源服务公司和劳务公司管理服务

8-1-45

费的市场询价结果,核查发行人主要数据服务供应商服务费率的定价公允性;

11、获取了实际控制人曾经控制的关联方SpeechOcean Ltd.的审计报告、账务记录、银行流水等财务资料,对报告期内发行人与其之间的关联销售和采购交易进行了穿透核查,核查了相关合同和银行流水,对重要的最终销售客户进行了实地走访或视频访谈;核查了2015年度关联销售和采购的具体内容;测算了报告期内SpeechOcean Ltd.的现金流转情况,并对相关数字的勾稽关系进行了复核;获取并查阅了境外律师出具的关于SpeechOcean Ltd.注销事宜的法律意见书;

12、获取了发行人实际控制人及其配偶、发行人总经理控制、担任董事或高级管理人员、具有重大影响的企业(包括注销或转让的)及其董事、监事、高级管理人员出具的说明,确认该等企业及其董事、监事、高级管理人员与发行人供应商之间是否在交易、资金往来或其他利益安排,是否存在为发行人代垫成本费用的行为,核查发行人成本费用的完整性;

经核查,保荐机构、申报会计师认为:

发行人针对数据服务采购业务建立了较为完善的内部控制并得到了有效执行;发行人及其关联方与数据服务供应商之间不存在关联关系;报告期内,发行人与数据服务供应商采购业务真实、采购数据准确、完整,采购定价公允;发行人对数据服务费采购的核算真实、准确、完整,不存在其他相关方为发行人代垫成本费用的情形,不存在体外支付成本费用的情形。

请保荐机构和申报会计师对上述事项进行核查并发表明确意见。

经核查,保荐机构、申报会计师认为:报告期内为发行人寻找境外数据被采集人的供应商的服务费率与SpeechOcean的毛利率不存在明显差异;发行人根据劳务服务供应商的税务成本和管理难度差异,与供应商协商确定服务费率,相关服务费率变动合理;发行人报告期内对所采购的劳务服务进行验收后,即代表数据质量已经合格,不存在验收并结算后需要返工的情形;发行人向同一人控制或管理的多家劳务服务企业进行采购的原因合理,发行人除直接向王驰直接持股的北京博睿、恩泽尔和洪琪直接持股的信阳联智采购劳务服务外,还存在向王驰受托经营的北京零点采购劳务服务的情形,原因合理。

8-1-46

问题5、关于发行人的营业收入

申报材料显示:(1)发行人已按语种披露了智能语音类数据资源定制服务和数据库产品的销量和销售价格;(2)发行人存量数据库的销售收入逐年上升;(3)发行人应收账款和收入函证的回函差异较大。

请发行人:(1)进一步区分不同项目特征(采集、单一或多样化标注等)和语言类型(中文、外语、小语种和方言等)补充披露智能语音类定制服务和数据库的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因;(2)计算机视觉类定制服务收入增长较快,进一步区分不同项目特征(手写体、光学字符识别和行车相关视频等)补充披露计算机视觉类定制服务的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因;(3)说明报告期各期各类型数据库的库存量、新增量和结存量,并结合各类型数据库的生命周期进一步分析各期销售和未销售的对应数据库数量变动情

况、销售数据库的开发成本和销售价格。

请保荐机构和申报会计师对上述事项进行核查并发表明确意见,进一步说明回函不符的事项履行的核查程序,列表说明具体调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。

答复:

(1)进一步区分不同项目特征(采集、单一或多样化标注等)和语言类型(中文、外语、小语种和方言等)补充披露智能语音类定制服务和数据库的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因

发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/3、主要产品和服务的销量和价格分析/(1)智能语音领域”中对以下内容进行了补充披露:

8-1-47

①智能语音类数据资源定制服务报告期内,公司智能语音类数据资源定制服务的销量和价格情况如下:

业务细分类别语种2018年度2017年度2016年度
销量 (小时)价格 (元/小时)销量 (小时)价格 (元/小时)销量 (小时)价格 (元/小时)
有采集的单一化标注语音中文38,286.00355.1416,759.01448.146,533.00553.11
外语种20,055.00722.768,028.03872.4611,091.40716.31
小计58,341.00481.5124,787.04585.5717,624.40655.82
无采集的单一化标注语音中文88,196.01302.4641,646.21312.4150,191.57291.28
外语种3,067.41955.131,886.61572.922,268.81653.94
小计91,263.42324.4043,532.82323.7052,460.38306.96
多样化标注语音中文783.8617,110.43313.7027,392.84237.0620,957.44
外语种536.4751,796.84463.5425,327.38228.7421,508.92
小计1,320.3331,204.04777.2426,161.01465.8021,228.26

8-1-48

外语种业务2017年单价较高,2016年和2018年较为平稳。2017年单价较高是由于发行人开展了一些低噪声环境、车载环境等场景以及法语、德语的项目,报价较高,拉升了2017年的平均单价。英语类项目的价格在报告期内较为平稳,该类别涵盖全球多个国家和地区的英语,如新加坡、英国、加拿大等英语母语国家,以及西班牙、意大利等非英语母语国家,资源相对分散,发达国家物价水平较高,导致成本较高,因而销售价格较高。其他语种覆盖的语种超过20个,由于每种语言特点均不相同,客户对特定语种的需求紧迫程度、发音人资源稀缺程度在不同年份也有所不同,因此会造成一定的价格波动。

语种价格(元/小时)
2018年度2017年度2016年度
英语869.51875.40836.82
其他语种664.79870.70690.18

8-1-49

由于多样化标注语音项目的定制化程度最高,因此其不同项目之间的单价差异更明显,报告期各期平均单价的合理波动区间更大。

中文业务2017年单价提升,主要原因是发行人开展了中文搭配 其他语种混读、温柔型风格等项目,由于难度较高且资源稀缺造成单价较高;同时2017年是下游智能音箱行业的集中研发时期,各智能音箱厂商研发周期有限,需求急迫,发行人议价空间较大;2018年单价明显下降,是由于开展了部分无需进行音素边界标注的多样化标注语音项目,成本相对较低,因此价格较低。

外语种业务2018年单价大幅上升,主要原因是随着下游语音合成技术应用性的提升,客户对发音人要求越来越高,例如对其音色的代表性、发音的专业性等方面都提出了更高的要求。2018年,发行人根据客户需求启动了欧美多个语言的合成项目,此类项目需求较一般合成项目要求更高:对于录音棚,要求更低的背景噪声和更高的信噪比;对于发音人,要求发音人具备五年以上播音、配音及主持相关经验,每个项目要求提供至少五十个候选发音人,同时对于候选发音人通过100 个该语种母语用户的主观评测进行选择;对于录音过程,除配备录音工程师外,要求同时配备录音指导,录音指导需具备音乐相关领域本科以上学历,五年以上音乐导演或配音导演工作经历,以及熟练的英语沟通能力。这类要求均超出以往年度一般合成项目的要求,因此使得项目难度和成本显著提升,同时价格也相应显著上涨。

相比单一化标注语音项目的价格受语种影响较大,多样化标注语音项目的价格主要取决于发音人价格和标注类型,而与语种关联性较低,中文与外语种之间不存在固有的价格差异。发音人主要取决于专业性、知名程度、当地物价水平等因素,即使是同一语言,个体差异也可能较大。多样化标注中的主要标注类型音素边界标注是针对音素(如“a”,“o”,“b”,“h”等),所有语言均可用国际音标表示其发音,标注成本与语言相关度较弱。

②智能语音类数据库产品

报告期内,公司智能语音类数据库产品的销量和价格情况如下:

业务细分语种2018年度2017年度2016年度

8-1-50

类别销量 (小时)价格 (元/小时)销量 (小时)价格 (元/小时)销量 (小时)价格 (元/小时)
有采集的单一化标注语音中文68,536.93354.7941,159.09473.3023,881.88374.47
外语种47,099.49720.4527,063.42868.5226,961.93765.26
小计115,636.42503.7368,222.51630.0950,843.81581.70
多样化标注语音中文50.2012,514.05114.4716,405.95133.7616,307.24
外语种45.5028,520.32183.7723,649.1275.9829,045.19
小计95.7020,124.13298.2420,869.06209.7420,921.67

8-1-51

稀缺性较高,因此价格较高。

外语种业务单价明显高于中文业务,是由于国内外语种资源相对稀缺,采集和标注难度高于中文所致,具备合理性。

b、多样化标注语音

如前述原因,多样化标注语音项目按小时计算的产出量远低于有采集的单一化标注语音项目,同时单位价格远高于有采集的单一化标注语音项目。

此外,多样化标注语音数据库产品受到发音人定位的不同,价格变动比较明显,报告期各期平均单价的合理波动区间较大,因此上述中文和外语种业务的价格整体处于合理波动区间。

(2)计算机视觉类定制服务收入增长较快,进一步区分不同项目特征(手写体、光学字符识别和行车相关视频等)补充披露计算机视觉类定制服务的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因

由于计算机视觉类业务各细分类别差异较大,例如手写体应用于手写输入,光学字符识别应用于拍照翻译等功能,行车相关视频应用于自动驾驶,且计价单位不同,因此不同类型项目的销售价格之间无法横向比较。

发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/3、主要产品和服务的销量和价格分析/(2)计算机视觉和自然语言领域”中对以下内容进行了补充披露:

报告期内,公司计算机视觉类数据资源定制服务中手写体、光学字符识别、行车相关视频业务的销量和价格情况如下:

业务细分类别2018年度2017年度2016年度
销量单位价格 (元)销量单位价格 (元)销量单位价格 (元)
手写体2,740494.903,8751,238.897952,444.21
光学字符识别47,419.8665.1313,238.0448.401,811.6918.16
行车相关1,188,754.204.77----

8-1-52

业务细分类别2018年度2017年度2016年度
销量单位价格 (元)销量单位价格 (元)销量单位价格 (元)
视频

8-1-53

报告期内,发行人各年新增的智能语音数据库产品数量分别为76个、49个和24个,各年末库存结余量分别为334个、383个和407个,各年新增数据库产品在报告期内实现销售的数量以及未实现销售的数量情况具体如下:

单位:个

年份各期新增数量(产成数据库个数)期末 库存量各期产成的数据库中,报告期内实现销售的数据库个数各期产成的数据库中,报告期内未实现销售的数据库个数
2016年2017年2018年2016年2017年2018年
2013年 及以前16116140684712193114
2014年5021111914394136
2015年4725851725423022
2016年76334442333325343
2017年49383-4912--37
2018年24407--24---
合计407-100166153307241254
销售数据库的平均开发成本 (万元/个)27.3925.1426.62---
销售数据库的平均销售价格 (万元/个)26.5322.6828.52---

8-1-54

报告期内实现销售的智能语音数据库产品对应的平均开发成本和平均销售价格总体较为稳定,平均开发成本分别为27.39万元、25.14万元和26.62万元,平均销售价格分别为26.53万元、22.68万元和28.52万元。由于数据库产品可重复授权销售,因此平均销售价格低于平均开发成本并不一定导致发行人开发数据库产品出现亏损。

二、计算机视觉领域和自然语言领域

报告期内,发行人各年新增的计算机视觉数据库产品个数分别为3个、19个和11个,各年末的库存结余量分别是7个、26个和37个,各年新增计算机视觉数据库产品在报告期内实现销售的数量以及未实现销售的数量情况具体如下:

单位:个

年份各期新增数量(产成数据库个数)期末 库存量各期产成的数据库中,报告期内实现销售的数据库个数各期产成的数据库中,报告期内未实现销售的数据库个数
2016年2017年2018年2016年2017年2018年
2015年 及以前44-1443-
2016年373---33
2017年1926-111-818
2018年1137--11---
合计37-31216342521
销售数据库的平均开发成本 (万元/个)5.6811.8711.35---
销售数据库的平均销售价格 (万元/个)6.0915.657.45---
年份各期新增数量(产成数据库个数)期末库存量各期产成的数据库中,报告期内实现销售的数据库个数各期产成的数据库中,报告期内未实现销售的数据库个数
2016年2017年2018年2016年2017年2018年
2015年及以前23231035132018
2016年14371445-109
2017年1956-171-218

8-1-55

2018年1672--16---
合计72-242427484845
销售数据库的平均开发成本 (万元/个)5.163.366.61---
销售数据库的平均销售价格 (万元/个)16.7310.6013.72---

8-1-56

为报告期内产成,年限较短,其生命周期情况尚难以判断,2015年及以前产成的数据库产品在2018年部分实现了销售,仍保持在生命周期之内。

请保荐机构和申报会计师进一步说明回函不符的事项履行的核查程序,列表说明具体调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。

一、进一步说明针对回函不符事项履行的核查程序

报告期内,客户未直接在回函中对发行人应收账款和营业收入确认的情况较多,主要原因系发行人确认收入根据客户验收报告,而客户确认采购依据发行人开具的发票,双方核算的口径不一致而导致。针对回函不符事项,保荐机构、申报会计师主要履行了以下核查程序:

1、了解发行人与客户之间的验收、结算和对账流程,并对业务环节中的关键控制点进行测试;

2、通过函证取得客户可以确认的信息(包括发票与付款信息),与发行人账面记载的应收账款金额、营业收入金额、开具发票金额、客户验收金额和收款金额进行核对,分析其勾稽关系的合理性,并对差异情况进行调节;

3、执行收入核查程序,以营业收入为起点,检查销售合同、项目执行过程中与客户的邮件沟通记录、产品或服务交付记录、客户验收报告、开票记录和银行回款流水等,就上述资料中的客户名称、合同条款、业务内容、数据数量、数据交付时间、客户验收时间、开票时间和收款时间等信息进行匹配和穿行测试,检查营业收入和应收账款确认的真实性和准确性。

4、对发行人主要客户进行了实地走访,了解客户和发行人之间的合作模式、合作业务规模和结算方式。通过实地走访,未发现发行人与客户之间销售业务存在异常情形。

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-57

二、列表说明具体的调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。

根据最新的回函情况,报告期内应收账款和营业收入的函证汇总情况更新如下:

单位:万元

年度/时点报表科目发函情况回函情况1期后回款2 (截至2019年4月30日)
账面金额发函金额发函比例回函对应的发函金额回函金额回函差异
2018-12-31 /2018年应收账款3,096.752,911.3094.01%2,411.531,115.451,296.082,073.17
营业收入19,265.7717,724.0292.00%13,684.3212,861.77822.54——
2017-12-31 /2017年应收账款2,707.572,535.8493.66%2,134.691,471.89662.802,438.69
营业收入11,907.0910,652.1089.46%9,629.789,451.94177.84——
2016-12-31 /2016年应收账款1,772.881,644.4592.76%1,644.451,945.75-301.311,657.03
营业收入8,422.867,334.4987.08%7,121.117,223.29-102.18——

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-58

应关系。经核查,期后回款逐一匹配至相应的应收账款。

报告期内,营业收入、应收账款函证的回函差异主要集中在前五大营业收入客户(按品牌)和前五大应收账款对象(按品牌)。根据审核问询要求,将前五大营业收入客户(按品牌)和前五大应收账款对象(按品牌)函证情况按照法人主体列示如下:

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-59

(一)前五大营业收入客户(按品牌)的函证汇总情况

单位:万元

年度客户品牌客户名称账面金额发函金额回函金额回函差异备 注
2018年阿里巴巴淘宝(中国)软件有限公司2,019.422,019.421,399.64619.78
阿里巴巴(中国)网络技术有限公司1,602.971,602.971,398.16204.81
浙江天猫技术有限公司1,418.371,418.371,195.87222.50
三星Samsung Electronics Co., Ltd.1,679.681,679.68————未回函
北京三星通信技术研究有限公司603.15603.1561.64541.51
Samsung R&D Institute India - Bangalore Pvt Ltd.153.99153.99311.73-157.74
腾讯腾讯科技(深圳)有限公司978.68978.681,354.46-375.78
深圳市腾讯计算机系统有限公司390.84390.84424.54-33.69
腾讯科技(成都)有限公司168.54168.54162.595.95
微软微软(中国)有限公司957.75957.751,904.58-946.83
Microsoft Corporation-USA341.98341.98341.98
百度百度国际科技(深圳)有限公司334.26334.26350.39-16.13
北京百度网讯科技有限公司375.27375.27284.0191.26
百度时代网络技术(北京)有限公司90.2990.29————未回函
百度在线网络技术(北京)有限公司88.4788.4788.47
2017年腾讯深圳市腾讯计算机系统有限公司417.77417.77374.5343.24

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-60

年度客户品牌客户名称账面金额发函金额回函金额回函差异备 注
腾讯科技(上海)有限公司88.4188.4174.6713.74
腾讯科技(深圳)有限公司1,263.871,263.871,030.28233.59
三星SAMSUNG ELECTRONICS CO., LTD.113.96113.96113.96
北京三星通信技术研究有限公司1,439.121,439.121,558.19-119.07
阿里巴巴阿里云计算有限公司526.90526.90387.14139.76
淘宝(中国)软件有限公司241.61241.61317.30-75.69
广州神马移动信息科技有限公司110.26110.26110.26
浙江天猫技术有限公司118.77118.7781.8936.88
阿里巴巴(北京)软件服务有限公司63.6863.6863.68
支付宝(中国)网络技术有限公司45.4445.44————未回函
微软Microsoft Corporation-USA477.99477.99477.99
微软(中国)有限公司580.87580.87826.27-245.40
百度北京百度网讯科技有限公司585.29585.29585.29
2016年阿里巴巴淘宝(中国)软件有限公司361.67361.67361.67
阿里云计算有限公司160.01160.01160.01
阿里巴巴(北京)软件服务有限公司93.7593.7593.75
阿里巴巴(中国)网络技术有限公司10.1610.1610.16
北京阿里巴巴云计算技术有限公司9.989.989.98
支付宝(中国)网络技术有限公司166.60166.60166.60

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-61

年度客户品牌客户名称账面金额发函金额回函金额回函差异备 注
高德信息技术有限公司175.81175.81175.81
三星北京三星通信技术研究有限公司863.80863.80948.39-84.59
微软微软(中国)有限公司389.74389.74525.50-135.76
Microsoft Corporation-USA237.27237.27237.27
Microsoft Corporation印度198.80198.80198.80
SpeechOcean Ltd.SpeechOcean Ltd.716.94716.94716.94
百度北京百度网讯科技有限公司526.78526.78526.78
时点客户品牌客户名称账面金额发函金额回函金额回函差异备 注
2018年 12月31日阿里巴巴阿里巴巴(中国)网络技术有限公司217.11217.11217.11
浙江天猫技术有限公司274.96274.96136.48138.48
淘宝(中国)软件有限公司752.11752.11587.65164.47
腾讯深圳市腾讯计算机系统有限公司213.39213.39未确认213.39
腾讯科技(成都)有限公司101.84101.84未确认101.84
腾讯科技(深圳)有限公司139.04139.04未确认139.04
AmazonAmazon Web Services, Inc.351.94351.94————未回函
百度北京百度网讯科技有限公司289.80289.80未确认289.80

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-62

时点客户品牌客户名称账面金额发函金额回函金额回函差异备 注
深圳市天道日新科技有限公司深圳市天道日新科技有限公司110.00110.00110.00
2017年 12月31日腾讯腾讯科技(上海)有限公司14.7114.71未确认14.71
深圳市腾讯计算机系统有限公司52.1652.164.0048.16
腾讯科技(深圳)有限公司769.76769.76186.58583.19
阿里巴巴支付宝(中国)网络技术有限公司10.7910.79————未回函
浙江天猫技术有限公司39.1039.1039.10
阿里云计算有限公司181.16181.16181.020.14
淘宝(中国)软件有限公司95.8495.84122.45-26.61
乐视乐乐创新智能科技(北京)有限公司209.88209.88————未回函
百度北京百度网讯科技有限公司202.76202.76202.76
富士康云智汇(深圳)高新科技服务有限公司191.52191.52191.52
2016年 12月31日阿里巴巴阿里巴巴(中国)网络技术有限公司10.7710.7710.77
支付宝(中国)网络技术有限公司16.3016.3016.30
阿里云计算有限公司39.6239.6239.62
高德信息技术有限公司121.55121.55121.55
淘宝(中国)软件有限公司153.70153.70153.70
阿里巴巴(北京)软件服务有限公司14.2814.2814.28
腾讯腾讯科技(深圳)有限公司311.63311.63218.2193.42
百度北京百度网讯科技有限公司205.96205.96205.96

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-63

时点客户品牌客户名称账面金额发函金额回函金额回函差异备 注
乐视乐乐创新智能科技(北京)有限公司115.85115.85115.85
联想联想(北京)有限公司110.00110.00110.00

8-1-64

(三)回函差异调节过程

1、关于营业收入的调节过程

发行人按照项目交付与验收进度为依据确认对客户的营业收入,而客户通常按照收到发行人的发票作为确认当期采购的情形,双方核算的差异导致营业收入的回函存在差异,具体分析如下:

类型发行人(以验收为依据)客户(以发票为依据)是否需要调节
数据 验收时间开具 发票时间确认 收入数据 验收时间取得 发票时间确认 采购
情形1当期当期当期当期
情形2当期前期当期前期×
情形3当期尚未当期尚未×
情形4尚未当期×尚未当期
情形5前期当期×前期当期
营业收入回函差异调节过程项目备注
客户回函的发票金额——
减:当期开票、前期验收情形5
减:当期开票、尚未验收情形4
加:当期验收、前期开票情形2
加:当期验收、尚未开票情形3
调节后的营业收入金额——

8-1-65

基于此,对于发行应收账款回函差异的主要通过检查年初余额、本年含税营业收入、本年收款、本年只开票税金影响与年末应收账款余额的会计核算逻辑等式的一致性进行核查。

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-66

3、前五大品牌客户回函差异的调节过程

(1)营业收入回函差异调节过程

①2018年回函差异调节过程

单位:万元

品牌主 体发函金额回函金额调节过程调节后金额调节结论
当期开票 前期验收当期开票尚未验收当期验收 前期开票当期验收 尚未开票
逻辑关系⑦=②-③-④+⑤+⑥
阿里巴巴淘宝(中国)软件有限公司2,019.421,399.6464.5270.81755.122,019.42一致
阿里巴巴(中国)网络技术有限公司1,602.971,398.16204.821,602.97一致
浙江天猫技术有限公司1,418.371,195.8736.89141.51400.901,418.37一致
三星北京三星通信技术研究有限公司603.1561.6419.3433.39594.28603.15一致
Samsung R&D Institute India - Bangalore Pvt Ltd.153.99311.73157.74153.99一致
腾讯腾讯科技(深圳)有限公司978.681,354.46352.7162.1039.03978.68一致
深圳市腾讯计算机系统有限公司390.84424.5435.3915.3017.00390.84一致
腾讯科技(成都)有限公司168.54162.5934.1240.07168.54一致
微软微软(中国)有限公司957.751,904.5823.191,179.88250.585.66957.75一致
百度百度国际科技(深圳)有限公司334.26350.3960.7441.882.72334.26一致

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-67

品牌主 体发函金额回函金额调节过程调节后金额调节结论
当期开票 前期验收当期开票尚未验收当期验收 前期开票当期验收 尚未开票
北京百度网讯科技有限公司375.27284.0113.25104.51375.27一致

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-68

②2017年回函差异调节过程

单位:万元

品牌主体发函金额回函金额调节过程调节后金额调节结论
当期开票 前期验收当期开票尚未验收当期验收 前期开票当期验收 尚未开票
逻辑关系⑦=②-③-④+⑤+⑥
腾讯深圳市腾讯计算机系统有限公司417.77374.5343.24417.77一致
腾讯科技(上海)有限公司88.4174.6713.7488.41一致
腾讯科技(深圳)有限公司1,263.871,030.28289.3984.9125.64582.241,263.87一致
三星北京三星通信技术研究有限公司1,439.121,558.19647.16452.9075.201,439.12一致
阿里巴巴阿里云计算有限公司526.90387.1440.3295.6352.46223.25526.90一致
淘宝(中国)软件有限公司241.61317.30150.2628.23102.79241.61一致
浙江天猫技术有限公司118.7781.8936.89118.77一致
微软微软(中国)有限公司580.87826.2770.44345.77168.012.81580.87一致

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-69

③2016年回函差异调节过程

单位:万元

品牌主体发函金额回函金额调节过程调节后金额调节结论
当期开票 前期验收当期开票 尚未验收当期验收 前期开票当期验收 尚未开票
逻辑关系⑦=②-③-④+⑤+⑥
三星北京三星通信技术研究有限公司863.80948.39637.08479.2573.24863.80一致
微软微软(中国)有限公司389.74525.502.83236.71103.77389.74一致
时点客户 品牌主体期初应收账款本期销售只开票税金影响本期收款期末应收账款逻辑关系检查核对结论期后回款
营业收入含税 销售额
逻辑关系⑦=①+③+④-⑤-⑥————
2018年12月31日阿里巴巴淘宝(中国)软件有限公司95.842,019.422,149.43-0.701,492.46752.11核对一致733.20
阿里巴巴(中国)网络技术有限公司1,602.971,764.111,547.00217.11核对一致180.47
浙江天猫技术有限公司39.101,418.371,503.481,267.62274.96核对一致274.96

北京海天瑞声科技股份有限公司 第三轮审核问询函的回复

8-1-70

时点客户 品牌主体期初应收账款本期销售只开票税金影响本期收款期末应收账款逻辑关系检查核对结论期后回款
营业收入含税 销售额
逻辑关系⑦=①+③+④-⑤-⑥————
腾讯腾讯科技(深圳)有限公司769.76978.681,068.656.211,807.76139.04核对一致12.99
深圳市腾讯计算机系统有限公司52.16390.84421.68226.78213.39213.39
腾讯科技(成都)有限公司168.54178.658.30101.84101.84
百度北京百度网讯科技有限公司202.76375.27413.07-8.92317.11289.80核对一致159.37
2017年12月31日腾讯深圳市腾讯计算机系统有限公司417.77482.720.91431.4752.16核对一致52.16
腾讯科技(上海)有限公司88.4199.5084.7914.71核对一致14.71
腾讯科技(深圳)有限公司311.631,263.871,387.15-2.76926.26769.76核对一致769.76
阿里巴巴阿里云计算有限公司39.62526.90556.04-0.33414.17181.16核对一致181.16
淘宝(中国)软件有限公司153.70241.61256.1122.37336.3495.84核对一致95.84
2016年12月31日腾讯腾讯科技(深圳)有限公司318.51357.274.3650.00311.63核对一致311.63

8-1-71

问题6、关于发行人毛利率

发行人已区分不同项目类型和特征说明了智能语音类业务销量、在产品结存和新增数据库产品时长与采集服务数量、标注服务数量之间的配比关系,多样化标注语音的标注产出比显著高于单一化标注语音。

请发行人:(1)结合多样化标注语音的不同项目特征进一步说明多样化标注语音的标注产出比的变动原因、远高于其他项目的原因及合理性,相关处理技术如何提高标注的工作效率;(2)结合不同项目特征和语言类型的项目情况,进一步列示单位价格、单位成本中采集和标注服务费的变动情况并对毛利率波动进行分析。

请保荐机构和申报会计师进行核查并发表明确意见。

答复:

(1)结合多样化标注语音的不同项目特征进一步说明多样化标注语音的标注产出比的变动原因、远高于其他项目的原因及合理性,相关处理技术如何提高标注的工作效率

一、多样化标注语音标注产出比远高于其他项目的原因及合理性

多样化标注语音标注产出比远高于其他项目的原因为标注精细度和复杂度远远超过单一化标注语音项目。

单一化标注语音要求较为简单,有采集的单一化标注语音,通常是发音人对照预设文本进行朗读,因此只需要完成语音与文字一致性的检查、语音边界标注;无采集的单一化标注语音,通常需要先进行人工文本生成后,再进行前述标注即可。

而对于多样化标注语音,主要应用于语音合成算法模型训练,为了使合成的声音更加接近于人声,需要对语音进行各种细节描述,因此需要对数据进行多样化标注,包括音段(音素、音素边界)和超音段(韵律)标注信息,精细和复杂程度远高于单一化标注语音,因此标记同样时间长度的语音文件,所需要的时间更长、环节更多,导致多样化标注语音的标注产出比远高于单一化标注语音。

8-1-72

标注内容标注说明有采集的单一化标注语音无采集的单一化标注语音多样化标注语音
语音边界标注标记语音的起止点
人工文本生成将语音内容听写成文字√(如果无预设文本)
语音属性标注标记发音人性别、方言区
声音事件标注标记笑声、关门声等非语音类型
音素标注根据实际发音,标注真实的音段信息,含音素、音节边界、重音/声调
音素边界标注根据实际发音,逐个标示出每个音素在语音上的起止位置
韵律标注听声音判断每个音节末尾的韵律边界类型,分别用#1~#4表示韵律词、二级韵律短语、一级韵律短语、语调短语
词性标注标注每个语法词词性信息
标注产出比注约为3约为12约为50-60

8-1-73

多样化标注语音标注产出比的变动主要体现为2018年单位产出的标注量下降。主要原因是随着2018年发行人音素边界自动预测、基于语音特征的韵律预测等高效数据处理技术的成熟和普遍应用,发行人数据处理工作效率得到提高,标注过程中的人工工作量有效减少,使得单位产出的标注量有所下降。

通过技术辅助数据处理,发行人标注工作效率提升主要体现在以下两个方面:

1、发行人利用音素标注正确率校验技术,发现并定位人工标注错误,以帮助快速修改错误,提高数据质量与工作效率。

音素标注的正确性是衡量多样化标注语音数据库质量的重要指标,通常需要由标注人员通过语音听辨确认音素(音素为根据语音的自然属性划分出来的最小语音单位,以1,000句文本为例,按照每句话平均15个字,每个字包括声、韵母,音素量为1,000*15*2=30,000个)。由于人工标注结果难免存在错误,而从大量数据中发现并修正错误极为耗时。

发行人音素标注正确率校验技术,利用语音识别中GMM-HMM三音子声学模型,对每个音素样本进行置信度打分,针对不同置信度区间设计不同的音素样本检查校对策略,将校对重点进行有效集中,在减少整体校对工作量的同时,提高了音素标注正确率。发行人已针对该项技术于2018年7月提交了“音素误标注的检测方法和装置”发明专利申请。

2、发行人利用基于语音特征的韵律预测技术,采用自动预标注,用半自动代替全人工从而提高工作效率。

由于语音韵律具有较强的差异性和个人特色,因此韵律标注需要标注人员通过语音听辨,根据韵律标注规范,判断每个语法词的韵律边界类型。

8-1-74

如上图所示,韵律标注一般有两种方法:

①全人工韵律标注:即上图“1、人工标注韵律”,由标注人员通过听辨语音直接在原始文本上标注韵律符号;

②半自动韵律标注:即先使用算法预测韵律信息(“3、自动预测韵律”),而后再“2、人工校对韵律”,由标注人员结合语音听辨在预测结果上进行修改。

发行人所掌握的基于语音特征的韵律预测技术,可以利用语音识别模型对音素进行自动切分并预测韵律边界,修正基于文本的韵律预测结果,从而提高韵律预标的准确率,有效减少了标注过程中约25%的人工标注工作量。发行人已针对该项技术于2018年8月提交了“韵律标注方法、装置和设备”发明专利申请。

(2)结合不同项目特征和语言类型的项目情况,进一步列示单位价格、单位成本中采集和标注服务费的变动情况并对毛利率波动进行分析

报告期内,发行人主营业务的毛利率情况如下:

项目2018年度2017年度2016年度
收入 占比毛利率综合毛利率贡献收入 占比毛利率综合毛利率贡献收入 占比毛利率综合毛利率贡献
数据资源定制服务64.20%45.64%29.30%52.89%47.87%25.32%53.15%40.44%21.49%
数据库产品34.27%100.00%34.27%46.10%100.00%46.10%45.48%100.00%45.48%
数据资源相关的应用服务1.53%78.70%1.20%1.01%82.90%0.84%1.36%79.27%1.08%
综合毛利率64.77%72.26%68.06%

8-1-75

综合毛利率变动的主要因素。数据资源相关的应用服务收入和毛利规模较小,对发行人综合毛利率水平不构成实质性影响。

发行人数据库产品业务类型的毛利率为100%保持不变,收入占比会发生变化;数据资源定制服务的毛利率、收入占比均会发生变化。因此,发行人综合毛利率的变动主要取决于发行人收入结构的变化和数据资源定制服务自身的毛利率水平变动:

1、2017年综合毛利率较2016年增长4.21%,主要是数据资源定制服务和数据库产品的收入占比无明显变化的情况下,定制服务的毛利率增长7.43%所致;

2、2018年综合毛利率较2017年下降7.49%,主要是数据资源定制服务毛利率基本稳定的情况下,其收入占比提高11.31%所致。该收入结构的变化,是由于发行人部分客户随着其人工智能业务的深入发展,数据资源定制化服务需求增长迅速,发行人对数据资源定制复核和数据库产品开发进行更有针对性和更有效的资源分配,以更好的满足客户的各种需求。

以上着重分析了定制服务和数据库产品收入占比结构的变化对综合毛利率的影响;下文重点分析数据资源定制服务的毛利率变动情况。

(二)数据资源定制服务毛利率分析

报告期内,发行人数据资源定制服务收入主要来源于智能语音领域,其收入占比分别为83.97%、77.72% 和 79.95%,因此主要分析智能语音数据资源定制服务毛利率的变动。发行人智能语音数据资源定制服务各业务细分类别的毛利率情况如下:

业务细分类别年度收入(万元)成本(万元)收入占比毛利率
有采集的单一化标注语音2018年度2,809.181,606.8328.41%42.80%
2017年度1,451.45741.4829.66%48.91%
2016年度1,155.84685.6730.78%40.68%
无采集的单一化标注语音2018年度2,960.542,131.4529.94%28.00%
2017年度1,409.18979.4328.79%30.50%
2016年度1,610.331,159.8542.89%27.97%
多样化标注语音2018年度4,119.961,584.0541.66%61.55%

8-1-76

2017年度2,033.35821.2341.55%59.61%
2016年度988.81426.0126.33%56.92%

8-1-77

2、发行人智能语音类定制服务毛利率波动分析

(1)有采集的单一化标注语音项目

该业务类型在报告期收入占比较为稳定,2017年毛利率较高。2017年行业下游各大公司在当年普遍加大投入,开发符合自身定位的智能音箱等产品,产生了较多基于特殊设备的数据需求。具体情况请参见第二轮审核问询函回复问题10(1)。

(2)无采集的单一化标注语音项目、多样化标注语音项目

这两种业务类型在报告期毛利率相对稳定,而收入占比结构发生了变化。随着智能语音领域人工智能技术的快速进步和相关产品在众多应用场景实现落地,2017年和2018年,毛利率较高的多样化标注语音和毛利率较低的单一化标注语音的收入占比较2016年分别出现明显上升和下降,带动了2017年和2018年整体毛利率水平较2016年有较大幅度提升。

(三)数据资源定制服务毛利率分析——进一步区分语言类型

报告期内,发行人中文业务毛利率整体上呈现下降状态,反映中文语音数据资源服务的市场竞争程度有所加强,外语种业务毛利率整体上呈现上升状态,体现资源稀缺程度所带来的溢价和发行人多语种覆盖能力所形成的竞争优势。具体分析如下:

数据服务费是数据资源定制服务的主要成本构成,并对数据资源定制服务的定价起到重要的影响作用。报告期内,发行人智能语音三种业务细分类别的单位价格、单位数据服务费、毛利率情况如下:

业务细分类别语种2018年度2017年度2016年度
单位价格(元)单位数据服务费(元)毛利率单位价格(元)单位数据服务费(元)毛利率单位价格(元)单位数据服务费(元)毛利率
有采集的单一化标注语音中文355.14140.4341.14%448.14168.7150.00%553.11229.4450.43%
外语种722.76334.3044.36%872.46374.8347.75%716.31351.0536.24%
小计481.51207.0742.80%585.57235.4748.91%655.82305.9740.68%
无采集的中文302.46206.1726.55%312.41189.5931.02%291.28172.8028.36%

8-1-78

业务细分类别语种2018年度2017年度2016年度
单一化标注语音外语种955.13496.7241.28%572.92369.6424.15%653.94422.2824.18%
小计324.40215.9428.00%323.70197.3930.50%306.96183.5927.97%
多样化标注语音中文17,110.435,287.7053.66%27,392.848,868.1455.01%20,957.446,688.9857.21%
外语种51,796.8412,919.8665.36%25,327.387,514.2362.98%21,508.925,878.1056.62%
小计31,204.048,388.7661.55%26,161.018,060.6759.61%21,228.266,290.7856.92%

8-1-79

务的毛利率水平。

3、多样化标注语音

中文业务毛利率逐年小幅下降,主要受到中文数据资源日益丰富和市场竞争日趋激烈的影响。外语种业务毛利率逐年持续提升,是由于2016年发行人处于外语种多样化标注语音业务的发展初期,发音人资源有限,成本相对较高而价格相对较低,通过报告期内的经营积累,发行人有效扩展了发音人渠道,掌握了该类业务的主要市场资源,提升了议价能力,价格涨幅超过成本,且外语种业务相较于中文业务更为稀缺,下游需求的持续增长也带动了毛利率的逐步提升。

请保荐机构和申报会计师进行核查并发表明确意见。

针对上述事项,保荐机构、申报会计师执行的核查程序:

1、查阅了发行人多样化标注语音的业务介绍文档,了解了发行人多样化标注语音的项目特点、操作流程以及发行人相关辅助数据处理技术;

2、查阅并复核了发行人按照不同项目特征和语言类型划分的业务类型的单位价格、单位成本中采集和标注服务费、收入和毛利、毛利率等相关数据。

3、访谈发行人高管和财务人员,了解发行人业务开展情况以及相关财务指标的变动情况。

经核查,保荐机构、申报会计师认为:

发行人多样化标注语音由于其标注内容复杂,环节较多,因此标注产出比远高于其他项目,具备合理性;2018年多样化标注语音单位产出的标注量下降的原因是随着发行人音素边界自动预测、基于语音特征的韵律预测等高效数据处理技术的成熟和普遍应用,提高了发行人数据处理工作效率,有效减少了多样化标注语音标注过程中的人工工作量,使得单位产出的标注量有所下降;发行人智能语音类数据资源定制服务的单位价格、单位数据服务费以及毛利率变动情况合理,不存在异常情况。

8-1-80

(本页无正文,为北京海天瑞声科技股份有限公司对《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件第三轮审核问询函的回复》之签章页)

北京海天瑞声科技股份有限公司

年 月 日

8-1-81

(本页无正文,为华泰联合证券有限责任公司对《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件第三轮审核问询函的回复》之签章页)

保荐代表人: ______________ ______________葛 青 姚玉蓉

华泰联合证券有限责任公司

年 月 日

8-1-82

保荐机构总经理关于审核问询函回复报告的声明

本人已认真阅读北京海天瑞声科技股份有限公司本次审核问询函回复报告的全部内容,了解报告涉及问题的核查过程、本公司的内核和风险控制流程,确认本公司按照勤勉尽责原则履行核查程序,审核问询函回复报告不存在虚假记载、误导性陈述或者重大遗漏,并对上述文件的真实性、准确性、完整性、及时性承担相应法律责任。

保荐机构总经理:
江 禹

  附件:公告原文
返回页顶