8-2-1
《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件的第三轮审核问询函》之专项核查意见
瑞华专函字【2019】02280015号
上海证券交易所:
根据贵所于2019 年6月6日出具的《关于北京海天瑞声科技股份有限公司首次发行股票并在科创板上市申请文件的第三轮审核问询函》上证科审(审核)【2019】231号(以下简称“《第三轮审核问询函》”)相关问题的要求,瑞华会计师事务所(特殊普通合伙)(以下简称“本所”或“申报会计师”)对《第三轮审核问询函》就我所涉及到的有关问题,履行了审慎核查义务。现对《第三轮审核问询函》回复如下:
问题3、关于发行人股份支付
回复材料显示:(1)张蕊因职务调整为审计部经理,2016年度张蕊向创世联合转让13.3333万元实缴出资额,占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%,对应的海天瑞声有限出资金额为9.6万股,转让后张蕊持有中瑞安全部出资额的5.00%;(2)唐涤飞原持有中瑞立21.05%的实缴出资额,2016年3月唐涤飞向创慧科瑞转让上述实缴出资额,转让时创慧科瑞的股东分别为唐涤飞和贺琳,2016年12月贺琳将其持有创慧科瑞的股权转让给志鹏。
请发行人进一步说明:(1)张蕊向创世联合转让实缴出资额的原因及合理性,未在2015年度按照13.89%的出资比例计算股份支付费用的原因及依据,是否
通讯地址:北京市东城区永定门西滨河路8号院7号楼中海地产广场西塔9层 Postal Address:9/F,West Tower of China Overseas Property Plaza, Building 7,NO.8,Yongdingmen Xibinhe Road, Dongcheng District, Beijing 邮政编码(Post Code):100077 电话(Tel):+86(10)88095588 传真(Fax):+86(10)88091199 |
8-2-2
符合企业会计准则的相关规定;(2)唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权一系列交易安排的原因及合理性;(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况。
请保荐机构和申报会计师核查并发表明确意见。答复:
(1)张蕊向创世联合转让实缴出资额的原因及合理性,未在 2015 年度按照 13.89%的出资比例计算股份支付费用的原因及依据,是否符合企业会计准则的相关规定;
一、张蕊向创世联合转让实缴出资额的原因及合理性
发行人在2015年8月开始筹划股权激励事宜时,综合考虑了激励对象的入职年限、岗位分工、贡献程度等因素来确定核心员工激励份额。张蕊加入海天瑞声时间较早,历任海天瑞声财务经理、综合部总监等职务。截至2015年末,公司财务负责人岗位处于空缺状态。因此,在设计持股平台的股东结构及持股比例时,综合考虑张蕊的入职年限、岗位分工、贡献程度,以及未来拟担任财务负责人职务的情形,决定授予张蕊认缴中瑞安138.8889万元,占平台内出资比例为13.89%,对应海天瑞声有限的出资比例为2.50%。张蕊实缴出资20.8333万元。
2016年8月,随着新投资人的进入以及公司业务快速发展,发行人的上市准备工作也开始提上日程,各项工作对财务负责人的能力提出了更高的要求。考虑到张蕊在拟上市公司的会计核算体系建设、内部控制体系搭建等方面缺乏一定的经验,发行人董事会决定重新选聘请财务负责人,并对张蕊的职务进行调整,同时同步调整了向张蕊授予的股权。实施方案上,由张蕊先行转让给普通合伙人创世联合,后续授予明确的激励对象时再由创始联合转出。
经张蕊本人同意,其于2016年8月向创世联合转让88.8889万元的出资(其中实缴13.3333万元),占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%。
综上,张蕊向创世联合转让实缴出资额是在发行人公司业务发展及完善公司
8-2-3
内部治理的背景下,基于张蕊岗位调整等因素综合考虑而进行的。经公司、张蕊协商一致,对张蕊授予股权激励份额调整为向创世联合认缴50万元出资额(其中实缴7.5万元),占中瑞安全部出资额的5%,对应海天瑞声有限的出资比例为0.9%。综合考虑所有激励对象的入职年限、岗位分工、贡献程度等因素,对张蕊授予股权激励份额进行调整以及调整后的授予份额具备合理性。
二、2015年未按13.89%的出资比例计算张蕊股份支付费用的原因及依据发行人在2016年进行以前年度财务核算进行规范时,对2015年的股份支付事项进行了追溯确认。
鉴于在股份支付事项追溯确认时,相关管理人员的职责已经明确到位,持股平台的股权结构已经调整到位,因此,发行人按照调整到位的出资金额确认2015年股份支付费用,对张蕊按照持有中瑞安5%的出资份额(对应海天瑞声有限的出资比例为0.90%)确认股份支付费用。
综上,发行人于2016年及时对激励方案进行了调整并整体追溯确认、调整了2015年末的股权激励,因此,从调整后的报表来看,2015年未按持有中瑞安13.89%的出资比例计算张蕊股份支付费用。对张蕊确认的股份支付金额与其向发行人提供的服务相匹配,符合企业会计准则的相关规定。
三、假设2015年按13.89%的出资比例模拟测算张蕊股份支付费用的影响
2015年12月,发行人授予张蕊认缴中瑞安138.8889万元,占持股平台中瑞安的出资比例为13.89%,对应海天瑞声有限的出资比例为2.50%,对应发行人的出资金额15万元。经张蕊同意,其于2016年8月向创世联合转让88.8889万元的出资(其中实缴13.3333万元),占中瑞安全部出资额的8.89%,对应海天瑞声有限的出资比例为1.60%,对应发行人的出资金额9.6万元。
2015年按13.89%的出资比例模拟测算张蕊股份支付费用的影响如下:
1、模拟测算股份支付费用计算表:
计算公式 | 项目 | 金额(元) |
① | 转让注册资本 | 96,000.00 |
② | 每1元注册资本对应的公允价值 | 22.18 |
8-2-4
计算公式 | 项目 | 金额(元) |
③ | 受让成本/每1元注册资本 | 1.00 |
④=①×(②-③) | 测算确认股份支付费用 | 2,033,280.00 |
影响科目 | 2015-12-31/ 2015年 | 影响金额 (万元) | 2015-12-31/2015年 (模拟确认后) |
资本公积 | 2,427.23 | 203.33 | 2,630.56 |
盈余公积 | 72.44 | 72.44 | |
未分配利润 | -789.00 | -203.33 | -992.33 |
管理费用 | 3,278.81 | 203.33 | 3,482.13 |
净利润 | -1,225.14 | -203.33 | -1,428.47 |
扣除股份支付后净利润 | 1,202.09 | 1,202.09 |
8-2-5
待创慧科瑞设立后,唐涤飞再将相应的出资额转让给创慧科瑞。中瑞立设立时,唐涤飞以货币认缴出资210.5263万元并实际缴纳21.0526万元,占中瑞立出资总额的21.05%,占穿透后海天瑞声股权比例为2%。2015年12月23日,创慧科瑞设立时,贺琳、唐涤飞分别持有其50%、50%的股权。2016年3月,唐涤飞向创慧科瑞转让上述210.5263万元的出资(其中实缴21.0526万元出资)。
二、贺琳向志鹏转让创慧科瑞股权的背景
贺琳与志鹏于2015年12月15日正式签署《顾问服务协议》,约定贺琳聘请志鹏作为顾问协助其向投资人转让海天瑞声有限股权,贺琳向志鹏转让海天瑞声有限1%股权作为服务费用。
经贺琳与志鹏协商一致,2016年12月贺琳、志鹏签署《转让协议》,贺琳将所持创慧科瑞50%股权(占穿透后海天瑞声的股权比例为1%)转让给志鹏。
三、小结
综上,唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权等一系列交易安排符合实际情况,具有合理性。上述股权转让价款均已结清,不存在争议或纠纷。
(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况
一、中瑞立历次出资或股权转让的价格、定价依据、资金来源和支付情况、完税情况
中瑞立于2015年12月作为员工持股平台而设立,除设立时各合伙人合计实缴100万元出资外,不存在其他出资情形。自设立以来,中瑞立存在两次股权转让情形。中瑞立出资或股权转让的价格、定价依据、资金来源和支付情况、完税具体情况如下:
事项 | 出资或股权转让情况 | 出资/股权转让价格(万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税情况 |
2015年12月,设立 | 合伙人 | 认缴/实缴出资(万元) | |||||
贺琳(LP) | 421.0526/42.1053 | 42.1053 | 出资 | 自有资金 | 已实缴 | 不涉 |
8-2-6
唐涤飞(GP) | 210.5263/21.0526 | 21.0526 | 原值 | 部分出资 | 及 | |||
黄大伟(LP) | 115.7895/11.5789 | 11.5789 | ||||||
宋琼(LP) | 94.7368/9.4737 | 9.4737 | ||||||
廖晓玲(LP) | 94.7368/9.4737 | 9.4737 | ||||||
辛晓峰(LP) | 31.5790/3.1579 | 3.1579 | ||||||
葛兴彤(LP) | 31.5790/3.1579 | 3.1579 | ||||||
小计 | 1,000/100 | 100.00 | — | — | — | — | ||
2016年3月,第一次股权转让 | 转让方 | 受让方 | 转让的认缴/实缴出资额(万元) | 出资/股权转让价格(万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税情况 |
唐涤飞 | 创慧科瑞 | 210.5263/21.0526 | 21.0526 | 出资原值 | 股东贺琳、唐涤飞以自有资金向创慧科瑞提供借款 | 已支付完毕 | 不涉及 | |
贺琳 | 陈琪 | 94.7368/9.4737 | 9.4737 | 出资原值 | 自有资金 | 已支付完毕 | 不涉及 | |
2017年6月,第二次股权转让注 | 贺琳 | 创慧科瑞 | 83.5914/8.3591 | — | — | — | — | 不涉及 |
黄大伟 | 45.9752/4.5975 | |||||||
宋琼 | 37.6161/3.7616 | |||||||
廖晓玲 | 37.6161/3.7616 | |||||||
陈琪 | 37.6161/3.7616 | |||||||
辛晓峰 | 12.5387/1.2539 | |||||||
葛星彤 | 12.5387/1.2539 |
事项 | 出资或股权转让情况 | 出资/股权转让价格(万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税情况 | |
2015年 | 合伙人 | 认缴/实缴出资 |
8-2-7
12月,设立 | (万元) | |||||||
程显峰(LP) | 361.1111/54.1667 | 54.1667 | 出资原值 | 自有资金 | 已实缴部分出资 | 不涉及 | ||
李科(LP) | 277.7778/41.6667 | 41.6667 | ||||||
郝玉峰(LP) | 194.4444/29.1667 | 29.1667 | ||||||
张蕊(LP) | 138.8889/20.8333 | 20.8333 | ||||||
贺琳(GP) | 27.7778/4.1667 | 4.1667 | ||||||
小计 | 1,000/150 | 150.00 | — | — | — | — | ||
2016年3月,第一次股权转让 | 转让方 | 受让方 | 转让的认缴/实缴出资额(万元) | 出资/股权转让价格 | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税情况 |
贺琳 | 创世联合 | 27.7778/4.1667 | 4.1667 | 出资原值 | 创世联合自有资金及股东贺琳以自有资金提供的借款 | 已支付完毕 | 不涉及 | |
2016年8月,第二次股权转让 | 程显峰 | 吕思遥 | 72.2222/10.8333 | 10.8333 | 出资原值 | 自有资金 | 已支付完毕 | 不涉及 |
创世 联合 | 吕思遥 | 11.1111/1.6667 | 1.6667 | 出资原值 | 自有资金 | 已支付完毕 | 不涉及 | |
创世 联合 | 李科 | 27.7778/4.1667 | 4.1667 | 出资原值 | 自有资金 | 已支付完毕 | 不涉及 | |
张蕊 | 创世联合 | 88.8889/13.3333 | 13.3333 | 出资原值 | 创世联合自有资金及股东贺琳以自有资金提供的借款 | 已支付完毕 | 不涉及 | |
2019年1月,第三次股权转让 | 程显峰 | 创世联合 | 288.8889/43.3334 | 43.3334 | 出资原值 | 股东贺琳以自有资金向创世联合提供借款 | 已支付完毕 | 不涉及 |
事项 | 出资或股权转让情况 | 出资价格 (万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税 情况 | |
股东 | 出资金额 (万元) | ||||||
2015年12月,设立 | 贺琳 | 1 | 1 | 出资原值 | 自有资金 | 已实缴全部 出资 | 不涉及 |
2018年1月,增资 | 贺琳 | 29 | 29 | 出资原值 | 自有资金 | 已实缴全部出资 | 不涉及 |
8-2-8
事项 | 出资或股权转让情况 | 出资价格 (万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税 情况 | |
股东 | 出资金额 (万元) | ||||||
小计 | 30 | 30 | — | — | — | — |
事项 | 出资或股权转让情况 | 出资价格(万元) | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税 情况 | ||
股东 | 出资金额 (万元) | |||||||
2015年12月,设立 | 贺琳 | 0.5 | 0.5 | 出资原值 | 自有资金 | 已实缴全部出资 | 不涉及 | |
唐涤飞 | 0.5 | 0.5 | ||||||
2018年6月,增资 | 唐涤飞 | 19.5 | 19.5 | 出资原值 | 自有资金 | 已实缴全部出资 | 不涉及 | |
志鹏 | 19.5 | 19.5 | ||||||
小计 | 40 | 40 | — | — | — | — | ||
2017年1月,股权转让 | 转让方 | 受让方 | 转让的出资金额(万元) | 出资/股权转让价格 | 定价依据 | 资金来源 | 出资/股权转让价款支付情况 | 完税 情况 |
贺琳 | 志鹏 | 0.5 | 0.5 | 出资原值 | 自有资金 | 已支付完毕 | 不涉及 |
8-2-9
3、中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让不涉及缴纳个人所得税。
请保荐机构和申报会计师核查并发表明确意见。
针对上述事项,申报会计师执行的核查程序如下:
1、对贺琳、张蕊进行访谈,了解股权激励份额调整的原因;审阅中瑞安关于该次出资变更的工商登记档案,获取张蕊向创世联合转让出资份额的协议及价款支付凭证;获取张蕊的个人履历、及其出具的关于持有发行人股份真实性的确认文件。
2、审阅中瑞立、创慧科瑞的工商登记档案资料;获取唐涤飞向创慧科瑞转让中瑞立出资额相应价款支付凭证;获取贺琳与志鹏签署的《顾问服务协议》以及贺琳向志鹏转让创慧科瑞股权转让价款支付凭证;核查确认中瑞立受让海天瑞声股权及股份支付确认情况;分别对贺琳、唐涤飞、志鹏进行访谈,确认上述交易安排的背景;获取贺琳、唐涤飞、志鹏关于持有发行人股份真实性的确认文件。
3、审阅中瑞立、中瑞安、创世联合和创慧科瑞的工商登记档案资料;获取前述机构的实际缴纳出资凭证,审阅其财务报表。获取中瑞立、中瑞安、创慧科瑞的出资/股权转让相关的价款 支付凭证,核实个人所得税缴纳事项,并与相关方就转让原因、价款支付情况等进行访谈。对贺琳、唐涤飞进行访谈,获取股东借款相关往来凭证,核查创世联合、创慧科瑞设立及受让出资的资金来源。获取中瑞安、中瑞立合伙人及创世联合、创慧科瑞股东出具的关于持有出资/股权真实性的确认文件。
经核查,申报会计师认为:
1、张蕊向创世联合转让实缴出资额是在发行人公司业务发展及完善公司内部治理的背景下,基于张蕊岗位调整等因素综合考虑进行的;前述激励份额调整考虑了激励对象的入职年限、岗位分工、贡献程度等因素,具备合理性。未在 2015年度按照13.89%的出资比例计算股份支付费用具备合理性,符合企业会计准则的相关规定。假设2015年度按照13.89%的出资比例计算张蕊的股份支付费用,仅影响报告期期初的所有者权益结构,对报告期内利润表项目不构成影响。
8-2-10
2、唐涤飞转让中瑞立实缴出资额、贺琳转让创慧科瑞股权等一系列交易安排符合实际情况,具有合理性。
3、(1)除中瑞立2017年6月第二次股权转让以外,中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让均按照出资原值确定价格;中瑞立2017年6月第二次股权转让系因中瑞立将所持海天瑞声有限的股权转让价款全部分配给贺琳,为使除贺琳外的其他合伙人通过中瑞立间接持有海天瑞声有限的股权保持不变,贺琳将所持部分中瑞立出资转让给其他合伙人,不需支付对价。(2)中瑞立、中瑞安、创世联合和创慧科瑞历次实缴出资已缴纳完毕,资金来源于合伙人/股东的自有资金;历次股权转让价款已支付完毕,资金来源于受让方自有资金或受让方股东以自有资金提供的借款;(3)中瑞立、中瑞安、创世联合和创慧科瑞历次出资或股权转让不涉及缴纳个人所得税。
问题4、关于发行人采购成本
回复材料显示:(1)发行人被采集人关系网络或发行人员工的人际关系网络寻找合适的境外数据被采集人,采集完成后通过Speech Ocean Ltd.向境外数据被采集人支付数据服务费用;(2)对于境内数据服务提供商,根据组织和管理被采集人员、标记人员的数量规模和管理难度,发行人与供应商分别约定采用10-11.5%的服务费率,采购定价具有公允性和合理性,处于境内同类公司的市场报价区间;(3)北京零点、北京天创共盈科技发展有限公司、北京中惠商客科技有限公司由北京博睿、恩泽尔实际控制人王驰受托统一进行经营管理,信阳市晨曦电子科技有限公司由信阳联智实际控制人洪琪受托统一进行经营管理;(4)发行人通过一体化人工智能数据处理技术支持平台对标注服务实施管理。
请发行人:(1)说明报告期内发行人寻找境外数据采集人的方式及供应商的具体名称、采购金额和被采集人的具体情况,该等的供应商的服务费率与SpeechOcean的毛利率的比较情况及差异原因;(2)发行人报告期各期前五大劳务服务企业的服务费率及变动情况,结合采购额变化、人员数量规模和各采集项目的具体情况,进一步说明发行人如何确定相关的服务费率,发行人如何量化劳务服务企业的管理难度并反映在服务费率中;(3)进一步说明报告期内是否出现
8-2-11
返工的情况,发行人与劳务服务企业的服务费用调整机制,因返工而导致的服务费用调整金额、原因和依据;(4)发行人向同一人控制或管理的多家劳务服务企业进行采购的原因及合理性,发行人未直接向王驰和洪琪直接持股的企业进行采购劳务服务的原因及合理性。
请保荐机构和申报会计师提供发行人主要的业务信息系统的情况,对发行人一体化人工智能数据处理技术支持平台等核心业务系统进行信息系统专项核查并出具专项核查报告,对系统控制、运营日志和运营数据的真实性、准确性和完整性进行核查、对财务数据和业务数据的衔接和是否存在运营数据缺失或被违规修改的情形进行核查,并对与信息系统相关的内部控制有效性发表明确意见。
请保荐机构和申报会计师对上述事项进行核查并发表明确意见。
答复:
(1)说明报告期内发行人寻找境外数据采集人的方式及供应商的具体名称、采购金额和被采集人的具体情况,该等的供应商的服务费率与SpeechOcean的毛利率的比较情况及差异原因
报告期内,初期发行人通过被采集人关系网络或发行人员工的人际关系网络寻找境外数据被采集人。随着业务规模增长,发行人2016年即已开始逐步转变为由具备资源优势的人力资源服务企业或劳务服务企业等供应商负责被采集人的匹配和组织,其通过境外华人群体资源为发行人提供境外生数据采集服务。该等境内外供应商数量较多,共计62个,其中主要涉及的供应商为除信阳联智、睿祥文乂以外的发行人报告期各期前五大数据服务供应商,即广州善世、芜湖善慧、北京博睿、北京零点、北京冠华等境内供应商和恩泽尔、TWIN STUDIOS、THINKWILD STUDIOS, S.L.、SAKURA JAPAN LLC、CHUSHOUKIGYOU,CONSULTING, CENTER., LTD.等境外供应商。报告期内,为发行人寻找境外数据被采集人的供应商涉及的采购金额和采集人数情况如下:
年度 | 采购金额(万元) | 采集人数(人) |
2018年度 | 1,364.55 | 13,506 |
2017年度 | 726.97 | 9,583 |
2016年度 | 652.33 | 12,550 |
8-2-12
报告期内,发行人境外数据被采集人的采购金额逐年上升,是由于发行人外语种业务快速发展,同时下游客户对本土采集的要求也逐步提高,因此发行人境外采集的规模也逐年提升;境外数据被采集人的单价也呈现上升趋势,主要是多样化标注语音等单个被采集人价格较高的外语种业务增长所致。
考虑到境外数据被采集人的稀缺度、寻找难度以及不同国家地区的商业环境等实际情况,上述主要供应商为发行人寻找境外数据被采集人的服务费率在6-11.5%之间。SpeechOcean的毛利率为9.09%,处于前述范围内,不存在明显差异。
(2)发行人报告期各期前五大劳务服务企业的服务费率及变动情况,结合采购额变化、人员数量规模和各采集项目的具体情况,进一步说明发行人如何确定相关的服务费率,发行人如何量化劳务服务企业的管理难度并反映在服务费率中
报告期各期,发行人前五大劳务服务企业的采购金额和服务费率情况如下:
2018年度 | |||||
序号 | 供应商名称 | 采购金额(万元) | 服务费率 | ||
1 | 广州善世人力资源服务有限公司 | 1,755.67 | 11.5% | ||
芜湖善慧人力资源服务有限公司 | 1,541.91 | 11.5% | |||
2 | 北京博睿驰信人力资源有限公司 | 1,681.57 | 11.5% | ||
恩泽尔商贸有限公司 | 249.09 | 6% | |||
3 | 北京冠华英才国际经济技术有限公司 | 905.61 | 10%、11.5% | ||
4 | TWIN STUDIOS | 229.97 | 10% | ||
5 | THINKWILD STUDIOS, S.L. | 129.85 | 9% | ||
2017年度 | |||||
序号 | 供应商名称 | 采购金额(万元) | 服务费率 | ||
1 | 芜湖善慧人力资源服务有限公司 | 1,064.36 | 11.5% | ||
广州善世人力资源服务有限公司 | 658.34 | 11.5% | |||
2 | 北京博睿驰信人力资源有限公司 | 529.80 | 11.5% | ||
恩泽尔商贸有限公司 | 244.78 | 6% | |||
北京零点起航营销策划有限公司 | 55.33 | 10% | |||
3 | 北京冠华英才国际经济技术有限公司 | 539.82 | 部分采购由10%提高至11.5% |
8-2-13
4 | SAKURA JAPAN LLC | 189.68 | 10% |
5 | 信阳市联智网络科技有限公司 | 89.08 | 10% |
2016年度 | |||
序号 | 供应商名称 | 采购金额(万元) | 服务费率 |
1 | 广州善世人力资源服务有限公司 | 948.82 | 10%提高至11.5% |
2 | 北京零点起航营销策划有限公司 | 401.13 | 10% |
北京博睿驰信人力资源有限公司 | 267.87 | 10%提高至11.5% | |
恩泽尔商贸有限公司 | 34.20 | 6% | |
3 | 北京冠华英才国际经济技术有限公司 | 644.25 | 10% |
4 | 北京睿祥文乂技术服务有限公司 | 224.63 | 10% |
5 | CHUSHOUKIGYOU,CONSULTING, CENTER.,LTD. | 109.33 | 9% |
8-2-14
(3)进一步说明报告期内是否出现返工的情况,发行人与劳务服务企业的服务费用调整机制,因返工而导致的服务费用调整金额、原因和依据
发行人在标注过程中对标记人员进行技术指导,并对数据质量进行定期和不定期检查,检查不合格的数据,发行人要求数据服务提供商及时修改数据,以保证项目进度。该等数据修改均处于标记人员提供劳务的过程中,是发行人对供应商进行采购管理的一项内部控制措施,此时发行人尚未对其提供的劳务服务进行验收并与劳务服务企业进行结算,因此不涉及服务费用调整。
报告期内,发行人对所采购的劳务服务进行验收后,即代表数据质量已经合格,因此不存在验收并结算后需要返工的情形。
(4)发行人向同一人控制或管理的多家劳务服务企业进行采购的原因及合理性,发行人未直接向王驰和洪琪直接持股的企业进行采购劳务服务的原因及合理性
发行人主要供应商中,存在多家劳务服务企业受同一人控制或管理的情况,主要是由于供应商实际控制人出于针对不同地域特征划分区域管理等因素而形成的,属于其个人商业考虑。例如,广州善世和芜湖善慧受同一人控制,分别负责华南地区和华东地区业务;北京博睿和恩泽尔受同一人控制,分别负责境内和境外业务,发行人向其进行采购时需要根据所属业务的地域特点与供应商不同主体签约,具备合理性。
同时,发行人除直接向王驰直接持股的北京博睿、恩泽尔和洪琪直接持股的信阳联智采购劳务服务外,还存在向王驰受托经营的北京零点采购劳务服务的情形。保荐机构对北京零点唯一股东进行了访谈,经核查,北京零点股东因家庭原因难以确保足够的精力和时间继续经营北京零点,由于公司尚有员工和部分业务,为妥善安排,北京零点股东与长期相识的北京博睿股东王驰达成委托经营协议,由王驰统一对北京零点进行经营管理,后因王驰经营成果较好,该等委托经营关系一直持续至今。
发行人已合并计算和披露了向同一人控制或管理的劳务服务企业进行采购的金额等情况。由于该等劳务服务供应商提供的服务主要为根据客户需求进行劳
8-2-15
务人员的匹配、组织和管理,其签约主体本身的安排对于发行人采购不构成实质影响。
请保荐机构和申报会计师提供发行人主要的业务信息系统的情况,对发行人一体化人工智能数据处理技术支持平台等核心业务系统进行信息系统专项核查并出具专项核查报告,对系统控制、运营日志和运营数据的真实性、准确性和完整性进行核查、对财务数据和业务数据的衔接和是否存在运营数据缺失或被违规修改的情形进行核查,并对与信息系统相关的内部控制有效性发表明确意见。
申报会计师针对公司报告期信息安全治理环境、信息系统管理和信息系统运行情况的测试,结合对公司业务模块运营模式的理解,从主营业务收入、主要成本等对其业务运营、财务报告有较大影响的业务和管理流程出发,通过穿行相关业务及管理流程,选取其业务主体及管理流程,筛选出支撑这些业务流程运营的主要信息系统,信息系统具体情况如下:
序号 | 系统名称 | 系统介绍 |
1 | 一体化数据处理技术支撑平台 | 或称为 “一体化人工智能数据处理技术支撑平台”,简称为“一体化智能平台系统”,是由公司自主研发的技术支持平台,整合并贯通了数据库设计、数据采集、数据处理、质量检测、质量控制和数据安全管理等各个环节,嵌入了项目管理、质量控制、数据安全的流程管理和工具,主要支持业务人员进行人工智能数据资源开发相关工作的软件系统。 |
2 | 业务管理平台 | 简称管理平台,是由公司自主研发的,以支撑公司项目管理工作、串联公司主要业务及财务流程,解决公司业务内部管理分析、对外信息披露、业务财务映射符合财务原则和标准、业务数据细分及内部控制管理各环节数据统计口径不一致、不及时、不准确等痛点问题为目标,加强合同及项目管理,提高日常工作效率,进行更准确的项目核算而开发的管理系统。该平台于2017年1月1日上线使用,实现了公司合同及项目管理等基本功能。 |
3 | 用友财务系统 | 用友财务系统,是公司外购、主要由财务部使用的财务管理软件,其以总账系统为核心,包括往来、现金、项目、税务、工资管理、固定资产等模块,负责支撑公司会计核算、财务管理和财务决策等职能。 |
8-2-16
申报会计师采取必要的评估程序和方法对报告期内支撑公司主要业务运营和财务入账流程的信息系统及相关业务数据及财务数据进行了专项核查,涉及公司信息科技治理、主要信息系统一般性控制管理,并对存在于公司主要信息系统中的相关业务运营数据及财务数据进行了验证和分析,以评估和验证公司相关信息系统在运行管理和应用控制方面的有效性。保荐机构和申报会计师分别出具了关于发行人主要信息系统的专项核查报告。
经核查,申报会计师认为:公司目前对主要信息系统的控制总体有效,未发现重大或重要的控制缺陷。同时综合整体的风险排查和信息系统应用控制测试、业务运营数据及财务数据验证和分析结果,公司报告期内的主营业务和财务报告流程中涉及的信息系统处理及应用控制总体有效,未见明显异常。
除上述信息系统专项核查外,申报会计师针对数据服务费相关采购支出的真实性、准确性和完整性,主要执行了以下核查程序:
1、获取了发行人的采购业务相关管理制度,了解了发行人数据服务采购的管理流程,并选取样本,就其重要内部控制环节(立项和预算管理、采购申请及审批、合同签订、质检验收、过程控制、供应商对账、结算付款等)执行控制测试,核查采购内控管理的有效性;
2、针对发行人报告期内数据服务费执行采购核查程序,从账面记录的数据服务费采购出发,获取采购框架合同、采购订单资料、经双方盖章确认的验收结算单、收到的发票、支付采购结算款项的银行回单,检查供应商名称、验收服务的内容、验收时间、结算数量、结算单价、结算金额、支付金额等信息与发行人记录是否一致,核查采购交易的真实性、准确性;
3、抽取发行人部分业务项目,从发行人后台系统导出采集、标注环节的人员服务记录,与验收结算单所记载的采购服务数量核对,核查采购交易的真实性、准确性、完整性;实地参与了采集项目的采集过程、对标记人员进行了访谈;
4、分析了发行人报告期内向数据服务采购数量、采购单价的变动原因及其合理性,以及采购数量和产出情况的配比关系及其合理性,核查发行人数据服务费采购是否存在异常波动,并调查分析造成波动的原因,对其合理性进行分析复
8-2-17
核;
5、获取了发行人董事、监事、高级管理人员及相关财务人员的银行账户资金流水,核查是否存在与主要数据服务供应商及其关键人员存在资金往来并为发行人代垫成本费用的行为,核查发行人成本费用的完整性;
6、对发行人报告期内主要数据服务供应商进行函证,核查采购金额和往来余额的真实性和准确性,报告期内各年发函金额占当年采购金额的比例分别达到79.25%、78.41%和84.77%,所发函证均取得回函,回函金额不存在差异;
7、对发行人报告期内主要数据服务供应商进行了实地走访,所走访的数据服务供应商的对应各年数据服务采购金额占各年数据服务采购总金额的比例超过90%,访谈过程中,主要就双方合作时间、合作方式、提供服务类型、各年交易规模、发行人采购占其同类销售占比、验收结算方式、与外部劳务人员签订协议情况等情况进行详细了解,核查采购交易的真实性、合理性,以及采购模式的可持续性;
8、获取了发行人报告期内主要数据服务供应商的工商资料和报告期内税务合规证明,并穿透获得其股东和其他关键人员、关联公司名单,检查与发行人、发行人关联方及其董事、监事、高级管理人员等关键人员是否存在关联关系;
9、获取了发行人报告期内主要数据服务供应商出具的说明和提供的财务数据,核查其与发行人之间采购定价是否公允,采购交易是否符合商业实质并为供应商带来商业收益,确认双方之间及双方股东、董事、监事、高级管理人员、关键经办人员之间是否存在关联关系,是否存在提供劳务服务以外的其他交易和资金往来并为发行人代垫成本费用的行为,核查发行人成本费用的完整性;
10、查询了互联网上发布的采集、标注服务价格信息,与发行人向终端被采集人和标记人员的采购单价进行比较,核查发行人采购单价是否公允;复核了发行人对数据服务供应商类似的市场同类人力资源服务公司和劳务公司管理服务费的市场询价结果,核查发行人主要数据服务供应商服务费率的定价公允性;
11、获取了实际控制人曾经控制的关联方SpeechOcean Ltd.的审计报告、账务记录、银行流水等财务资料,对报告期内发行人与其之间的关联销售和采购交
8-2-18
易进行了穿透核查,核查了相关合同和银行流水,对重要的最终销售客户进行了实地走访或视频访谈;核查了2015年度关联销售和采购的具体内容;测算了报告期内SpeechOcean Ltd.的现金流转情况,并对相关数字的勾稽关系进行了复核;获取并查阅了境外律师出具的关于SpeechOcean Ltd.注销事宜的法律意见书;
12、获取了发行人实际控制人及其配偶、发行人总经理控制、担任董事或高级管理人员、具有重大影响的企业(包括注销或转让的)及其董事、监事、高级管理人员出具的说明,确认该等企业及其董事、监事、高级管理人员与发行人供应商之间是否在交易、资金往来或其他利益安排,是否存在为发行人代垫成本费用的行为,核查发行人成本费用的完整性;
经核查,申报会计师认为:
发行人针对数据服务采购业务建立了较为完善的内部控制并得到了有效执行;发行人及其关联方与数据服务供应商之间不存在关联关系;报告期内,发行人与数据服务供应商采购业务真实、采购数据准确、完整,采购定价公允;发行人对数据服务费采购的核算真实、准确、完整,不存在其他相关方为发行人代垫成本费用的情形,不存在体外支付成本费用的情形。
请保荐机构和申报会计师对上述事项进行核查并发表明确意见。
经核查,申报会计师认为:报告期内为发行人寻找境外数据被采集人的供应商的服务费率与SpeechOcean的毛利率不存在明显差异;发行人根据劳务服务供应商的税务成本和管理难度差异,与供应商协商确定服务费率,相关服务费率变动合理;发行人报告期内对所采购的劳务服务进行验收后,即代表数据质量已经合格,不存在验收并结算后需要返工的情形;发行人向同一人控制或管理的多家劳务服务企业进行采购的原因合理,发行人除直接向王驰直接持股的北京博睿、恩泽尔和洪琪直接持股的信阳联智采购劳务服务外,还存在向王驰受托经营的北京零点采购劳务服务的情形,原因合理。
8-2-19
问题5、关于发行人的营业收入申报材料显示:(1)发行人已按语种披露了智能语音类数据资源定制服务和数据库产品的销量和销售价格;(2)发行人存量数据库的销售收入逐年上升;(3)发行人应收账款和收入函证的回函差异较大。
请发行人:(1)进一步区分不同项目特征(采集、单一或多样化标注等)和语言类型(中文、外语、小语种和方言等)补充披露智能语音类定制服务和数据库的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因;(2)计算机视觉类定制服务收入增长较快,进一步区分不同项目特征(手写体、光学字符识别和行车相关视频等)补充披露计算机视觉类定制服务的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因;(3)说明报告期各期各类型数据库的库存量、新增量和结存量,并结合各类型数据库的生命周期进一步分析各期销售和未销售的对应数据库数量变动情
况、销售数据库的开发成本和销售价格。
请保荐机构和申报会计师对上述事项进行核查并发表明确意见,进一步说明回函不符的事项履行的核查程序,列表说明具体调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。
答复:
(1)进一步区分不同项目特征(采集、单一或多样化标注等)和语言类型(中文、外语、小语种和方言等)补充披露智能语音类定制服务和数据库的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因
发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/3、主要产品和服务的销量和价格分析/(1)智能语音领域”中对以下内容进行了补充披露:
①智能语音类数据资源定制服务
报告期内,公司智能语音类数据资源定制服务的销量和价格情况如下:
8-2-20
业务细分类别 | 语种 | 2018年度 | 2017年度 | 2016年度 | |||
销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | ||
有采集的单一化标注语音 | 中文 | 38,286.00 | 355.14 | 16,759.01 | 448.14 | 6,533.00 | 553.11 |
外语种 | 20,055.00 | 722.76 | 8,028.03 | 872.46 | 11,091.40 | 716.31 | |
小计 | 58,341.00 | 481.51 | 24,787.04 | 585.57 | 17,624.40 | 655.82 | |
无采集的单一化标注语音 | 中文 | 88,196.01 | 302.46 | 41,646.21 | 312.41 | 50,191.57 | 291.28 |
外语种 | 3,067.41 | 955.13 | 1,886.61 | 572.92 | 2,268.81 | 653.94 | |
小计 | 91,263.42 | 324.40 | 43,532.82 | 323.70 | 52,460.38 | 306.96 | |
多样化标注语音 | 中文 | 783.86 | 17,110.43 | 313.70 | 27,392.84 | 237.06 | 20,957.44 |
外语种 | 536.47 | 51,796.84 | 463.54 | 25,327.38 | 228.74 | 21,508.92 | |
小计 | 1,320.33 | 31,204.04 | 777.24 | 26,161.01 | 465.80 | 21,228.26 |
8-2-21
报价较高,拉升了2017年的平均单价。英语类项目的价格在报告期内较为平稳,该类别涵盖全球多个国家和地区的英语,如新加坡、英国、加拿大等英语母语国家,以及西班牙、意大利等非英语母语国家,资源相对分散,发达国家物价水平较高,导致成本较高,因而销售价格较高。其他语种覆盖的语种超过20个,由于每种语言特点均不相同,客户对特定语种的需求紧迫程度、发音人资源稀缺程度在不同年份也有所不同,因此会造成一定的价格波动。
语种 | 价格(元/小时) | ||
2018年度 | 2017年度 | 2016年度 | |
英语 | 869.51 | 875.40 | 836.82 |
其他语种 | 664.79 | 870.70 | 690.18 |
8-2-22
中文业务2017年单价提升,主要原因是发行人开展了中文搭配 其他语种混读、温柔型风格等项目,由于难度较高且资源稀缺造成单价较高;同时2017年是下游智能音箱行业的集中研发时期,各智能音箱厂商研发周期有限,需求急迫,发行人议价空间较大;2018年单价明显下降,是由于开展了部分无需进行音素边界标注的多样化标注语音项目,成本相对较低,因此价格较低。
外语种业务2018年单价大幅上升,主要原因是随着下游语音合成技术应用性的提升,客户对发音人要求越来越高,例如对其音色的代表性、发音的专业性等方面都提出了更高的要求。2018年,发行人根据客户需求启动了欧美多个语言的合成项目,此类项目需求较一般合成项目要求更高:对于录音棚,要求更低的背景噪声和更高的信噪比;对于发音人,要求发音人具备五年以上播音、配音及主持相关经验,每个项目要求提供至少五十个候选发音人,同时对于候选发音人通过100 个该语种母语用户的主观评测进行选择;对于录音过程,除配备录音工程师外,要求同时配备录音指导,录音指导需具备音乐相关领域本科以上学历,五年以上音乐导演或配音导演工作经历,以及熟练的英语沟通能力。这类要求均超出以往年度一般合成项目的要求,因此使得项目难度和成本显著提升,同时价格也相应显著上涨。
相比单一化标注语音项目的价格受语种影响较大,多样化标注语音项目的价格主要取决于发音人价格和标注类型,而与语种关联性较低,中文与外语种之间不存在固有的价格差异。发音人主要取决于专业性、知名程度、当地物价水平等因素,即使是同一语言,个体差异也可能较大。多样化标注中的主要标注类型音素边界标注是针对音素(如“a”,“o”,“b”,“h”等),所有语言均可用国际音标表示其发音,标注成本与语言相关度较弱。
②智能语音类数据库产品
报告期内,公司智能语音类数据库产品的销量和价格情况如下:
业务细分类别 | 语种 | 2018年度 | 2017年度 | 2016年度 | |||
销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | ||
有采集的单一化标 | 中文 | 68,536.93 | 354.79 | 41,159.09 | 473.30 | 23,881.88 | 374.47 |
外语种 | 47,099.49 | 720.45 | 27,063.42 | 868.52 | 26,961.93 | 765.26 |
8-2-23
业务细分类别 | 语种 | 2018年度 | 2017年度 | 2016年度 | |||
销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | 销量 (小时) | 价格 (元/小时) | ||
注语音 | 小计 | 115,636.42 | 503.73 | 68,222.51 | 630.09 | 50,843.81 | 581.70 |
多样化标注语音 | 中文 | 50.20 | 12,514.05 | 114.47 | 16,405.95 | 133.76 | 16,307.24 |
外语种 | 45.50 | 28,520.32 | 183.77 | 23,649.12 | 75.98 | 29,045.19 | |
小计 | 95.70 | 20,124.13 | 298.24 | 20,869.06 | 209.74 | 20,921.67 |
8-2-24
外语种业务单价明显高于中文业务,是由于国内外语种资源相对稀缺,采集和标注难度高于中文所致,具备合理性。
b、多样化标注语音
如前述原因,多样化标注语音项目按小时计算的产出量远低于有采集的单一化标注语音项目,同时单位价格远高于有采集的单一化标注语音项目。
此外,多样化标注语音数据库产品受到发音人定位的不同,价格变动比较明显,报告期各期平均单价的合理波动区间较大,因此上述中文和外语种业务的价格整体处于合理波动区间。
(2)计算机视觉类定制服务收入增长较快,进一步区分不同项目特征(手写体、光学字符识别和行车相关视频等)补充披露计算机视觉类定制服务的销售量和销售价格并分析变动原因、不同特征和语言类型项目之间销售价格差异原因
由于计算机视觉类业务各细分类别差异较大,例如手写体应用于手写输入,光学字符识别应用于拍照翻译等功能,行车相关视频应用于自动驾驶,且计价单位不同,因此不同类型项目的销售价格之间无法横向比较。
发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/3、主要产品和服务的销量和价格分析/(2)计算机视觉和自然语言领域”中对以下内容进行了补充披露:
报告期内,公司计算机视觉类数据资源定制服务中手写体、光学字符识别、行车相关视频业务的销量和价格情况如下:
业务细分类别 | 2018年度 | 2017年度 | 2016年度 | |||
销量 | 单位价格 (元) | 销量 | 单位价格 (元) | 销量 | 单位价格 (元) | |
手写体 | 2,740 | 494.90 | 3,875 | 1,238.89 | 795 | 2,444.21 |
光学字符识别 | 47,419.86 | 65.13 | 13,238.04 | 48.40 | 1,811.69 | 18.16 |
行车相关视频 | 1,188,754.20 | 4.77 | - | - | - | - |
8-2-25
①手写体报告期内,公司手写体业务2018年销量相较 2017年下降,主要是受到客户2018年项目启动时间较晚的影响,截至 2018年末,手写体业务仍有共 计22,704千词组的较大规模尚未验收的在产品结存,因此整体在手订单量保持了持续增长。平均销售单价逐年下降,主要是由于该类业务的语种差异所导致的。2016年,发行人手写体业务除英语外还包括西班牙语、意大利语等小语种,市场资源稀缺,采集难度较大,因此价格在报告期最高。2017年,语种涉及日语、英语、德语等,采集难度相对有所降低。2018年,该项业务的主要语种为中文,采集难度明显降低,因此价格也显著下降。
②光学字符识别2016年,公司光学字符识别业务规模很小,收入仅为 3.29万元,处于探索阶段,业务较为简单,无采集环节仅进行标注,因此单价较低。2017年和2018年,公司在光学字符识别业务方面实现了较快拓展,介入采集环节且采集量显著增长,销量快速增长的同时,单价也持续提升。
③行车相关视频公司行车相关视频业务是2018年新拓展业务。随着人工智能重要应用领域自动驾驶在技术和产业方面的快速发展,下游企业对于行车数据的需求不断扩大,公司借助这一契机积极拓展行车相关视频业务,2018年实现营业收入566.81万元。
(3)说明报告期各期各类型数据库的库存量、新增量和结存量,并结合各类型数据库的生命周期进一步分析各期销售和未销售的对应数据库数量变动情
况、销售数据库的开发成本和销售价格
8-2-26
一、智能语音领域报告期内,发行人各年新增的智能语音数据库产品数量分别为76个、49个和24个,各年末库存结余量分别为334个、383个和407个,各年新增数据库产品在报告期内实现销售的数量以及未实现销售的数量情况具体如下:
单位:个
年份 | 各期新增数量(产成数据库个数) | 期末 库存量 | 各期产成的数据库中,报告期内实现销售的数据库个数 | 各期产成的数据库中,报告期内未实现销售的数据库个数 | ||||
2016年 | 2017年 | 2018年 | 2016年 | 2017年 | 2018年 | |||
2013年 及以前 | 161 | 161 | 40 | 68 | 47 | 121 | 93 | 114 |
2014年 | 50 | 211 | 11 | 9 | 14 | 39 | 41 | 36 |
2015年 | 47 | 258 | 5 | 17 | 25 | 42 | 30 | 22 |
2016年 | 76 | 334 | 44 | 23 | 33 | 32 | 53 | 43 |
2017年 | 49 | 383 | - | 49 | 12 | - | - | 37 |
2018年 | 24 | 407 | - | - | 24 | - | - | - |
合计 | 407 | - | 100 | 166 | 153 | 307 | 241 | 254 |
销售数据库的平均开发成本 (万元/个) | 27.39 | 25.14 | 26.62 | - | - | - | ||
销售数据库的平均销售价格 (万元/个) | 26.53 | 22.68 | 28.52 | - | - | - |
8-2-27
智能下游技术应用行业不断涌入新的市场参与者,对于较为基础的通用型数据库产品也仍保持了一定的需求。
报告期内实现销售的智能语音数据库产品对应的平均开发成本和平均销售价格总体较为稳定,平均开发成本分别为27.39万元、25.14万元和26.62万元,平均销售价格分别为26.53万元、22.68万元和28.52万元。由于数据库产品可重复授权销售,因此平均销售价格低于平均开发成本并不一定导致发行人开发数据库产品出现亏损。
二、计算机视觉领域和自然语言领域
报告期内,发行人各年新增的计算机视觉数据库产品个数分别为3个、19个和11个,各年末的库存结余量分别是7个、26个和37个,各年新增计算机视觉数据库产品在报告期内实现销售的数量以及未实现销售的数量情况具体如下:
单位:个
年份 | 各期新增数量(产成数据库个数) | 期末 库存量 | 各期产成的数据库中,报告期内实现销售的数据库个数 | 各期产成的数据库中,报告期内未实现销售的数据库个数 | ||||
2016年 | 2017年 | 2018年 | 2016年 | 2017年 | 2018年 | |||
2015年 及以前 | 4 | 4 | - | 1 | 4 | 4 | 3 | - |
2016年 | 3 | 7 | 3 | - | - | - | 3 | 3 |
2017年 | 19 | 26 | - | 11 | 1 | - | 8 | 18 |
2018年 | 11 | 37 | - | - | 11 | - | - | - |
合计 | 37 | - | 3 | 12 | 16 | 34 | 25 | 21 |
销售数据库的平均开发成本 (万元/个) | 5.68 | 11.87 | 11.35 | - | - | - | ||
销售数据库的平均销售价格 (万元/个) | 6.09 | 15.65 | 7.45 | - | - | - |
年份 | 各期新增数量(产成数据库个数) | 期末库存量 | 各期产成的数据库中,报告期内实现销售的数据库个数 | 各期产成的数据库中,报告期内未实现销售的数据库个数 | ||||
2016年 | 2017年 | 2018年 | 2016年 | 2017年 | 2018年 |
8-2-28
年份 | 各期新增数量(产成数据库个数) | 期末库存量 | 各期产成的数据库中,报告期内实现销售的数据库个数 | 各期产成的数据库中,报告期内未实现销售的数据库个数 | ||||
2016年 | 2017年 | 2018年 | 2016年 | 2017年 | 2018年 | |||
2015年及以前 | 23 | 23 | 10 | 3 | 5 | 13 | 20 | 18 |
2016年 | 14 | 37 | 14 | 4 | 5 | - | 10 | 9 |
2017年 | 19 | 56 | - | 17 | 1 | - | 2 | 18 |
2018年 | 16 | 72 | - | - | 16 | - | - | - |
合计 | 72 | - | 24 | 24 | 27 | 48 | 48 | 45 |
销售数据库的平均开发成本 (万元/个) | 5.16 | 3.36 | 6.61 | - | - | - | ||
销售数据库的平均销售价格 (万元/个) | 16.73 | 10.60 | 13.72 | - | - | - |
8-2-29
品的销售量和销售价格变动原因合理,不同特征和语言类型项目之间销售价格差异原因合理,不存在异常;发行人计算机视觉类数据资源定制服务的销售量和销售价格变动原因合理,计算机视觉类业务各细分类别差异较大,且计价单位不同,销售价格无法横向比较的原因具备合理性;发行人的智能语音数据库产品总体而言具备较长的生命周期,计算机视觉和自然语言数据库产品大部分为报告期内产成,年限较短,其生命周期情况尚难以判断,2015年及以前产成的数据库产品在2018年部分实现了销售,仍保持在生命周期之内。
请保荐机构和申报会计师进一步说明回函不符的事项履行的核查程序,列表说明具体调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。
一、进一步说明针对回函不符事项履行的核查程序
报告期内,客户未直接在回函中对发行人应收账款和营业收入确认的情况较多,主要原因系发行人确认收入根据客户验收报告,而客户确认采购依据发行人开具的发票,双方核算的口径不一致而导致。针对回函不符事项,申报会计师主要履行了以下核查程序:
1、了解发行人与客户之间的验收、结算和对账流程,并对业务环节中的关键控制点进行测试;
2、通过函证取得客户可以确认的信息(包括发票与付款信息),与发行人账面记载的应收账款金额、营业收入金额、开具发票金额、客户验收金额和收款金额进行核对,分析其勾稽关系的合理性,并对差异情况进行调节;
3、执行收入核查程序,以营业收入为起点,检查销售合同、项目执行过程中与客户的邮件沟通记录、产品或服务交付记录、客户验收报告、开票记录和银行回款流水等,就上述资料中的客户名称、合同条款、业务内容、数据数量、数据交付时间、客户验收时间、开票时间和收款时间等信息进行匹配和穿行测试,检查营业收入和应收账款确认的真实性和准确性。
4、对发行人主要客户进行了实地走访,了解客户和发行人之间的合作模式、合作业务规模和结算方式。通过实地走访,未发现发行人与客户之间销售业务存
8-2-30
在异常情形。
8-2-31
二、列表说明具体的调节过程,包括期初余额、当期确认收入、当期收到的预收账款和应收账款当期和期后回款的对应关系,调节事项是否经发行人客户确认。
根据最新的回函情况,报告期内应收账款和营业收入的函证汇总情况更新如下:
单位:万元
年度/时点 | 报表科目 | 发函情况 | 回函情况1 | 期后回款2 (截至2019年4月30日) | ||||
账面金额 | 发函金额 | 发函比例 | 回函对应的发函金额 | 回函金额 | 回函差异 | |||
2018-12-31 /2018年 | 应收账款 | 3,096.75 | 2,911.30 | 94.01% | 2,411.53 | 1,115.45 | 1,296.08 | 2,073.17 |
营业收入 | 19,265.77 | 17,724.02 | 92.00% | 13,684.32 | 12,861.77 | 822.54 | —— | |
2017-12-31 /2017年 | 应收账款 | 2,707.57 | 2,535.84 | 93.66% | 2,134.69 | 1,471.89 | 662.80 | 2,438.69 |
营业收入 | 11,907.09 | 10,652.10 | 89.46% | 9,629.78 | 9,451.94 | 177.84 | —— | |
2016-12-31 /2016年 | 应收账款 | 1,772.88 | 1,644.45 | 92.76% | 1,644.45 | 1,945.75 | -301.31 | 1,657.03 |
营业收入 | 8,422.86 | 7,334.49 | 87.08% | 7,121.11 | 7,223.29 | -102.18 | —— |
8-2-32
核查,期后回款逐一匹配至相应的应收账款。
报告期内,营业收入、应收账款函证的回函差异主要集中在前五大营业收入客户(按品牌)和前五大应收账款对象(按品牌)。根据审核问询要求,将前五大营业收入客户(按品牌)和前五大应收账款对象(按品牌)函证情况按照法人主体列示如下:
(一)前五大营业收入客户(按品牌)的函证汇总情况
单位:万元
年度 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
2018年 | 阿里巴巴 | 淘宝(中国)软件有限公司 | 2,019.42 | 2,019.42 | 1,399.64 | 619.78 | |
阿里巴巴(中国)网络技术有限公司 | 1,602.97 | 1,602.97 | 1,398.16 | 204.81 | |||
浙江天猫技术有限公司 | 1,418.37 | 1,418.37 | 1,195.87 | 222.50 | |||
三星 | Samsung Electronics Co., Ltd. | 1,679.68 | 1,679.68 | —— | —— | 未回函 | |
北京三星通信技术研究有限公司 | 603.15 | 603.15 | 61.64 | 541.51 | |||
Samsung R&D Institute India - Bangalore Pvt Ltd. | 153.99 | 153.99 | 311.73 | -157.74 | |||
腾讯 | 腾讯科技(深圳)有限公司 | 978.68 | 978.68 | 1,354.46 | -375.78 | ||
深圳市腾讯计算机系统有限公司 | 390.84 | 390.84 | 424.54 | -33.69 | |||
腾讯科技(成都)有限公司 | 168.54 | 168.54 | 162.59 | 5.95 | |||
微软 | 微软(中国)有限公司 | 957.75 | 957.75 | 1,904.58 | -946.83 | ||
Microsoft Corporation-USA | 341.98 | 341.98 | 341.98 | ||||
百度 | 百度国际科技(深圳)有限公司 | 334.26 | 334.26 | 350.39 | -16.13 | ||
北京百度网讯科技有限公司 | 375.27 | 375.27 | 284.01 | 91.26 |
8-2-33
年度 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
百度时代网络技术(北京)有限公司 | 90.29 | 90.29 | —— | —— | 未回函 | ||
百度在线网络技术(北京)有限公司 | 88.47 | 88.47 | 88.47 | ||||
2017年 | 腾讯 | 深圳市腾讯计算机系统有限公司 | 417.77 | 417.77 | 374.53 | 43.24 | |
腾讯科技(上海)有限公司 | 88.41 | 88.41 | 74.67 | 13.74 | |||
腾讯科技(深圳)有限公司 | 1,263.87 | 1,263.87 | 1,030.28 | 233.59 | |||
三星 | SAMSUNG ELECTRONICS CO., LTD. | 113.96 | 113.96 | 113.96 | |||
北京三星通信技术研究有限公司 | 1,439.12 | 1,439.12 | 1,558.19 | -119.07 | |||
阿里巴巴 | 阿里云计算有限公司 | 526.90 | 526.90 | 387.14 | 139.76 | ||
淘宝(中国)软件有限公司 | 241.61 | 241.61 | 317.30 | -75.69 | |||
广州神马移动信息科技有限公司 | 110.26 | 110.26 | 110.26 | ||||
浙江天猫技术有限公司 | 118.77 | 118.77 | 81.89 | 36.88 | |||
阿里巴巴(北京)软件服务有限公司 | 63.68 | 63.68 | 63.68 | ||||
支付宝(中国)网络技术有限公司 | 45.44 | 45.44 | —— | —— | 未回函 | ||
微软 | Microsoft Corporation-USA | 477.99 | 477.99 | 477.99 | - | ||
微软(中国)有限公司 | 580.87 | 580.87 | 826.27 | -245.40 | |||
百度 | 北京百度网讯科技有限公司 | 585.29 | 585.29 | 585.29 | |||
2016年 | 阿里巴巴 | 淘宝(中国)软件有限公司 | 361.67 | 361.67 | 361.67 | ||
阿里云计算有限公司 | 160.01 | 160.01 | 160.01 | ||||
阿里巴巴(北京)软件服务有限公司 | 93.75 | 93.75 | 93.75 |
8-2-34
年度 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
阿里巴巴(中国)网络技术有限公司 | 10.16 | 10.16 | 10.16 | ||||
北京阿里巴巴云计算技术有限公司 | 9.98 | 9.98 | 9.98 | ||||
支付宝(中国)网络技术有限公司 | 166.60 | 166.60 | 166.60 | ||||
高德信息技术有限公司 | 175.81 | 175.81 | 175.81 | ||||
三星 | 北京三星通信技术研究有限公司 | 863.80 | 863.80 | 948.39 | -84.59 | ||
微软 | 微软(中国)有限公司 | 389.74 | 389.74 | 525.50 | -135.76 | ||
Microsoft Corporation-USA | 237.27 | 237.27 | 237.27 | ||||
Microsoft Corporation印度 | 198.80 | 198.80 | 198.80 | ||||
SpeechOcean Ltd. | SpeechOcean Ltd. | 716.94 | 716.94 | 716.94 | |||
百度 | 北京百度网讯科技有限公司 | 526.78 | 526.78 | 526.78 |
时点 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
2018年 12月31日 | 阿里巴巴 | 阿里巴巴(中国)网络技术有限公司 | 217.11 | 217.11 | 未确认 | 217.11 | |
浙江天猫技术有限公司 | 274.96 | 274.96 | 136.48 | 138.48 | |||
淘宝(中国)软件有限公司 | 752.11 | 752.11 | 587.65 | 164.47 | |||
腾讯 | 深圳市腾讯计算机系统有限公司 | 213.39 | 213.39 | 未确认 | 213.39 | ||
腾讯科技(成都)有限公司 | 101.84 | 101.84 | 未确认 | 101.84 |
8-2-35
时点 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
腾讯科技(深圳)有限公司 | 139.04 | 139.04 | 未确认 | 139.04 | |||
Amazon | Amazon Web Services, Inc. | 351.94 | 351.94 | —— | —— | 未回函 | |
百度 | 北京百度网讯科技有限公司 | 289.80 | 289.80 | 未确认 | 289.80 | ||
深圳市天道日新科技有限公司 | 深圳市天道日新科技有限公司 | 110.00 | 110.00 | 110.00 | |||
2017年 12月31日 | 腾讯 | 腾讯科技(上海)有限公司 | 14.71 | 14.71 | 未确认 | 14.71 | |
深圳市腾讯计算机系统有限公司 | 52.16 | 52.16 | 4.00 | 48.16 | |||
腾讯科技(深圳)有限公司 | 769.76 | 769.76 | 186.58 | 583.19 | |||
阿里巴巴 | 支付宝(中国)网络技术有限公司 | 10.79 | 10.79 | —— | —— | 未回函 | |
浙江天猫技术有限公司 | 39.10 | 39.10 | 39.10 | ||||
阿里云计算有限公司 | 181.16 | 181.16 | 181.02 | 0.14 | |||
淘宝(中国)软件有限公司 | 95.84 | 95.84 | 122.45 | -26.61 | |||
乐视 | 乐乐创新智能科技(北京)有限公司 | 209.88 | 209.88 | —— | —— | 未回函 | |
百度 | 北京百度网讯科技有限公司 | 202.76 | 202.76 | 202.76 | |||
富士康 | 云智汇(深圳)高新科技服务有限公司 | 191.52 | 191.52 | 191.52 | |||
2016年 12月31日 | 阿里巴巴 | 阿里巴巴(中国)网络技术有限公司 | 10.77 | 10.77 | 10.77 | ||
支付宝(中国)网络技术有限公司 | 16.30 | 16.30 | 16.30 | ||||
阿里云计算有限公司 | 39.62 | 39.62 | 39.62 | ||||
高德信息技术有限公司 | 121.55 | 121.55 | 121.55 | ||||
淘宝(中国)软件有限公司 | 153.70 | 153.70 | 153.70 |
8-2-36
时点 | 客户品牌 | 客户名称 | 账面金额 | 发函金额 | 回函金额 | 回函差异 | 备 注 |
阿里巴巴(北京)软件服务有限公司 | 14.28 | 14.28 | 14.28 | ||||
腾讯 | 腾讯科技(深圳)有限公司 | 311.63 | 311.63 | 218.21 | 93.42 | ||
百度 | 北京百度网讯科技有限公司 | 205.96 | 205.96 | 205.96 | |||
乐视 | 乐乐创新智能科技(北京)有限公司 | 115.85 | 115.85 | 115.85 | |||
联想 | 联想(北京)有限公司 | 110.00 | 110.00 | 110.00 |
8-2-37
(三)回函差异调节过程
1、关于营业收入的调节过程
发行人按照项目交付与验收进度为依据确认对客户的营业收入,而客户通常按照收到发行人的发票作为确认当期采购的情形,双方核算的差异导致营业收入的回函存在差异,具体分析如下:
类型 | 发行人(以验收为依据) | 客户(以发票为依据) | 是否需要调节 | ||||
数据 验收时间 | 开具 发票时间 | 确认 收入 | 数据 验收时间 | 取得 发票时间 | 确认 采购 | ||
情形1 | 当期 | 当期 | √ | 当期 | 当期 | √ | 否 |
情形2 | 当期 | 前期 | √ | 当期 | 前期 | × | 是 |
情形3 | 当期 | 尚未 | √ | 当期 | 尚未 | × | |
情形4 | 尚未 | 当期 | × | 尚未 | 当期 | √ | |
情形5 | 前期 | 当期 | × | 前期 | 当期 | √ |
营业收入回函差异调节过程 | 项目 | 备注 |
客户回函的发票金额 | —— | |
减:当期开票、前期验收 | 情形5 | |
减:当期开票、尚未验收 | 情形4 | |
加:当期验收、前期开票 | 情形2 | |
加:当期验收、尚未开票 | 情形3 | |
调节后的营业收入金额 | —— |
8-2-38
基于此,对于发行应收账款回函差异的主要通过检查年初余额、本年含税营业收入、本年收款、本年只开票税金影响与年末应收账款余额的会计核算逻辑等式的一致性进行核查。
8-2-39
3、前五大品牌客户回函差异的调节过程
(1)营业收入回函差异调节过程
①2018年回函差异调节过程
单位:万元
品牌 | 主 体 | 发函金额 | 回函金额 | 调节过程 | 调节后金额 | 调节结论 | |||
当期开票 前期验收 | 当期开票尚未验收 | 当期验收 前期开票 | 当期验收 尚未开票 | ||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=②-③-④+⑤+⑥ | ⑧ | |
阿里巴巴 | 淘宝(中国)软件有限公司 | 2,019.42 | 1,399.64 | 64.52 | 70.81 | 755.12 | 2,019.42 | 一致 | |
阿里巴巴(中国)网络技术有限公司 | 1,602.97 | 1,398.16 | 204.82 | 1,602.97 | 一致 | ||||
浙江天猫技术有限公司 | 1,418.37 | 1,195.87 | 36.89 | 141.51 | 400.90 | 1,418.37 | 一致 | ||
三星 | 北京三星通信技术研究有限公司 | 603.15 | 61.64 | 19.34 | 33.39 | 594.28 | 603.15 | 一致 | |
Samsung R&D Institute India - Bangalore Pvt Ltd. | 153.99 | 311.73 | 157.74 | 153.99 | 一致 | ||||
腾讯 | 腾讯科技(深圳)有限公司 | 978.68 | 1,354.46 | 352.71 | 62.10 | 39.03 | 978.68 | 一致 | |
深圳市腾讯计算机系统有限公司 | 390.84 | 424.54 | 35.39 | 15.30 | 17.00 | 390.84 | 一致 | ||
腾讯科技(成都)有限公司 | 168.54 | 162.59 | 34.12 | 40.07 | 168.54 | 一致 | |||
微软 | 微软(中国)有限公司 | 957.75 | 1,904.58 | 23.19 | 1,179.88 | 250.58 | 5.66 | 957.75 | 一致 |
百度 | 百度国际科技(深圳)有限公司 | 334.26 | 350.39 | 60.74 | 41.88 | 2.72 | 334.26 | 一致 |
8-2-40
品牌 | 主 体 | 发函金额 | 回函金额 | 调节过程 | 调节后金额 | 调节结论 | |||
当期开票 前期验收 | 当期开票尚未验收 | 当期验收 前期开票 | 当期验收 尚未开票 | ||||||
北京百度网讯科技有限公司 | 375.27 | 284.01 | 13.25 | 104.51 | 375.27 | 一致 |
品牌 | 主体 | 发函金额 | 回函金额 | 调节过程 | 调节后金额 | 调节结论 | |||
当期开票 前期验收 | 当期开票尚未验收 | 当期验收 前期开票 | 当期验收 尚未开票 | ||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=②-③-④+⑤+⑥ | ⑧ | |
腾讯 | 深圳市腾讯计算机系统有限公司 | 417.77 | 374.53 | 43.24 | 417.77 | 一致 | |||
腾讯科技(上海)有限公司 | 88.41 | 74.67 | 13.74 | 88.41 | 一致 | ||||
腾讯科技(深圳)有限公司 | 1,263.87 | 1,030.28 | 289.39 | 84.91 | 25.64 | 582.24 | 1,263.87 | 一致 | |
三星 | 北京三星通信技术研究有限公司 | 1,439.12 | 1,558.19 | 647.16 | 452.90 | 75.20 | 1,439.12 | 一致 | |
阿里巴巴 | 阿里云计算有限公司 | 526.90 | 387.14 | 40.32 | 95.63 | 52.46 | 223.25 | 526.90 | 一致 |
淘宝(中国)软件有限公司 | 241.61 | 317.30 | 150.26 | 28.23 | 102.79 | 241.61 | 一致 | ||
浙江天猫技术有限公司 | 118.77 | 81.89 | 36.89 | 118.77 | 一致 | ||||
微软 | 微软(中国)有限公司 | 580.87 | 826.27 | 70.44 | 345.77 | 168.01 | 2.81 | 580.87 | 一致 |
8-2-41
③2016年回函差异调节过程
单位:万元
品牌 | 主体 | 发函金额 | 回函金额 | 调节过程 | 调节后金额 | 调节结论 | |||
当期开票 前期验收 | 当期开票 尚未验收 | 当期验收 前期开票 | 当期验收 尚未开票 | ||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=②-③-④+⑤+⑥ | ⑧ | |
三星 | 北京三星通信技术研究有限公司 | 863.80 | 948.39 | 637.08 | 479.25 | 73.24 | 863.80 | 一致 | |
微软 | 微软(中国)有限公司 | 389.74 | 525.50 | 2.83 | 236.71 | 103.77 | 389.74 | 一致 |
时点 | 客户 品牌 | 主体 | 期初应收账款 | 本期销售 | 只开票税金影响 | 本期收款 | 期末应收账款 | 逻辑关系检查 | 核对结论 | 期后回款 | |
营业收入 | 含税 销售额 | ||||||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=①+③+④-⑤-⑥ | —— | —— | ||
2018年12月31日 | 阿里巴巴 | 淘宝(中国)软件有限公司 | 95.84 | 2,019.42 | 2,149.43 | -0.70 | 1,492.46 | 752.11 | 核对一致 | 733.20 | |
阿里巴巴(中国)网络技术有限公司 | 1,602.97 | 1,764.11 | 1,547.00 | 217.11 | 核对一致 | 180.47 | |||||
浙江天猫技术有限公司 | 39.10 | 1,418.37 | 1,503.48 | 1,267.62 | 274.96 | 核对一致 | 274.96 |
8-2-42
时点 | 客户 品牌 | 主体 | 期初应收账款 | 本期销售 | 只开票税金影响 | 本期收款 | 期末应收账款 | 逻辑关系检查 | 核对结论 | 期后回款 | |
营业收入 | 含税 销售额 | ||||||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=①+③+④-⑤-⑥ | —— | —— | ||
腾讯 | 腾讯科技(深圳)有限公司 | 769.76 | 978.68 | 1,068.65 | 6.21 | 1,807.76 | 139.04 | 核对一致 | 12.99 | ||
深圳市腾讯计算机系统有限公司 | 52.16 | 390.84 | 421.68 | 226.78 | 213.39 | 213.39 | |||||
腾讯科技(成都)有限公司 | 168.54 | 178.65 | 8.30 | 101.84 | 101.84 | ||||||
百度 | 北京百度网讯科技有限公司 | 202.76 | 375.27 | 413.07 | -8.92 | 317.11 | 289.80 | 核对一致 | 159.37 | ||
2017年12月31日 | 腾讯 | 深圳市腾讯计算机系统有限公司 | 417.77 | 482.72 | 0.91 | 431.47 | 52.16 | 核对一致 | 52.16 | ||
腾讯科技(上海)有限公司 | 88.41 | 99.50 | 84.79 | 14.71 | 核对一致 | 14.71 | |||||
腾讯科技(深圳)有限公司 | 311.63 | 1,263.87 | 1,387.15 | -2.76 | 926.26 | 769.76 | 核对一致 | 769.76 | |||
阿里巴巴 | 阿里云计算有限公司 | 39.62 | 526.90 | 556.04 | -0.33 | 414.17 | 181.16 | 核对一致 | 181.16 | ||
淘宝(中国)软件有限公司 | 153.70 | 241.61 | 256.11 | 22.37 | 336.34 | 95.84 | 核对一致 | 95.84 | |||
2016年12月31日 | 腾讯 | 腾讯科技(深圳)有限公司 | 318.51 | 357.27 | 4.36 | 50.00 | 311.63 | 核对一致 | 311.63 |
8-2-43
问题6、关于发行人毛利率发行人已区分不同项目类型和特征说明了智能语音类业务销量、在产品结存和新增数据库产品时长与采集服务数量、标注服务数量之间的配比关系,多样化标注语音的标注产出比显著高于单一化标注语音。
请发行人:(1)结合多样化标注语音的不同项目特征进一步说明多样化标注语音的标注产出比的变动原因、远高于其他项目的原因及合理性,相关处理技术如何提高标注的工作效率;(2)结合不同项目特征和语言类型的项目情况,进一步列示单位价格、单位成本中采集和标注服务费的变动情况并对毛利率波动进行分析。
请保荐机构和申报会计师进行核查并发表明确意见。
答复:
(1)结合多样化标注语音的不同项目特征进一步说明多样化标注语音的标注产出比的变动原因、远高于其他项目的原因及合理性,相关处理技术如何提高标注的工作效率
一、多样化标注语音标注产出比远高于其他项目的原因及合理性
多样化标注语音标注产出比远高于其他项目的原因为标注精细度和复杂度远远超过单一化标注语音项目。
单一化标注语音要求较为简单,有采集的单一化标注语音,通常是发音人对照预设文本进行朗读,因此只需要完成语音与文字一致性的检查、语音边界标注;无采集的单一化标注语音,通常需要先进行人工文本生成后,再进行前述标注即可。
而对于多样化标注语音,主要应用于语音合成算法模型训练,为了使合成的声音更加接近于人声,需要对语音进行各种细节描述,因此需要对数据进行多样化标注,包括音段(音素、音素边界)和超音段(韵律)标注信息,精细和复杂程度远高于单一化标注语音,因此标记同样时间长度的语音文件,所需要的时间更长、环节更多,导致多样化标注语音的标注产出比远高于单一化标注语音。
8-2-44
标注内容 | 标注说明 | 有采集的单一化标注语音 | 无采集的单一化标注语音 | 多样化标注语音 |
语音边界标注 | 标记语音的起止点 | √ | √ | √ |
人工文本生成 | 将语音内容听写成文字 | √(如果无预设文本) | √ | √ |
语音属性标注 | 标记发音人性别、方言区 | √ | ||
声音事件标注 | 标记笑声、关门声等非语音类型 | √ | ||
音素标注 | 根据实际发音,标注真实的音段信息,含音素、音节边界、重音/声调 | √ | ||
音素边界标注 | 根据实际发音,逐个标示出每个音素在语音上的起止位置 | √ | ||
韵律标注 | 听声音判断每个音节末尾的韵律边界类型,分别用#1~#4表示韵律词、二级韵律短语、一级韵律短语、语调短语 | √ | ||
词性标注 | 标注每个语法词词性信息 | √ | ||
标注产出比注 | 约为3 | 约为12 | 约为50-60 |
8-2-45
二、多样化标注语音标注产出比的变动原因及相关处理技术情况多样化标注语音标注产出比的变动主要体现为2018年单位产出的标注量下降。主要原因是随着2018年发行人音素边界自动预测、基于语音特征的韵律预测等高效数据处理技术的成熟和普遍应用,发行人数据处理工作效率得到提高,标注过程中的人工工作量有效减少,使得单位产出的标注量有所下降。
通过技术辅助数据处理,发行人标注工作效率提升主要体现在以下两个方面:
1、发行人利用音素标注正确率校验技术,发现并定位人工标注错误,以帮助快速修改错误,提高数据质量与工作效率。
音素标注的正确性是衡量多样化标注语音数据库质量的重要指标,通常需要由标注人员通过语音听辨确认音素(音素为根据语音的自然属性划分出来的最小语音单位,以1,000句文本为例,按照每句话平均15个字,每个字包括声、韵母,音素量为1,000*15*2=30,000个)。由于人工标注结果难免存在错误,而从大量数据中发现并修正错误极为耗时。
发行人音素标注正确率校验技术,利用语音识别中GMM-HMM三音子声学模型,对每个音素样本进行置信度打分,针对不同置信度区间设计不同的音素样本检查校对策略,将校对重点进行有效集中,在减少整体校对工作量的同时,提高了音素标注正确率。发行人已针对该项技术于2018年7月提交了“音素误标注的检测方法和装置”发明专利申请。
2、发行人利用基于语音特征的韵律预测技术,采用自动预标注,用半自动代替全人工从而提高工作效率。
由于语音韵律具有较强的差异性和个人特色,因此韵律标注需要标注人员通过语音听辨,根据韵律标注规范,判断每个语法词的韵律边界类型。
8-2-46
如上图所示,韵律标注一般有两种方法:
①全人工韵律标注:即上图“1、人工标注韵律”,由标注人员通过听辨语音直接在原始文本上标注韵律符号;
②半自动韵律标注:即先使用算法预测韵律信息(“3、自动预测韵律”),而后再“2、人工校对韵律”,由标注人员结合语音听辨在预测结果上进行修改。
发行人所掌握的基于语音特征的韵律预测技术,可以利用语音识别模型对音素进行自动切分并预测韵律边界,修正基于文本的韵律预测结果,从而提高韵律预标的准确率,有效减少了标注过程中约25%的人工标注工作量。发行人已针对该项技术于2018年8月提交了“韵律标注方法、装置和设备”发明专利申请。
(2)结合不同项目特征和语言类型的项目情况,进一步列示单位价格、单位成本中采集和标注服务费的变动情况并对毛利率波动进行分析
报告期内,发行人主营业务的毛利率情况如下:
项目 | 2018年度 | 2017年度 | 2016年度 | ||||||
收入 占比 | 毛利率 | 综合毛利率贡献 | 收入 占比 | 毛利率 | 综合毛利率贡献 | 收入 占比 | 毛利率 | 综合毛利率贡献 | |
数据资源定制服务 | 64.20% | 45.64% | 29.30% | 52.89% | 47.87% | 25.32% | 53.15% | 40.44% | 21.49% |
数据库产品 | 34.27% | 100.00% | 34.27% | 46.10% | 100.00% | 46.10% | 45.48% | 100.00% | 45.48% |
数据资源相关的应用服务 | 1.53% | 78.70% | 1.20% | 1.01% | 82.90% | 0.84% | 1.36% | 79.27% | 1.08% |
综合毛利率 | 64.77% | 72.26% | 68.06% |
8-2-47
综合毛利率变动的主要因素。数据资源相关的应用服务收入和毛利规模较小,对发行人综合毛利率水平不构成实质性影响。
发行人数据库产品业务类型的毛利率为100%保持不变,收入占比会发生变化;数据资源定制服务的毛利率、收入占比均会发生变化。因此,发行人综合毛利率的变动主要取决于发行人收入结构的变化和数据资源定制服务自身的毛利率水平变动:
1、2017年综合毛利率较2016年增长4.21%,主要是数据资源定制服务和数据库产品的收入占比无明显变化的情况下,定制服务的毛利率增长7.43%所致;
2、2018年综合毛利率较2017年下降7.49%,主要是数据资源定制服务毛利率基本稳定的情况下,其收入占比提高11.31%所致。该收入结构的变化,是由于发行人部分客户随着其人工智能业务的深入发展,数据资源定制化服务需求增长迅速,发行人对数据资源定制复核和数据库产品开发进行更有针对性和更有效的资源分配,以更好的满足客户的各种需求。
以上着重分析了定制服务和数据库产品收入占比结构的变化对综合毛利率的影响;下文重点分析数据资源定制服务的毛利率变动情况。
(二)数据资源定制服务毛利率分析
报告期内,发行人数据资源定制服务收入主要来源于智能语音领域,其收入占比分别为83.97%、77.72% 和 79.95%,因此主要分析智能语音数据资源定制服务毛利率的变动。发行人智能语音数据资源定制服务各业务细分类别的毛利率情况如下:
业务细分类别 | 年度 | 收入(万元) | 成本(万元) | 收入占比 | 毛利率 |
有采集的单一化标注语音 | 2018年度 | 2,809.18 | 1,606.83 | 28.41% | 42.80% |
2017年度 | 1,451.45 | 741.48 | 29.66% | 48.91% | |
2016年度 | 1,155.84 | 685.67 | 30.78% | 40.68% | |
无采集的单一化标注语音 | 2018年度 | 2,960.54 | 2,131.45 | 29.94% | 28.00% |
2017年度 | 1,409.18 | 979.43 | 28.79% | 30.50% | |
2016年度 | 1,610.33 | 1,159.85 | 42.89% | 27.97% | |
多样化标注语音 | 2018年度 | 4,119.96 | 1,584.05 | 41.66% | 61.55% |
8-2-48
业务细分类别 | 年度 | 收入(万元) | 成本(万元) | 收入占比 | 毛利率 |
2017年度 | 2,033.35 | 821.23 | 41.55% | 59.61% | |
2016年度 | 988.81 | 426.01 | 26.33% | 56.92% |
8-2-49
型,毛利率约为60%左右。
2、发行人智能语音类定制服务毛利率波动分析
(1)有采集的单一化标注语音项目
该业务类型在报告期收入占比较为稳定,2017年毛利率较高。2017年行业下游各大公司在当年普遍加大投入,开发符合自身定位的智能音箱等产品,产生了较多基于特殊设备的数据需求。具体情况请参见第二轮审核问询函回复问题10(1)。
(2)无采集的单一化标注语音项目、多样化标注语音项目
这两种业务类型在报告期毛利率相对稳定,而收入占比结构发生了变化。随着智能语音领域人工智能技术的快速进步和相关产品在众多应用场景实现落地,2017年和2018年,毛利率较高的多样化标注语音和毛利率较低的单一化标注语音的收入占比较2016年分别出现明显上升和下降,带动了2017年和2018年整体毛利率水平较2016年有较大幅度提升。
(三)数据资源定制服务毛利率分析—进一步区分语言类型
报告期内,发行人中文业务毛利率整体上呈现下降状态,反映中文语音数据资源服务的市场竞争程度有所加强,外语种业务毛利率整体上呈现上升状态,体现资源稀缺程度所带来的溢价和发行人多语种覆盖能力所形成的竞争优势。具体分析如下:
数据服务费是数据资源定制服务的主要成本构成,并对数据资源定制服务的定价起到重要的影响作用。报告期内,发行人智能语音三种业务细分类别的单位价格、单位数据服务费、毛利率情况如下:
业务细分类别 | 语种 | 2018年度 | 2017年度 | 2016年度 | ||||||
单位价格(元) | 单位数据服务费(元) | 毛利率 | 单位价格(元) | 单位数据服务费(元) | 毛利率 | 单位价格(元) | 单位数据服务费(元) | 毛利率 | ||
有采集的单一化标注语音 | 中文 | 355.14 | 140.43 | 41.14% | 448.14 | 168.71 | 50.00% | 553.11 | 229.44 | 50.43% |
外语种 | 722.76 | 334.30 | 44.36% | 872.46 | 374.83 | 47.75% | 716.31 | 351.05 | 36.24% | |
小计 | 481.51 | 207.07 | 42.80% | 585.57 | 235.47 | 48.91% | 655.82 | 305.97 | 40.68% |
8-2-50
业务细分类别 | 语种 | 2018年度 | 2017年度 | 2016年度 | ||||||
无采集的单一化标注语音 | 中文 | 302.46 | 206.17 | 26.55% | 312.41 | 189.59 | 31.02% | 291.28 | 172.80 | 28.36% |
外语种 | 955.13 | 496.72 | 41.28% | 572.92 | 369.64 | 24.15% | 653.94 | 422.28 | 24.18% | |
小计 | 324.40 | 215.94 | 28.00% | 323.70 | 197.39 | 30.50% | 306.96 | 183.59 | 27.97% | |
多样化标注语音 | 中文 | 17,110.43 | 5,287.70 | 53.66% | 27,392.84 | 8,868.14 | 55.01% | 20,957.44 | 6,688.98 | 57.21% |
外语种 | 51,796.84 | 12,919.86 | 65.36% | 25,327.38 | 7,514.23 | 62.98% | 21,508.92 | 5,878.10 | 56.62% | |
小计 | 31,204.04 | 8,388.76 | 61.55% | 26,161.01 | 8,060.67 | 59.61% | 21,228.26 | 6,290.78 | 56.92% |
8-2-51
同时发行人也具备较强的销售议价能力,因而毛利率较高,从而提升了外语种业务的毛利率水平。
3、多样化标注语音
中文业务毛利率逐年小幅下降,主要受到中文数据资源日益丰富和市场竞争日趋激烈的影响。外语种业务毛利率逐年持续提升,是由于2016年发行人处于外语种多样化标注语音业务的发展初期,发音人资源有限,成本相对较高而价格相对较低,通过报告期内的经营积累,发行人有效扩展了发音人渠道,掌握了该类业务的主要市场资源,提升了议价能力,价格涨幅超过成本,且外语种业务相较于中文业务更为稀缺,下游需求的持续增长也带动了毛利率的逐步提升。
请保荐机构和申报会计师进行核查并发表明确意见。
针对上述事项,申报会计师执行了以下核查程序:
1、查阅了发行人多样化标注语音的业务介绍文档,了解了发行人多样化标注语音的项目特点、操作流程以及发行人相关辅助数据处理技术;
2、查阅并复核了发行人按照不同项目特征和语言类型划分的业务类型的单位价格、单位成本中采集和标注服务费、收入和毛利、毛利率等相关数据。
3、访谈发行人高管和财务人员,了解发行人业务开展情况以及相关财务指标的变动情况。
经核查,申报会计师认为:
发行人多样化标注语音由于其标注内容复杂,环节较多,因此标注产出比远高于其他项目,具备合理性;2018年多样化标注语音单位产出的标注量下降的原因是随着发行人音素边界自动预测、基于语音特征的韵律预测等高效数据处理技术的成熟和普遍应用,提高了发行人数据处理工作效率,有效减少了多样化标注语音标注过程中的人工工作量,使得单位产出的标注量有所下降;发行人智能语音类数据资源定制服务的单位价格、单位数据服务费以及毛利率变动情况合理,不存在异常情况。
8-2-52
【本页系瑞华会计师事务所(特殊普通合伙)《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件的第三轮审核问询函之专项核查意见》之签章页】
瑞华会计师事务所(特殊普通合伙) | 中国注册会计师: 郭勇 |
中国·北京 | 中国注册会计师: 左东强 |
2019年 月 日 |