8-2-1-1
关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市申请文件的
审核问询函回复的专项说明
上海证券交易所:
毕马威华振会计师事务所 (特殊普通合伙) (以下简称“本所”或“我们”) 接受北京海天瑞声科技股份有限公司 (以下简称“公司”或“发行人”) 的委托,按照中国注册会计师审计准则审计了截至2017年12月31日、2018年12月31日、2019年12月31日及2020年9月30日的合并及母公司资产负债表,2017年度、2018年度、2019年度及自2020年1月1日至2020年9月30日止九个月期间的合并及母公司利润表、合并及母公司现金流量表、合并及母公司股东权益变动表以及财务报表附注(以下简称“财务报表”),并于2020年12月16日出具了标准无保留意见的审计报告。
本所按照中国注册会计师审计准则的规定执行了审计工作。我们的目标是对财务报表整体是否不存在由于舞弊或错误导致的重大错报获取合理保证。我们审计的目的并不是对上述财务报表中的任何个别账户或项目的余额或金额、或个别附注单独发表意见。在按照审计准则执行审计工作的过程中,我们运用职业判断,并保持职业怀疑。同时,我们也执行以下工作:(1) 识别和评估由于舞弊或错误导致的财务报表重大错报风险,设计和实施审计程序以应对这些风险,并获取充分、适当的审计证据,作为发表审计意见的基础;(2) 了解与审计相关的内部控制,以设计恰当的审计程序;(3) 评价管理层选用会计政策的恰当性和作出会计估计及相关披露的合理性;(4) 对管理层使用持续经营假设的恰当性得出结论;(5) 评价财务报表的总体列报、结构和内容 (包括披露),并评价财务报表是否公允反映相关交易和事项;(6) 就发行人中实体或业务活动的财务信息获取充分、适当的审计证据,以对财务报表发表审计意见。
另外,本所按照中国注册会计师协会发布的《内部控制审核指导意见》,对发行人2020年9月30日与财务报表相关的内部控制有效性的认定进行了审核,我们认为发行人于2020年9月30日在所有重大方面保持了按照《企业内部控制基本规范》标准建立的与财务报表相关的有效的内部控制。在审核过程中,我们实施了包括了解、测试
8-2-1-2
和评价内部控制设计的合理性和执行的有效性,以及本所认为必要的其他程序,以对与财务报表相关的内部控制有效性发表审核意见。本所根据公司转来《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创版上市申请文件的审核问询函》(以下简称“审核问询函”)中下述问题之要求,以及与发行人沟通、在上述审计及审核过程中获得的审计证据和本次核查中所进行的工作,就有关问题作如下说明(本说明除特别注明外,所涉及发行人财务数据均为合并口径):
8-2-1-3
目 录
二、关于发行人业务 ...... 4
9.关于销售模式和主要客户 .................................................................................... 4
9.1关于主要服务和产品 ......................................................................................... 4
9.2关于主要客户和境内外销售 ............................................................................ 15
9.3关于销售收入核查 .......................................................................................... 51
10.关于采购模式和主要供应商 ............................................................................. 64
10.1关于数据服务采购 ........................................................................................ 64
10.2关于采购情况 ............................................................................................. 142
四、关于公司治理与独立性 ...... 157
12.关于关联方.................................................................................................... 157
五、关于财务会计信息与管理层分析 ...... 164
13.关于营业收入 ................................................................................................ 164
13.1关于收入确认政策 ...................................................................................... 164
13.2关于营业收入波动 ...................................................................................... 183
14.关于营业成本 ................................................................................................ 187
15.关于毛利率.................................................................................................... 199
16.关于期间费用 ................................................................................................ 203
16.1关于销售费用 ............................................................................................. 203
16.2关于管理费用 ............................................................................................. 208
16.3关于研发费用 ............................................................................................. 212
17.关于税务事项 ................................................................................................ 224
18.关于货币资金 ................................................................................................ 240
19.关于应收账款 ................................................................................................ 251
20.关于存货 ....................................................................................................... 259
21.关于预收账款 ................................................................................................ 271
22.关于现金流量表 ............................................................................................ 274
8-2-1-4
二、关于发行人业务
9.关于销售模式和主要客户
9.1关于主要服务和产品
招股说明书披露,发行人产品和服务分为训练数据定制服务、训练数据产品和训练数据相关的应用服务,训练数据定制服务和训练数据产品按照应用领域可以分为智能语音、计算机视觉和自然语言,智能语音可以进一步分为语音识别采集、语音识别转写和语音合成。
请发行人补充披露:(1)训练数据定制服务中各应用领域中采集加工和纯加工服务的营业收入、营业成本和毛利率情况;(2)不同目标客户类型的客户数量、产品销售或服务的具体情况。
请发行人说明:(1)相关产品或服务的分类是否符合行业惯例,是否属于行业通用用语;(2)不同服务形式和应用领域的定制服务从合同签署至最终验收交付的实际购产销过程以及采用目前经营模式的原因;(3)三项智能语音细分类别与训练数据定制服务形式之间的对应关系;(4)训练数据相关的应用服务的具体内容、相关合同的主要权利义务、服务成果以及定价依据等,是否独立于训练数据定制服务和训练数据产品;(5)训练数据定制服务和训练数据产品的目标客户是否存在重合及重合情况,两项业务是否构成替代关系。
答复:
发行人补充披露事项
(1)训练数据定制服务中各应用领域中采集加工和纯加工服务的营业收入、营业成本和毛利率情况
发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(三)毛利及毛利率分析/4、训练数据定制服务各服务形式毛利率情况”中补充披露了下述内容:
报告期内,发行人在训练数据定制服务各应用领域均同时提供采集加工服务和纯加工服务。前述两种业务类型分别主要服务于客户不同阶段的需求:
①客户算法模型初始上线前的训练阶段——采集加工服务:在此阶段,客户的AI技术应用还未对外提供使用,尚处于算法模型的内部训练和模拟阶段,还未取得算法模型对外上线后能收集到的实际数据。为了使得算法模型取得更好的训练效果、更适
8-2-1-5
用于实际场景,客户可向发行人采购[采集加工]类别的训练数据定制服务,发行人将根据客户算法模型的个性化需求,有针对性地采集原料数据,并进行加工处理,从而更好地模拟实际应用场景数据,使得客户的算法模型获得更佳的训练效果。
②客户算法模型上线后的持续优化迭代阶段——纯加工服务:在此阶段,客户的AI算法模型/技术应用已正式上线并对外运营,客户在运营过程中可以收集到大量实际场景下的原料数据。为进一步优化算法模型,客户可向发行人采购[纯加工服务],将运营过程中收集的实际场景原料数据提供给发行人,由发行人对其执行标注等加工工作,形成源自真实应用场景的训练数据,对算法模型进行进一步的训练、优化、迭代。
③客户算法模型的领域拓展阶段——采集加工服务:在此阶段,客户拟对其AI算法模型进行领域拓展(如应用场景拓展、语种/方言拓展等)。与上述阶段①类似,客户需要先对其算法模型进行相应领域的内部训练,暂未取得相应领域下的实际数据,因此可向发行人采购[采集加工服务],以对其算法模型加以训练。
报告期内,训练数据定制服务各领域中采集加工和纯加工服务的营业收入、营业成本和毛利率情况具体如下所示:
8-2-1-6
金额单位:万元
应用 领域 | 业务类别 | 营业收入 | 营业成本 | 毛利率 | ||||||||||
2020年 1-9月 | 2019年 | 2018年 | 2017年 | 2020年 1-9月 | 2019年 | 2018年 | 2017年 | 2020年 1-9月 | 2019年 | 2018年 | 2017年 | |||
智能语音 | 语音识别 | 采集加工服务 (即语音识别采集) | 833.98 | 2,059.97 | 2,809.18 | 1,451.45 | 499.93 | 1,157.17 | 1,606.83 | 741.48 | 40.05% | 43.83% | 42.80% | 48.91% |
纯加工服务 (即语音识别转写) | 2,190.62 | 2,562.42 | 2,960.54 | 1,409.18 | 1,653.27 | 1,740.04 | 2,131.45 | 979.43 | 24.53% | 32.09% | 28.00% | 30.50% | ||
语音合成 | 采集加工服务 | 1,853.80 | 5,653.06 | 3,613.25 | 1,541.13 | 996.11 | 2,173.05 | 1,394.73 | 674.30 | 46.27% | 61.56% | 61.40% | 56.25% | |
纯加工服务 | 149.78 | 675.01 | 506.71 | 492.22 | 48.37 | 235.53 | 189.32 | 146.93 | 67.71% | 65.11% | 62.64% | 70.15% | ||
计算机视觉 | 采集加工服务 | 840.05 | 1,051.77 | 381.37 | 623.27 | 429.24 | 595.38 | 157.49 | 279.64 | 48.90% | 43.39% | 58.70% | 55.13% | |
纯加工服务 | 214.35 | 1,026.70 | 1,287.35 | 199.12 | 131.53 | 573.97 | 749.25 | 131.95 | 38.64% | 44.09% | 41.80% | 33.73% | ||
自然语言 | 采集加工服务 | 445.16 | 288.82 | 205.24 | 126.83 | 238.29 | 63.45 | 108.65 | 68.95 | 46.47% | 78.03% | 47.06% | 45.64% | |
纯加工服务 | 435.06 | 915.16 | 605.91 | 454.04 | 269.23 | 419.08 | 386.31 | 260.18 | 38.12% | 54.21% | 36.24% | 42.70% | ||
合计 | 6,962.82 | 14,232.91 | 12,369.55 | 6,297.23 | 4,265.97 | 6,957.69 | 6,724.04 | 3,282.86 | 38.73% | 51.12% | 45.64% | 47.87% |
2017年、2018年、2019年及2020年1-9月,发行人训练数据定制服务中,各领域采集加工服务收入合计值分别为3,742.68万元、7,009.05万元、9,053.63万元及3,973.00万元;纯加工服务收入合计值分别为2,554.55万元、5,360.51万元、5,179.28万元及2,989.81万元。采集加工服务和纯加工服务均为发行人训练数据定制服务业务的重要形式,报告期内收入贡献比例分别约为60%:
40%,采集加工服务收入贡献度整体高于纯加工服务。
8-2-1-7
其中,在智能语音类别中,语音合成领域纯加工服务的毛利率水平高于语音识别领域纯加工服务,主要原因是:语音合成领域的标注工作涉及音素、韵律、词性等多种标注类型,相对复杂度较高,所需技术处理环节较多,因此毛利率相对高于语音识别领域的纯加工服务。
8-2-1-8
(2)不同目标客户类型的客户数量、产品销售或服务的具体情况。发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(二)主要客户情况/3、各类型目标客户情况”中披露下述相关内容:
发行人的目标客户可分为大型科技公司、人工智能企业、科研机构三类
。截至2020年9月30日,发行人不同目标客户类型的客户数量情况如下:
目标客户类型 | 客户数量 | 客户示例 |
大型科技公司 | 24个品牌、80个客户主体 | 三星、阿里巴巴、微软、腾讯、亚马逊等 |
人工智能企业 | 283个品牌、370个客户主体 | 海康威视、科大讯飞、Naver、Verint等 |
科研机构 | 60个品牌、67个客户主体 | 中国科学院、清华大学等 |
注:上表统计客户均为历史上曾为发行人贡献业务收入或已与发行人签署业务合作协议/合同并实际开展了业务往来的客户群体。
不同目标客户类型的产品销售或服务的具体情况如下:
金额单位:万元
销售收入 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
营业收入 | 占比 | 营业收入 | 占比 | 营业收入 | 占比 | 营业收入 | 占比 | |
大型科技公司 | 9,740.28 | 68.22% | 17,003.58 | 71.58% | 14,188.80 | 73.65% | 7,425.81 | 62.36% |
其中:训练数据定制服务 | 5,555.12 | 38.91% | 11,626.58 | 48.94% | 9,788.06 | 50.81% | 4,344.48 | 36.49% |
训练数据产品 | 4,137.31 | 28.98% | 5,376.49 | 22.63% | 4,400.74 | 22.84% | 3,005.69 | 25.24% |
训练数据相关的应用服务 | 47.86 | 0.34% | 0.51 | 0.00% | - | - | 75.63 | 0.64% |
人工智能企业 | 4,227.75 | 29.61% | 6,049.60 | 25.47% | 4,641.46 | 24.09% | 3,941.94 | 33.11% |
其中:训练数据定制服务 | 1,393.23 | 9.76% | 2,139.52 | 9.01% | 2,187.33 | 11.35% | 1,822.42 | 15.31% |
训练数据产品 | 2,610.03 | 18.28% | 3,583.13 | 15.08% | 2,160.50 | 11.21% | 2,074.59 | 17.42% |
训练数据相关的应用服务 | 224.50 | 1.57% | 326.95 | 1.38% | 293.64 | 1.52% | 44.92 | 0.38% |
科研机构 | 309.32 | 2.17% | 702.63 | 2.96% | 435.50 | 2.26% | 539.35 | 4.53% |
大型科技公司主要为三星、阿里巴巴、微软、腾讯、亚马逊等业务范围较广的知名综合性科技企业,人工智能企业主要为海康威视、科大讯飞等主要专长于人工智能具体技术领域(如智能语音、计算机视觉等)的企业;科研院所主要指中国科学院、清华大学等开展人工智能相关科学研究的研究院、研究所、大专院校等机构。
8-2-1-9
其中:训练数据定制服务 | 14.47 | 0.10% | 466.81 | 1.97% | 394.17 | 2.05% | 130.32 | 1.09% |
训练数据产品 | 266.55 | 1.87% | 216.85 | 0.91% | 40.43 | 0.21% | 409.03 | 3.44% |
训练数据相关的应用服务 | 28.30 | 0.20% | 18.98 | 0.08% | 0.91 | 0.00% | - | - |
营业收入合计 | 14,277.35 | 100.00% | 23,755.81 | 100.00% | 19,265.77 | 100.00% | 11,907.09 | 100.00% |
报告期内,大型科技公司类客户贡献的收入金额最大、占比最高,发行人主要向其销售训练数据定制服务和训练数据产品,其中训练数据定制服务收入占比更高,一方面是由于阿里巴巴、腾讯、百度、微软、三星、亚马逊等大型科技公司近些年加大了在人工智能领域的投入,相应提升了对训练数据产品和服务的采购规模;另一方面是由于发行人通过长期经营树立了品牌形象和市场地位,对大型客户保持了较高的吸引力和黏性。人工智能企业类别客户贡献收入仅次于大型科技公司,发行人向该类客户销售呈现训练数据定制服务和训练数据产品并重的现象,训练数据产品整体销售收入略高于训练数据定制服务。科研机构类客户贡献收入占比较低,发行人向其销售的也主要是训练数据定制服务和训练数据产品。发行人说明事项
(1)相关产品或服务的分类是否符合行业惯例,是否属于行业通用用语;
发行人将主要产品或服务按业务类型及下游应用领域划分符合行业惯例,属于行业通用用语。具体说明如下:
1、主要产品或服务按业务类型划分
发行人将主要产品及服务划分为训练数据定制服务、训练数据产品及训练数据相关的应用服务。前述分类主要是依据为客户提供产品服务的业务模式及交付物的权属进行,主要划分为根据客户需求提供服务、交付的训练数据权属归属于客户的定制服务,以及可反复销售使用授权、发行人拥有知识产权的通用成品训练数据集。以同行业竞争对手标贝科技为例,根据其官方网站披露,其将产品服务划分为“提供服务”及“热销数据”两类,与发行人分类方式相同。
发行人的前述分类符合行业惯例,是行业通用用语。
2、主要产品或服务按下游应用领域划分
发行人将训练数据定制服务、训练数据产品均按应用领域划分,分为智能语音、计算机视觉及自然语言三大领域。
8-2-1-10
前述分类主要是按发行人提供的训练数据对应的下游AI应用领域划分,智能语音、计算机视觉及自然语言是当前人工智能发展阶段最为主流的三个应用领域,是众多人工智能行业介绍、技术架构介绍中的通行标准。如中国信通院与中国人工智能产业发展联盟共同编纂的《人工智能发展白皮书技术架构篇(2018年)》、中国电子技术标准化研究院编纂的《人工智能标准化白皮书2018版》等,均使用智能语音、计算机视觉、自然语言处理作为人工智能技术的领域划分用语进行呈现。
不同应用领域的训练数据在数据形态方面存在差异,对应采集的原料数据类型、执行的标注工作类型也有所差异,发行人以此分类具备合理性。以同行业竞争对手标贝科技为例,其也按应用领域对其数据产品和服务加以分类,如语音识别数据库、语音合成定制等。
发行人的前述分类符合行业惯例,属于行业通用用语。
(2)不同服务形式和应用领域的定制服务从合同签署至最终验收交付的实际购产销过程以及采用目前经营模式的原因;
一、不同服务形式和应用领域的定制服务从合同签署至最终验收交付的实际购产销过程
发行人各应用领域的定制服务的购产销过程基本相同。
在采购过程中,因各应用领域涉及的原料数据类型不同,对应采购的采集、标注服务类型也有所不同,例如:智能语音领域需要采集的原料数据主要为语音数据等,对应的标注类型有转写、校对、韵律、词性、音素标注等;计算机视觉领域涉及的原料数据主要为图像、视频数据等,对应的标注类型有属性标注、主观标注等;自然语言领域对应的原料数据主要为对话文本等,对应的标注类型有词法标注、语音、语法、语用相关标注等。
但各应用领域的采购流程整体相同。因此下文区分服务形式说明发行人定制服务的购产销过程,不区分应用领域。
发行人的训练数据定制服务实质为按客户需求生产训练数据集并交付予客户,因此其购产销过程为以销定产的按需生产过程。采集加工、纯加工两种服务形式的购产销过程具体如下所示:
8-2-1-11
注:发行人的质检工作贯穿采集、加工全过程(具体参见招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况/(三)主要经营模式/2、生产或服务模式”),上图主要列示采集标注完成后的大规模质检环节情况。
二、采用目前经营模式的原因
发行人的训练数据定制服务致力于以客户需求为导向,在客户自身技术和产品研发的不同阶段满足其不同需求,因此,在该类服务领域,发行人根据客户的不同需要可提供采集加工和纯加工两种服务形式:
8-2-1-12
1、新产品或应用首次研发并上市的准备阶段,客户可使用发行人提供的训练数据定制服务-采集加工服务,定制更符合其算法模型运用场景的训练数据;
2、客户的算法模型或应用的实际运行阶段,客户的算法模型将可获取实际场景数据,为进一步实现算法模型性能的持续提升,客户可使用训练数据定制服务-纯加工服务,将收集到的实际场景数据交由发行人进行加工,定制训练数据用于进一步训练算法模型;
3、在应用领域拓展及语种拓展阶段,客户可使用发行人提供的训练数据定制服务-采集加工服务等,定制特定领域或语种的训练数据。
(3)三项智能语音细分类别与训练数据定制服务形式之间的对应关系;
三项智能语音细分类别与训练数据定制服务形式之间的对应关系如下:
产品/服务类型 | 应用领域 | 产品/服务细分类别 | 说明 | |
训练数据定制服务 | 智能语音 | 语音识别 | 语音识别采集 | 采集加工服务 |
语音识别转写 | 纯加工服务 | |||
语音合成 | 采集加工服务、纯加工服务 |
发行人将训练数据定制服务及训练数据产品均按下游应用领域进行了划分。在智能语音领域,发行人又根据所提供的训练数据服务的智能语音算法模型类别,划分为语音识别和语音合成两个技术领域。
1、语音识别:语音识别(Automatic Speech Recognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器自动将语音信号转换为对应的文本信息。对于服务语音识别算法模型的训练数据定制服务,发行人根据下游客户需求的实际情况和公司内部精细化经营管理需要,依据是否需要发行人采集原料数据进行了划分,分为语音识别采集(采集加工服务,发行人采集数据并加工)及语音识别转写(纯加工服务,发行人对客户提供的数据进行加工)两类。
2、语音合成:语音合成(Text to Speech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。发行人将服务于语音合成算法模型的训练数据定制服务划分为语音合成类别,该类别定制服务同时包含采集加工服务及纯加工服务,因纯加工服务收入规模较小,发行人未单独再将该类别进行划分。
综上,发行人依据下游算法模型的技术类型将训练数据服务分为语音合成、语音识别两大类别;对于语音识别类别又根据发行人是否需要采集原料数据划分为语音识别采
8-2-1-13
集(采集加工服务)、语音识别转写(纯加工服务)两小类,总共分为语音合成、语音识别采集、语音识别转写3个类别。
(4)训练数据相关的应用服务的具体内容、相关合同的主要权利义务、服务成果以及定价依据等,是否独立于训练数据定制服务和训练数据产品;
一、训练数据相关的应用服务的具体内容、相关合同的主要权利义务、服务成果以及定价依据
(一)具体内容
训练数据相关的应用服务是指发行人基于其生产的训练数据为客户提供AI算法模型相关的训练服务,运用训练数据研发能力助力下游客户完成其AI算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属AI算法模型,提高AI技术应用效果。
具体内容主要包括:①依据客户需求,在客户通用算法模型的基础上,为客户定制开发特定语种/方言、应用领域的AI算法模型或②使用特定语种/方言、特定应用领域的训练数据,对客户的AI算法模型进行训练,使客户的算法模型实现语种/方言覆盖能力的拓展,满足其在特定行业、地区或者特定应用领域的运用需要。
(二)相关合同的主要权利义务:具体约定根据具体合同有所差异,核心约定通常为:客户对其算法模型相关的软件功能提出要求,发行人为客户的AI算法模型相关软件系统提供具体应用层面的开发、调试、优化、安装、使用培训等技术支持和实施服务工作,客户提供相应配合并支付项目费用。
(三)服务成果及形式:通常为软件形式或软硬件一体化销售。
(四)定价依据:根据客户的具体需求,评估项目实施难度、周期和成本,针对每一个项目进行单独的价格协商后确定价格。
(五)补充举例说明
发行人为某主要客户提供某特定地区方言的算法模型训练服务,具体情况为:该客户拟开发覆盖多语种/方言的语音识别算法模型,但因涉及的语种/方言类别众多、训练工作量较大,为节省模型开发训练时间、提升工作效率,该客户将某一特定地区方言的少量算法模型的开发、训练工作交由发行人执行。在此服务项目过程中,发行人执行的具体工作内容及义务为:运用自有的特定方言训练数据对客户的算法模型进行训练和调优,使其达到客户要求的语音识别准确率效果,之后将训练、调优完成后的算法模型(软件形式)交付予客户。
8-2-1-14
发行人为客户开发、训练的算法模型需要依托一定的运行环境、硬件系统,例如服务器等硬件设备需要满足一定的参数、设备要求。为节省时间、提升效率,少数客户在委托发行人为其进行少量算法模型开发、训练工作的同时,也直接向发行人采购符合算法模型运行要求的硬件设备,发行人直接将开发、训练完成的算法模型部署在硬件设备中,以软硬件结合的形式向客户交付算法模型。
二、是否独立于训练数据定制服务、训练数据产品
训练数据相关的应用服务独立于训练数据定制服务、训练数据产品,具体说明如下:
训练数据定制服务、训练数据产品的核心都是为客户提供训练数据;而训练数据相关的应用服务不涉及为客户提供训练数据,而是主要为客户的AI算法模型提供应用层面的开发、调试、优化、安装等相关训练服务,与前述两项业务完全独立。
(5)训练数据定制服务和训练数据产品的目标客户是否存在重合及重合情况,两项业务是否构成替代关系。
一、训练数据定制服务和训练数据产品的目标客户范围一致
训练数据定制服务、训练数据产品业务的核心均在于为客户提供可供AI算法模型训练使用的训练数据,两类业务目标客户范围一致,均为人工智能产业链上的各类机构,包括阿里巴巴、腾讯、百度、微软、三星等大型科技公司,科大讯飞、商汤科技、云知声、海康威视等人工智能企业,及中国科学院、清华大学等科研机构。对同一客户而言,训练数据定制服务和训练数据产品可运用于不同的模型训练阶段和训练目标。
二、训练数据定制服务及训练数据产品存在一定替代关系,二者共同构成发行人完整的训练数据服务体系
训练数据定制服务与训练数据产品均为公司主营业务的重要组成部分,二者在公司整体销售策略的把控下存在一定的替代关系,共同构成公司完整的训练数据服务体系。阿里巴巴、腾讯、百度、微软、三星等公司主要客户普遍存在同时采购训练数据定制服务与训练数据产品的情况,训练数据定制服务可满足客户设备系统独特性、应用领域特殊性持续提升衍生的差异化训练数据需求;训练数据产品则可满足客户通用型算法模型需要的通用训练数据的快速采购需求。在客户自身技术和产品研发的不同阶段,发行人的训练数据定制服务和训练数据产品都可以针对不同需求提供支持,如新产品或应用首次研发并上市(使用训练数据定制服务或训练数据产品)、持续性能提升(使用训练数据定制服务-纯加工服务)、应用领域拓展(使用训练数据定制服务或针对特定领域的训练数据产品)、语种拓展(使用训练数据定制服务或使用多语种训练数据产品)等。
8-2-1-15
9.2关于主要客户和境内外销售
招股说明书披露:(1)报告期各期发行人营业收入分别为11,907.09万元、19,265.77万元和23,755.81万元,前五大客户占当期营业收入的比重分别为51.22%、
59.06%和53.88%;(2)报告期各期境内销售收入占比分别为70.94%、69.00%和
50.40%,逐年下降;(3)报告期内,发行人分别取得境外收入3,460.17万元、5,972.00万元和11,782.07万元,占主营业务收入的比例分别为29.06%、31.00%和
49.60%。
请发行人补充披露:(1)按照产品类别披露报告期各期前五大客户以及主要客户的获取方式、合作历史,是否存在应履行公开招投标程序而未履行的情形;(2)报告期各期前五大客户的直接签约方或接受服务方名称、销售内容及其对应的营业收入和占比,结合报告期各期对该等客户的项目服务量、产品数量销售情况,分析发行人对上述客户在报告期各期的营业收入变化原因;(3)境内外前五大客户的公司名称、销售内容及其对应的营业收入和占比;(4)报告期内境外销售具体情况,包括但不限于国家地区、产品种类、销售量、销售单价、销售金额及占比,境外销售模式及流程、主要客户,境外经营是否符合当地规定以及进口国同类产品的竞争格局;发行人境外销售收入逐年上升的原因,是否来源于新增客户,发行人海外业务拓展采取了哪些措施,是否具有可持续性,结合当前疫情、国际形势等因素说明对于发行人经营状况的影响及发行人的应对措施;(5)报告期内训练数据产品的具体销售情况,包括主要内容、资源类型、数量、授权使用使用次数、平均售价等;(6)训练数据产品是否存在数据资源被泄露、盗版等可能,发行人所采取的保护措施及其有效性,相关风险揭示是否充分。
请发行人说明:(1)上述客户的基本情况及合作历史,发行人获取该等客户的渠道及方式;(2)2019年度境内销售收入2018年下降的原因,是否系市场竞争加剧所致。
请保荐机构、申报会计师对上述事项进行核查,并发表明确意见。
答复:
发行人补充披露事项
8-2-1-16
(1)按照产品类别披露报告期各期前五大客户以及主要客户的获取方式、合作历史,是否存在应履行公开招投标程序而未履行的情形;发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(二)主要客户情况/4、按产品类别分类的前五大客户情况及7、涉及公开招投标程序的情况说明”中披露下述回复的相关内容:
一、按照产品类别披露报告期各期前五大客户以及主要客户的获取方式、合作历史
报告期内,训练数据定制服务和训练数据产品为发行人最主要的业务类别,各年收入占比合计均超过98%;训练数据相关的应用服务收入占比较低,尚处于起步拓展阶段。因此下文主要针对训练数据定制服务、训练数据产品披露前五大客户及其具体情况:
(一)训练数据定制服务
训练数据定制服务各期前五大客户及其收入情况如下:
金额单位:万元
2020年1-9月 | |||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据定制服务收入比重 | 占营业收入比重 | |
1 | 微软 | 1,763.17 | 25.32% | 12.35% | |
2 | 阿里巴巴 | 1,125.65 | 16.17% | 7.88% | |
3 | 腾讯 | 755.36 | 10.85% | 5.29% | |
4 | 某国际消费电子产品厂商 | 732.91 | 10.53% | 5.13% | |
5 | 百度 | 334.95 | 4.81% | 2.35% | |
合计 | 4,712.04 | 67.67% | 33.00% | ||
训练数据定制服务收入总额 | 6,962.82 | 100.00% | 48.77% | ||
营业收入总额 | 14,277.35 | - | 100.00% | ||
2019年 | |||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据定制服务收入比重 | 占营业收入比重 | |
1 | 三星 | 4,189.52 | 29.44% | 17.64% | |
2 | 阿里巴巴 | 2,150.34 | 15.11% | 9.05% | |
3 | 微软 | 1,385.40 | 9.73% | 5.83% | |
4 | 腾讯 | 1,074.74 | 7.55% | 4.52% | |
5 | 某国际消费电子产品厂商 | 920.39 | 6.47% | 3.87% | |
合计 | 9,720.39 | 68.30% | 40.92% |
8-2-1-17
训练数据定制服务收入总额 | 14,232.91 | 100.00% | 59.91% | |
营业收入总额 | 23,755.81 | - | 100.00% | |
2018年 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据定制服务收入比重 | 占营业收入比重 |
1 | 阿里巴巴 | 4,452.41 | 35.99% | 23.11% |
2 | 三星 | 2,269.89 | 18.35% | 11.78% |
3 | 腾讯 | 1,193.79 | 9.65% | 6.20% |
4 | 微软 | 972.26 | 7.86% | 5.05% |
5 | 百度 | 391.19 | 3.16% | 2.03% |
合计 | 9,279.52 | 75.02% | 48.17% | |
训练数据定制服务收入总额 | 12,369.55 | 100.00% | 64.20% | |
营业收入总额 | 19,265.77 | - | 100.00% | |
2017年 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据定制服务收入比重 | 占营业收入比重 |
1 | 三星 | 1,112.18 | 17.66% | 9.34% |
2 | 阿里巴巴 | 783.47 | 12.44% | 6.58% |
3 | 腾讯 | 764.41 | 12.14% | 6.42% |
4 | 微软 | 552.94 | 8.78% | 4.64% |
5 | 某国际消费电子产品厂商 | 533.03 | 8.46% | 4.48% |
合计 | 3,746.03 | 59.49% | 31.46% | |
训练数据定制服务收入总额 | 6,297.23 | 100.00% | 52.89% | |
营业收入总额 | 11,907.09 | - | 100.00% |
8-2-1-18
(二)训练数据产品
训练数据产品各期前五大客户及其收入情况如下:
金额单位:万元
2020年1-9月 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据产品收入比重 | 占营业收入比重 |
1 | 字节跳动 | 753.15 | 10.74% | 5.28% |
2 | 669.74 | 9.55% | 4.69% | |
3 | 微软 | 625.96 | 8.92% | 4.38% |
4 | 客户1 | 490.48 | 6.99% | 3.44% |
5 | 阿里巴巴 | 370.73 | 5.29% | 2.60% |
合计 | 2,910.05 | 41.49% | 20.38% | |
训练数据产品收入总额 | 7,013.88 | 100.00% | 49.13% | |
营业收入总额 | 14,277.35 | - | 100.00% | |
2019年 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据产品收入比重 | 占营业收入比重 |
1 | 微软 | 1,490.80 | 16.25% | 6.28% |
2 | 亚马逊 | 901.45 | 9.82% | 3.79% |
3 | 客户2 | 666.66 | 7.26% | 2.81% |
4 | 三星 | 572.03 | 6.23% | 2.41% |
5 | 中国某大型科技公司 | 525.53 | 5.73% | 2.21% |
合计 | 4,156.47 | 45.29% | 17.50% | |
训练数据产品收入总额 | 9,176.47 | 100.00% | 38.63% | |
营业收入总额 | 23,755.81 | - | 100.00% | |
2018年 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据产品收入比重 | 占营业收入比重 |
1 | 804.89 | 12.19% | 4.18% | |
2 | 阿里巴巴 | 726.67 | 11.01% | 3.77% |
3 | 中国某大型科技公司 | 622.51 | 9.43% | 3.23% |
4 | 百度 | 497.10 | 7.53% | 2.58% |
5 | 亚马逊 | 422.42 | 6.40% | 2.19% |
合计 | 3,073.60 | 46.56% | 15.95% | |
训练数据产品收入总额 | 6,601.67 | 100.00% | 34.27% | |
营业收入总额 | 19,265.77 | - | 100.00% |
8-2-1-19
2017年 | ||||
序号 | 客户名称(品牌) | 营业收入 | 占训练数据产品收入比重 | 占营业收入比重 |
1 | 腾讯 | 1,005.64 | 18.32% | 8.45% |
2 | 微软 | 505.93 | 9.22% | 4.25% |
3 | 三星 | 426.75 | 7.77% | 3.58% |
4 | 阿里巴巴 | 326.84 | 5.95% | 2.74% |
5 | 中国某大型科技公司 | 239.76 | 4.37% | 2.01% |
合计 | 2,504.92 | 45.63% | 21.04% | |
训练数据产品收入总额 | 5,489.31 | 100.00% | 46.10% | |
营业收入总额 | 11,907.09 | - | 100.00% |
(三)主要客户的获取方式、合作历史
发行人获取客户的方式主要包括:
情形一:于公司成立初期即开始合作,早期客户开拓主要来自公司创始人贺琳多年积累的人脉基础;
情形二:通过学术会议接触,之后经过客户拜访、意向接触、商务洽谈等步骤建立合作关系;
情形三:因公司在行业内有良好的口碑,合作过的客户向业内其他客户推荐发行人从而建立联系,进而开展合作;
情形四:通过网络挖掘,获得客户的公共联系方式,然后有针对性地向客户发送邮件主动进行宣传推广,进而建立联系、开展合作;
情形五:通过电话销售,获得客户联系人信息,进而通过邮件沟通、客户拜访等方式获取客户需求,进行合作;
情形六:客户通过公司官网主动向发行人留言咨询,后续通过意向接触、商务洽谈等步骤建立合作。
上述主要客户的获取方式、合作历史情况如下:
主要客户名称(品牌) | 获取方式 | 合作起始时间 |
阿里巴巴 | 情形二 | 2010 |
百度 | 情形三 | 2011 |
三星 | 情形二 | 2010 |
腾讯 | 情形二、情形三 | 2012 |
8-2-1-20
微软 | 情形一 | 2005 |
中国某大型科技公司 | 情形二、情形四 | 2012 |
亚马逊 | 情形二 | 2012 |
某国际消费电子产品厂商 | 情形四 | 2010 |
情形二、情形五 | 2017 | |
客户1 | 情形三、情形六 | 2016 |
客户2 | 情形三、情形六 | 2015 |
字节跳动 | 情形三 | 2017 |
报告期内,发行人的销售模式与行业普遍模式相同,即主要采用直接对接并服务客户的直销模式进行销售。基于多年的行业经验和知识储备,公司以高品质的训练数据产品及服务吸引客户,并在持续服务的过程中提升服务价值和客户黏度。公司获取客户的具体方式主要是:通过口碑传播(客户介绍)、参与学术会议、官方网站展示等方式建立品牌知名度以及与客户之间的沟通联系,后续按照客户的采购要求以商务谈判、招投标等形式获取业务机会。初次获取客户后,发行人会通过常规方式维持与客户的稳定交流和持续沟通,不断挖掘新的业务机会、开展合作,具体举措包括:及时响应客户主动下达的订单需求,与客户及时沟通并相应提供产品服务;不定期联系、拜访客户,了解客户业务最新发展动向和潜在的训练数据需求,并向客户推介发行人新增的训练数据产品、服务等。
二、是否存在应履行公开招投标程序而未履行的情形
(一)应履行公开招投标程序的情形说明
根据《中华人民共和国政府采购法》及其实施条例,政府采购是指各级国家机关、事业单位和团体组织,使用财政性资金采购依法制定的集中采购目录以内的或者采购限额标准以上的货物、工程和服务的行为,政府采购方式包括公开招标、邀请招标、竞争性谈判、单一来源采购、询价等;政府采购限额标准,属于中央预算的政府采购项目,由国务院确定并公布;属于地方预算的政府采购项目,由省、自治区、直辖市人民政府或者其授权的机构确定并公布。
报告期内,发行人客户主要为人工智能产业链上的各类知名机构,如阿里巴巴、腾讯、百度、微软、三星、亚马逊等提供服务,仅少量业务涉及根据上述规定应执行政府采购制度的国家机关、事业单位等客户(包含中央预算单位、地方预算单位),该等情形极少且销售额较小,具体参见下述(二)论述。
(二)发行人不存在应履行公开招投标程序而未履行的情形
8-2-1-21
1、向中央预算单位客户销售的情形
根据《国务院办公厅关于印发中央预算单位2017-2018年政府集中采购目录及标准的通知》(国办发〔2016〕96号)、《财政部关于中央预算单位政府集中采购目录及标准有关问题的通知》(财库(2019)2号)、《国务院办公厅关于印发中央预算单位政府集中采购目录及标准(2020年版)的通知》(国办发〔2019〕55号),报告期内,中央预算单位进行政府采购,单项采购金额达到200万元以上的,必须采用公开招标方式。报告期内,发行人涉及向科研院所等中央预算单位销售的销售合同共77份,合同金额合计1,075.70万元,单份合同金额最高为140万元,未达到依据上述规定需采用公开招标方式的200万元单项采购金额标准,不存在应履行公开招投标程序而未履行的情形。
2、向地方预算单位客户销售的情形
报告期内,发行人涉及向地方所属高校等地方预算单位销售的销售合同共10份,合同金额合计43.16万元,单份合同金额最高为15万元。经查询相应各地招投标相关规定,上述合同金额均未达到执行政府采购制度的限额标准,不存在应履行公开招投标程序而未履行的情形。
综上,报告期内发行人不存在应履行公开招投标程序而未履行的情形。
(2)报告期各期前五大客户的直接签约方或接受服务方名称、销售内容及其对应的营业收入和占比,结合报告期各期对该等客户的项目服务量、产品数量销售情况,分析发行人对上述客户在报告期各期的营业收入变化原因;
发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(二)主要客户情况/2、前五大客户销售内容及营业收入变动分析”中披露下述回复的相关内容:
报告期内各期,发行人前五大客户的直接签约方或接受服务方名称、销售内容及其对应的营业收入和占比明细具体如下:
单位:万元
2020年1-9月 | |||||
序号 | 客户 品牌 | 直接签约方/接受服务方名称 | 营业收入 | 占营业收入比重 | 销售内容 |
1 | 微软 | 微软(中国)有限公司、Microsoft Corporation | 2,399.75 | 16.81% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务及训练产品、计算机视觉-训练数据定制服务、训练数据相关 |
8-2-1-22
的应用服务 | |||||
2 | 阿里巴巴 | 淘宝(中国)软件有限公司、支付宝(中国)网络技术有限公司、浙江天猫技术有限公司、阿里云计算有限公司、阿里巴巴丝路有限公司、斑马网络技术有限公司、浙江菜鸟供应链管理有限公司、阿里巴巴科技(北京)有限公司、阿里巴巴(中国)网络技术有限公司 | 1,534.12 | 10.75% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务及训练数据产品、计算机视觉-训练数据定制服务及训练数据产品、训练数据相关的应用服务 |
3 | 腾讯 | 腾讯科技(成都)有限公司、腾讯科技(深圳)有限公司、Tencent Mobile International Limited、财付通支付科技有限公司 | 1,079.09 | 7.56% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务及训练数据产品 |
4 | 字节跳动 | 北京有竹居网络技术有限公司、北京吉云互动科技有限公司 | 822.42 | 5.76% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据产品 |
5 | 某国际消费电子产品厂商 | 732.91 | 5.13% | 自然语言-训练数据定制服务、计算机视觉-训练数据定制服务 | |
合计 | 6,568.29 | 46.00% | |||
营业收入总额 | 14,277.35 | 100.00% | |||
2019年 | |||||
序号 | 客户 品牌 | 直接签约方/接受服务方名称 | 营业收入 | 占营业收入比重 | 销售内容 |
1 | 三星 | Samsung Electronics Co., Ltd.、北京三星通信技术研究有限公司、Samsung R&D Institute India-Bangalore Pvt. Ltd. | 4,762.06 | 20.05% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务 |
2 | 微软 | 微软(中国)有限公司、 Microsoft Corporation、Microsoft India R&D Private Limited | 2,876.20 | 12.11% | 智能语音-训练数据定制服务及训练数据产品、计算机视觉-训练数据定制服务、自然语言-训练数据定制服务及训练数据产品 |
3 | 阿里巴巴 | 淘宝(中国)软件有限公司、浙江天猫技术有限公司、广州神马移动信息科技有限公司、广州阿里巴巴文学信息技术有限公司、阿里云计算有限公司、支付宝(中国)网络技术有限公司、浙江菜鸟供应链管理有限公司、阿里巴巴(中国)网络技术有限公司、上海盒马网络科技有限公司、阿里巴巴俪人购(上海)电 | 2,208.26 | 9.30% | 智能语音-训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务;自然语言-训练数据定制服务及训练数据产品 |
8-2-1-23
子商务有限公司、阿里巴巴科技(北京)有限公司 | |||||
4 | 亚马逊 | Amazon Web Services, Inc. | 1,492.98 | 6.28% | 智能语音-训练数据产品、智能语音-训练数据定制服务 |
5 | 腾讯 | 腾讯科技(成都)有限公司、腾讯科技(深圳)有限公司、深圳市腾讯计算机系统有限公司、财付通支付科技有限公司 | 1,459.31 | 6.14% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务及训练数据产品 |
合计 | 12,798.80 | 53.88% | |||
营业收入总额 | 23,755.81 | 100.00% | |||
2018年 | |||||
序号 | 客户 品牌 | 直接签约方/接受服务方名称 | 营业收入 | 占营业收入比重 | 销售内容 |
1 | 阿里巴巴 | 淘宝(中国)软件有限公司、阿里巴巴(中国)网络技术有限公司、浙江天猫技术有限公司、广州阿里巴巴文学信息技术有限公司、支付宝(中国)网络技术有限公司、阿里云计算有限公司、广州阿里巴巴文学信息技术有限公司北京分公司 | 5,179.07 | 26.88% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务及训练数据产品、计算机视觉-训练数据定制服务 |
2 | 三星 | Samsung Electronics Co., Ltd.、北京三星通信技术研究有限公司、Samsung R&D Institute India-Bangalore Pvt. Ltd. | 2,436.81 | 12.65% | 智能语音-训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务;自然语言-训练数据定制服务及训练数据产品 |
3 | 腾讯 | 腾讯科技(深圳)有限公司、深圳市腾讯计算机系统有限公司、腾讯科技(成都)有限公司、腾讯科技(上海)有限公司、腾讯数码(天津)有限公司 | 1,574.16 | 8.17% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务 |
4 | 微软 | 微软(中国)有限公司、Microsoft Corporation | 1,299.73 | 6.75% |
5 | 百度 | 北京百度网讯科技有限公司、百度国际科技(深圳)有限公司、百度时代网络技术(北京)有限公司、百度在线网络技术(北京)有限公司 | 888.29 | 4.61% | 智能语音-训练数据定制服务及训练数据产品;自然语言训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务、及训练数据产品 |
合计 | 11,378.06 | 59.06% | |||
营业收入总额 | 19,265.77 | 100.00% |
8-2-1-24
2017年 | |||||
序号 | 客户 品牌 | 直接签约方/接受服务方名称 | 营业收入 | 占营业收入比重 | 销售内容 |
1 | 腾讯 | 腾讯科技(深圳)有限公司、深圳市腾讯计算机系统有限公司、腾讯科技(上海)有限公司 | 1,770.05 | 14.87% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务及训练数据产品、计算机视觉-训练数据定制服务及训练数据产品 |
2 | 三星 | 北京三星通信技术研究有限公司、Samsung Electronics Co., Ltd. | 1,553.08 | 13.04% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务及训练数据产品;计算机视觉-训练数据定制服务;训练数据相关的应用服务 |
3 | 阿里巴巴 | 阿里云计算有限公司、淘宝(中国)软件有限公司、浙江天猫技术有限公司、广州神马移动信息科技有限公司、阿里巴巴(北京)软件服务有限公司、支付宝(中国)网络技术有限公司、浙江阿里巴巴机器人有限公司、阿里巴巴(中国)网络技术有限公司 | 1,132.01 | 9.51% | 智能语音-训练数据定制服务及训练数据产品;自然语言-训练数据定制服务及训练数据产品;计算机视觉训练数据定制服务及训练数据产品;训练数据相关的应用服务 |
4 | 微软 | 微软(中国)有限公司、Microsoft Corporation | 1,058.87 | 8.89% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务及训练数据产品 |
5 | 百度 | 北京百度网讯科技有限公司 | 585.29 | 4.92% | 智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务 |
合计 | 6,099.29 | 51.22% | |||
营业收入总额 | 11,907.09 | 100.00% |
报告期内,发行人各期前五大客户整体较为稳定,主要包括三星、微软、阿里巴巴、亚马逊、腾讯、百度及字节跳动、某国际消费电子产品厂商共计8个人工智能产业链上的知名机构。对于前述客户在报告期内贡献的营业收入变动情况分析如下:
前述主要客户在报告期内的营业收入变动情况:
金额单位:万元
项目 | 营业收入 | |||
2020年1-9月 | 2019年 | 2018年 | 2017年 | |
主要客户合计 | 7,421.45 | 14,391.30 | 12,219.40 | 6,714.92 |
8-2-1-25
前述8个主要客户在2017-2019年间贡献的营业收入合计数均持续增长。2020年1-9月,由于部分客户前期在一些领域向发行人采购了较大规模的训练数据,可以支撑其在一段时间内的产品应用拓展和性能迭代等需求,或因部分客户的研发节奏安排,其在2020年1-9月针对特定领域的训练数据需求量有所减少,导致当期采购量有所下降,因此2020年1-9月主要客户贡献的收入规模有所减小。
(3)境内外
前五大客户的公司名称、销售内容及其对应的营业收入和占比;
发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(二)主要客户情况/5、境内外前五大客户及对其销售情况”中披露下述回复的相关内容:
一、境内前五大客户及其情况
金额单位:万元
2020年1-9月 | |||||
序号 | 客户品牌 | 营业收入 | 占境内收入比重 | 占营业收入比重 | 销售内容 |
1 | 微软 | 1,819.99 | 21.02% | 12.75% | 智能语音-训练数据定制服务、智能语音-训练数据产品、计算机视觉-训练数据定制服务、自然语言-训练数据定制服务、训练数据相关的应用服务 |
2 | 阿里巴巴 | 1,534.12 | 17.72% | 10.75% | 智能语音-训练数据定制服务、智能语音-训练数据产品、计算机视觉-训练数据定制服务、计算机视觉-训练数据产品、自然语言-训练数据定制服务、自然语言-训练数据产品、训练数据相关的应用服务 |
3 | 腾讯 | 1,068.24 | 12.34% | 7.48% | 智能语音-训练数据定制服务、智能语音-训练数据产品、计算机视觉-训练数据定制服务、计算机视觉-训练数据产品、自然语言-训练数据定制服务 |
4 | 字节跳动 | 822.42 | 9.50% | 5.76% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据产品 |
5 | 中国某大型科技公司 | 514.72 | 5.94% | 3.61% | 智能语音-训练数据定制服务、智能语音-训练数据产品、计算机视觉-训练数据定制服务、计算机视觉-训练数据产品、自然语言-训练数据定制服务 |
合计 | 5,759.49 | 66.52% | 40.34% |
此处以客户主体所在地区划分境内外客户;部分客户品牌在多个国家/地区均有主体分布,因此可能同时为发行人境内前五大客户及境外前五大客户。
8-2-1-26
境内收入总额 | 8,658.02 | 100.00% | 60.64% | ||
营业收入总额 | 14,277.35 | 100.00% | |||
2019年 | |||||
序号 | 客户品牌 | 营业收入 | 占境内收入比重 | 占营业收入比重 | 销售内容 |
1 | 阿里巴巴 | 2,208.26 | 18.44% | 9.30% | 智能语音-训练数据定制服务、计算机视觉-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务 |
2 | 腾讯 | 1,459.31 | 12.19% | 6.14% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据产品、计算机视觉-训练数据产品、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务 |
3 | 微软 | 1,415.71 | 11.82% | 5.96% | 智能语音-训练数据定制服务、计算机视觉-训练数据定制服务、自然语言-训练数据定制服务、智能语音-训练数据产品 |
4 | 中国某大型科技公司 | 1,019.94 | 8.52% | 4.29% | 计算机视觉-训练数据产品、智能语音-训练数据定制服务、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据产品 |
5 | 百度 | 544.90 | 4.55% | 2.29% | 智能语音-训练数据产品、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务、智能语音-训练数据定制服务 |
合计 | 6,648.11 | 55.52% | 27.99% | ||
境内收入总额 | 11,973.75 | 100.00% | 50.40% | ||
营业收入总额 | 23,755.81 | 100.00% | |||
2018年 | |||||
序号 | 客户品牌 | 营业收入 | 占境内收入比重 | 占营业收入比重 | 销售内容 |
1 | 阿里巴巴 | 5,179.07 | 38.96% | 26.88% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务、自然语言-训练数据产品、计算机视觉-训练数据定制服务 |
2 | 腾讯 | 1,574.16 | 11.84% | 8.17% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据产品、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务 |
3 | 微软 | 957.75 | 7.20% | 4.97% | 计算机视觉-训练数据定制服务、智能语音-训练数据定制服务、自然语言-训练数据定制服务 |
4 | 百度 | 888.29 | 6.68% | 4.61% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务、自然语言-训练数据产品 |
5 | 中国某大型科技公司 | 650.97 | 4.90% | 3.38% | 智能语音-训练数据产品、自然语言-训练数据产品、计算机视觉-训练数据产品、自然语言-训练数据定制服务、智能语音-训练数据定制服务 |
8-2-1-27
合计 | 9,250.24 | 69.58% | 48.01% | ||
境内收入总额 | 13,293.77 | 100.00% | 69.00% | ||
营业收入总额 | 19,265.77 | 100.00% | |||
2017年 | |||||
序号 | 客户品牌 | 营业收入 | 占境内收入比重 | 占营业收入比重 | 销售内容 |
1 | 腾讯 | 1,770.05 | 20.95% | 14.87% | 智能语音-训练数据产品、智能语音-训练数据定制服务、自然语言-训练数据产品、计算机视觉-训练数据定制服务、计算机视觉-训练数据产品 |
2 | 三星 | 1,439.12 | 17.04% | 12.09% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务、自然语言-训练数据产品、计算机视觉-训练数据定制服务、其他-训练数据相关的应用服务 |
3 | 阿里巴巴 | 1,132.01 | 13.40% | 9.51% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务、自然语言-训练数据产品、计算机视觉-训练数据产品、计算机视觉-训练数据定制服务 |
4 | 百度 | 585.29 | 6.93% | 4.92% | 智能语音-训练数据定制服务、智能语音-训练数据产品、自然语言-训练数据定制服务 |
5 | 微软 | 580.87 | 6.88% | 4.88% | 智能语音-训练数据定制服务、自然语言-训练数据定制服务、计算机视觉-训练数据定制服务、智能语音-训练数据产品、计算机视觉-训练数据产品 |
合计 | 5,507.34 | 65.20% | 46.25% | ||
境内收入总额 | 8,446.92 | 100.00% | 70.94% | ||
营业收入总额 | 11,907.09 | 100.00% |
二、境外前五大客户及其情况
金额单位:万元
2020年1-9月 | |||||
序号 | 客户品牌 | 营业收入 | 占境外收入比重 | 占营业收入比重 | 销售内容 |
1 | 某国际消费电子产品厂商 | 732.91 | 13.04% | 5.13% | 计算机视觉-训练数据定制服务、自然语言-训练数据定制服务 |
2 | 669.74 | 11.92% | 4.69% | 智能语音-训练数据产品 | |
3 | 微软 | 579.76 | 10.32% | 4.06% | 智能语音-训练数据产品、自然语言-训练数据产品、训练数据相关的应用服务 |
4 | 客户1 | 490.48 | 8.73% | 3.44% | 智能语音-训练数据产品 |
5 | 客户3 | 307.69 | 5.48% | 2.16% | 智能语音-训练数据定制服务、智能语音-训练数据产品、计算机视觉- |
8-2-1-28
训练数据定制服务 | |||||
合计 | 2,780.57 | 49.48% | 19.48% | ||
境外收入总额 | 5,619.33 | 100.00% | 39.36% | ||
营业收入总额 | 14,277.35 | 100.00% | |||
2019年 | |||||
序号 | 客户品牌 | 营业收入 | 占境外收入比重 | 占营业收入比重 | 销售内容 |
1 | 三星 | 4,269.02 | 36.23% | 17.97% | 智能语音-训练数据定制服务、智能语音-训练数据产品 |
2 | 亚马逊 | 1,492.98 | 12.67% | 6.28% | 智能语音-训练数据产品、智能语音-训练数据定制服务 |
3 | 微软 | 1,460.49 | 12.40% | 6.15% | 智能语音-训练数据产品、自然语言-训练数据产品 |
4 | 某国际消费电子产品厂商 | 920.39 | 7.81% | 3.87% | 计算机视觉-训练数据定制服务、自然语言-训练数据定制服务 |
5 | 客户2 | 666.66 | 5.66% | 2.81% | 智能语音-训练数据产品、自然语言-训练数据产品 |
合计 | 8,809.54 | 74.77% | 37.08% | ||
境外收入总额 | 11,782.07 | 100.00% | 49.60% | ||
营业收入总额 | 23,755.81 | 100.00% | |||
2018年 | |||||
序号 | 客户品牌 | 营业收入 | 占境外收入比重 | 占营业收入比重 | 销售内容 |
1 | 三星 | 1,833.67 | 30.70% | 9.52% | 智能语音-训练数据定制服务、计算机视觉-训练数据定制服务、智能语音-训练数据产品 |
2 | 804.89 | 13.48% | 4.18% | 智能语音-训练数据产品 | |
3 | 亚马逊 | 465.00 | 7.79% | 2.41% | 智能语音-训练数据产品、智能语音-训练数据定制服务 |
4 | 纽康3 | 371.15 | 6.21% | 1.93% | 智能语音-训练数据定制服务、训练数据相关的应用服务 |
5 | 微软 | 341.98 | 5.73% | 1.78% | 智能语音-训练数据产品、自然语言-训练数据产品 |
合计 | 3,816.69 | 63.91% | 19.81% | ||
境外收入总额 | 5,972.00 | 100.00% | 31.00% |
纽康:即纽康品牌旗下企业,报告期内与发行人合作的签约主体包括日本纽康株式会社、海南纽康信息系统有限公司。
8-2-1-29
营业收入总额 | 19,265.77 | 100.00% | |||
2017年 | |||||
序号 | 客户品牌 | 营业收入 | 占境外收入比重 | 占营业收入比重 | 销售内容 |
1 | 某国际消费电子产品厂商 | 580.16 | 16.77% | 4.87% | 计算机视觉-训练数据定制服务、自然语言-训练数据定制服务、智能语音-训练数据产品 |
2 | 微软 | 477.99 | 13.81% | 4.01% | 智能语音-训练数据产品、计算机视觉-训练数据定制服务、自然语言-训练数据定制服务 |
3 | 纽康 | 359.68 | 10.39% | 3.02% | 智能语音-训练数据定制服务、自然语言-训练数据定制服务、其他-训练数据相关的应用服务、自然语言-训练数据产品 |
4 | NAVER4 | 353.33 | 10.21% | 2.97% | 智能语音-训练数据定制服务、智能语音-训练数据产品、其他-训练数据相关的应用服务 |
5 | EML5 | 190.33 | 5.50% | 1.60% | 智能语音-训练数据产品 |
合计 | 1,961.49 | 56.69% | 16.47% | ||
境外收入总额 | 3,460.17 | 100.00% | 29.06% | ||
营业收入总额 | 11,907.09 | 100.00% |
(4)报告期内境外销售具体情况,包括但不限于国家地区、产品种类、销售量、销售单价、销售金额及占比,境外销售模式及流程、主要客户,境外经营是否符合当地规定以及进口国同类产品的竞争格局;发行人境外销售收入逐年上升的原因,是否来源于新增客户,发行人海外业务拓展采取了哪些措施,是否具有可持续性,结合当前疫情、国际形势等因素说明对于发行人经营状况的影响及发行人的应对措施;
一、报告期内境外销售具体情况,包括但不限于国家地区、产品种类、销售量、销售单价、销售金额及占比,境外销售模式及流程、主要客户
发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(二)主要客户情况/6、境外销售具体情况”中披露下述回复的相关内容:
Naver:即Naver品牌,报告期内该品牌与发行人合作的签约主体包括NAVER Corporation、LINE PlusCorporation。前述公司与韩国证券交易所上市公司Naver Corp.(035420)隶属同一控制。
EML:即European Media Laboratory GmbH,成立于1997年,由知名软件公司SAP创始人、物理学家Klaus Tschira (1940-2015)创立。
8-2-1-30
(一)境外销售主要国家地区、产品服务种类、各国家地区主要客户
金额单位:万元
序号 | 国家地区 | 产品服务类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | 主要客户 | ||||
营业收入 | 占营业收入总额比重 | 营业收入 | 占营业收入总额比重 | 营业收入 | 占营业收入总额比重 | 营业收入 | 占营业收入总额比重 | ||||
1 | 日韩 | 总收入 | 1,498.89 | 10.50% | 5,688.34 | 23.95% | 2,531.45 | 13.14% | 1,491.68 | 12.53% | 三星(韩国)、纽康、Naver、客户2、客户1 |
其中:训练数据定制服务 | 165.65 | 1.16% | 3,973.37 | 16.73% | 2,473.59 | 12.84% | 705.72 | 5.93% | |||
训练数据产品 | 1,333.24 | 9.34% | 1,714.97 | 7.22% | 48.96 | 0.25% | 747.34 | 6.28% | |||
训练数据相关的应用服务 | - | - | - | - | 8.90 | 0.05% | 38.62 | 0.32% | |||
2 | 美国 | 总收入 | 3,722.41 | 26.07% | 4,628.51 | 19.48% | 2,496.28 | 12.96% | 1,494.79 | 12.55% | 微软、亚马逊、某国际消费电子产品厂商、Google |
其中:训练数据定制服务 | 860.90 | 6.03% | 1,521.43 | 6.40% | 342.36 | 1.78% | 679.15 | 5.70% | |||
训练数据产品 | 2,851.82 | 19.97% | 3,107.08 | 13.08% | 2,153.92 | 11.18% | 792.85 | 6.66% | |||
训练数据相关的应用服务 | 9.69 | 0.07% | - | - | - | 0.00% | 22.80 | 0.19% | |||
3 | 其他 | 总收入 | 398.04 | 2.79% | 1,465.21 | 6.17% | 944.27 | 4.90% | 473.70 | 3.98% | Verint6、三星(印度)、Nuance7 |
其中:训练数据定制服务 | 109.76 | 0.77% | 742.31 | 3.12% | 624.16 | 3.24% | 209.57 | 1.76% | |||
训练数据产品 | 288.28 | 2.02% | 713.23 | 3.00% | 319.64 | 1.66% | 257.83 | 2.17% |
Verint:即Verint品牌,报告期内发行人与该品牌合作的签约主体包括Verint Systems Inc.(已于纳斯达克主板上市,股票代码VRNT)与Verint CES Ltd.。
Nuance:即Nuance品牌,报告期内发行人与该品牌合作的签约主体包括Nuance Communications International BVBA、Nuance Communications Ireland Limited、Nuance Communications Services Ireland Limited及纽昂司软件技术(北京)有限公司,前述主体与纳斯达克上市公司Nuance Communications Inc.(NUAN)隶属同一控制。
8-2-1-31
训练数据相关的应用服务 | - | - | 9.67 | 0.04% | 0.47 | 0.00% | 6.30 | 0.05% | ||
境外收入合计 | 5,619.33 | 39.36% | 11,782.07 | 49.60% | 5,972.00 | 31.00% | 3,460.17 | 29.06% | ||
营业收入总额 | 14,277.35 | 100.00% | 23,755.81 | 100.00% | 19,265.77 | 100.00% | 11,907.09 | 100.00% |
注:训练数据相关的应用服务各年境外收入占比较低,下文销量、单价情况主要列示训练数据定制服务、训练数据产品相关情况。
(二)境外销售主要国家地区的销售量、销售单价情况
境外销售主要国家地区的销量单价情况如下:
1、训练数据定制服务
类别 | 收入(万元) | 销量 | 单价 | |||||||||||
2020年1-9月 | 2019年 | 2018年 | 2017年 | 销量单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | 单价 单位 | 2020年 1-9月 | 2019年 | 2018年 | 2017年 | |
智能语音 | 345.70 | 5,032.28 | 3,002.51 | 915.06 | 小时 | 3,977 | 11,302 | 17,219 | 6,884 | 元/小时 | 869.19 | 4,452.74 | 1,743.67 | 1,329.26 |
计算机视觉 | 615.03 | 807.02 | 266.86 | 531.45 | 个 | 11 | 6 | 15 | 8 | 元/个 | 559,117.13 | 1,345,028.75 | 177,907.56 | 664,313.80 |
自然语言 | 175.57 | 397.81 | 170.74 | 147.93 | 个 | 48 | 55 | 63 | 37 | 元/个 | 36,577.66 | 72,329.31 | 27,102.24 | 39,979.88 |
2、训练数据产品
类别 | 收入(万元) | 销量 | 单价 | |||||||||||
2020年1-9月 | 2019年 | 2018年 | 2017年 | 销量单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | 单价 单位 | 2020年 1-9月 | 2019年 | 2018年 | 2017年 |
8-2-1-32
智能语音 | 4,100.75 | 5,292.45 | 2,477.03 | 1,705.12 | 小时 | 44,635 | 57,366 | 46,493 | 15,991 | 元/小时 | 918.73 | 922.58 | 532.77 | 1,066.28 |
计算机视觉 | 34.88 | - | 2.28 | - | 个 | 2 | - | 1 | - | 元/个 | 174,415.44 | - | 22,822.21 | - |
自然语言 | 337.71 | 242.84 | 43.20 | 92.89 | 个 | 22 | 16 | 5 | 9 | 元/个 | 153,503.46 | 151,775.42 | 86,398.93 | 103,210.58 |
3、说明
在境外销售主要国家/地区,发行人同类业务产品/服务单价基本稳定,但受客户议价情况、具体项目需求、项目复杂程度,以及涉及的语种/方言等多方面因素影响,也存在一定波动。各年计算机视觉、自然语言按项目(销售的训练数据集)个数计算单价,因境外客户上述类别项目规模通常较大,促使销售单价均较高。
8-2-1-33
(三)境外销售模式及流程
发行人境外销售的模式、流程与发行人通用的销售模式、销售流程无差异,发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况/(三)主要模式/6、销售模式”中披露了相关内容,具体如下:
1、销售模式
公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高品质的训练数据产品和服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过口碑传播、参与学术会议、官方网站展示等方式建立品牌知名度、与客户建立联系,后续再通过商务谈判、招投标等形式获取具体业务机会。
2、销售流程
图:销售流程图
二、境外经营是否符合当地规定及进口国同类产品的竞争格局
发行人已在招股说明书“第六节 业务和技术/七、发行人的境外经营及境外资产情况”、“第六节 业务和技术/二、发行人所处行业的基本情况和竞争状况/(四)发行人产品或服务
8-2-1-34
的市场地位/5、市场地位、竞争格局在报告期内的变化情况及未来变化趋势”中补充披露下述回复的相关内容:
(一)发行人的境外经营符合当地规定
发行人主要在中华人民共和国境内进行生产经营,其全资子公司香港海天瑞声在境外承担发行人的少量境外业务拓展和服务采购职能。除香港子公司外,发行人在境外无经营场所或经营主体;发行人及其子公司为境外客户提供产品/服务,涉及境外销售。
1、香港子公司经营情况
根据君合律师事务所出具的法律意见书,截至2020年12月10日,香港海天瑞声有效登记、存续,其依据与发行人签署的业务协议内容开展业务不需要向香港监管机构或部门申请、取得任何执照或许可。香港子公司经营符合当地规定。
2、境外销售情况
发行人的境外销售主要涉及美国、韩国、日本等地,上述国家对信息技术等货品进口的基本规定主要如下:
国家 | 法律法规 | 相关规定 |
美国 | 《特别指定国民和被封锁人员清单》 | 美国人被禁止与特别指定国民清单中的各方进行交易,并且必须封锁其在全球各地占有或控制的特别指定国民清单上的各方的任何资产。任何人寻求与被封锁方进行交易,必须首先向海外资产控制办公室申请特别许可,除非海外资产控制办公室一般豁免许可允许交易。 |
韩国 | 《对外贸易法》 | 1、在属于以下各款之一情况下,产业资源部长可根据总统令规定,采取特别措施,限制或禁止物品的进口或出口:(1)在韩国或韩国的贸易对象国发生战争、事变或自然灾害时;(2)在交易对象国否认一般公认的国际协定中所规定的韩国的权益时;(3)当交易对象国对同韩国的贸易增加不正当或不合理的负担或限制时;(4)为履行依据宪法缔结并公布的有关贸易条约和一般公认的国际法规中规定的维持国际和平与安全的义务必需时;(5)为保护人类健康和生命安全或动植物的健康、生命和环境安全以及保护国内资源所必需时; 2、当国内产业处于以下各项之一的情况时,与该产业有利害关系者或掌管该产业的有关行政机关之长可向贸易委员会提出对该特定产品的进口、贸易及流通服务对国内产业造成的影响进行调查。 (1)特定物品进口增加对生产同类物品或生产有直接竞争关系的物品的国内产业的发展造成严重影响或可能造成影响时;(2)外国人(包括依据大韩民国法律设立的法人企业和二分之一股份由外国人持有的法人企业)从事贸易、流通服 |
8-2-1-35
务的增加对从事同类贸易、流通服务的国内产业或有直接竞争关系的国内产业造成严重影响或可能造成影响时;(3)进口商品损害到受国内法律保护的特许权、实用新案权、外观设计权、商标权、著作权、著作邻接权、软件开发权及半导体集成电路的配置设计权,使得生产该产品或与该产品有直接竞争关系的产品的国内产业受到影响或有可能受到影响时; 3、贸易委员会通过对国内产业被侵害的调查认定国内产业遭受侵害后,自判定日起45日内可建议有关行政机关之长在一定时日内采取以下各项之一的措施。(1)限制进口物品的数量(2)调整进口关税率(3)根据有关法律对工业农林水产业、矿业的中小企业提供技术支援(4)终止或禁止特定物品或特定贸易交易者的进口(5)为救济其他国内产业实行总统令规定的措施 | ||
日本 | 《外汇与外国贸易法》 | 1、为对外贸易和国民经济的健康发展而进口货物的业者,依据政令的规定,有义务取得进口许可。 2、居住者与非居住者之间拟转让非居住者实施的工业产权及其他有关技术的权利,或订立有关这些权利的使用权,以及签订或更新关于事业经营的技术指导合同,或者变更该合同的条款,如果在这些当中有政令规定的属于需要审查的,依据政令的规定,事先必须把签订该引进技术合同的条款及其他政令规定的事项,向大藏大臣和行业主管大臣申报;在接到申报的情况下,大藏大臣及行业主管大臣,认为有必要审查该申报的引进技术合同,如存在会损害国家安全、妨碍维护公共秩序或妨碍保护人民群众的安全、给予日本经济的顺利发展带来严重的不利影响的引进技术合同等时,可以延长不得签订与该申报有关的引进技术合同的期限。期限为自受理之日起四个月。 |
经核查,发行人境外销售主要涉及美国、韩国、日本等国家,前述国家主要针对可能严重损害数字经济安全、国家安全、国民健康、产业安全等的情形进行了限制,未直接限制、禁止从发行人进口数据产品或接受发行人提供数据服务。发行人严格遵守境外销售国家/地区的相关规定,为境外客户提供训练数据服务或产品,不存在被列入负面清单或违反当地规定的情形。综上,发行人香港子公司境外经营符合当地规定;发行人境外销售主要涉及的国家并无禁止或限制数据进口的相关规定,发行人向境外客户销售训练数据产品及服务符合当地规定。
(二)进口国同类产品的竞争格局
发行人的产品和服务的主要出口地包括美国、日韩等国家或地区。在美国市场,发行人面对的主要竞争对手有Appen、Globalme、DefinedCrowd、Scale AI等;在日韩市
8-2-1-36
场,发行人面对的主要竞争对手依然以Appen、Globalme、DefinedCrowd为主,同时还有一些本土的数据服务商如:Baobab(日本)和AIMMO(韩国)等。在美国市场上,由于美国AI技术发展比中国早,AI数据服务商的整体成熟度高于中国。语言文字同源,文化同源等因素的影响,使得澳洲公司、欧美公司在美国市场有着先天的信任优势和沟通优势,发行人在这方面有一定竞争劣势;但发行人也存在以下竞争优势:1、截至2020年9月30日,公司已有近700个自有知识产权的训练数据产品,相对竞争对手有一定优势,可以帮助客户更快更好地进行算法优化;2、公司已经拥有150余个语种/方言的覆盖能力,不仅包括含英法德日意等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种的服务上,具备竞争优势。
在日韩市场上,日韩科技公司或AI公司也会使用Appen以及部分美国数据供应商。同时,本土的数据服务供应商也会参与竞争。在日韩市场,与欧美竞争对手相比,公司在训练数据产品库和覆盖语言能力,尤其是亚洲语种覆盖方面具备竞争优势;与日韩本土服务商相比,公司在此领域深耕多年,具备多语种服务能力,数据资源来源广泛、储备丰富,具备竞争优势。
三、发行人境外销售收入逐年上升的原因,是否来源于新增客户,发行人海外业务拓展采取了哪些措施,是否具有可持续性,结合当前疫情、国际形势等因素说明对于发行人经营状况的影响及发行人的应对措施
(一)发行人境外收入逐年上升原因及是否来源于新增客户
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/5、按区域分类的主营业务收入分析/(2)境外收入来源于新增客户的情况”中进行了补充披露:
报告期内各期,发行人境外收入按是否来源于新增客户拆分如下:
境外国家/地区 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
新增客户收入占比 | 原有客户收入占比 | 新增客户收入占比 | 原有客户收入占比 | 新增客户收入占比 | 原有客户收入占比 | 新增客户收入占比 | 原有客户收入占比 | |
日韩 | 0.20% | 99.80% | 5.39% | 94.61% | 1.11% | 98.89% | 19.97% | 80.03% |
美国 | 11.41% | 88.59% | 9.84% | 90.16% | 21.00% | 79.00% | 16.86% | 83.14% |
其他 | 4.24% | 95.76% | 36.37% | 63.63% | 36.11% | 63.89% | 13.32% | 86.68% |
8-2-1-37
境外收入合计 | 7.91% | 92.09% | 10.99% | 89.01% | 14.96% | 85.04% | 17.72% | 82.28% |
报告期内,发行人各期境外收入均主要来源于原有客户,而非新增客户。2017-2019年发行人境外收入逐年上升,2020年1-9月有所回落。
2017年-2019年境外收入逐年上升的原因具体分析如下:
1、部分客户品牌变更采购签约主体:如大客户品牌三星向发行人采购金额持续增加,且因自身业务经营和管理需要,变更其向发行人执行采购的签约主体,主要签约主体从境内主体中国三星变更为境外主体韩国三星。2017-2019年,发行人向三星销售收入按签约主体拆分情况如下:
单位:万元
销售收入 | 2019年 | 2018年 | 2017年 |
三星 | 4,762.06 | 2,436.81 | 1,553.08 |
境内签约主体 | 493.04 | 603.15 | 1,439.12 |
境外签约主体 | 4,269.02 | 1,833.67 | 113.96 |
2、境外客户因自身业务发展需要拓展采购需求:2017-2019年,来自境外主要客户亚马逊、微软(境外签约主体)、某国际消费电子产品厂商的销售收入持续增长。报告期内,前述境外主要客户收入增长情况如下所示:
单位:万元
销售收入 | 2019年 | 2018年 | 2017年 |
亚马逊(境外签约主体) | 1,492.98 | 465.00 | 35.46 |
微软(境外签约主体) | 1,460.49 | 341.98 | 477.99 |
某国际消费电子产品厂商 | 920.39 | 278.97 | 580.16 |
亚马逊、微软销售收入增长主要是前述客户拓展其算法模型的语种/方言覆盖,加大对外语种训练数据产品需求和采购力度所致。某国际消费电子产品厂商销售收入增长主要是其对滑行输入训练数据需求持续增长所致。
3、发行人增聘了境外销售人员、加强境外业务开拓力度:发行人高度重视境外业务开拓,持续增聘境外销售人员,增强境外销售团队实力,助力公司境外业务开拓、新客户拓展。发行人注重加强与原有客户的沟通联系、稳固原定境外客户合作关系、拓展业务合作范围;增强新客户开拓和对接,储备业务合作基础。2019年至今,发行人新建立合作关系的境外客户共计38家,覆盖多家知名大型科技公司、人工智能企业及科研院所。
8-2-1-38
2020年1-9月,发行人境外收入规模有所回落,主要原因是日韩地区收入、其他地区收入下降所致。日韩地区收入下降的主要原因是:主要客户三星等受自身研发节奏影响,在2018年、2019年集中采购了大量语音合成训练数据定制服务,能够满足其在该领域一段时间内的需求,因此2020年1-9月采购量有所回落。其他地区收入下降的主要原因是主要客户IMDA等在2018年、2019年采购了类别较为丰富的语音识别训练数据定制服务,能够支撑其在该领域一段时间内的研发需求,在2020年1-9月采购量有所回落。
综上,2017-2019年发行人境外收入增加主要是:部分主要客户变更境内外采购签约主体;境外客户因其自身业务发展需要、算法模型的语种覆盖需求拓展、对新兴品类训练数据需求增加等因素增加训练数据采购以及发行人提升海外业务拓展力度所致。2020年1-9月境外收入有所回落,主要是境外客户受自身研发节奏影响,需求有所变动所致。
(二)发行人海外业务拓展采取了哪些措施,是否具有可持续性
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/5、按区域分类的主营业务收入分析/(3)发行人海外业务拓展措施”中进行了补充披露:
针对海外业务拓展,发行人采取了下述措施:
1、建设内部团队:增聘境外销售人员
发行人高度重视境外业务开拓,持续增聘境外销售人员,通过境外销售人员进行有规律的信息收集,获得海外市场与客户的一手信息。同时加强对境外销售人员的产品培训力度,增强境外销售团队实力,助力公司境外业务开拓、新客户拓展。
2、跟进境外优质客户的训练数据需求,拓展业务增长点
在业务开展过程中,对于原有客户,发行人注重与客户的长期关系维系和持续服务,持续跟进下游客户业务的发展方向,随之布局、拓展相应的训练数据产品服务类型和应用领域,以持续满足客户需求、拓展营收增长点。
3、加强在海外市场线上线下的宣传投放力度,持续针对海外客户及潜在客户进行品牌宣传
线上推广部分:发行人持续针对海外目标客户所在国家和地区进行搜索引擎广告投放,吸引新老客户的关注及问询。同时发行人还在全球知名的职场社交平台“领英”进行广告投
8-2-1-39
放,提升品牌的境外知名度、美誉度。同时,发行人还会根据不同的市场活动,在海外学术论坛发布推广信息。线下推广部分:发行人持续主动参加国际学术会议,增加展位部署,提升在海外客户市场的宣传曝光力度、吸引海外客户。例如:发行人每年都会参加全球人工智能领域的权威学术会议(如:CVPR-计算机视觉/ICASSP-综合/INTERSPEECH-智能语音等),发行人作为参展商向与会的众多人工智能产业机构进行品牌宣传并直接获客;并通过参与学术会议跟进AI技术发展中的前沿方向,以此作为后续产品服务开发拓展的重要参考。
通过采取上述措施,发行人对外持续加强针对海外市场的新增客户开拓能力、原有客户新增业务挖掘能力;对内持续提升训练数据产品服务提供能力。同时,下游AI行业的持续发展,AI算法模型的垂直领域、新兴语种覆盖拓展需求预期均将持续带动对相应训练数据需求的持续增长,发行人的海外业务拓展措施、境外收入均具备可持续性。
(三)结合当前疫情、国际形势等因素说明对于发行人经营状况的影响及发行人的应对措施
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/5、按区域分类的主营业务收入分析/(4)当前疫情、国际形势对发行人经营状况的影响及发行人的应对措施”中进行了补充披露:
疫情、国际形势均属发行人业务的短期影响因素:疫情在短期之内对发行人组织原料数据现场集中采集、标注工作造成了一定影响,发行人通过引导客户采购成品训练数据集(即训练数据产品)平抑相关影响;随着我国疫情逐步稳定、各地有序复工,境内疫情影响逐步减弱;但境外疫情仍在蔓延,发行人的境外原料数据采集、标注工作开展会受到一定影响,发行人通过改善和提升工具性能,引导采集、标注人员使用线上远程采集、标注工具平抑相关影响。国际形势在现阶段对发行人所在行业无实质影响,发行人与境外各客户的商业洽谈、合作和拓展均在稳定、持续进行中。
发行人对此采取的应对措施包括:
1、对于疫情:疫情影响发行人原料数据现场采集、标注工作的开展,因此也对训练数据定制服务的开展造成影响,发行人通过引导客户采购成品训练数据集、改善和提升工具性能,引导采集标注人员使用远程采集、标注工具平抑前述短期影响。
2、对于国际形势:国际形势在现阶段对发行人所在行业无实质影响。为了应对国际形势未来可能造成的影响,发行人采取的措施包括:(1)持续跟进服务现有境内外优质
8-2-1-40
客户;(2)拓展新兴优质客户(互联网领域新兴活跃企业,如字节跳动系、拼多多系、小米系、美团系客户等),持续跟进服务前述客户对训练数据的需求;(3)跟进AI前沿领域发展趋势、拓展训练数据产品服务布局覆盖,整体稳固现有客户收入、拓展业务增长点。此外,发行人已在招股说明书中针对疫情、国际形势等进行了风险提示,具体参见招股说明书“重大事项提示/三、特别风险提示/(三)中美贸易摩擦风险”及“重大事项提示/四、新型冠状病毒肺炎疫情对公司经营情况的影响”、“第四节 风险因素/二、疫情风险及四、中美贸易摩擦风险”。
(5)报告期内训练数据产品的具体销售情况,包括主要内容、资源类型、数量、授权使用次数、平均售价等;发行人已在招股说明书“第六节 业务和技术/三、销售情况和主要客户/(一)报告期内销售情况/3、训练数据产品销售情况/(3)训练数据产品销售具体情况”中披露下述回复的相关内容:
报告期内,发行人训练数据产品的具体销售情况(主要内容、资源类型、数量、授权使用次数、平均售价)如下:
注:发行人的训练数据产品开发完成后可授权予客户使用,一次生产完成后可重复多次销售使用权。下文列示的“授权使用次数合计”指标为各期实现销售的训练数据产品在当期销售使用权的次数合计值。
1、2020年1-9月训练数据产品的具体销售情况
(1)智能语音领域
序号 | 资源类型 | 主要内容 | 2020年1-9月销售情况 | 发行人积累的训练数据产品总数(个,截至2020年9月30日) | ||||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 销量(小时) | 平均售价(元) | |||||
1 | 智能语音 | 中文 | 唤醒词、单句、对话等 | 76 | 115 | 66,730 | 262 | 171 |
外语种 | 唤醒词、单句、对话等 | 150 | 193 | 72,286 | 622 | 363 |
(2)计算机视觉、自然语言领域
8-2-1-41
序号 | 资源类型 | 主要内容 | 2020年1-9月销售情况 | 发行人积累的训练数据产品总数(个,截至2020年9月30日) | ||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 平均售价 (万元) | ||||
1 | 自然语言 | 词典 | 24 | 27 | 15.67 | 95 |
2 | 计算机视觉 | 人脸、人像目标等 | 14 | 17 | 20.48 | 70 |
2、2019年训练数据产品的具体销售情况
(1)智能语音领域
序号 | 资源类型 | 主要内容 | 2019年销售情况 | 发行人积累的训练数据产品总数(个,截至2019年12月31日) | ||||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 销量(小时) | 平均售价(元) | |||||
1 | 智能语音 | 中文 | 唤醒词、单句、对话等 | 79 | 114 | 55,957 | 317 | 166 |
外语种 | 唤醒词、单句、对话等 | 171 | 245 | 80,728 | 793 | 317 |
(2)计算机视觉、自然语言领域
序号 | 资源类型 | 主要内容 | 2019年销售情况 | 发行人积累的训练数据产品总数(个,截至2019年12月31日) | ||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 平均售价(万元) | ||||
1 | 自然语言 | 词典、语料等 | 26 | 30 | 12.56 | 82 |
2 | 计算机视觉 | 人脸、手势、活体对抗、自然场景、人车2D、交通标志等 | 17 | 25 | 25.17 | 54 |
3、2018年训练数据产品的具体销售情况
(1)智能语音领域
序号 | 资源类型 | 主要内容 | 2018年销售情况 | 发行人积累的训练数据产品总数(个,截至2018年12月31日) | ||||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 销量(小时) | 平均售价(元) | |||||
1 | 智能语音 | 中文 | 唤醒词、单句、对话等 | 57 | 88 | 68,587 | 364 | 151 |
8-2-1-42
外语种 | 唤醒词、单句、对话等 | 90 | 123 | 47,145 | 747 | 256 |
(2)计算机视觉、自然语言领域
序号 | 资源类型 | 主要内容 | 2018年销售情况 | 发行人积累的训练数据产品总数(个截至2018年12月31日) | ||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 平均售价(万元) | ||||
1 | 自然语言 | 词典、语料等 | 17 | 29 | 13.72 | 72 |
2 | 计算机视觉 | 人脸、人车2D、行车、前/后置人像等 | 19 | 25 | 7.45 | 37 |
4、2017年训练数据产品的具体销售情况
(1)智能语音领域
序号 | 资源类型 | 主要内容 | 2017年销售情况 | 发行人积累的训练数据产品总数(个,截至2017年12月31日) | ||||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 销量(小时) | 平均售价(元) | |||||
1 | 智能语音 | 中文 | 唤醒词、单句、对话等 | 71 | 98 | 41,274 | 517 | 143 |
外语种 | 唤醒词、单句、对话等 | 81 | 119 | 27,247 | 1,022 | 240 |
(2)计算机视觉、自然语言领域
序号 | 资源类型 | 主要内容 | 2017年销售情况 | 发行人积累的训练数据产品总数(个,截至2017年12月31日) | ||
当期实现销售的训练数据产品数量(个) | 授权使用次数合计(次) | 平均售价(万元) | ||||
1 | 自然语言 | 词典、语料等 | 9 | 30 | 10.60 | 56 |
2 | 计算机视觉 | 人脸、室内场景、车辆特征等 | 5 | 16 | 15.65 | 26 |
(6)训练数据产品是否存在数据资源被泄露、盗版等可能,发行人所采取的保护措施及其有效性,相关风险揭示是否充分。
一、训练数据产品是否存在数据资源被泄露、盗版等可能,发行人所采取的保护措施及其有效性
8-2-1-43
发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况/(二)主要产品及服务/4、训练数据产品的数据资源泄露、盗版风险及发行人采取的保护措施情况”中披露下述回复的相关内容:
发行人的训练数据产品是以二进制形式存储,理论上存在被泄露或者盗版的可能,针对训练数据产品,发行人采取的保护措施如下:
(一)外部:与客户就训练数据产品保护事项在商业层面进行条款约定
在与客户进行合作时,发行人首先会在商业合同条款中约定训练数据产品保护的相关条款,对此进行约束。其次,考虑到训练数据产品的泄露或者盗版会对发行人的客户也可能造成直接的利益损失(如增加其竞争对手等),因此发行人的客户也有动机主动保护训练数据产品不被泄露。
(二)内部:采用技术保密手段、制定数据保密相关制度对训练数据产品加以保护
1、信息安全管理体系层面——已取得了ISO/IEC 27001信息安全管理体系认证
发行人构建了完善的信息系统维护管理制度,确保信息系统能够对数据安全起到有力保障:通过信息系统的日常运行维护、系统更新、安全管理等手段保障服务器安全、应用系统安全、网络安全、物理安全,满足开发管理、防病毒管理、应急管理等方面要求;组织开展对信息系统的安全评估,发现危害数据、信息安全的问题及时整改;定期进行数据备份、软硬件更新,保障数据安全、降低数据流失风险;严禁擅自修改系统软件和应用软件,确需修改需履行审批申请程序,由信息管理员负责,并在维护过程中防止数据丢失、失效。
2、技术层面——构建一体化数据处理平台(以下简称“平台”),嵌入业务过程的数据安全管理需求;运用技术手段保障数据安全
对于在海天瑞声的平台上处理的数据,发行人的一体化数据处理平台可实现下述功能,在数据采集、传输、加工、存储过程中确保数据安全:
(1)可实现私有化部署,加工、质检过程中数据源均保存在海天瑞声的服务器中,不允许随意复制、外泄;
(2)数据加密存储:对所有存储在平台的数据进行加密存储;涉及移动设备(如移动硬盘、U盘等)外部移动数据存储的也进行加密处理,并制定了严格的移动设备管理制度;
8-2-1-44
(3)数据加密传输:对于平台之间,或平台、客户端之间的数据传输,运用行业通行的加密方式对数据进行加密传输;
(4)嵌入访问权限控制、身份验证、密码管理功能,限制数据的查看、使用范围,保障数据安全。
对于在客户平台上处理的数据:发行人及其团队可依据客户需求运用客户指定的工具、平台对数据加以处理,严格防范数据外泄。
3、内部控制层面——强化职责分离、权限管理
与上述信息系统安全管理相关举措配合,发行人制定、采取了有效的内控制度及举措,防止因内控弱化导致的数据被随意控制、操作的风险,具体包括:加强信息系统的职责分离、权限管理,加强与信息系统使用、授权相关的制度建设,完善授权审批管理流程等。
4、保密制度层面——签署保密协议,制定保密要求、泄密惩治机制
发行人构建了有力的保密制度,对于数据、技术等各类保密信息制定了相应的保密要求,与员工签署保密协议,约定保密义务;辅以保密教育、泄密惩治机制,确保员工遵守保密要求。
综上,发行人的训练数据产品存在数据资源被泄露、盗版等的可能,发行人采取了有效的保护措施对其进行保护,防止相关泄露、盗版情形发生。但若公司的数据安全管理体系研发升级未能跟上业务发展的需要、或客户未能遵守训练数据产品保护相关商业约定,则公司可能面临训练数据产品被泄露、盗版等数据安全相关风险,详见招股说明书“重大事项提示/三、特别风险提示/(八)数据安全相关风险”。
三、相关风险揭示是否充分
发行人已在招股书“重大事项提示/三、特别风险提示/(八)数据安全相关风险”及“第四节 风险因素/十四、数据安全相关风险”中对数据安全相关风险进行了充分提示,具体如下:
“数据安全相关风险
发行人主要从事训练数据的研发设计、生产及销售业务,所提供的产品和服务主要以数据的形式体现。一方面,随着发行人业务的快速发展和规模的持续扩张,原料数据采集与数据加工的数量持续增长;另外一方面,与数据安全、个人信息保护相关的法律规章体系逐步完善。如果将来公司未能根据法律规章的更新要求及时调整现行业务开展方式、公
8-2-1-45
司的数据安全管理体系研发升级未能跟上业务发展的需要、或客户未能遵守训练数据产品保护相关商业约定,则公司可能面临生产经营不符合法律规章的要求、训练数据产品被泄露、盗版等数据安全相关风险或可能产生诉讼纠纷,进而给公司的经营带来不利影响。”发行人说明事项
(1)上述客户的基本情况及合作历史,发行人获取该等客户的渠道及方式;依据问题9.2补充披露事项(1)列示,发行人获取客户的方式主要包括:
情形一:于公司成立初期即开始合作,早期客户开拓主要来自公司创始人贺琳多年积累的人脉基础;情形二:通过学术会议接触,之后经过客户拜访、意向接触、商务洽谈等步骤建立合作关系;
情形三:因公司在行业内有良好的口碑,合作过的客户向业内其他客户推荐发行人从而建立联系,进而开展合作;
情形四:通过网络挖掘,获得客户的公共联系方式,然后有针对性地向客户发送邮件主动进行宣传推广,进而建立联系、开展合作;
情形五:通过电话销售,获得客户联系人信息,进而通过客户拜访等方式获取客户需求,进行合作;
情形六:客户通过公司官网主动向发行人留言咨询,后续通过意向接触、商务洽谈等步骤建立合作。
补充披露事项涉及客户的基本情况、合作历史、获取方式,列示如下:
客户名称(品牌) | 基本情况 | 获取方式 | 合作起始时间 |
阿里巴巴 | 阿里巴巴集团控股有限公司(已于纳斯达克主板、香港联交所主板及伦敦证券交易所上市,股票/存托凭证代码:BABA、9988、0HCI)成立于1999年,现已成为大型科技公司集团,旗下主体业务覆盖电商、网上支付、物流、云计算、文娱等多个领域。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形二 | 2010 |
百度 | 百度股份有限公司(已于纳斯达克主板、新加坡证券交 | 情形三 | 2011 |
8-2-1-46
易所国际板、伦敦证券交易所国际板上市,股票/存托凭证代码:BIDU、K3SD、0HL1)成立于2000年,是目前全球最大的中文搜索引擎企业,提供以信息和知识为核心的互联网综合服务,业务领域覆盖搜索、人工智能等。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | |||
三星 | 三星集团成立于1938年,是韩国的大型跨国企业集团,旗下拥有三星电子(已于韩国证券交易所、伦敦证券交所主板上市,股票/存托凭证代码分别为005930、SMSD等)、三星物产、三星人寿保险等诸多子公司,业务覆盖电子、金融、机械、化学等众多领域。 报告期内,该品牌与发行人合作的签约主体均隶属三星集团。 | 情形二 | 2010 |
腾讯 | 腾讯控股有限公司(已于香港联交所主板上市,股票代码0700)成立于1999年,是中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一。提供包括社交和通信服务、游戏、新闻、网络视频服务等在内的多元化服务;腾讯旗下腾讯音乐已于纽约证券交易所主板上市,股票代码TME。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形二、情形三 | 2012 |
微软 | 微软公司(Microsoft Corp,已于纳斯达克主板、伦敦证券交易所国际版、香港联交所主板上市,股票代码分别为MSFT、0QYP、4388)成立于1975年,是一家美国的跨国科技公司,是个人计算机软件开发的先导者,目前是全球最大的电脑软件提供商,业务覆盖电脑软件的研发、制造、授权及相关服务等。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形一 | 2005 |
中国某大型科技公司 | 是我国领先的信息与通信技术解决方案提供商,可为运营商、企业及消费者提供有竞争力的ICT解决方案、产品和服务。 | 情形二、情形四 | 2012 |
亚马逊 | Amazon.Com Inc.(已于纳斯达克主板、圣地亚哥证券交易所、伦敦证券交易所国际板上市,股票代码分别为: | 情形二 | 2012 |
8-2-1-47
AMZN、AMZN、0R1O)成立于1994年,是美国最大的电商公司,也是最早经营电商的公司之一,已发展为业务覆盖电商、互联网、云服务的大型科技公司。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | |||
某国际消费电子产品厂商 | 是美国的一家大型科技公司,经营范围包括电脑硬件、软件,消费电子产品、数字发布、零售业务等。 | 情形四 | 2010 |
Alphabet Inc.(已于纳斯达克主板、伦敦证券交易所国际板上市,股票代码分别为GOOG、0HD6),是美国的一家跨国企业,是全球最大的搜索引擎公司,业务覆盖互联网搜索、云计算、广告业务等,也提供基于互联网的产品与服务。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形二、情形五 | 2017 | |
客户1 | 成立于2010年,是日本的一家贸易公司,主要从事汽车及机械零件的进出口贸易、海外商业软件代理、行业相关的新技术、新产业信息的贸易和中介等。客户覆盖京都大学、日本国家航空航天局、厚生劳动省等知名机构。 报告期内,该主体是个别最终需求方的指定代理方,发行人与最终需求方就训练数据产品或服务的具体需求进行直接对接沟通,后续最终需求方出于自身经营管理需要,指定客户1为其签约/采购主体,发行人完成训练数据相关产品/服务后向客户1进行交付。 | 情形三、情形六 | 2016 |
客户2 | 成立于1970年,是日本的一家贸易企业,主要从事重型电气设备及工业的进出口贸易,海外材料、零件、设备的采购以及海外新产品、新兴市场制造产品的销售。 报告期内,该主体是个别最终需求方的指定代理方,发行人与最终需求方就训练数据产品或服务的具体需求进行直接对接沟通,后续最终需求方出于自身经营管理需要,指定客户2为其签约/采购主体,发行人完成训练数据相关产品/服务后向客户2进行交付。 | 情形三、情形六 | 2015 |
客户3 | 成立于1946年,是日本的一家大型综合性跨国企业集团,业务覆盖视听、电子游戏、通讯产品、信息技术等领域。 | 情形二 | 2012 |
8-2-1-48
纽康 | 日本纽康株式会社是成立于1991年的日本企业,主要提供系统解决方案、医疗系统业务、信息服务、客户服务业务等。 报告期内,该品牌与发行人合作的签约主体包括日本纽康株式会社、海南纽康信息系统有限公司。 | 情形三、情形六 | 2015 |
Naver | Naver Corp.(已于韩国证券交易所主板上市,股票代码:035420)是著名社交软件Line的母公司,世界第五大搜索引擎网站,韩国最大的搜索引擎和门户网站。韩国股票市场市值最高的互联网公司。 报告期内,该品牌客户与发行人合作的签约主体均隶属前述上市公司体系。 | 情形四 | 2013 |
EML | European Media Laboratory GmbH,成立于1997年,由知名软件公司SAP创始人、物理学家Klaus Tschira (1940-2015)创立,主要从事人机交互领域的研发以及自动语音处理,产品服务可覆盖语音分析、媒体转换、语音信息、语音搜索等。 | 情形六 | 2013 |
Verint | Verint Systems Inc.(已于纳斯达克主板上市,股票代码VRNT)成立于1994年,主要提供可操作的智能解决方案和增值服务,帮助客户收集和分析大量的结构化和非结构化信息,如电话交谈、视频交流等。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形三 | 2010 |
Nuance | Nuance Communications Inc.(已于纳斯达克主板上市,股票代码NUAN)成立于1992年,是专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司,覆盖医疗、银行、航空、电信以及汽车等诸多领域。 报告期内,该品牌客户与发行人合作的签约主体隶属于前述上市公司体系,或与前述上市公司受同一控制。 | 情形三 | 2010 |
字节跳动 | 即字节跳动及其体系内企业,北京字节跳动科技有限公司成立于2012年,是一家信息科技企业,旗下产品覆盖今日头条、西瓜视频、抖音、火山小视频等。 报告期内,该品牌客户与发行人合作的签约主体具体包含北京有竹居网络技术有限公司、北京吉云互动科技有限公司。 | 情形三 | 2017 |
8-2-1-49
上述客户中,客户1、客户2分别为个别最终需求方指定的签约/采购主体,发行人与最终需求方直接沟通具体产品/服务需求并执行,完成相关产品/服务后向客户1、客户2交付。前述由最终需求方指定其他签约/采购主体的情形极少,发行人在与客户直接对接沟通后通常采取与客户主体直接签约的形式开展业务合作。
(2)2019年度境内销售收入较2018年下降的原因,是否系市场竞争加剧所致。
发行人2019年度境内收入为11,973.75万元,较2018年度的13,293.77万元有所下降,主要原因是:
第一,语音识别采集的中文业务市场竞争激烈,市场需求一定程度被分流,销量有所下降,对发行人境内销售收入造成一定影响;
第二,发行人向主要客户阿里巴巴的销售金额下降,由2018年的5,179.07万元降至2019年的2,208.26万元,主要是阿里巴巴对训练数据的需求受其研发计划进展节奏影响有所波动所致,如阿里巴巴在2018年购置的语音识别转写训练数据可以在一段时间内支撑其产品或应用性能迭代,因此2019年的同类中文转写需求量有所减少;
第三,部分跨国企业变更向发行人执行采购的签约主体,其签约主体由境内主体变更为境外主体,使发行人统计的境内销售收入减少,具体情况请参见本问题“发行人补充披露事项(4)/三、发行人境外销售收入逐年上升的原因,是否来源于新增客户,发行人海外业务拓展采取了哪些措施,是否具有可持续性,结合当前疫情、国际形势等因素说明对于发行人经营状况的影响及发行人的应对措施”的回复内容。会计师核查事项本所在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,对主要客户及境内外销售进行核查,执行的主要程序如下:
1、访谈了发行人的主要管理人员,取得了报告期内各期发行人的收入明细及主要客户合同,取得了报告期内训练数据产品的销售数据,查阅了报告期内前五大客户(及其签约方)的销售情况、境内外前五大客户及其销售情况、境外销售情况,对相关项目服务量、产品数量及营收变动进行了分析;
2、梳理了报告期内发行人涉及公开招投标程序的项目合同,核查发行人是否存在应履行公开招投标程序而未履行的情形;
8-2-1-50
3、对报告期内的主要客户执行了访谈、函证程序,了解各期主要客户与发行人的主要交易内容及交易情况,确认交易额及应收账款余额;
4、查阅了发行人主要境外收入来源地区的法律规定及其相关行业研究报告,对发行人境外销售是否合规、境外收入地区的竞争格局情况进行了核查;
5、访谈了发行人的主要管理人员、技术人员,了解发行人采取的训练数据产品保密措施,并对发行人的信息系统进行了专项核查,检验包括数据安全在内的信息系统运行情况。
基于我们所执行的审计和核查程序,申报会计师认为:
1、报告期内,发行人不存在应履行公开招标程序而未履行的情形。
2、结合报告期内对各期前五大客户的项目服务量、产品数量销售情况,前述客户在报告期内营业收入变化合理。
3、发行人境外经营符合当地规定。境外销售收入持续上升主要来源于原有客户,具体原因包括:部分客户品牌因自身业务管理需要变更采购签约主体;境外客户因自身业务发展需要增加采购;发行人增聘了境外销售人员,加强了境外业务拓展及储备力度。发行人为海外业务拓展采取了建设内部团队、持续跟进客户需求、加大线上线下宣传推广力度等措施,具备可持续性。
4、疫情、国际形势均属发行人业务的短期影响因素。发行人通过引导客户采集成品训练数据集、引导采集标注人员使用远程采集、标注工具平抑疫情影响;通过持续跟进服务现有优质客户、拓展新兴优质客户、跟进AI前沿领域发展需求平抑国际形势影响。
5、发行人的训练数据产品理论上存在被泄露、盗版可能,发行人采取了多层次保护措施对其进行保护,保护措施有效、相关风险揭示充分。
6、发行人2019年境内销售收入较2018年下降主要是语音识别采集类中文业务竞争加剧、发行人向个别客户销售金额下降、部分跨国企业将向发行人执行采购的签约主体由境内主体变更为境外主体所致。
8-2-1-51
9.3关于销售收入核查
根据申报文件,申报会计师将营业收入认定为关键审计事项,招股说明书未披露关键审计事项。请发行人补充披露:关键审计事项。请保荐机构和申报会计师说明:(1)与收入确认相关的关键财务报告内部控制的设计和运行有效性的测试情况;(2)主要客户的实地走访和视频访谈情况;(3)抽样程序样本的选取方法,抽样过程、金额和比例;(4)应收账款和营业收入的函证程序和函证比例,未回函和回函差异金额及比例,主要未回函和回函差异客户的情况以及履行的替代程序。答复:
发行人补充披露事项
关键审计事项
发行人已在招股说明书“第八节财务会计信息与管理层分析/一、报告期经审计的财务报表/(一)审计意见”中披露如下:
毕马威华振会计师事务所(特殊普通合伙)识别出的关键审计事项如下:
收入确认 | |
请参阅本节“四、报告期内主要采用的会计政策和会计估计/(十七)收入”所述的会计政策及“九、经营成果分析/(一)营业收入分析”。 | |
关键审计事项 | 在审计中如何应对该事项 |
北京海天瑞声科技股份有限公司及子公司(以下简称“海天瑞声集团”)2017年度、2018年度及2019年度及2020年1-9月(以下简称“报告期”)的收入分别为11,907.09万元、19,265.77万元、23,755.81万元及14,277.35万元,主要包括提供训练数据定制服务收入及训练数据产品收入。 训练数据定制服务收入主要是指海天瑞声集团根据客户需求为客户提供训练数据定制服务而收取的收入。训练数据产品收入主要是指海天瑞声集团授权客户永久使用本集团已经开发完成并 | 与评价收入确认相关的审计程序中包括以下: 了解并评价与收入确认相关的关键财务报告内部控制的设计和运行有效性; 选取样本,检查销售合同或订单,识别与风险和报酬转移或控制权转移相关的合同或订单条款,评价海天瑞声集团的各类收入的收入确认政策是否符合企业会计准则的相关要求; 选取各期收入的前十大客户和当期新增主要客户,获取相关公开信息(如通过“全国企业信用信息公示系统”),核对客户的股东、董事和监事情况,并和海天瑞声集团提供的信息进行比对,检查是否 |
8-2-1-52
拥有所有权的训练数据产品而向客户收取的收入。 于2017年度、2018年度、2019年度,海天瑞声集团以风险报酬转移时点作为收入确认的判断标准。对于训练数据定制服务收入,采用完工百分比法确认收入,并按照提供给客户并经客户验收和确认的服务量占服务总量的比例计算和确定完工进度。对于训练数据产品收入,按照合同约定向客户提交训练数据产品并经客户验收确认后的时点确认收入。 自2020年1月1日起,海天瑞声集团执行《企业会计准则第14号——收入(修订)》(以下简称“新收入准则”),以控制权转移作为收入确认时点的判断依据,并综合考虑合同条款和业务安排来评估新收入准则的影响。经评估认为,对于训练数据定制服务收入,单元定制化训练数据被识别为单项履约义务,属于某一时点履行的履约义务,因此在将单元数据向客户交付并经客户验收确认时确认收入。对于训练数据产品收入,因为训练数据产品属于某一时点履行的知识产权许可授权,因此在向客户交付训练数据产品并经客户验收确认后确认收入。 由于收入是海天瑞声集团的关键业绩指标之一,存在管理层为了达到特定目标或期望而操纵收入确认时点的固有风险或收入被确认于不正确的会计期间的错报风险,同时新收入准则的实施也需要管理层根据合同条款和业务安排评估对收入确认会计政策的影响,该评估涉及管理层重大判断,因此毕马威华振事务所将海天瑞声集团的收入确认识别为关键审计事项。 | 存在关联关系; 在抽样的基础上,将各期记录的收入核对至相关的销售合同或订单、客户验收文件、发票等相关支持性依据,以评价相关收入是否按照海天瑞声集团的收入确认政策予以确认; 根据客户的交易特点和性质,选取样本,就于资产负债表日的往来款项余额及报告期间的销售交易金额执行函证程序; 选取重要客户,实地走访或视频访谈,询问其与海天瑞声集团的主要交易情况,及其是否与海天瑞声集团存在关联方关系,检查客户及交易的真实性,识别是否存在异常情况; 从资产负债表日前后的收入交易中选取样本,检查与收入确认相关的销售合同或订单、客户验收文件、发票等相关支持性依据,评价接近资产负债表日前后记录的收入是否记录于恰当期间; 选取符合特定风险标准的收入会计分录(包括期后重大调整分录),核对至相关支持性文件。 |
会计师说明事项
(1)与收入确认相关的关键财务报告内部控制的设计和运行有效性的测试情况发行人按照所在行业销售与收款业务的流程特点,制定了《销售管理制度》、《销售信用管理规定》、《项目管理办法》和《会计核算制度》等内部控制制度,明确规定了公
8-2-1-53
司的销售主管部门——营销中心的岗位职责分工、权限范围和审批程序,确保办理销售与收款业务的不兼容岗位相互分离、制约和监督;同时对销售业务的定价原则、赊销业务的信用资格审查、合同审批、客户验收、收入确认、应收账款对账、坏账计提等相关内容作出了明确规定。发行人与收入确认相关的关键财务报告内部控制的内容(关键控制点、控制活动情况)具体如下:
关键控制点 | 控制活动 |
信用管理 | 公司营销中心对客户信用进行统一管理,具体包括新客户审查、授信额度及付款账期评估、设置、变更、延期、中止等。 财务部负责对客户的信用评级进行审核及审批,以及对信用执行进行日常监督管理。 总经理办公会负责对特殊信用额度申请/变更进行审批。 |
合同审批 | 销售人员以销售价格体系和销售政策为依据,与客户进行商务沟通和谈判并与客户协商确定销售合同条款,经销售分管负责人、业务部门负责人、财务部、法务人员、总经理逐级审批。重要合同须经总经理办公会审议。 |
产品服务交付 | 项目完成或阶段性工作完成后,将产品或服务交付客户。在交付产品及服务时需向客户发送交付通知,并将交付通知留存且在业务管理平台中上传,作为交付产品/服务的证明。 |
客户验收 | 交付完成后,由客户按双方约定形式进行验收。在客户对产品及服务进行验收确认后,需在业务管理平台中填写项目验收信息、上传验收证据文件,经业务部门负责人、财务部审核后,将验收数量、验收金额、验收时间记录在业务管理平台中,作为收入确认的基础信息。 |
收入确认记账 |
应收账款对账 | 公司营销中心定期与客户对账,并将对账记录进行归档保管;财务部每月与营销中心进行核对确认,将核对结果反馈给营销中心,由其对逾期未收款的部分进行催收。 |
计提坏账 | 财务人员根据会计政策计提坏账,登记应收账款明细账,经财务部负责人审核后计提坏账记账凭证。 |
申报会计师针对上述关键内部控制的设计和运行的有效性情况执行了测试/核查程序,具体情况如下:
1、访谈发行人管理层及销售业务主管人员,了解公司的销售业务流程情况;
2、查阅发行人的《销售管理制度》、《销售信用管理规定》、《项目管理办法》和《会计核算制度》等与发行人销售流程管理、内部控制相关的规章制度,结合发行人销售、
8-2-1-54
收款、收入确认流程情况,对照《企业内部控制基本规范》的要求,评估公司相关内部控制制度的设计合理性;
3、执行穿行测试,将收入相关内部控制制度及流程中规定的内部控制措施,与穿行测试抽取的证据进行核对,验证收入相关内部控制是否有效执行;
4、执行控制测试,根据相关内部控制测试点的发生频率抽取样本,核查相关内部控制执行在报告期间内是否具备一贯性,并确保获取证据的充分性。
经核查,申报会计师认为,发行人与收入确认相关的关键财务报告内部控制设计有效并得到有效执行。
(2)主要客户的实地走访和视频访谈情况
申报会计师主要通过实地走访形式对发行人主要客户执行了访谈核查程序。因受境内外新冠肺炎疫情影响,有少量客户访谈以视频访谈等形式进行。通过前述访谈,申报会计师向客户询问了解了:客户的规模、业务经营等基本情况,其与发行人之间的合作历史、业务模式、业务往来的发展情况,向发行人采购的具体内容、结算方式,对发行人的评价、持续合作意愿,以及发行人在业务合作中的合规情况等,并取得签字确认的访谈纪要。
经访谈核查,申报会计师认为,发行人与主要客户已建立了良好的合作关系,相关销售业务真实、具备商业合理性,不存在异常情形。
报告期内,申报会计师访谈的客户覆盖发行人各期营业收入比例情况如下:
金额单位:万元
金额 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
实地走访 | 7,553.39 | 14,979.29 | 14,624.37 | 8,882.55 |
视频访谈等非实地走访方式 | 3,627.21 | 3,733.03 | 1,356.11 | 375.82 |
访谈客户覆盖收入合计 | 11,180.60 | 18,712.32 | 15,980.48 | 9,258.38 |
占比 | ||||
实地走访客户占营业收入比重 | 52.90% | 63.06% | 75.91% | 74.60% |
视频走访等非实地走访方式客户占营业收入比重 | 25.41% | 15.71% | 7.04% | 3.16% |
访谈客户占营业收入比重合计 | 78.31% | 78.77% | 82.95% | 77.76% |
注:1、申报会计师对发行人各期主要客户进行了多次走访/访谈,对于同时接受过实地走访、视频访谈等非实地走访的客户,上表计入“实地走访”计算。
8-2-1-55
2、因受新冠肺炎疫情影响,2019年、2020年前三季度主要客户视频走访等非实地走访方式占比相比2018年、2017年有所提高。
(3)抽样程序样本的选取方法,抽样过程、金额和比例
针对收入这一关键审计事项,申报会计师结合各期营业收入情况,抽样选取样本,与对应的销售合同或订单、客户验收文件、发票等相关支持性依据进行核对,核查验证营业收入的真实性、准确性。
抽样选取方法为个别重大与随机抽样相结合的方法。抽样过程具体如下:
申报会计师根据发行人的实际情况,以经常性业务的税前利润为基准,设定个别重大标准的金额,将当期收入确认金额超过个别重大标准的项目全部抽取作为样本;对于当期确认收入小于个别重大标准的项目,使用非统计抽样,结合可容忍错报金额、错报风险、样本总体等因素随机选取样本。样本金额和比例详见下表:
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
数量 | 金额 | 数量 | 金额 | 数量 | 金额 | 数量 | 金额 | |
个别重大样本 | 56 | 4,978.59 | 43 | 8,539.94 | 59 | 7,729.27 | 83 | 6,137.46 |
非个别重大样本 | 162 | 3,807.37 | 229 | 7,817.13 | 142 | 3,850.15 | 118 | 2,151.31 |
抽样样本合计 | 218 | 8,785.96 | 272 | 16,357.07 | 201 | 11,579.42 | 201 | 8,288.78 |
收入金额(总体) | 948 | 14,277.35 | 1,330 | 23,755.81 | 1,110 | 19,265.77 | 750 | 11,907.09 |
抽样样本项目占比 | - | 62% | - | 69% | - | 60% | - | 70% |
(4)应收账款和营业收入的函证程序和函证比例,未回函和回函差异金额及比例,主要未回函和回函差异客户的情况以及履行的替代程序:
一、应收账款和营业收入的函证程序情况
(一)函证程序设计
申报会计师按照《中国注册会计师审计准则第1312号—函证》的相关规定,综合考虑海天瑞声的经营环境、内部控制的有效性、账户或交易的性质、被询证者处理询证函的习惯做法及回函的可能性等,对海天瑞声报告期内的营业收入、应收账款的函证程序进行了恰当的设计,确定了函证的内容、范围、时间和方式。
8-2-1-56
申报会计师对发行人报告期内的主要客户执行了独立函证程序,发函主要通过邮寄纸质函证方式进行。因受境内外新冠病毒疫情影响,对于少量海外客户或受疫情影响无法纸质寄达的国内客户,申报会计师同时发送电子邮件函证。
申报会计师在询证函中所列示的信息通常包括:截至资产负债表日针对该客户的应收账款(或预收账款)余额、当年向该客户实现的销售额、当年向该客户开具的发票明细、当年收到该客户付款的明细,以核实公司与客户之间的交易金额、期末往来余额信息。
申报会计师根据回函差异情况编制回函差异调节表,对回函差异原因予以核实,并对未回函的客户执行相应的替代程序。
(二)发函程序控制情况
对于通过邮寄方式发放的函证,申报会计师独立核对被询证者名称、地址的真实性,以确保询证函中的名称、地址等内容的准确性。
对于通过电子邮件发放的函证,申报会计师独立执行的控制措施包括但不限于:(1)将收件人邮箱的后缀与被询证者官网显示的企业邮箱后缀进行比对;(2)获取发行人与客户在日常沟通时的往来邮件,确认该邮箱地址的使用者确实是被询证者与发行人日常业务往来的联系人且知晓双方的交易情况;(3)将核对后的盖章纸质函证扫描成PDF文件作为邮件附件;(4)由申报会计师独立直接向被函证的客户发送函证,并要求对方直接回复至发件人。
(三)回函程序控制情况
对于通过邮寄方式收到的回函,申报会计师执行下述独立检查程序:(1)检查被询证者确认的询证函是否是原件,是否与发出的询证函是同一份;(2)回函是否由被询证者直接寄给发件方;(3)寄给发函主体的回邮信封或快递信封中记录的发件方名称、地址是否与询证函中记载的被询证者名称、地址相符;(4)回邮信封上寄出方的邮戳显示发出城市或地区是否与被询证者的地址一致;(5)被询证者加盖在询证函上的印章以及签名中显示的被询证者名称是否与询证函中记载的被询证者名称一致。
对于通过电子邮件收到的回函,申报会计师独立核对:(1)发出回函的发件人是否与申报会计师发函时的收件人一致;(2)客户回复的函证附件是否与申报会计师独立发送的原始发函文件一致。
8-2-1-57
二、报告期内应收账款和营业收入发函金额及函证比例,未回函和回函差异金额及比例情况
(一)营业收入
金额单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | |
收入总额 | A | 14,277.35 | 23,755.81 | 19,265.77 | 11,907.09 |
1、发函情况 | |||||
发函金额 | B | 13,024.98 | 21,668.34 | 17,239.82 | 10,839.94 |
发函比例 | C=B/A | 91.23% | 91.21% | 89.48% | 91.04% |
其中:纸质邮寄发函比例 | 77.68% | 89.90% | 88.63% | 89.91% | |
电子邮件发函比例 | 13.55% | 1.32% | 0.85% | 1.12% | |
2、回函情况 | |||||
回函金额 | D | 9,838.12 | 17,973.03 | 15,093.41 | 9,717.38 |
回函比例 | E=K/A | 71.50% | 76.72% | 79.37% | 76.91% |
其中:纸质邮寄回函比例 | 54.15% | 69.58% | 75.21% | 70.91% | |
电子邮件回函比例 | 17.35% | 7.13% | 4.16% | 6.00% | |
回函差异 | F=B-D-H | 370.81 | 251.61 | 198.19 | -559.80 |
回函差异比例 | G=F/A | 2.60% | 1.06% | 1.03% | -4.70% |
未回函金额 | H | 2,816.06 | 3,443.70 | 1,948.22 | 1,682.36 |
未回函比例 | I=H/A | 19.72% | 14.50% | 10.11% | 14.13% |
3、回函差异情况说明及调节、替代核查程序 | |||||
(1)回函差异原因 | |||||
入账时间及暂估税额差异 | J | 370.81 | 251.61 | 198.19 | -559.80 |
(2)回函差异调节 | |||||
经回函差异调节表调整后 回函金额 | K =D+J | 10,208.93 | 18,224.64 | 15,291.60 | 9,157.58 |
经回函差异调节表调整后 | - | - | - | - |
8-2-1-58
回函差异 | |||||
(3)未回函替代核查 | |||||
替代核查金额 | L | 2,816.06 | 3,443.70 | 1,948.22 | 1,682.36 |
(4)函证核查结果 | |||||
调节回函差异、执行替代 程序后可确认的金额 | M=K+L | 13,024.98 | 21,668.34 | 17,239.82 | 10,839.94 |
调节回函差异、执行替代 程序后可确认的金额占比 | N=M/A | 91.23% | 91.21% | 89.48% | 91.04% |
(二)应收账款
金额单位:万元
项目 | 2020年9月30日 | 2019年12月31日 | 2018年12月31日 | 2017年12月31日 | |
应收账款余额 | A | 3,810.01 | 4,660.36 | 3,096.75 | 2,707.57 |
1、发函情况 | |||||
发函金额 | B | 3,477.91 | 4,257.16 | 3,063.41 | 2,401.82 |
发函比例 | C=B/A | 91.28% | 91.35% | 98.92% | 88.71% |
其中:纸质邮寄发函比例 | 85.55% | 91.35% | 98.92% | 85.81% | |
电子邮件发函比例 | 5.73% | - | - | 2.89% | |
2、回函情况 | |||||
回函金额 | D | 1,424.41 | 2,375.16 | 1,590.74 | 1,156.32 |
回函比例 | E=K/A | 67.12% | 79.54% | 79.41% | 76.06% |
其中:纸质邮寄回函比例 | 52.78% | 77.80% | 78.41% | 73.17% | |
电子邮件回函比例 | 14.34% | 1.74% | 1.00% | 2.89% | |
回函差异 | F=B-D-H | 1,132.81 | 1,331.72 | 868.31 | 903.19 |
回函差异比例 | G=F/A | 29.73% | 28.58% | 28.04% | 33.36% |
未回函金额 | H | 920.69 | 550.28 | 604.35 | 342.31 |
未回函比例 | I=H/A | 24.17% | 11.81% | 19.52% | 12.64% |
3、回函差异情况说明及调节、替代核查程序 |
8-2-1-59
(1)回函差异原因 | |||||
入账时间及暂估税额差异 | J | 1,132.81 | 1,331.72 | 868.31 | 903.19 |
(2)回函差异调节 | |||||
经回函差异调节表调整后 回函金额 | K =D+J | 2,557.22 | 3,706.88 | 2,459.05 | 2,059.51 |
经回函差异调节表调整后 回函差异 | - | - | - | - | |
(3)未回函替代核查 | |||||
替代核查金额 | L | 920.69 | 550.28 | 604.35 | 342.31 |
(4)函证核查结果 | |||||
调节回函差异、执行替代 程序后可确认的金额 | M=K+L | 3,477.91 | 4,257.16 | 3,063.41 | 2,401.82 |
调节回函差异、执行替代 程序后可确认的金额 | N=M/A | 91.28% | 91.35% | 98.92% | 88.71% |
注 1:上表中列示的2020年9月30日应收账款余额中包括合同资产。注 2:因受新冠肺炎疫情影响,2020年前三季度电子邮件函证及回函比例有所提高。
三、报告期未回函情况及针对此类情况执行的程序
(一)未回函的原因说明
报告期内,客户未回函的原因主要包括以下4种情况:
情形1:客户根据其内部管理规定不对外部函证进行处理,并以邮件的形式明确告知;情形2:客户认为业务已结算完毕,没有再配合处理外部函证的义务;情形3:客户无专门处理函证的人员和流程,或者客户因相关人员和流程发生变更而未处理函证;情形4:2020年受新冠疫情影响客户延迟复工、人员流动接触受限等原因,因此部分客户未回函。
(二)主要未回函情况
8-2-1-60
申报会计师对报告期内的主要客户独立执行了函证程序,主要未回函客户及其未回函原因列示如下:
1、营业收入
报告期内,各期营业收入未回函的主要客户涉及的未回函原因主要为情形1-3。
2、应收账款
报告期内,各期应收账款未回函的主要客户涉及的未回函原因主要为情形1及情形3。
(三)履行的主要替代程序
针对未回函客户,申报会计师执行了以下替代程序:
1、了解发行人与相应客户之间的验收、结算和对账流程,并对具体业务环节中的关键控制点进行测试;
2、针对营业收入未回函客户,执行收入核查程序,取得当年/期实现的销售收入的支持性依据,包括销售合同、订单、交付和验收记录、发票、银行进账单等,并核对查验当年/期记录的销售收入是否与上述原始凭据相符;
3、针对应收账款未回函客户,取得相应的银行进账单及账务处理记录,检查应收账款的期后回款情况;
4、对发行人主要客户进行实地走访或视频访谈,了解客户和发行人之间的合作模式、合作业务规模和结算方式。通过访谈确认发行人与客户业务和交易的真实性。
(四)执行替代程序结果汇总情况
针对未回函情况履行替代程序核查结果汇总如下:
金额单位:万元
项目 | 2020年1-9月 /2020年9月30日 | 2019年/2019年12月31日 | 2018年/2018年12月31日 | 2017年/2017年12月31日 | ||||||||
未回函金额 | 替代核查金额 | 占比 | 未回函金额 | 替代核查金额 | 占比 | 未回函金额 | 替代核查金额 | 占比 | 未回函金额 | 替代核查金额 | 占比 | |
应收账款 | 920.69 | 920.69 | 100% | 550.28 | 550.28 | 100% | 604.35 | 604.35 | 100% | 342.31 | 342.31 | 100% |
营业收入 | 2,816.06 | 2,816.06 | 100% | 3,443.70 | 3,443.70 | 100% | 1,948.22 | 1,948.22 | 100% | 1,682.36 | 1,682.36 | 100% |
四、报告期回函差异情况及针对此类情况执行的程序
(一)回函差异的原因说明
8-2-1-61
发行人根据项目验收进度确认对该客户的应收账款和营业收入;而客户存在根据收到发行人发票时间作为确认采购和应付账款的时点的情形。发行人向客户开具发票的时间与项目验收时间并不完全同步,导致发行人根据项目验收确认的营业收入、应收账款与客户根据收到发票确认的采购额和应付账款产生不一致情况。
(二)针对回函差异执行的核查程序
针对营业收入、应收账款的回函差异情况,申报会计师执行了核查程序,具体如下:
1、了解发行人与客户之间的验收、结算和对账流程,并抽样对业务环节中的关键控制点进行测试。
2、访谈发行人管理层,了解回函差异的产生原因,通过函证取得客户可协助确认的信息(包括发票与付款信息),与发行人账面记载的应收账款金额、营业收入金额、开具发票金额、客户验收金额和收款金额进行核对,分析其勾稽关系的合理性,并对差异情况进行调节;获取营业收入、应收账款相关的合同订单、交付和验收记录、发票、银行流水等支持性依据,对差异原因进行核实检查。
3、检查应收账款的期后回款,并检查核对至银行进账单等支持性依据。
4、对发行人主要客户进行实地走访或视频访谈,了解客户和发行人之间的合作模式、合作业务规模和结算方式。通过访谈确认发行人与客户业务和交易的真实性。
申报会计师对报告期内的主要客户独立执行了函证程序,下文将营业收入、应收账款的主要函证差异及其调节过程/核查程序情况进行了列示。
(三)营业收入回函差异调节过程
发行人以项目交付与验收进度为依据确认对客户的营业收入,而客户存在按照收到发行人的发票作为确认当期采购的情形,双方核算的差异导致营业收入的回函存在差异,具体分析如下:
类型 | 发行人(以验收为依据) | 客户(以发票为依据) | 是否需要调节 | ||||
数据验收时间 | 开具发票时间 | 确认收入 | 数据验收时间 | 取得发票时间 | 确认采购 | ||
情形1 | 当期 | 当期 | √ | 当期 | 当期 | √ | 否 |
情形2 | 当期 | 前期 | √ | 当期 | 前期 | × | 是 |
情形3 | 当期 | 尚未 | √ | 当期 | 尚未 | × |
8-2-1-62
情形4 | 尚未 | 当期 | × | 尚未 | 当期 | √ |
情形5 | 前期 | 当期 | × | 前期 | 当期 | √ |
注:情形1即发行人确认收入的时间与客户确认采购的时间一致的情形,该情形下无需对营业收入进行调节。除情形1外,其余4种情形均可能导致发行人确认收入的时间与客户确认采购的时间不一致,均需要对回函差异进行调节分析。申报会计师对发行人营业收入回函差异的调节步骤为:以客户回函的金额为基础,结合验收与开具发票各种情形进行调节,最终与发行人的营业收入调节一致,具体过程如下:
营业收入回函差异调节过程 | 项目 | 备注 |
客户回函的发票金额 | - | |
减:当期开票、前期验收 | 情形5 | |
减:当期开票、尚未验收 | 情形4 | |
加:当期验收、前期开票 | 情形2 | |
加:当期验收、尚未开票 | 情形3 | |
调节后的营业收入金额 | - |
(四)主要客户营业收入回函差异调节过程
2017年、2018年、2019年及2020年1-9月,主要客户营业收入回函差异调节过程汇总如下:
单位:万元
三年一期 各期营业收入回函差异主要客户 | 发函金额 | 回函金额 | 营业收入回函差异调节过程 | 调节后金额 | 调节结论 | ||||
当期开票 前期验收 | 当期开票 尚未验收 | 当期验收 前期开票 | 当期验收 尚未开票 | 小计 | |||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=-③-④+⑤+⑥ | ⑧=②+⑦ | |
2020年1-9月 | 4,841.46 | 4,439.70 | 2.12 | 1,441.68 | 797.14 | 1,048.42 | 401.76 | 4,841.46 | 一致 |
2019年 | 11,381.30 | 11,086.37 | 1,400.05 | 1,600.01 | 1,961.20 | 1,333.79 | 294.93 | 11,381.30 | 一致 |
2018年 | 9,741.25 | 9,562.42 | 849.6 | 1,695.50 | 331.49 | 2,392.52 | 178.91 | 9,741.25 | 一致 |
2017年 | 5,618.50 | 6,186.25 | 578.36 | 1,815.49 | 699.01 | 1,127.11 | -567.73 | 5,618.50 | 一致 |
(五)应收账款回函差异核查过程
报告期内各年/期末,发行人根据年初余额、本年含税营业收入、本年收款、本年只开票税金影响等项目变动的逻辑关系计算确认对客户的应收账款余额。其中,开具发票和本
8-2-1-63
年收款可通过客户回函情况确认,本年营业收入根据客户回函情况进行专门调节。只开票税金影响金额较小,主要通过复核未验收已开票项目(包括开票并收预收款和只开票两种类型)金额进行确认。
基于此,申报会计师对于应收账款回函差异的核查方式主要通过检查应收账款年初余额、本年含税营业收入、本年收款、本年只开票税金影响与年末应收账款余额的会计核算逻辑等式的一致性进行核查。
(六)主要客户应收账款回函差异核查过程
2017年末、2018年末、2019年末及2020年9月30日,主要客户应收账款回函差异调节过程汇总如下:
单位:万元
时点 | 期初 | 本期销售 | 只开票税金影响 | 本期收款 | 期末 | 逻辑关系检查 | 核对结论 | 期后回款1 | |
应收账款 | 营业收入 | 含税销售额 | 应收账款 | ||||||
逻辑关系 | ① | ② | ③ | ④ | ⑤ | ⑥ | ⑦=①+③+④-⑤-⑥ | —— | —— |
2020年9月30日 | 494.46 | 2,808.01 | 3,032.18 | -0.53 | 2,137.79 | 1,388.33 | - | 核对一致 | 449.71 |
2019年12月31日 | 1,573.40 | 4,517.26 | 4,825.42 | -10.38 | 4,686.99 | 1,701.45 | - | 核对一致 | 1,701.45 |
2018年12月31日 | 1,159.62 | 6,954.09 | 7,499.07 | -3.41 | 6,667.03 | 1,988.25 | - | 核对一致 | 1,988.25 |
2017年12月31日 | 504.95 | 2,538.56 | 2,781.52 | 20.19 | 2,193.03 | 1,113.63 | - | 核对一致 | 1,113.63 |
注1:期后回款截止日期为2020年11月30日。注2:只开票税金的影响是由于发行人按合同约定节点开具发票,尚未收到款项,且未验收达到收入确认时点,发行人相应确认应收开票税金和应交销项税所导致。
(七)回函差异调节/核查情况汇总
回函差异调节/核查情况汇总如下:
金额单位:万元
项目 | 2020年1-9月 /2020年9月30日 | 2019年/2019年12月31日 | 2018年/2018年12月31日 | 2017年/2017年12月31日 | ||||||||
回函差异金额 | 调节或核查金额 | 占比 | 回函差异金额 | 调节或核查金额 | 占比 | 回函差异金额 | 调节或核查金额 | 占比 | 回函差异金额 | 调节或核查金额 | 占比 |
8-2-1-64
应收账款 | 1,132.81 | 1,132.81 | 100% | 1,331.72 | 1,331.72 | 100% | 868.31 | 868.31 | 100% | 903.19 | 903.19 | 100% |
营业收入 | 370.81 | 370.81 | 100% | 251.61 | 251.61 | 100% | 198.19 | 198.19 | 100% | -559.80 | -559.80 | 100% |
五、结论
申报会计师在对发行人报告期内的营业收入、应收账款的函证按照《中国注册会计师审计准则第1312号—函证》执行,对被询证者的选择、询证函的设计、询证函的发出和收回均保持了恰当的控制。针对回函不符事项,申报会计师追加了必要的核查程序,并最终与函证金额调节一致;针对未回函事项,申报会计师实施了有效的替代性核查程序,并最终与函证金额印证一致。
10.关于采购模式和主要供应商
10.1关于数据服务采购
招股说明书披露:(1)在原料数据采集、数据标注环节,发行人主要向人力资源服务公司(以下简称服务公司)等采购非核心技术环节的数据采集、标注服务;(2)服务公司采用与不同类型终端人员的组织人员(小外包)对接方式来组织终端人员为发行人提供相应服务。根据申报文件,发行人采购数据服务过程中存在少量通过发行人业务人员事先垫付资金的情形。
请发行人补充披露:(1)前五大服务公司名称、采购内容、采购金额及其占比;(2)发行人向自然人和服务公司的采购内容、采购金额及其占比,服务公司采取小外包和直接对接的采购内容、采购金额及其占比;(3)发行人与服务公司、小外包人员和终端人员之间的合作模式、合同签署过程、实际业务执行过程以及资金支付情况;(4)主要原料数据采集、标注服务提供商是否具备必要的业务资质;(5)结合主要原料数据采集、标注服务提供商的规模、员工数量等,说明其是否有足够能力为发行人提供相关服务,相关服务提供商报告期内是否存在以发行人名义招聘实习生或者兼职人员的情形,如存在,请说明具体情况;发行人是否存在以外包名义按劳务派遣用工形式使用劳动者的情形;(6)发行人报告期内是否存在向个人供应商采购原料数据采集、标注服务的情形,如存在,向个人供应商采购的原因及商业合理性;(7)发行人采取何种措施保证供应商提供的数据满足其采集需求,比如如何确定被采集人的年龄、籍贯、性别、口音特点、采集场地以及标注人员的语言背景、专业技能和学历要求等符合采集需求,发行人采取的相关内部控制措施及其有效性;(8)发行人向个人租赁房产的实际用途与其法定用途是否相符。
8-2-1-65
请发行人说明:(1)发行人采购数据采集和标注服务的人员管理、场地使用、进度管理和质量控制措施、验收标准、结算方式、结算对象和结算周期等情况,与数据服务采购相关内部控制的设计是否合理、执行是否有效;(2)报告期各期服务公司小外包人员的数量及其变动情况,是否为服务公司员工,是否存在相互重合的情形,发行人和服务公司对小外包人员的管理措施,是否均由发行人员工直接对小外包人员进行管理和控制;(3)发行人业务人员事先垫付资金的具体原因、后续结算及差异调整情况,是否符合相关内部控制制度的规定,报告期各期事先垫付资金的金额及占比;(4)结合服务公司提供管理服务的内容、过程和必要性,说明发行人向服务公司支付服务管理费的原因及合理性,加成率的定价依据及公允性,不同公司的加成率之间是否存在差异并说明具体原因;(5)采集和标注单价的具体确定依据和过程,同类型项目的采集和标注单价是否存在差异并分析具体原因;(6)采集数据量、标注数据量和标产比相关的确定方法和具体依据,是否存在随意修改或调整的情形,同类型项目的采集数据量、标注数据量和标产比是否存在差异并分析具体原因;(7)劳务数量及数据服务费用变动是否与发行人经营情况相匹配,数据服务费用的采购价格是否公允,劳务用工成本核算是否完整且不存在跨期,发行人建立的相关内部控制措施及执行情况;(8)前述服务公司的基本情况和员工数量,是否与发行人对其的采购规模相匹配,认定同一控制的依据,通过同一控制下不同企业开展业务的原因及合理性,发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务,主要小外包人员的基本情况,服务公司及其关联方和主要小外包人员是否与发行人客户及其关键经办人员、发行人控股股东、实际控制人、发行人关联方、员工及前员工之间存在关联关系、关联交易、资金往来或其他利益安排,是否存在通过服务公司向客户进行商业贿赂的情形;(9)服务公司作为扣缴义务人是否已替小外包人员或终端人员履行了代扣代缴税款义务,是否存在违反相关法律法规的情形。
请发行人律师对披露事项的(4)-(8)进行核查并发表明确意见。
请申报会计师对上述说明事项进行核查并发表明确意见,并说明:(1)未将营业成本认定为关键审计事项的原因;(2)对数据服务采购发生、准确性和截止性认定履行的具体审计程序;(3)对IT审计报告中存在的异常项目履行的进一步审计程序;(4)对服务公司、小外包人员和终端人员履行的具体核查程序、核查过程、核查比例和核查结论。
答复:
发行人补充披露事项
8-2-1-66
(1)前五大服务公司名称、采购内容、采购金额及其占比
发行人已在招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(二)主要供应商情况/2、主要数据服务供应商情况”中补充披露下述内容:
报告期内发行人向前五名数据服务供应商(受同一控制的供应商合并计算采购额)采购情况如下表所示:
金额单位:万元
2020年1-9月 | |||||
序号 | 供应商名称 | 是否为发行人关联方 | 采购金额 | 占采购总额比重 | 采购内容 |
1 | 善世(广东)企业服务外包有限公司8 | 否 | 1,770.18 | 26.26% | 原料数据采集、标注服务 |
共青城宜邦人力资源服务有限公司 | 否 | 1,388.38 | 20.60% | 原料数据标注服务 | |
芜湖善慧人力资源服务有限公司 | 否 | 0.19 | 0.003% | 原料数据采集、标注服务 | |
2 | 北京博睿驰信人力资源有限公司 | 否 | 986.94 | 14.64% | 原料数据采集、标注服务;岗位服务 |
恩泽尔商贸有限公司 | 否 | 244.18 | 3.62% | 原料数据采集、标注服务 | |
3 | Voices.com Inc. | 否 | 211.15 | 3.13% | 原料数据采集服务 |
4 | 北京冠华英才国际经济技术有限公司 | 否 | 184.45 | 2.74% | 原料数据标注服务 |
5 | IVO EMEA Ltd. | 否 | 72.25 | 1.07% | 原料数据采集服务 |
合计 | 4,857.70 | 72.07% | |||
2019年 | |||||
序号 | 供应商名称 | 是否为发行人关联方 | 采购金额 | 占采购总额比重 | 采购内容 |
1 | 芜湖善慧人力资源服务有限公司 | 否 | 1,512.55 | 19.80% | 原料数据采集、标注服务 |
善世(广东)企业服务外包有 | 否 | 1,374.11 | 17.98% | 原料数据采集、标注 |
曾用名“广州善世人力资源服务有限公司”。
8-2-1-67
限公司9 | 服务 | ||||
共青城宜邦人力资源服务有限公司 | 否 | 261.18 | 3.42% | 原料数据标注服务 | |
才星(广州)科技服务有限公司10 | 否 | 5.57 | 0.07% | 原料数据标注服务 | |
2 | 北京博睿驰信人力资源有限公司 | 否 | 1,432.77 | 18.75% | 原料数据采集、标注服务,岗位服务 |
恩泽尔商贸有限公司 | 否 | 140.69 | 1.84% | 原料数据采集、标注服务 | |
3 | 北京冠华英才国际经济技术有限公司 | 否 | 388.90 | 5.09% | 原料数据采集、标注服务 |
4 | Atrium Studio Medienproduktion GmbH | 否 | 138.71 | 1.82% | 原料数据采集服务 |
5 | SAKURA JAPAN LLC | 否 | 114.55 | 1.50% | 原料数据采集服务 |
合计 | 5,369.03 | 70.27% | |||
2018年 | |||||
序号 | 供应商名称 | 是否为发行人关联方 | 采购金额 | 占采购总额比重 | 采购内容 |
1 | 广州善世人力资源服务有限公司 | 否 | 1,755.67 | 19.39% | 原料数据标注服务 |
芜湖善慧人力资源服务有限公司 | 否 | 1,541.91 | 17.03% | 原料数据采集、标注服务 | |
广州金社宝网络技术有限公司 | 否 | 26.89 | 0.30% | 原料数据标注服务 | |
2 | 北京博睿驰信人力资源有限公司 | 否 | 1,829.37 | 20.21% | 原料数据采集、标注服务,岗位服务 |
恩泽尔商贸有限公司 | 否 | 249.09 | 2.75% | 原料数据采集、标注服务 | |
3 | 北京冠华英才国际经济技术有限公司 | 否 | 905.61 | 10.00% | 原料数据采集、标注服务 |
4 | TWIN STUDIOS | 否 | 229.97 | 2.54% | 原料数据采集服务 |
曾用名“广州善世人力资源服务有限公司”。
曾用名“广州金社宝网络技术有限公司”。
8-2-1-68
5 | THINKWILD STUDIOS, S.L. | 否 | 129.85 | 1.43% | 原料数据采集服务 |
合计 | 6,668.36 | 73.66% | |||
2017年 | |||||
序号 | 供应商名称 | 是否为发行人关联方 | 采购金额 | 占采购总额比重 | 采购内容 |
1 | 芜湖善慧人力资源服务有限公司 | 否 | 1,064.36 | 21.02% | 原料数据采集、标注服务 |
广州善世人力资源服务有限公司 | 否 | 658.34 | 13.00% | 原料数据采集、标注服务 | |
2 | 北京博睿驰信人力资源有限公司 | 否 | 536.68 | 10.60% | 原料数据采集、标注服务,岗位服务 |
恩泽尔商贸有限公司 | 否 | 244.78 | 4.83% | 原料数据采集、标注服务 | |
北京零点起航营销策划有限公司 | 否 | 68.11 | 1.35% | 原料数据采集、标注服务 | |
3 | 北京冠华英才国际经济技术有限公司 | 否 | 662.12 | 13.08% | 原料数据采集、标注服务,岗位服务 |
4 | SAKURA JAPAN LLC | 否 | 150.69 | 2.98% | 原料数据采集服务 |
5 | 信阳市联智网络科技有限公司 | 否 | 89.08 | 1.76% | 原料数据采集、标注服务 |
合计 | 3,474.15 | 68.62% |
注:(1)善世(广东)企业服务外包有限公司、芜湖善慧人力资源服务有限公司、才星(广州)科技服务有限公司、共青城宜邦人力资源服务有限公司因共同关联股东持股及共同人员管理而被认定为同一控制主体;(2)北京博睿驰信人力资源有限公司、恩泽尔商贸有限公司均受同一股东控制,且该股东拥有北京零点起航营销策划有限公司的委托经营权,上述三个主体被认定为同一控制主体。
(2)发行人向自然人和服务公司的采购内容、采购金额及其占比,服务公司采取小外包和直接对接的采购内容、采购金额及其占比
发行人已在招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(一)报告期内采购情况/3、发行人向自然人、服务公司采购数据服务情况”中补充披露下述内容:
发行人向自然人和服务公司(包括服务公司采取小外包和直接对接两种形式)的采购内容均为原料数据采集、标注服务,其中自然人为直接向发行人提供服务,服务公司为按照发行人确定的原料数据采集、标注要求(如发音人的性别、年龄、口音地区等需求)寻
8-2-1-69
找匹配的终端采集、标注人员,组织其使用发行人研发的技术、平台、工具等,为发行人提供合乎标准的数据采集、标注服务。报告期内,发行人向自然人和服务公司(包括服务公司采取小外包和直接对接两种形式)的采购金额情况如下:
单位:万元
采购方式 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
采购金额 | 占比 | 采购金额 | 占比 | 采购金额 | 占比 | 采购金额 | 占比 | |
通过服务公司采购 | 5,375.77 | 95.21% | 5,912.58 | 96.93% | 7,231.42 | 98.35% | 3,816.55 | 94.07% |
其中:通过小外包采购 | 3,747.80 | 66.38% | 4,281.03 | 70.18% | 4,567.55 | 62.12% | 1,949.36 | 48.05% |
直接对接采购 | 1,627.97 | 28.83% | 1,631.55 | 26.75% | 2,663.87 | 36.23% | 1,867.19 | 46.02% |
直接向自然人采购 | 270.55 | 4.79% | 187.37 | 3.07% | 121.24 | 1.65% | 240.76 | 5.93% |
数据服务费采购额 | 5,646.32 | 100.00% | 6,099.95 | 100.00% | 7,352.66 | 100.00% | 4,057.31 | 100.00% |
(3)发行人与服务公司、小外包人员和终端人员之间的合作模式、合同签署过程、实际业务执行过程以及资金支付情况
发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况 /(三)主要经营模式/4、数据服务采购情况介绍”中补充披露下述内容:
一、合作模式
发行人与服务公司、小外包人员和终端人员共同合作完成原料数据的采集和标注工作,具体职责划分如下:
1、发行人职责
(1)设计训练数据集结构,确定训练数据集开发标准,制定原料数据采集方案;
(2)确定数据采集、标注标准和规程并提供数据采集、标注过程中所需的技术、平台和工具;
(3)监督采集、标注工作的具体开展;
(4)对采集、标注形成的数据质量进行检测、验证。
2、服务公司职责
8-2-1-70
(1)按照发行人确定的原料数据采集、标注要求(如发音人的性别、年龄、口音地区等需求)寻找匹配的终端采集、标注人员。在部分具体训练数据生产项目中,涉及的终端采集、标注人员数量较多,且覆盖的语种、口音区、年龄特征等要求多种多样,服务公司也采取与不同类型小外包人员对接的方式,来组织终端人员为发行人提供相应服务;
(2)组织上述人员使用发行人研发的技术、平台、工具等,并对服务进度与交付进行管理,保证该等人员提供服务的质量;
(3)对小外包及直接对接的终端人进行人员管理,包括劳务合同签署、进度安排、支付款项、代扣代缴税款等。
3、小外包人员职责
(1)按照发行人确定的原料数据采集、标注要求(如发音人的性别、年龄、口音地区等需求)寻找匹配的终端采集、标注人员;
(2)组织终端人员为发行人提供相应服务。
4、终端人员职责
(1)为发行人提供合乎标准的数据采集、标注服务;
(2)授权发行人使用其提供的数据用于业务经营。
二、合同签署过程、实际业务执行过程
1、发行人与服务公司之间的合同签署及实际业务执行情况
(1)发行人与服务公司等长期签订框架性的数据服务采购协议,约定发行人根据业务需要委托服务公司完成原料数据采集、标注工作,双方根据验收结算单确认的服务量和收费标准结算数据服务费;
(2)发行人根据服务公司的地区覆盖能力、资源匹配能力和管理能力,对于不同的业务类型选择不同服务公司进行合作,例如智能语音业务涉及人员规模大、覆盖地区多,因此优先选择体量规模相对较大的善世系服务公司(包括善世(广东)企业服务外包有限公司、芜湖善慧人力资源服务有限公司、共青城宜邦人力资源服务有限公司等同一控制主体),服务公司根据下属主体划分的覆盖区域确定具体服务主体;
8-2-1-71
(3)发行人在实际业务执行时通过会议、邮件等方式向服务公司沟通具体采购需求,确认服务工期要求,原料数据采集、标注服务量,被采集人的年龄、籍贯、性别、口音特点、采集场地等,以及标注人员的语言背景、专业技能和学历要求等;
(4)服务公司根据寻找的人力资源情况,将价格信息反馈给发行人,发行人参考业务采购价格体系和过往执行的同类项目的价格,并结合当前项目可能存在的特殊要素要求,与数据服务提供商协商确认价格信息,双方达成一致后确定采集和标注单价;
(5)发行人在数据服务采购过程中,对采集、标注人员或其组织人员(服务公司人员或小外包人员)进行培训,部署所需的平台和工具,并下达采集、标注的具体要求;
(6)发行人把控项目执行的时间进度,敦促服务公司及其相关人员按时交付数据,并持续监督、关注交付的数据质量。
2、服务公司与小外包人员以及直接对接的终端人员之间的合同签署及实际业务执行情况
(1)服务公司与小外包人员以及直接对接的终端人员签署劳务服务合同;
(2)服务公司在实际业务执行时对其进行监督、管理,包括进度时间安排、人员信息登记、直接对接的终端人员授权签署、人员纠纷解决等,确保其提供发行人所需的数据服务,以及提供数据的完整性;
(3)服务公司在数据服务采购过程中会持续与发行人进行沟通,获取发行人对采标服务及数据质量的反馈情况,及时反馈给小外包人员和直接对接的终端人员,确保其为发行人提供服务的质量。
3、小外包人员与其管理的终端人员之间的实际业务执行情况
(1)小外包人员根据发行人数据服务采购需求寻找符合条件的终端人员;
(2)小外包人员组织并管理终端人员提供劳务,包括人员信息登记、终端人授权签署、人员工作时间安排及现场引导、对终端人员的服务进度和数据完整性进行把控等。
三、资金支付情况
发行人按项目进度向服务公司结算采购费用,统一采用银行转账的形式。服务公司收到资金后,向小外包人员和其直接对接的终端人员支付劳务费用,统一采用银行转账的形式。小外包人员收到资金后向终端人员支付劳务费用。
8-2-1-72
四、数据服务采购执行过程示例
以2019年某唤醒词命令词语音识别采集项目为例,该项目采集人数超过200人,采集对象要求多地区、可进行标准美国英语发音、年龄结构多样,采集工期为15天,发行人与服务公司、小外包人员和终端人员之间的数据服务采购过程如下:
1、发行人与各数据服务提供商签订采购框架协议,包括芜湖善慧人力资源服务有限公司(以下简称“芜湖善慧”),双方约定服务费率为10%;
2、发行人综合考虑该项目所需要的语音识别采集人员数量较多、覆盖地区较广、工期较紧等实际情况,参考各服务公司的资源匹配能力和管理能力,并结合服务公司对于下属主体覆盖区域的划分,确定选择芜湖善慧作为该项目的供应商;
3、发行人自测标产比,并与芜湖善慧沟通后达成一致,按照项目所需标注的数据量与标产比的乘积计算所需的标注工时,该项目中所需标注的数据量为200小时,约定的标产比是2.625;
4、发行人以电子邮件形式向芜湖善慧下达采购通知,写明项目简介、服务工期要求,并明确项目采购量为采集服务210人,标注服务525小时,其中标注服务525小时=所需标注的数据量200小时*标产比2.625;
5、芜湖善慧通过小外包人员在上海、深圳、成都等地寻找到足够数量的终端采集人员,同时直接寻找了部分终端标注人员,将报价信息反馈给发行人,经发行人判断符合其业务采购价格体系及同类项目价格区间,双方达成一致确定采集单价和标注单价;
6、服务公司与小外包人员和直接对接的终端人员签订劳务合同,双方正式确定劳务关系;
7、发行人对小外包人员、终端人员进行培训,部署所需的平台和工具,小外包人员组织并管理终端人员开始进行原料数据的采集和标注,服务公司进行全程的监督、管理;
8、服务公司根据原料数据的采集和标注情况,保持与发行人、小外包人员、终端人员等各方的及时沟通,确保采购服务工期进度及数据质量,并向发行人交付采集标注后的数据;
9、发行人对数据进行质量验收后,与服务公司进行结算并出具验收结算单。验收结算单由发行人与服务公司双方盖章确认,记载经发行人验收合格的采集、标注工作量,以及经双方约定一致的采集、标注单价信息。发行人根据验收结算单计算的数据服务费金额
8-2-1-73
(数据服务费=验收工作量*单价)向服务公司进行支付,并按照框架协议中约定的服务费率按比例支付给服务公司。服务公司按照约定将发行人支付的数据服务费部分支付给小外包人员和直接对接的终端人员,小外包人员收到资金后向其寻找的终端人员支付劳务费用。
(4)主要原料数据采集、标注服务提供商是否具备必要的业务资质发行人已在招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(二)主要供应商情况/2、主要数据服务供应商情况”中补充披露下述内容:
由于相关法律法规并未就原料数据的采集、标注服务规定专门的业务资质许可,主要原料数据采集、标注服务提供商向发行人提供原料数据采集、标注服务不需要取得专门的业务资质。根据中国境内主要原料数据采集、标注服务提供商的营业执照,其为发行人提供数据采集、标注服务未超出其《营业执照》上核准的经营范围。主要原料数据采集、标注服务提供商与发行人合作,具备提供相关服务的能力,能够按照与发行人的协议约定提供原料数据采集、标注服务。
8-2-1-74
(5)结合主要原料数据采集、标注服务提供商的规模、员工数量等,说明其是否有足够能力为发行人提供相关服务,相关服务提供商报告期内是否存在以发行人名义招聘实习生或者兼职人员的情形,如存在,请说明具体情况;发行人是否存在以外包名义按劳务派遣用工形式使用劳动者的情形
一、结合主要原料数据采集、标注服务提供商的规模、员工数量等,说明其是否有足够能力为发行人提供相关服务
发行人已在招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(二)主要供应商情况/3、主要数据服务供应商服务能力、服务提供情况说明”中补充披露下述内容:
(一)主要原料数据采集、标注服务提供商的规模、员工数量等情况如下:
8-2-1-75
序号 | 供应商 名称 | 成立 日期 | 注册资本 | 股权结构 | 注册地 | 实际经营地 | 业务经营 情况 | 合作期间员工数量(人) | 合作期间 营业收入 (万元/年) |
1 | 善世(广东)企业服务外包有限公司 | 2014年2月 | 2,100万元 | 陈玦霏持股40% | 广州市白云区齐富路自编5号718房 | 人力资源外包、劳务承揽、劳务派遣服务等 | 90-150 | 13,000-28,000 | |
白云持股40% | |||||||||
高洁持股20% | |||||||||
共青城宜邦人力资源服务有限公司 | 2019年3月 | 200万元 | 夏建平持股70% | 江西省九江市共青城市科技一大道66号3楼308室 | |||||
陈礼秋持股30% | |||||||||
芜湖善慧人力资源服务有限公司 | 2016年11月 | 200万元 | 陈玦霏持股32% | 安徽省芜湖市镜湖区镜湖世纪城绿地新都会办公C座15层077号 | 安徽省芜湖市镜湖区镜湖世纪城绿地新都会D座16层 | ||||
莫天勤持股32% | |||||||||
徐洪超持股30% | |||||||||
欧阳刚持股3% | |||||||||
王宏志持股3% | |||||||||
才星(广州)科技服务有限公司 | 2016年5月 | 680万元 | 王宏志持股40% | 广州市海珠区阅江中路832号3605、3606房 | |||||
莫天勤持股30% | |||||||||
陈玦霏持股30% | |||||||||
2 | 北京博睿驰信人力资源有限公司 | 2013年5月 | 500万元 | 王驰持股100% | 北京市大兴区滨河街27号14层1402 | 劳务服务、劳务派遣、企业管理咨询等 | 45-65 | 2,000-5,200 | |
恩泽尔商贸有限公司 | 2016年9月 | 5万美元 | 王驰持股100% | 马绍尔群岛 | 北京市大兴区滨河街27号14层1402 | ||||
北京零点 | 2013年12 | 200万 | 张立文持股50% | 北京市大兴区滨河 |
8-2-1-76
起航营销策划有限公司 | 月 | 元 | 刘凡茂持股50% | 街27号14层1402 | |||||
3 | 北京冠华英才国际经济技术有限公司 | 1999年11月 | 11,000万元 | 齐宝春持股50% | 北京市平谷区平谷北街甲15号院2号1层101 | 北京朝阳区北三环安贞桥东胜古家园2号冠华商务会馆2层 | 专业承包、劳务分包、劳务派遣等 | 约100 | 19,000-26,000 |
孙进荣持股50% | |||||||||
4 | 信阳市联智网络科技有限公司 | 2016年1月 | 1,000万元 | 洪琪持股100% | 信阳市羊山新区新八街信阳电子商务产业园大厦二层205 | 网络信息技术开发与服务、计算机领域的技术服务等 | 约100 | 180-470 | |
5 | SAKURA JAPAN LLC | 2016年12月 | 50万日元 | 高見一廣持股60% | 栃木県小山市横倉新田95-208 | 人力资源服务、技术服务等 | 约50 | 600-1,000 | |
劉暁傑持股40% | |||||||||
6 | THINKWILD STUDIOS, S.L. | 2009年5月 | 3,010欧元 | Rossana Giacomelli 和 Carlos Gomez-Mira共同持股 | C/ Castillo de Fuensalda?a N?4 Las Rozas, 28232 Madrid Spain | 录音制作等 | -- | -- | |
7 | TWIN STUDIOS | 1996年1月 | 48,000欧元 | -- | 2 AVENUE DU MARECHAL MAUNOURY 75016 Paris 16th Arrondissement | 录音制作等 | -- | -- | |
8 | Atrium Studio Medienproduktion GmbH | 1998年 | -- | -- | Zielstattstr. 33 81379 München | 录音制作等 | -- | -- | |
9 | Voices.com Inc | 2003年12月 | -- | David Ciccarelli和Stephanie Ciccarelli共同持股 | 100 Dundas St., Suite 700 London, ON N6A 5B6 Canada | 录音制作等 | 约100 | -- | |
10 | IVO EMEA LTD. | 1998年 | -- | -- | 32 Merrion Street Upper, D02 KW80, Ireland | 录音制作等 | 15-20 | 100万美元-500万美元之间 |
注:(1)北京博睿驰信人力资源有限公司、恩泽尔商贸有限公司、北京零点起航营销策划有限公司的合并员工数量及营业收入计算包含与其受同一控制的北京天创共盈科技发展有限公司、北京中惠商客科技有限公司;(2)信阳市
8-2-1-77
联智网络科技有限公司的员工数量及营业收入计算包含与其受同一控制的信阳市晨曦电子科技有限公司;(3)上述部分境外供应商未提供相关资料信息。
(二)发行人对原料数据采集、标注服务提供商的主要需求
发行人从事数据采集、标注所需劳务人员数量较大、临时性较强、对人员响应速度要求较快,且该类工作的执行为非核心技术环节,无需较高技术门槛,而服务提供商专业从事大量人员招募和管理工作,能够满足发行人相关服务需求,因此发行人主要通过向服务提供商采购的方式完成数据采集、标注的业务环节。发行人对服务提供商的主要需求如下:
1、接收并传达采集、标注需求:发行人与服务提供商沟通确定数据采集、标注的数量、具体要求、时间进度等,并对服务提供商进行培训,服务提供商接受发行人的服务需求,并将服务要求传达给所联系的劳务人员(包括可以直接提供服务的终端人或有相应能力的小外包人员);
2、人员寻找和管理:服务提供商按发行人指定要求寻找上述劳务人员,并对该等劳务人员进行管理,与其签署劳务协议,按服务量向其支付劳务报酬,并为其代扣代缴个税等;
3、工作进度与数据交付管理:服务提供商或小外包人员对终端人进行数据采集、标注的进度等进行监督管理;服务提供商持续与发行人进行沟通,获取发行人对数据服务质量的反馈情况,及时反馈给小外包、直接对接的终端劳务人员,保证其提供服务的质量。
(三)主要原料数据采集、标注服务提供商有足够能力为发行人提供服务
1、主要原料数据采集、标注服务提供商具有相关人员资源
数据采集、标注服务不涉及专门的业务资质。上述表格所列1-5项主要原料数据采集、标注服务提供商具体从事对外提供劳务/技术服务的业务经营,积累了相关人员资源;上述表格所列6-10项主要原料数据采集、标注服务提供商为专业录音机构,具有专业发音人资源。服务提供商均能够及时响应发行人对数据采集、标注人员的需求。
2、主要原料数据采集、标注服务提供商具有人员管理等业务经验
上述表格所列1-5项主要原料数据采集、标注服务提供商具有人员管理、项目管理或技术服务的业务经验,经发行人培训后能够掌握数据采集、标注的规范和流程,能够按发行人要求对数据采集、标注的进度、质量进行管控。上述表格所列6-10项主要原
8-2-1-78
料数据采集、标注服务提供商为专业录音机构,具有专业的录音场地和人员及项目管理经验,能够为发行人提供对录音指标、录音环境要求较高的数据采集服务。上述主要原料数据采集、标注服务提供商在与发行人合作过程中,均按照协议约定提供数据采集、标注服务,未发生因其自身能力问题与发行人停止合作的情形。综上,主要原料数据采集、标注服务提供商有足够能力为发行人提供相关服务。
二、相关服务提供商报告期内是否存在以发行人名义招聘实习生或者兼职人员的情形,如存在,请说明具体情况发行人已在招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(二)主要供应商情况/3、主要数据服务供应商服务能力、服务提供情况说明”中补充披露下述内容:
根据相关服务提供商的确认及网络公开检索,相关服务提供商报告期内不存在以发行人名义招聘实习生或者兼职人员的情形。相关服务提供商通过其自身招聘渠道寻找劳务人员,并直接与劳务人员签署劳务协议。根据实际业务需要,发行人存在少量以自身名义临时招聘实习生或兼职人员的情形。
三、发行人是否存在以外包名义按劳务派遣用工形式使用劳动者的情形
发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况 /(三)主要经营模式/5、数据服务采购的合规性说明”中补充披露下述内容:
根据《中华人民共和国劳动合同法》、《中华人民共和国劳动合同法实施条例》、《劳务派遣暂行规定》等的规定,劳务派遣是指用工单位与劳务派遣单位订立劳务派遣协议,劳务派遣单位与被派遣劳动者订立劳动合同,被派遣劳动者在约定的用工单位相应岗位上工作的制度。劳务外包是指企业将部分业务或工作发包给外包服务单位,由外包服务单位安排人员完成相关的业务或工作,企业按照业务或工作的完成情况与外包服务单位进行结算,劳务外包关系适用《中华人民共和国合同法》。
发行人与数据服务提供商之间的业务合作属于劳务外包关系,与劳务派遣的主要区别如下:
区别 | 劳务派遣 | 发行人与数据服务提供商之间的业务关系 |
合同 关系 | 实际用工单位与劳务派遣单位签订劳动派遣协议,劳务派遣单位与劳务派遣人员签订劳动合同。 | 发行人和数据服务提供商签署《业务服务协议》,对服务提供商采购服务,服务提供应商向发行人提供合同约定的服务。 |
8-2-1-79
服务提供商根据项目需要与劳务人员签署劳务协议 | ||
费用 结算 | 实际用工单位向劳务派遣单位支付劳务派遣费用,具体根据被派遣员工的人数、派遣用工的工作时间和约定的薪酬标准等支付对应费用。 |
服务人员的管理 | 被派遣人员在实际用工单位处工作,接受实际用工单位管理,需要遵守用工单位的相关规章制度,在用工单位的工作时间内专为用工单位提供劳务。 | 数据服务提供商提供服务对应的终端人员不在发行人处工作,也不接受发行人管理,并非专门为发行人提供劳务。 发行人仅按照采购合同约定要求服务提供商提供服务。 |
综上,发行人与数据服务提供商签署合同,由数据服务提供商提供原料数据的采集、标注等服务,发行人要求数据服务提供商按照约定交付工作成果,并按照服务项目的验收成果进行结算,不对劳务人员具体进行管理,不要求劳务人员遵守发行人员工规章制度。因此,发行人委托数据服务提供商提供原料数据采集和标注服务构成劳务外包,发行人不存在以外包名义按劳务派遣用工形式使用劳动者的情形。
(6)发行人报告期内是否存在向个人供应商采购原料数据采集、标注服务的情形,如存在,向个人供应商采购的原因及商业合理性
发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况 /(三)主要经营模式/4、数据服务采购情况介绍”中补充披露下述相关内容:
报告期内,在个别业务中,发行人存在向个人供应商采购原料数据采集、标注服务的情形。该等向个人供应商采购的金额较低,占比很小,并非发行人主要采用的采购模式,而是作为发行人在个别业务中的少量补充性采购,满足发行人的零散数据服务采购需求,具备商业合理性,并且不对发行人业务经营构成重大影响。发行人向个人供应商采购的具体金额及占比请参见本问题“发行人补充披露事项/(2)发行人向自然人和服务公司的采购内容、采购金额及其占比,服务公司采取小外包和直接对接的采购内容、采购金额及其占比”。
(7)发行人采取何种措施保证供应商提供的数据满足其采集需求,比如如何确定被采集人的年龄、籍贯、性别、口音特点、采集场地以及标注人员的语言背景、专业技能和学历要求等符合采集需求,发行人采取的相关内部控制措施及其有效性
发行人已在招股说明书“第六节 业务和技术/一、发行人主营业务、主要产品或服务的情况 /(三)主要经营模式/4、数据服务采购情况介绍”中补充披露下述相关内容:
8-2-1-80
发行人有效执行了一系列质量控制措施,以确保供应商提供的数据满足其采集需求。具体如下:
1、与供应商充分沟通传达采集、标注需求:发行人在根据项目情况确定采购需求后,即通过会议、邮件等方式与供应商进行沟通,明确被采集人的年龄、籍贯、性别、口音特点、采集场地等,以及标注人员的语言背景、专业技能和学历要求等。对于重要项目,发行人会与供应商就上述要求进行书面确认,确保最终的采集、标注人员符合发行人需求。
2、采集、标注人员属性的事前验证:在原料数据的采集、标注工作开始前,发行人会直接或通过供应商、小外包人员对终端人员进行身份验证,包括身份证明、学历证明、资质证明等,验证被采集人的年龄、籍贯、性别、口音等身份特征和标注人员的专业性。标注人员需要进行试标注,以检查其专业技能,并可能通过多个标注人员进行交叉验证。同时,发行人会对服务公司人员、小外包人员或终端人员进行规则培训,培训合格后正式开始原料数据的采集、标注。
3、数据质量的事中控制:在原料数据的采集、标注过程中,发行人提供技术人员、管理人员,全程监督指导,确保交付的数据质量符合要求。数据采集、标注工作主要在发行人的平台、工具上执行,发行人通过其系统对数据进行自动检验,通过检验的数据才能保留在系统中,进行下一步的生产环节、交付及验收。
4、数据质量的事后验收:在原料数据的采集、标注工作结束后,发行人按照制定的验收标准对采集或标注形成的数据进行验收,包括工具质检、人工复核、抽检等形式,确保其符合发行人需求。对于可在采集、标注后数据中体现的人员属性(如性别、口音等),发行人通过事后对数据进行质检进一步复核是否符合前期提出的采集需求。
上述质量控制措施涉及的发行人内部控制手段为采购前下达采购通知和采购执行过程中的质量检查。发行人采取的相关内部控制措施及其有效性的具体情况请参见本问题“发行人说明事项/(1)发行人采购数据采集和标注服务的人员管理、场地使用、进度管理和质量控制措施、验收标准、结算方式、结算对象和结算周期等情况,与数据服务采购相关内部控制的设计是否合理、执行是否有效/二、与数据服务采购相关内部控制的设计是否合理、执行是否有效”。
综上,发行人采取的质量控制措施能够保证供应商提供的数据满足其采集需求,发行人采取了相关内部控制措施并有效执行。
8-2-1-81
(8)发行人向个人租赁房产的实际用途与其法定用途是否相符发行人已在招股说明书“第六节 业务和技术/五、发行人的主要固定资产和无形资产 /(一)主要固定资产”中补充披露下述相关内容:
发行人目前向个人租赁的主要房产的用途等情况如下:
序号 | 出租方 | 租赁房屋坐落 | 租赁期限 | 实际用途 | 不动产权证 记载用途 |
1 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、07、08、09、11 | 2020年5月17日至2022年5月16日 | 办公 | 办公 |
2 | 赵峻 | 北京市海淀区成府路28号3-801、3-803、3-807、3-809 | 2020年5月16日至2021年5月15日 | 办公 | 办公 |
3 | 徐小勇、苗英 | 北京市海淀区成府路28号12层4-1215 | 2020年4月19日至2021年4月18日 | 办公 | 办公 |
上述出租方提供了租赁房屋的不动产权证,发行人实际使用用途与其产权证上记载房屋用途均为办公,因此,发行人向个人租赁房产的实际用途与其法定用途相符。发行人说明事项
(1)发行人采购数据采集和标注服务的人员管理、场地使用、进度管理和质量控制措施、验收标准、结算方式、结算对象和结算周期等情况,与数据服务采购相关内部控制的设计是否合理、执行是否有效
一、发行人采购数据采集和标注服务的具体情况
采购内容 | 人员管理 | 场地使用 | 进度管理 |
原料数据采集、标注服务 | 服务公司、小外包负责对参与采集、标注的人员进行管理,具体职责划分如下: ①服务公司:直接监督、管理小外包及其直接对接的终端人员;管理前述人群的劳务关系(包括劳务合同签署、进度时间安排、人员信息登记、终端人授权签署等)、按经核对一致的服务量支付款项,并为其代扣代缴需要缴纳的社保、个税等。 ②小外包:负责寻找符合发行人要求的终端劳务人员;组织并管理终端人提供 | 依据项目要求确定,有的项目在服务公司、小外包提供的场地进行;有的项目在发行人提供的场所进行 | 发行人、服务公司、小外包均参与进度监控和管理。具体职责如下: ①发行人:负责在采集、标注的具体执行过程中,对采集、标注人员或其组织人员(服务公司人员或小外包)进行培训,部署采集、标注所用平台、工具,下达采集、标注的具体要求;把控项目整体执行的时间进度,敦促服务公司及其相关 |
8-2-1-82
劳务:包括人员信息登记、终端人授权签署、人员工作时间安排及现场引导等;与其负责的终端人进行结算支付。 | 人员按时交付数据。 ②服务公司:负责敦促小外包及其直接对接的终端人员按时提供发行人所需的数据服务,保证提供数据的完整性。 ③小外包:负责对其负责的终端人的服务进度和数据完整性进行把控等。 |
(续)
采购内容 | 质量控制措施 | 验收标准 |
原料数据采集、标注服务 | 发行人、服务公司均参与质量控制,具体职责如下: 发行人: ①订单确认:发行人通过会议或者邮件等方式与服务公司详细沟通需求;如被采集人的年龄、籍贯、性别、口音特点、工期要求、采集场地等;标注人员的语言背景、专业技能和学历要求等。重要项目会对该类要求有书面确认,保证被采集人和标注员的构成符合发行人制定的要求。 ②原料数据采集和标注过程管理:发行人对服务公司人员、小外包或终端服务人员进行采集、标注规程相关培训,培训合格后开始原料数据的采集、标注工作。采集、标注具体过程中,发行人的技术人员和管理人员会进行监督和指导,确保交付的原料数据或标注数据符合发行人的质量标准。 ③质检及验收:发行人根据项目工期对服务公司负责采集或标注的数据进行验收。验收前发行人会进行质量验证,数据采集和标注的工作主要在海天瑞声提供的平台、工具上进行,系统提供自动验证方式,搭配人工复核、抽检等方式,通过质量验证的数据即实现交付及验收。根据双方合同约定,根据服务数据量,发行人与服务公司签署验收结算单予以确认,不符合要求的不予验收。 服务公司: 在采集、标注具体执行过程中,持续与发行人进行沟通,获取发行人对采标服务及数据质量的反馈情况,及时反馈给小外包、终端劳务人员,确保其为发行人提供服务的质量。 | 根据双方约定来确定验收标准,验收标准主要包括数据数量及根据不同项目设定的质量参数(如:声音参数和声音质量、声音文本一致性、图像像素等级、文本规模等) |
根据双方约定来确定验收标准,验收标准因项目不同会有所差异(一般验收标准参数包括:标注字准确率、句准确率、图像框位置准确率等) |
(续)
8-2-1-83
采购内容 | 结算方式 | 结算对象 | 结算周期 |
原料数据采集、标注服务 | 发行人与服务公司根据验收结算单对账,依据双方认可的数据质量、数量进行结算,并以银行对公转账方式付款。 | 发行人向服务公司结算 | 按月/半月/周结算,以周结算为主 |
二、与数据服务采购相关内部控制的设计是否合理、执行是否有效
(一)发行人数据服务采购相关的内部控制情况
报告期内,发行人建立了《海天瑞声采购管理制度》、《海天瑞声项目管理办法》、《海天瑞声供应商管理制度》、《海天瑞声合同管理制度》和《海天瑞声业务采购实施细则》等规章制度作为对外采购数据服务的制度依据。针对数据服务采购业务环节涉及的控制点(年度总体预算、供应商选择和持续管理、采购协议签署、采购价格管理、立项及预算管理、采购申请与审批、下达采购需求、供应商提供服务、验收结算及费用报销、供应商付款、项目决算、业财核对),发行人均制定了、采取了有效的控制措施/活动,并确保数据服务采购管内控制度有效执行。具体控制手段及制度设置情况如下:
数据服务采购主要业务环节/控制点 | 控制手段 | 控制频率 | 内控制度 |
年度总体预算 | 年度采购预算 | 年度采购预算:每年一次 | 《海天瑞声全面预算管理办法》 《海天瑞声项目管理办法》 |
供应商选择和持续管理 | 《合格供应商名录》管理 | 每年定期评估一次,不定期更新维护 | 《海天瑞声供应商管理制度》 |
采购价格管理 | 采购价格体系 | 持续维护,每半年更新一次 | 《海天瑞声采购管理制度》 《海天瑞声业务采购实施细则》 |
采购协议签署 | 合同签订审批 | 每个合同审批一次 | 《海天瑞声采购管理制度》 《海天瑞声业务采购实施细则》 《海天瑞声合同管理制度》 |
立项及项目预算管理★ | 项目预算 | 每个项目一次 | 《海天瑞声项目管理办法》 |
采购申请与 审批 | 审批控制 | 每类申请审批一次 | 《海天瑞声采购管理制度》 《海天瑞声业务采购实施细则》 |
下达采购通知★ | 采购会议、发送采购需求邮件 | 每个项目一次 | 《海天瑞声业务采购实施细则》 |
8-2-1-84
供应商提供 服务 | 标准制定、服务过程监督和指导、质检、验收 | 提供服务全过程跟踪控制 | 《海天瑞声项目管理办法》 |
验收结算及费用报销★ | 报销申请审批、验收结算确认单盖章确认 | 每次申请审批一次、每次报销与供应商签订确认单 | 《海天瑞声项目管理办法》 |
供应商付款 | 付款审批 | 每次申请审批一次 | 《海天瑞声财务报销及借款管理办法》 |
项目决算★ | 项目决算 | 每个项目一次 | 《海天瑞声项目管理办法》 |
业财核对★ | 业财核对 | 每月一次 | 《海天瑞声会计核算制度》 |
注:上述过程中的关键控制节点以★标示。
各控制点及其对应的控制手段具体说明如下:
1、年度总体预算
发行人实施全面预算管理。各年年初,发行人会针对各业务条线制定总体收入计划,结合各业务指导毛利率、一般性支出结构情况计算得到关于数据服务采购金额总量的大致预算情况。
上述年度预算由发行人财务部门会同各部门共同起草制定,经董事会、股东大会审批生效。
2、供应商选择和持续管理
发行人建立“供应商评估标准”,对《合格供应商名录》内的数据服务供应商进行年度评估,重点评估要点包括人员需求完成程度、响应速度、提供数据的数量和质量等,保证其在各方面均可满足公司要求,可作为合格供应商与公司继续合作。若已有《合格供应商名录》内的供应商无法满足需求时,发行人将从外部寻找新供应商,首先针对新供应商进行资质评估,评估范围主要包括基本工商资质、主要产品与服务、售后服务情况和价格水平等,经总经理办公会审批后进入《合格供应商名录》,后续才可启动后续采购 。
3、采购价格管理
发行人建立了业务采购价格体系,用于汇总和追踪采集与标注服务的单价实施情况和变动情况,同时作为业务采购的价格指导。该体系每半年更新一次,以确保该价格体系与公司实际采购情况、市场价格相符。采购部对该体系中的价格进行定期公允性检查,以确保采购价格在合理范围内。检查方式包括但不限于同类供应商询价、供应商及其内
8-2-1-85
部人员访谈、发布模拟招聘信息询价、波动原因解析等。对超出价格体系范围10%以上的采购需求,需对原因进行说明,并在采购部备案。
4、采购协议签署
发行人与供应商签署框架合作协议,约定双方的权利与义务等,并约定数据服务管理费费率和结算方式。发行人在正式合同签署前,要求由采购部专员提交《合同审批表》,并按公司规定,经过采购部门负责人、业务部门负责人、财务部、法务和总经理审批后,方能正式签署合同。
5、立项及项目预算管理★
在项目执行之前,发行人需要对每个项目编制详细的项目预算。立项及项目预算管理,是发行人保证成本完整性、准确性的重要控制点,一般项目为三级审批制,重大项目为五级审批制。
对于项目预算中数据服务费部分,采集数据量需要参照“以销定采”的业务逻辑,根据销售合同或订单约定的交付数据量并考虑合理的采集损耗率后确定,标注量(即有效工时)根据采集数据量并参照合理的标产比后确定;标产比根据项目启动前的自测标产比或与客户约定的标产比确定;采集单价和标注单价参照公司采购价格体系确定;项目负责人编制预算时需要将数据服务费的采购量、采购单价均按工作环节逐项、单独填报于业务管理平台,经过业务部门、财务部等多层级审批通过后才可执行。
对于上述采购量,发行人执行的主要复核环节如下:①将预计采集数据量、标注数据量与销售合同或订单约定的交付数据量之间进行核对,保证预算采购数据量的真实、完整、准确;②分析采集损耗率的合理性,对比同类项目间的标产比,保证预计采集数据量和有效工时的合理、完整;③综合考虑市场价格和该供应商的过往采购价格,对比采购价格体系,对采集、标注单价进行复核,保证预算中采集、标注单价的合理性;
④根据销售合同或订单金额、预算支出金额,测算预算毛利率,复核项目盈利能力的合理性。
6、采购申请与审批
业务部门需提出采购申请,以对采集和标注服务的采购行为的发起进行合理性控制,经部门直属负责人、部门分管负责人、采购部三级审批,确保采购需求及供应商选择的合理性。
7、下达采购通知★
8-2-1-86
发行人通过以下两种方式向供应商下达采购通知:1、与数据服务供应商召开采购会议,形成采购会议纪要;2、发送采购需求邮件。采购通知中对采集、标注需求进行明确规范。采购通知的内容包括项目简介、服务工期、符合项目预算的原料数据采集、标注服务量、采集或标注的人员要求和特别要素(例如被采集人的年龄、籍贯、性别、口音特点、采集场地,标注人员的语言背景、专业技能、学历要求)等。其中原料数据标注服务量根据需要标注的数据量与双方协商确定的标产比相乘计算得出。
8、供应商提供服务(采购执行)
在供应商提供服务过程中,发行人的技术人员和管理人员负责对服务公司人员、小外包人员或终端服务人员进行规则培训,培训合格后开始采集或标注。在原料数据采集、标注过程中,发行人会参与监督和指导,确保其交付的数据符合发行人的要求。
9、验收结算及费用报销★
供应商采集与标注完毕后,业务部门项目负责人进行验收,并将质量验收合格的采集数据量、有效工时等信息录入表格/信息系统(即采购量录入环节),并要求终端劳务人员签字确认其提供的劳务工作量。在上述过程中的采购量录入环节,复核人员针对采集、标注各环节的数据量执行了详细的比对、复核程序,具体如下:
①对于采集:复核人员对录入的采集数据量、交付数据量与采集环节的结算量等业务量信息进行交叉比对,如存在重大差异,需由项目负责人解释原因;如与预算对比出现重大差异,需经业务分管负责人、财务负责人审批。具体核对内容包括:交付数据量对比采集数据量,是否总体基本一致,采集损耗率是否在合理范围内;设计数据量对比采集数据量,是否总体基本一致;音频文件个数对比采集数据量,是否一致;采集数据量对比采集结算量,是否存在异常结算情况;采集结算量对比预算采购量,是否存在较大偏离;复核实际采集产出比,是否与商务约定或预算方案一致;采集单价对比预算单价,是否出现重大偏离。
②对于标注:复核人员针对标产比、有效工时进行合理性复核;如有效工时与预算对比出现重大差异,需经业务分管负责人、财务负责人审批。具体核对内容包括:对比采集数据量,复核标注工作覆盖的标注数据量是否完整;标产比对比预算,是否出现重大偏离;标产比在同类项目中进行对比,是否出现重大异常或偏离;有效工时的计算是否准确;标注单价对比预算单价,是否出现重大偏离。
业务部门项目负责人将载有采集数据量、有效工时、采购单价等信息的采购支出申请在业务管理平台中提交报销申请,部门分管负责人、财务部通过检查采集损耗率、标产比、项目预算以及生产系统日志记录等信息来验证报销数据的合理性,确认无误后对
8-2-1-87
报销申请进行审批,审批后,系统生成《验收结算确认单》,采购人员将《验收结算确认单》发送至供应商,由供应商确认后盖章,形成双方结算依据。10、供应商付款发行人定期发起向供应商进行付款,经部门负责人审批完成后,由财务部进行审核,并最终由财务经理或财务负责人审批完成,确认支付义务并对外进行支付。
11、项目决算★
发行人由项目负责人在业务管理平台中提出“决算申请”,并查阅“支出预算差额百分比”,若差异率超过10%以上需填写原因。项目负责人申请决算前,所有支出必须填写和报销完毕,由财务部确认项目预算执行情况和款项付款情况,审批项目决算。项目决算应在项目全部验收后进行,最晚不得晚于验收后 10个工作日,且季度内验收的项目必须在季度末完成决算、当年验收的项目必须在当年完成决算。项目决算后不得再对项目费用进行报销。
12、业财核对★
2019年4月前,项目采购支出、收入、成本等关键信息通过业务管理平台自动汇总并生成支出汇总表、财务确认表,财务人员根据报销申请单手工在财务用友系统中人工录入制造费用和研发费用,并根据财务确认表在财务用友系统中人工输入营业收入确认和营业成本结转数据。每月末,财务部门人员将两个系统的记录导出后进行复核比对,如有差异,调查原因,并进行相应修订。
2019年4月至10月,发行人实现了业务管理平台自动对接用友财务系统生成制造费用和研发费用的财务数据,财务人员仍根据财务确认表在财务用友系统中人工输入营业收入确认和营业成本结转数据。
2019年11月起,发行人实现了业务管理平台自动对接用友财务系统生成营业收入和营业成本的财务数据。
13、小结
综上所述,发行人根据《企业内部控制基本规范》的规定,针对对外采购原料数据采集和标注服务了完善的内控制度,包括:《海天瑞声采购管理制度》、《海天瑞声项目管理办法》、《海天瑞声供应商管理制度》、《海天瑞声合同管理制度》和《海天瑞声业务采购实施细则》等规章制度,对数据服务采购过程执行严格的内控管理制度。
(二)与数据服务采购相关的内部控制的设计合理,符合发行人业务特征
8-2-1-88
发行人的上述内部控制制度符合《企业内部控制基本规范》相关规定,并结合了发行人数据服务采购业务流程的实际特征,可针对数据服务采购过程中的各个环节有效进行复核、控制,相关内部控制设计合理。具体说明如下:
1、数据服务采购过程呈现“以销定采”、“同类业务标产比可比”的业务逻辑,可通过前述业务逻辑对数据服务采购量进行复核、确认
发行人训练数据定制服务和训练数据产品业务采购各环节的数据量和有效工时之间的关系,以及与数据采购支出的关系如下图所示:
注:采集结算量、有效工时指发行人与供应商结算的采集环节、标注环节采购量;交付数据量指经过标注、质检环节,可作为成品交付客户的数据的数量。
发行人数据服务(采集服务、标注服务)采购量与交付给客户的数据量紧密挂钩。对于采集服务:发行人采集损耗率保持较低水平,保证了采集服务的结算量可通过对比设计数据量、采集数据量和交付数据量得到有效控制。对于标注服务:发行人以标注数据量为基数,用标产比(通过实际自测或与客户约定)折算有效工时的方式来核算标注工作量并结算,因此可通过对比标注数据量和交付数据量、复核标产比的合理性对标注服务的结算量(有效工时)进行有效控制。
例如,某“150人中文纯净人声录音棚录音项目”,客户订单要求录音人数为150人(交付数据量)实际采集人数为152人(采集数据量、采集结算量)。成品训练数据集需要交付多少数据量,则相应采集对应的数据量并留出少量冗余即可,不存在额外采集更多数据量的经济必要性。经试标注测速后,标产比确定为2.7,假设某标注人员完成了10小时的音频数据标注工作,则其有效工时核定为10×2.7=27小时,同类型项目(即数据的特征与领域基本相当)的标产比应基本一致。
在复核、确认采购量的同时,发行人也通过内部控制设计定期维护更新业务采购价格体系,从而充分适应行业下游训练数据需求的变化,在数据类别、数据形式等方面不断拓展细化,以确保该价格体系与发行人实际采购情况、市场价格相符。
2、发行人的数据服务采购内部控制设计与上述业务逻辑相符,设计有效
8-2-1-89
发行人设计了完善的内部控制制度,对数据服务采购的各业务环节均施加有效控制。特别地,与上述业务逻辑相适应,发行人在立项及项目预算管理、验收结算及费用报销、项目决算、业财核对各个关键业务点设置了针对数据服务采购量、采购价格、采购金额、业务数据与财务数据一致等的复核控制,确保数据服务采购核算真实、准确、完整。发行人的数据服务采购内部控制设计符合业务逻辑,设计合理、有效。
(三)与数据服务采购相关的内部控制执行有效,可确保采购信息完整、准确记载,数据服务采购量可复核,财务信息与实际采购业务一致
1、发行人搭建了有效的内部信息系统,可记载完整、准确的采购信息等业务数据
发行人的内部信息系统包含三个组成部分,分别为一体化数据处理平台(前台生产系统)、业务管理平台(中台业务信息流转与管理系统)与用友财务系统(后台记账与报表系统)。各组成部分情况具体说明如下:
(1)一体化数据处理平台。该平台是发行人训练数据生产所需的各类工具、软件的集合,于2014年9月初始上线并持续优化,2018年初开始保留与生产过程相关的基本日志信息,如每个录音人的录音时长信息、录音文件大小信息等,在2019年9月上线搭载了终端人管理系统及日志管理系统,能够更为全面记录并保留生产过程中的详细日志信息,包括终端劳务人员注册信息、生产过程中终端人员行为日志信息等。
(2)业务管理平台。该平台于2017年1月开始上线使用,主要功能包含合同和项目创建、项目执行过程和结算、验收管理等,可覆盖项目管理全生命周期,并可根据系统记录的业务数据自动生成收入、成本、存货、产品研发费用等相关的财务数据。发行人报告期内销售、采购业务涉及的量、价和金额信息均完整记载于业务管理平台。
(3)用友财务系统。该系统于2015年开始上线使用,自上线至2019年4月为用友U8系统,2019年4月至今为用友NC系统,系统自上线以来未发生重大变更。
根据上述说明可知,公司内部信息系统均在报告期初上线运行并覆盖完整报告期间。发行人业务管理平台具有项目核算模块,能够按项目维度完整记录项目预算及支出相关信息,包括不限于每个项目所对应采购的劳务服务数量、结算价格及金额等,组成发行人业务采购的完整信息。
2、发行人业务管理平台记录了完整、准确的采购信息,使得可以通过“以销定采”、“同类业务标产比可比”的业务逻辑对数据服务采购量进行复核、确认
发行人通过业务管理平台对项目进行管理控制,包括项目预算申请和复核,支出的填报和复核,对采集数据量、采集结算量、交付数据量进行交叉比对,对标注产出比、
8-2-1-90
有效工时进行合理性复核,生成供应商验收结算确认单,进行验收和决算信息复核等。前述信息的准确记录,使得发行人可通过“以销定采”、“同类业务标产比可比”的业务逻辑对数据服务采购量进行复核、确认。
同时,发行人在项目预算申请环节参考业务采购价格体系对预算采购价格进行复核、确认,在项目支出报销环节参考预算采购价格对实际采购价格进行复核、确认,从而对采购价格进行有效的内部控制。
3、发行人财务系统中数据服务采购信息均基于业务管理平台产生,可保证实际采购业务与财务信息一致
项目采购支出信息通过业务管理平台自动汇总并生成支出汇总表,人工录入财务系统并经专人复核
,进而生成存货、研发费用等信息,可保证采购相关财务信息与业务信息的一致性。
(四)总结
综上,报告期内,发行人依据《企业内部控制基本规范》要求,结合数据服务采购的具体流程、特征设置了内部控制体系,相关内部控制体系符合数据服务采购的业务逻辑,设计有效;发行人搭建了有效的内部信息系统和业务数据流转、复核机制,可确保采购信息完整、准确记载,数据服务采购量、采购单价可复核,财务信息和实际采购业务一致,数据服务采购相关内部控制制度有效执行。
(2)报告期各期服务公司小外包人员的数量及其变动情况,是否为服务公司员工,是否存在相互重合的情形,发行人和服务公司对小外包人员的管理措施,是否均由发行人员工直接对小外包人员进行管理和控制
报告期各期,服务公司小外包人员数量如下所示:
2020年1-9月 | 2019年 | 2018年 | 2017年 | |||||
小外包个数及覆盖终端劳务人员数量占比 | 领取劳务费金额(万元)及占比 | 小外包个数及覆盖终端劳务人员数量占比 | 领取劳务费金额(万元)及占比 | 小外包个数及覆盖终端劳务人员数量占比 | 领取劳务费金额(万元)及占比 | 小外包个数及覆盖终端劳务人员数量占比 | 领取劳务费金额(万元)及占比 |
报告期内,发行人持续改进、升级业务管理平台功能,于2019年4月后可实现自动将相关信息传输至财务系统,进一步确保采购相关财务信息与业务信息的一致性。
8-2-1-91
当年组织终端人达1,001人以上 | 14 | 477.19 | 12 | 806.62 | 18 | 1,388.32 | 17 | 624.54 |
覆盖终端劳务人员占比 | 37.62% | 13.40% | 50.56% | 19.72% | 66.72% | 31.86% | 72.44% | 33.51% |
当年组织终端人501-1,000人 | 13 | 455.25 | 15 | 674.06 | 13 | 522.68 | 6 | 119.14 |
覆盖终端劳务人员占比 | 15.31% | 12.78% | 16.46% | 16.48% | 11.76% | 12.00% | 8.10% | 6.39% |
当年组织终端人101-500人 | 82 | 1,427.27 | 61 | 1,035.21 | 49 | 1,451.45 | 33 | 483.50 |
覆盖终端劳务人员占比 | 34.46% | 40.08% | 21.10% | 25.31% | 15.03% | 33.31% | 12.60% | 25.94% |
当年组织终端人100以下 | 484 | 1,201.57 | 618 | 1,574.92 | 213 | 994.56 | 213 | 636.82 |
覆盖终端劳务人员占比 | 12.61% | 33.74% | 11.88% | 38.50% | 6.49% | 22.83% | 6.86% | 34.16% |
小外包人员数量合计 | 593 | 706 | 293 | 269 |
2017年、2018年、2019年及2020年1-9月,小外包人数分别为269、293、706及593名。2019年、2020年1-9月小外包人员数量较多,主要原因是:当年执行的项目涉及较多新拓展的语种/方言,需要的被采集人和标注人员更为多样、所在地区更广,服务公司通过对接更多小外包为发行人寻找合适的采集、标注人员。同时,小外包人员规模的扩大也可以降低资源单一、集中带来的风险。通过对服务公司及小外包人员访谈确认,上述小外包人员均不属于服务公司员工。由于部分小外包人员专注从事终端人员的寻找和组织工作,可能对接多个服务公司,因此不同服务公司的小外包人员可能存在重合的情形。
服务公司根据发行人的需求,向具备相应能力的小外包人员下达需求,寻找合适的终端人员,并在原料数据的采集、标注过程中,督促小外包人员按项目进度和要求完成既定工作安排,同时与发行人进行沟通,获取发行人对采标服务及数据质量的反馈情况,及时反馈给小外包人员,确保其提供的数据服务质量。服务公司对小外包人员的管理措施包括签订劳务协议明确双方权利义务,建立相应管理制度对小外包人员提供劳务服务的具体过程进行规范等。而发行人负责对小外包人员进行业务方面的培训,不会对小外包人员进行直接的人员方面管理和控制,主要通过与服务公司的沟通合作,间接确保小外包人员按照发行人需求寻找并组织终端劳务人员进行原料数据采集和标注服务。
(3)发行人业务人员事先垫付资金的具体原因、后续结算及差异调整情况,是否符合相关内部控制制度的规定,报告期各期事先垫付资金的金额及占比
由于发行人的劳务采购存在临时性、一次性的特征,部分情况下需要在劳务提供完成时立即向终端劳务人员支付报酬,对于通过小外包人员对接劳务终端人员的情形下,一般会由小外包人员支付该笔款项,待相关劳务服务经发行人与服务公司验收结算后,由服务公司向小外包进行支付。对于少量由服务公司直接对接终端劳务人员的情形下,一般会由服务公司人员支付,对于服务公司人员未到达劳务服务现场或在现场未支付劳务报酬的极个别情况,存在发行人业务人员事先垫付资金的情形。后续发行人与供应商
8-2-1-92
验收结算后,终端劳务人员向发行人业务人员归还垫付款项并由供应商按劳务协议约定向终端劳务人员支付劳务费用。由于发行人业务人员垫付资金属于个别情形,未出现后续验收不通过的情况,因此不存在结算后需要调整差异的情况。
上述情况存在于2017年和2018年,且金额较小,不会对发行人内部控制的有效性造成重大不利影响,自2019年起,发行人已对上述备用金事项进行整改规范,内部完善了《备用金管理制度》,对于备用金使用范围、内部审批程序,款项归还时间等进行了明确约定,并要求员工对于备用金的支取和使用通过专门银行账户进行核算,同时严格要求服务公司履行对终端人的管理措施,确保其在必要时及时支付劳务报酬,因此不再存在上述由发行人业务人员垫付资金的情形。报告期内,发行人业务人员通过备用金事先垫付资金的金额及占比情况如下:
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
业务人员垫付资金总额 | - | - | 39.42 | 29.10 |
占服务公司直接对接采购支出的比例 | - | - | 1.48% | 1.56% |
占数据服务费采购支出的比例 | - | - | 0.54% | 0.72% |
(4)结合服务公司提供管理服务的内容、过程和必要性,说明发行人向服务公司支付服务管理费的原因及合理性,加成率的定价依据及公允性,不同公司的加成率之间是否存在差异并说明具体原因
发行人向服务公司采购非核心技术环节的数据采集、标注服务,是由于发行人业务的核心技术环节主要体现在训练数据集结构设计,训练数据集开发标准制定,数据采集加工过程中的技术研究、工具开发,训练数据集质量标准制定、质量检测和控制等方面,原料数据的具体采集和标注等过程主要为基础性、重复性的人工操作,发行人直接从事该等工作并不能突出发行人的竞争优势,而服务公司等具备在人力市场的资源获取能力,适合原料数据的采集与标注工作所呈现的执行人员属性要求众多、数量较大、临时性较强、流动性较高的特点,能够为发行人整体协调众多人力提供原料数据服务,解决发行人对被采集人、标注人员的寻找和管理需求,并保证服务的按期交付。因此发行人向服务公司采购非核心技术环节的数据采集、标注服务并支付服务管理费,具备商业上的必要性和合理性。
发行人支付给服务公司的加成率是综合考虑了服务内容、市场同类服务价格、服务公司自身成本及合理利润空间等因素,并经双方商务谈判与协商而确定的,符合服务公
8-2-1-93
司所提供服务的价值以及市场同类人力资源服务公司和劳务公司管理服务费率的整体水平,具备公允性。加成率有所差异的原因是税务成本和管理难度的差异所导致的。对于境内数据服务提供商,由于不同的供应商在各类型项目中组织和管理被采集人员、标注人员的数量规模、管理难度、税务成本等有所差异,因此发行人与供应商协商分别约定采用10-11.5%的服务费率,存在小幅差异。对于境外数据服务提供商,主要考虑到供应商所在地的税务成本和人力资源匹配成本,经发行人与供应商协商约定采用6-15%的服务费率,具备商业合理性。根据广州善世、芜湖善慧、北京博睿、北京零点、信阳联智等主要境内数据服务提供商出具的说明,其向其他客户收取的服务费率区间为9-13%,根据恩泽尔等主要境外数据服务提供商出具的说明,其向其他客户收取的服务费率区间为5-8%,与该等数据服务提供商向发行人收取的服务费率基本一致,不存在明显差异。
同时,经核查,根据发行人对市场同类人力资源服务公司和劳务公司的市场询价结果,同类境内服务商报价区间为9-15%,发行人向供应商支付的10-11.5%的服务费率符合境内服务商的普遍报价区间,服务费率的采购定价具备公允性。
(5)采集和标注单价的具体确定依据和过程,同类型项目的采集和标注单价是否存在差异并分析具体原因
一、采集和标注单价的具体确定依据和过程
采集和标注单价的确定依据均为参照市场价格及特定任务的难度综合确定。采集单价根据市场上类似服务的一般价格,并参考采集对象资源的稀缺性来确定。例如,外语种、儿童或老人、行车环境等要求较为特殊的采集项目,采集资源有一定稀缺性,则采集单价高于一般项目。标注单价根据市场上类似服务价格,并参考标注任务的难度来确定。例如标注专业领域的数据等高难度项目,则标注单价高于一般项目。发行人已经制定并定期更新业务采购价格体系,对采集和标注单价进行规范化管理。
采集和标注单价的确定过程主要为:结合上述确定依据,发行人在下达采购通知后,数据服务提供商根据寻找的人力资源情况,将价格信息反馈给发行人,双方协商一致后确定采集和标注单价,依此进行结算。
发行人数据服务采购所需劳务人员较多,且呈现人员要求多样化的特征,因此在下达采购通知时无法直接确定具体单价,需要服务公司及小外包人员根据采购通知的要求寻找对应的劳务人员时进行询价。对于服务公司反馈的价格信息,发行人参考业务采购价格体系和过往执行的同类项目的价格,并结合当前项目可能存在的特殊要素要求,综
8-2-1-94
合判断价格的合理性并与数据服务提供商协商,双方达成一致后确定采集和标注单价。考虑到业务实际情况和经营管理的便利性,在发行人下达采购通知确定采购量后,采集和标注单价通常采用电子邮件、补充确认单、通讯软件沟通等方式确定,并留存于验收结算单中。
二、同类型项目采集、标注单价情况,存在的差异及具体原因
发行人各年采购的数据服务对应的采集、标注单价按项目类型拆分如下:
单价单位:元/单位
应用领域 | 项目类型 | 单价类别 | 单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
智能语音 | 语音识别采集 | 采集单价 | 人 | 222.05 | 263.90 | 202.28 | 141.79 |
标注单价 | 工作小时 | 37.16 | 37.30 | 25.89 | 26.92 | ||
语音识别转写 | 标注单价 | 工作小时 | 18.44 | 17.78 | 17.60 | 16.49 | |
语音合成 | 采集单价 | 字/词 | 0.56 | 0.46 | 0.52 | 0.45 | |
标注单价 | 工作小时 | 30.10 | 28.19 | 46.04 | 41.83 | ||
计算机视觉 | 手写体 | 采集单价 | 工作小时 | 75.10 | 225.88 | 42.81 | 68.39 |
标注单价 | 工作小时 | 23.25 | - | - | 24.49 | ||
OCR | 采集单价 | 工作小时 | - | - | 52.55 | 11.96 | |
标注单价 | 工作小时 | 19.82 | 18.02 | 21.08 | 15.52 | ||
行车视频 | 采集单价 | 工作小时 | 84.95 | 75.37 | 43.09 | 12.42 | |
标注单价 | 工作小时 | 15.89 | 15.76 | 16.82 | 16.30 | ||
自然语言 | 语义理解 | 采集单价 | 工作小时 | - | - | 23.12 | 15.50 |
标注单价 | 工作小时 | 23.54 | 23.34 | 19.35 | 16.03 |
注:计算机视觉、自然语言类项目特异性较强、非标准化程度较高,涉及采集、标注单价类型及单位众多,此处选取采集、标注类型单位较为统一的主要类型的主要项目进行列示。同类型项目采集标注单价情况分析:
1、语音识别采集
采集单价:2018年-2020年9月单价整体稳定,有所波动。2018年采集单价较2017年有所增长,主要原因是发行人业务逐步向采集单价较高的外语种、自由对话类型训练数据拓展,且该趋势在近几年持续,推高了采集的平均单价。2020年1-9月采集单价相比2019年有所下降,一方面由于当期完成了部分较为简单的中文项目,例如中文唤醒词项目等,因此采集单价较低;另一方面,是因为当期执行的较多英语采集项目引入了中国发音人录制,成本较英语母语地区人员相比较低。
8-2-1-95
标注单价:2017-2020年9月标注单价有所差异,整体呈现波动上升趋势,主要原因是:一方面,各年语音识别采集项目涉及的语种类型有所差异,语种的结构变化会导致标注单价波动:与中文标注相比,外语种单价标注价格更高;在中文标注内部,粤语、台湾地区闽南语等标注难度较大、标注价格相对较高;在外语种标注内部,除语言本身标注难度会影响标注单价外,标注人员的选择也会影响标注单价,例如通常而言英国英语、美国英语标注难度相对较低、标注单价相对较低,但若选用母语国家标注人员进行标注则单价会有所提升;其他国家语种视具体类型标注单价有所差异,部分稀有语种标注难度、单价较高。另一方面,对于相同类别语种而言,各年标注单价整体保持稳定、部分细分语种标注单价略有波动:例如中文标注中,中文普通话、大陆方言等细分类别价格略有上升。上述两方面因素共同引致了报告期标注单价的波动。
2、语音识别转写
标注单价:报告期内单价均较为稳定,呈现小幅上升趋势是由于外语种语音识别转写业务的持续拓展使外语种标注占比逐年小幅提高。
3、语音合成
采集单价:报告期内单价较为稳定,整体略呈上升趋势,主要是因为各期执行项目对发音人的要求逐步细化提升、领域拓展逐步多样化。其中2018年单价略高,主要原因是因为有个别大额项目的外语种采集主要在2018年执行,而外语种采集单价较高,使得当年采集平均单价略高。
标注单价:2017-2018年单价较为稳定,自2019年起有所下降,2020年1-9月水平与2019年基本相当,主要原因是:(1)发行人预标注技术和工具自2018年开始逐步运用并普及,提升了原料数据标注能力和效率,对标注人员的个人要求降低,使得标注单价降低;(2)发行人通过服务公司组织更多具备多语种语言能力的中国标注人员对部分外语种语音进行标注,提升性价比、降低标注单价。
4、非智能语音类项目(计算机视觉、自然语言类)
报告期内,发行人的非智能语音类项目(计算机视觉、自然语言类项目)特异性较强、单个项目需求差异化特征较强,同类项目之间具体要求也存在较大差异,造成各年采集、标注单价波动较大。对于各类非智能语音类项目各年采集、标注单价变动情况分析如下:
(1)手写体
8-2-1-96
采集单价:2017年、2018年及2020年1-9月单价较低,2019年单价较高,主要原因是:发行人各年执行的手写体项目细分类型不同,难度逐步提升,滑行输入数据采集逐步从中文拓展至外语种、手写体项目细分类型从滑行输入数据采集拓展至复杂文本手写采集(含字体、左右手等细分要求)等,2019年项目涉及难度较大的复杂手写体采集、滑行输入等,采集要求、难度较高,采集单价随之较高。
标注单价:报告期内标注单价较为稳定。2018年、2019年无标注单价是因为对应项目为按客户需求采集手写体原料数据,无需执行标注工作。
(2)OCR
报告期内,发行人执行的OCR项目个性化特征较强,采集、标注类型、单位众多,差异较大,此处选取以工作小时为单位衡量的OCR项目进行列示及分析。此类OCR项目受采集资源特定要求的影响,采集单价存在一定波动,2018年采集试题数据,对作业本、采集对象年级等均有要求,采集单价较高;报告期内标注单价相对稳定。
(3)行车视频
采集单价:报告期内采集单价逐步提升,主要原因是发行人执行的行车视频采集项目采集要求和难度逐步提升,例如逐步从静止的泊车边位线图片采集拓展至动态的人车2D矩形框视频采集、城市交通路况路标的视频采集,采集环境要求(光线要求、角度要求等)也逐步拓展,采集单价逐步提升。
标注单价:报告期内标注单价较为稳定。
(4)语义理解
采集单价:2019年、2020年1-9月,发行人未开展语义理解采集类项目;2017年、2018年语义理解项目采集规模较小,采购金额较低,采集单价易受个别项目影响呈现波动。
标注单价:报告期内标注单价整体呈现逐步上升趋势,主要原因是:随着自然语言类项目逐步复杂化,文本结构、具体内容、标注规范均呈现难度逐渐加大的趋势,对标注人员的要求逐步提升,使得标注单价逐年提高。
综上,对于智能语音类项目,同类项目采集、标注单价相对稳定,但受具体语种/方言结构变动、发行人技术提升等因素影响存在差异;对于非智能语音类项目,因发行人项目非标准化、采标难度随发行人业务发展逐步提升等,同类型项目的采集和标注单价也存在一定差异。
8-2-1-97
(6)采集数据量、标注数据量和标产比相关的确定方法和具体依据,是否存在随意修改或调整的情形,同类型项目的采集数据量、标注数据量和标产比是否存在差异并分析具体原因
一、采集数据量、标注数据量和标产比的确定方法和具体依据,是否存在随意修改或调整的情形
发行人采集数据量、标注数据量与交付给客户的数据量之间有密切联系。交付给客户的数据量由发行人的销售合同或销售订单确定,且最终需要发行人客户进行验收确认。在实际业务执行过程中,发行人会根据经验判断,在满足客户交付数据量要求的基础上留出少量冗余,例如某“200人新加坡英语手机3通道语音识别项目”,客户订单要求录音人数为200人,实际采集、结算人数为206人。报告期内,发行人采集损耗率,即采集数据量相对于交付给客户的数据量的损耗比例,总体控制在5%以内,而标注数据量介于采集结算量和交付给客户的数据量之间,因此采集数据量和标注数据量不存在随意修改或调整的情形,具体请参见下述“二、同类型项目的采集数据量、标注数据量和标产比的差异情况及原因分析”。
发行人采购原料数据标注服务的有效工时由两方面因素构成:标注数据量和标产比(单位产出量所需的标注工作时长)。发行人通过自行测量的方式形成标产比后,与数据服务提供商沟通标产比的可行性,双方达成一致后发行人按照自测标产比折算有效工时,向数据服务提供商下达采购通知,确定标注服务采购量,并依此与数据服务提供商进行结算,主要留痕证据为采购通知和验收结算单。发行人自测标产比的具体方法为:
(1)发行人将待标注数据拆分为若干任务后,选取少量任务由标注人员进行试标注,测量在连续工作状态下的标产比;(2)自测标产比与供应商达成一致后确定为结算所用标产比。除上述自测标产比情形外,还存在少量的客户约定标产比的情形。该情形下,发行人与客户书面约定总交付数据量、标注工时每小时单价和标产比。综上所述,标产比一经确定,即按照这一比例与供应商结算标注工时,不存在随意修改或调整的情形。报告期内,发行人标产比的变动情况具体请参见下述“二、同类型项目的采集数据量、标注数据量和标产比的差异情况及原因分析”。
二、同类型项目的采集数据量、标注数据量和标产比的差异情况及原因分析
同类型项目由于项目规模不同,因此所需的采集数据量、标注数据量必然有所差异。以下通过分析报告期各期发行人训练数据定制服务完成项目和新增训练数据产品项目
8-2-1-98
的采产比和标产比来说明同类型项目的采集数据量、标注有效工时相对水平的差异情况,其中训练数据定制服务完成项目包括语音识别采集、语音识别转写、语音合成、计算机视觉主要细分类别(手写体、光学字符识别、行车相关视频)和自然语言主要细分类别(语义理解),新增训练数据产品包括语音识别采集、语音合成两类发行人最主要的产品类型。
(一)训练数据定制服务
1、语音识别采集
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (每小时产出所需人数) | 0.6 | 0.6 | 0.8 | 1.0 |
标产比 (每小时产出所需标注时长) | 1.2 | 3.5 | 3.0 | 2.5 |
报告期内,发行人语音识别采集训练数据定制服务的采产比分别为1.0、0.8、0.6和0.6,2018年、2019年和2020年1-9月较低的原因是部分项目存在客户特殊要求,单个发音人的录音时长由1小时左右增加到2-3小时左右,以及发行人为应对各种发音人资源稀缺的情况,采用了延长单个发音人录音时长的设计方式,该等项目的具体情况如下:
分类 | 时间 | 销量(小时) | 采集数量(人) | 采产比 |
客户特殊要求 | 2020年1-9月 | 16,008.00 | 4,286 | 0.3 |
2019年 | 15,965.40 | 5,753 | 0.4 | |
2018年 | 18,330.00 | 8,238 | 0.5 | |
发音人资源稀缺 | 2019年 | 2,200.00 | 959 | 0.4 |
2018年 | 10,800.00 | 7,767 | 0.7 | |
其他一般情况 | 2020年1-9月 | 15,099.25 | 14,352 | 1.0 |
2019年 | 15,251.20 | 14,968 | 1.0 | |
2018年 | 29,211.00 | 27,891 | 1.0 |
新增训练数据产品指当期研发费用的数据服务费所对应的训练数据产品产出量,其中部分训练数据产品可能并未开发完成,仅计入完整数据产品的一部分时长
8-2-1-99
客户特殊要求:部分客户对采集环节的实施有特殊要求,包括同一发音人覆盖多种细分场景、表达多种情感、涉及多个话题等,因此部分发音人的采集时间需要达到2-3个小时甚至更多,从而使得平均一个发音人产出的小时量增长,单位产出的采集量(即采集人数)下降。
发音人资源稀缺:为了解决部分项目中符合质量要求的发音人资源稀缺的问题,例如重口音类、儿童类、非母语外语种录音项目,捕捉同一发音人更多语言现象,发行人采用了延长单个发音人录音时长的设计方式,适度提高了单个发音人的录音时长,从而更加有效的利用发音人资源,达到利用同样数量发音人得到更多有效语音时长的效果。
扣除上述特殊项目,其他语音识别采集项目采产比在2018年、2019年和2020年1-9月均为1.0,与2017年相比保持稳定,不存在明显差异。
报告期内,发行人语音识别采集训练数据定制服务的标产比分别为2.5、3.0、3.5和1.2,2018年和2019年较高的主要原因是项目需求涉及较难语种或较难口音,同时客户对数据标注要求也较高,使得标产比增加,2020年1-9月完成的部分项目因客户需求,发行人需要进行标注工作较少甚至无需进行标注,如标注难度很低的唤醒词项目等,因此标产比较低,该等项目的具体情况如下:
分类 | 时间 | 销量(小时) | 标注数量 (工作小时) | 标产比 |
特殊项目 | 2020年1-9月 | 16,545.00 | 720.00 | 0.04 |
2019年 | 4,511.00 | 40,495.18 | 9.0 | |
2018年 | 13,137.00 | 65,727.55 | 5.0 | |
其他一般项目 | 2020年1-9月 | 14,562.25 | 37,589.82 | 2.6 |
2019年 | 28,905.60 | 76,599.23 | 2.6 | |
2018年 | 45,204.00 | 111,928.89 | 2.5 |
扣除上述特殊项目,其他语音识别采集标产比在报告期内分别为2.5、2.5、2.6和
2.6,基本保持稳定。
2、语音识别转写
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
标产比 (每小时产出所需标注时长) | 13.4 | 11.4 | 12.5 | 11.1 |
报告期内,发行人语音识别转写训练数据定制服务的标产比分别为11.1、12.5、
11.4和13.4,总体较为平稳。2018年标产比略高是由于长句音频项目当年占销量比重
8-2-1-100
较高,长句通常语速较快且变化更为复杂,人物角色和领域较为多样,多为客服等领域,因而难度较高,增加了语音标注的难度。2020年1-9月标产比略高除了与上述2018年一致的原因外,还由于个别主要客户的项目包含测试集数据,准确率要求高,需要投入较多的质检工时,以及部分项目需要进行无效数据标注并注明无效原因,使得标注工时增加。
3、语音合成
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (每小时产出所需万字词数) | 0.7 | 0.6 | 1.0 | 1.1 |
标产比 (每小时产出所需标注时长) | 22.3 | 45.1 | 44.8 | 67.3 |
报告期内,发行人语音合成训练数据定制服务的采产比分别为1.1、1.0、0.6和0.7。2019年和2020年1-9月较低的原因是由于语音合成业务承接向多元化趋势发展,当年承接了无采集环节的语音合成数据标注业务较多,因此造成采产比下降。
报告期内,发行人语音合成训练数据定制服务的标产比分别为67.3、44.8、45.1和22.3,整体呈现下降趋势的原因是随着发行人音素边界自动预测、基于语音特征的韵律预测等高效数据处理技术的成熟和普遍应用,提高了发行人数据处理工作效率,有效减少了标注过程中的人工工作量,使得单位产出的标注量有所下降。另外,2020年1-9月标产比较低还由于当期大部分项目无需进行音素边界标注,因此投入标注工时较少。
4、计算机视觉
选取计算机视觉类业务中销量单位、采集数量单位、标注数量单位可比的部分主要业务细分类别进行分析,包括手写体、光学字符识别、行车相关视频。
(1)手写体
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (千词组产出所需采集工时) | 2.2 | 2.6 | 2.5 | 2.6 |
标产比 (千词组产出所需标注时长) | 0.2 | - | - | 1.3 |
报告期内,发行人手写体训练数据定制服务的采产比分别为2.6、2.5、2.6和2.2,折算为每词组采集所需时间约为9秒左右,基本保持稳定。
8-2-1-101
2017年和2020年1-9月,手写体训练数据定制服务的标产比分别为1.3和0.2,折算为每词组标注所需时间约为4.7秒和0.7秒,主要是:1)语种不同导致的标注标准复杂度与难度差异所致,2017年手写体项目是语种为日语、德语等外语种的手写输入项目,而2020年1-9月手写体项目是语种为简体中文和繁体中文的手写输入项目;2)2020年1-9月手写体项目中还包括中文拼音输入项目,该项目标注环节仅需简单的数据整理,标注工时很少,因此拉低了整体标产比。2018年和2019年,手写体项目不涉及标注环节。
(2)光学字符识别
①有采集的光学字符识别
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (百张产出所需百张数) | 1.1 | 1.0 | 1.0 | 1.0 |
标产比 (百张产出所需标注时长) | 2.2 | - | 0.5 | 0.5 |
报告期内,发行人有采集的光学字符识别训练数据定制服务的采产比分别为1.0、
1.0、1.0和1.1,基本保持稳定。
2017年、2018年和2020年1-3月,发行人有采集的光学字符识别训练数据定制服务的标产比分别为0.5、0.5和2.2,折算为每百张标注时间分别为32分钟、31分钟和131分钟,2019年该业务无标注。2020年1-9月标产比较高的原因是当期主要项目为实况图片采集、财务文档采集及标注以及作文图片采集及标注,检查和整理内容较多,质检难度较大,花费的标注工时显著高于其他项目。
②无采集的光学字符识别
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
标产比 (百张产出所需标注时长) | 27.0 | 1.2 | 0.9 | 1.0 |
报告期内,发行人无采集的光学字符识别训练数据定制服务的标产比分别为1.0、
0.9、1.2和19.2,折算为每百张标注时间分别为61分钟、52分钟、70分钟和1,622分钟,2020年1-9月标产比高的原因是当期该业务均为例如试题、货架、报表等单图标注内容很多,字符多而密集,标注难度很高的项目,投入工时较长。
8-2-1-102
无采集的光学字符识别的标注环节涉及对字符进行定位和框选,而有采集的光学字符识别的标注环节主要为检查工作,难度相对较低,因而无采集的光学字符识别单位产出的标注数量高于有采集的光学字符识别。
(3)行车相关视频
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
标产比 (十个目标产出所需标注时长) | 0.06 | 0.07 | 0.09 | - |
行车相关视频业务为2018年新拓展业务,由客户提供原料数据,发行人提供标注服务,因此不涉及采集环节。2018年、2019年和2020年1-9月,发行人行车相关视频训练数据定制服务的标产比分别为0.09、0.07和0.06,折算为每分钟标注目标数量分别为1.8、2.2和2.7,相对保持稳定。
5、自然语言——语义理解
选取自然语言类业务中销量单位、采集数量单位、标注数量单位可比的主要业务细分类别语义理解进行分析。
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
标产比 (每小时产出所需标注时长) | 1.3 | 1.0 | 1.2 | 1.2 |
语义理解业务主要是基于客户提供的文本进行分词、词性、情感等标注,通常不存在采集环节。报告期内,发行人语义理解训练数据定制服务的标产比分别为1.2、1.2、
1.0和1.3,2019年标产比略低是由于当年部分项目采取了机器辅助标注手段,进行预标注后再由人工校对,降低了人工投入,使标产比小幅下降。
(二)训练数据产品
1、语音识别采集
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (每小时产出所需人数) | 0.6 | 0.6 | 0.7 | 1.1 |
标产比 (每小时产出所需标注时长) | 2.7 | 5.3 | 3.9 | 8.8 |
报告期内,发行人语音识别采集训练数据产品的采产比分别为1.1、0.7、0.6和0.6,采产比呈现下降趋势的原因与前述训练数据定制服务类似,发行人在设计训练数据产品
8-2-1-103
时考虑特殊场景的配置,以及发音人资源稀缺等原因,延长了单个发音人的录音时长。该等项目的具体情况如下:
分类 | 时间 | 新增时长(小时) | 采集数量(人) | 采产比 |
采集特殊要求 | 2020年1-9月 | 17,902.50 | 8,115 | 0.5 |
2019年 | 4,805.48 | 1,533 | 0.3 | |
发音人资源稀缺 | 2020年1-9月 | 9,371.00 | 4,499 | 0.5 |
2019年 | 11,284.97 | 5,003 | 0.4 | |
2018年 | 15,077.02 | 8,965 | 0.6 | |
其他一般情况 | 2020年1-9月 | 7,901.00 | 8,102 | 1.0 |
2019年 | 10,461.16 | 9,079 | 0.9 | |
2018年 | 8,794.21 | 8,836 | 1.0 |
扣除上述特殊项目,其他语音识别采集项目采产比在2018年、2019年和2020年1-9月分别为1.0、0.9和1.0,与2017年相比保持稳定,不存在明显差异。报告期内,发行人语音识别采集训练数据产品的标产比分别为8.8、3.9、5.3和2.7,2017年和2019年较高的原因是由于当年发行人基于对行业和市场的判断,开发了部分自由对话类训练数据产品,由于自由对话类项目是由发行人预设场景,采集环节无预设文本,而由发音人自由发挥,发行人需要先进行人工文本生成,再进行文本与声音一致性检查、声音事件分类标注等标注环节,因此相对有预设文本类项目而言标注复杂度更高,标注用时更长,从而提高标产比,该等项目的具体情况如下:
分类 | 时间 | 新增时长 (小时) | 标注数量 (工作小时) | 标产比 |
自由对话类 | 2019年 | 10,096.25 | 82,941.48 | 8.2 |
2017年 | 7,658.11 | 136,491.58 | 17.8 | |
预设文本类 | 2019年 | 16,455.36 | 57,713.72 | 3.5 |
2017年 | 13,288.65 | 48,260.41 | 3.6 |
自由对话类项目标产比在2017年明显高于2019年的原因是,2017年为保证产品质量,对转写环节进行了100%质检,并进行了二次抽检,因此投入标注工时较多,后续公司引入语音识别算法技术进行部分辅助转写,且能够对产品库的错误率进行自动检测,因此2019年进行的自由对话类项目直接进行抽检即可,节省了标注工时,降低了标产比。
8-2-1-104
扣除上述特殊项目,其他语音识别采集项目标产比在报告期内分别为3.6、3.9、3.5和2.7,2020年1-9月由于开发的产品中较多涉及手机单通道录音设备,标注环节无需在通道间进行数据对齐,因此标产比略低。
2、语音合成
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
采产比 (每小时产出所需万字词数) | 0.7 | 0.5 | 1.0 | - |
标产比 (每小时产出所需标注时长) | 42.7 | 61.1 | 58.9 | - |
2018年、2019年和2020年1-9月,发行人语音合成训练数据产品的采产比分别为1.0、0.5和0.7,2019年和2020年1-9月较低的原因是当年进行了部分语音合成训练数据产品的完善或扩建工作,主要针对声音清晰度、标注准确率等进行完善,产生新增时长但无对应的新增采集量或新增采集量很低。该等项目的具体情况如下:
分类 | 时间 | 新增时长 (小时) | 采集数量 (万字词) | 采产比 |
产品完善与扩建项目 | 2020年1-9月 | 159.33 | 0.82 | 0.01 |
2019年 | 28.79 | 0.71 | 0.02 | |
其他一般项目 | 2020年1-9月 | 209.95 | 269.20 | 1.3 |
2019年 | 28.10 | 30.04 | 1.1 |
扣除上述特殊项目,其他语音合成标产比在2019年和2020年1-9月分别为1.1和1.3,与2018年相比保持稳定,不存在明显差异。
2018年、2019年和2020年1-9月,发行人语音合成训练数据产品的标产比分别为58.9、61.1和42.7。2018、2019年标产比较为平稳,高于训练数据定制服务的原因是由于训练数据产品通常标注内容全面,且对标注的质量、质检的比例有统一和较高的要求,因此标注投入较多。2020年1-9月,发行人根据市场需求新建了较多平均音色的产品库,只需要进行简单的音频切分和校对工作,同时进行了部分语音合成产品的完善工作,只进行单一标注任务,因此所需标注工时较少,使得标产比偏低。
(7)劳务数量及数据服务费用变动是否与发行人经营情况相匹配,数据服务费用的采购价格是否公允, 劳务用工成本核算是否完整 且不存在跨期,发行人建立的相关内部控制措施及执行情况
一、劳务数量及数据服务费用变动是否与发行人经营情况相匹配
8-2-1-105
报告期内,数据服务费用的变动由劳务数量的变动和采购单价的变动构成,发行人采购单价在报告期内与发行人的经营情况相匹配(采购单价的具体分析参见本问题“发行人说明事项/(5)采集和标注单价的具体确定依据和过程,同类型项目的采集和标注单价是否存在差异并分析具体原因”的回复内容),因此发行人采购的数据服务费与发行人经营情况的匹配程度,也反映了发行人采购的劳务数量与发行人的经营情况的匹配程度。数据服务费同发行人主营业务收入的匹配情况如下:
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
采购的数据服务费 | 5,646.32 | 6,099.95 | 7,352.66 | 4,057.31 |
主营业务收入 | 14,277.35 | 23,755.81 | 19,265.77 | 11,907.09 |
采购的数据服务费占营业收入的比例 | 39.55% | 25.68% | 38.16% | 34.07% |
报告期内,发行人数据服务费采购占发行人营业收入的比例基本稳定,2019年数据服务费占营业收入的比例较低主要是由于部分验收周期较长的语音合成项目在2019年验收,贡献收入。而这些项目的原料数据采集工作主要在2018年完成,在2018年12月31日的存货中进行归集,因此2018年末存货余额中的数据服务费有明显增加,从2017年末的830.95万元增加至2018年末的1,827.06万元,而2019年原料数据采集相应减少,数据服务费采购占收入比例也相应降低。
二、数据服务费的采购价格是否公允
(一)数据服务费的采购价格构成
报告期内,发行人采购定价由两部分组成,一部分是供应商支付给终端服务人员的费用,一部分是供应商就其提供的组织和管理服务收取的管理服务费。
第一部分的定价是随着整体市场人力成本的变动而变动,发行人按人或按工作小时等支付的单价整体上符合市场上对类似服务价格的定位。发行人在业务实施过程中,未发生在现行价格体系下,因价格过低造成服务资源不足的情况。发行人内部管理制度《海天瑞声业务采购实施细则》对数据服务费采购价格的公允性做出了规定:采购部对业务价格体系中的价格进行定期公允性检查,以确保供应商价格在合理范围内,检查方式包括但不限于同类供应商询价、供应商及其内部人员访谈、发布模拟招聘信息询价、波动原因解析等。
第二部分的定价是根据供应商提供服务的能力不同而有所差异,管理服务费按照原料数据采集、标注服务采购金额乘以管理服务费率计算,目前的管理服务费率是提供类
8-2-1-106
似服务的人力资源公司或技术服务公司通行的收费水平,主要涵盖其项目人员薪酬、人员招募与管理、公司税费等成本,符合该类公司提供服务的技术含量和定位。对于境内数据服务提供商,由于不同的供应商在各类型项目中组织和管理被采集人员、标注人员的数量规模和管理难度有所差异,因此发行人与供应商分别约定采用10-11.5%的服务费率,存在小幅差异。对于境外数据服务提供商,主要考虑到供应商所在地的税务成本和人力资源匹配成本,发行人与供应商协商约定采用6-15%的服务费率。
(二)支付给终端服务人员的费用与市场上类似服务费用的比较数据服务提供商支付给终端服务人员的费用与市场上类似服务费用的比较情况如下:
1、采集服务
市场上类似采集服务信息相对较少,从公开网站找到类似采集服务价格情况如下:
类别 | 发布网站 | 招聘职位 | 报价 | 服务地点 | 折算单价(元/人次) |
采集 | 58同城 | 数据采集员 | 150元/天 | 北京 | 150 |
大街网 | 数据采集员 | 120-150元/天 | 北京 | 120-150 | |
BOSS直聘 | 数据采集员 | 80-200元/天 | 北京 | 80-200 | |
发行人 | 智能语音 | ||||
0.56元/字或词 | |||||
222.05元/人 |
注1:以上市场信息均来自相应发布网站;注2:由于市场上类似服务可比信息较少,特别是细分领域后更加难以准确找到合适信息进行对比,因此未进一步进行细分领域对比。
由于发行人的训练数据定制服务以及训练数据产品的研发,均有较强的单个项目需求差异化特征,采集业务受语种、发音人身份、地域、专业度、原料数据采集周期、原料数据特征需求等多种因素影响,而造成采购采集服务的价格有所差异。发行人会根据不同客户不同订单的特定需求,描绘被采集人的概况和特征,并承担不同水平的采购单价。2020年1-9月,发行人中文语音识别采集业务采集服务的平均单价为147元/人,与市场类似采集服务报价不存在明显差异。由于外语种资源的稀缺性,发行人外语种智能语音类业务采集服务平均采购单价较高,2020年1-9月外语种语音识别采集业务采集服务的平均单价为306元/人,提升了智能语音类业务采集服务的整体平均采购单价。
2、标注服务
8-2-1-107
根据标注服务的类别,选取了市场类似服务报价情况进行比较,标注服务采购单价对比情况如下:
类别 | 发布网站 | 招聘职位 | 报价 | 服务地点 | 折算单价(元/小时) |
标注 | 58同城 | 人工智能文本 | 100-220元/天 | 北京 | 12.5-27.5 |
数据标注员 | |||||
实习僧 | AI数据标注员 | 120-200元/天 | 北京 | 15-25 | |
大街网 | 中文标注员 | 100-200元/天 | 北京 | 12.5-25 | |
BOSS直聘 | 数据标注员 | 100-200元/天 | 北京 | 12.5-25 | |
发行人平均价格 | 智能语音 | 21.80 | |||
自然语言 | 25.65 | ||||
58同城 | 图片数据标注 | 110-180元/天 | 北京 | 13.75-22.5 | |
实习僧 | 图片标注员 | 100-250元/天 | 北京 | 12.5-31.25 | |
大街网 | 图像处理员 | 100-200元/天 | 北京 | 12.5-25 | |
BOSS直聘 | 图片标注员 | 100-150元/天 | 北京 | 12.5-18.75 | |
发行人平均价格 | 计算机视觉 | 17.53 |
注1:以上市场信息均来自相应发布网站;注2:发行人的折算单价为2020年1-9月相关类别数据服务提供商支付给终端服务人员的平均含税单价;注3:发行人智能语音、自然语言领域的标注都是在文本载体上进行的,因此统一归类为语音标注,与市场类似服务的价格进行对比,计算机视觉归类为图片标注与市场类似服务的价格进行对比。
如上表所示,发行人采购标注服务的价格与市场上类似服务的价格相比处于同一水平,发行人采购标注服务的价格与市场上类似服务的价格不存在明显差异。
(三)支付的管理服务费与市场上类似服务费用的比较
根据广州善世、芜湖善慧、北京博睿、北京零点、信阳联智等主要境内数据服务提供商出具的说明,其向其他客户收取的服务费率区间为9-13%,根据恩泽尔等主要境外数据服务提供商出具的说明,其向其他客户收取的服务费率区间为5-8%,与该等数据服务提供商向发行人收取的服务费率基本一致,不存在明显差异。
同时,根据发行人对市场同类人力资源服务公司和劳务公司的市场询价结果,同类境内服务商报价区间为9-15%。发行人向供应商支付的10-11.5%的服务费率符合境内服务商的普遍报价区间,服务费率的采购定价具备公允性。
三、劳务用工成本核算是否完整且不存在跨期
8-2-1-108
发行人在报告期内采购的劳务费支出主要反映在采购的数据服务费支出中。发行人在报告期内对劳务用工成本是采用了项目制的方式来进行归集和核算,即按照项目需求进行劳务用工采购,并按照项目归属来核算相关劳务用工成本。对于项目采购的劳务用工成本,发行人主要通过制定和执行严格的项目预算和项目决算制度来保证劳务用工成本核算的完整性。对于每个项目,发行人在项目开始前制定详细的项目预算。对于项目预算中数据服务费部分,采集量需要参照“以销定采”的逻辑,并考虑合理的采集损耗率后确定,标注量需要参照合理的标产比后确定;采集单价和标注单价参照公司采购价格体系确定;项目负责人编制预算时需要将数据服务费的采购量、采购单价均按工作环节逐项、单独填报于业务管理平台,经过业务部门直属负责人、财务部审核审批通过后才可执行。在项目进行过程中,数据服务费的采购严格按照项目预算执行,如果超出预算,则需要经过业务部门分管负责人、财务负责人批准后才可执行。
项目完工后必须及时进行项目决算。由项目经理提出决算申请,并说明预算完成情况及分析差异原因,并由财务部确认项目预算执行情况和款项付款情况,并对项目决算进行审批。项目决算应在项目全部验收后进行,最晚不得晚于验收后 10个工作日,且季度内验收的项目必须在季度末完成决算、当年验收的项目应在当年完成决算。项目决算后不得再对项目费用进行报销。
因此通过上述内部控制管理措施,发行人可以有效保证了劳务用工成本核算的完整性且不存在跨期。
另外,发行人与数据服务提供商之间的结算周期较短,报告期内应付账款周转天数平均为6.19天,因此相关劳务用工成本存在重大跨期结算和跨期入账的风险较低。从报告期内发行人账面记录的实际劳务成本金额来看,其与发行人的经营情况也是基本相符的,因此报告期内发行人的劳务成本核算是完整的,且不存在跨期现象。
四、发行人建立的相关内部控制措施及执行情况
报告期内,发行人建立的与数据服务采购和劳务用工成本核算相关的内部控制措施及执行情况请参见本问题“发行人说明事项/(1)发行人采购数据采集和标注服务的人员管理、场地使用、进度管理和质量控制措施、验收标准、结算方式、结算对象和结算周期等情况,与数据服务采购相关内部控制的设计是否合理、执行是否有效”的回复内容。
8-2-1-109
(8)前述服务公司的基本情况和员工数量,是否与发行人对其的采购规模相匹配,认定同一控制的依据,通过同一控制下不同企业开展业务的原因及合理性,发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务,主要小外包人员的基本情况,服务公司及其关联方和主要小外包人员是否与发行人客户及其关键经办人员、发行人控股股东、实际控制人、发行人关联方、员工及前员工之间存在关联关系、关联交易、资金往来或其他利益安排,是否存在通过服务公司向客户进行商业贿赂的情形
一、前述服务公司的基本情况和员工数量,是否与发行人对其的采购规模相匹配,认定同一控制的依据,通过同一控制下不同企业开展业务的原因及合理性,发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务
(一)前述服务公司的基本情况和员工数量,是否与发行人对其的采购规模相匹配
前述服务公司的基本情况和员工数量等情况见前述第本问询函回复第10题“发行人补充披露事项”之“(5)结合主要原料数据采集、标注服务提供商的规模、员工数量等,说明其是否有足够能力为发行人提供相关服务……”部分所述。
主要原料数据采集、标注服务提供商主要组织劳务人员来完成数据采集、标注服务,数据采集、标注服务并不涉及专门的业务资质,服务提供商具有劳务人员资源及劳务人员管理等业务经验,为包括发行人在内的客户群体提供服务。通过对比前述服务公司的经营财务数据与发行人对其的采购金额,以及就发行人对服务公司的业务需求、服务公司的人员资源及业务等经验进行分析,前述服务公司有足够能力为发行人提供相关服务,与发行人对其的采购规模相匹配。
(二)认定同一控制的依据,通过同一控制下不同企业开展业务的原因及合理性,发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务
1、善世(广东)企业服务外包有限公司(曾用名“广州善世人力资源服务有限公司”,以下简称“广州善世”)、芜湖善慧人力资源服务有限公司(以下简称“芜湖善慧”)、才星(广州)科技服务有限公司(曾用名“广州金社保网络技术有限公司”,以下简称“广州才星”)、共青城宜邦人力资源服务有限公司(以下简称“共青城宜邦”)
(1)认定同一控制的依据
该等公司系根据其股权结构及主要人员情况、人员之间关系等认定为同一控制,具体情况如下:
序号 | 公司名称 | 股权结构 | 主要人员 |
1 | 广州善世 | 陈玦霏持有40%股权,白云持有40%股权, | 陈玦霏任执行董事、经理, |
8-2-1-110
高洁持有20%股权 | 白云任监事 | ||
2 | 芜湖善慧 | 陈玦霏持有32%股权,莫天勤持有32%股权,徐洪超持有30%股权,王宏志持有3%股权,欧阳刚持有3%股权 | 陈玦霏任执行董事,莫天勤任监事 |
3 | 广州才星 | 王宏志持有40%股权,莫天勤持有30%股权,陈玦霏持有30%股权 | 王宏志任执行董事,陈玦霏任经理,莫天勤任监事 |
4 | 共青城宜邦 | 2019年12月王宏志、莫天勤将合计持有的70%股权转让给夏建平;上述股权转让后,夏建平持有70%股权,陈礼秋持有30%股权,夏建平为广州善世股东高洁的母亲,陈礼秋为广州善世股东陈玦霏的妹妹 | 2019年12月股权转让前,王宏志任董事,莫天勤任经理;2019年12月股权转让后,夏建平任执行董事、经理,陈礼秋任监事 |
(2)通过同一控制下不同企业开展业务的原因及合理性
上述该等企业通过同一控制下不同企业开展业务主要基于分地域进行业务开拓和区域管理的需要,具有合理性。其中,广州善世主要负责华南地区业务,芜湖善慧主要负责华东地区业务,广州才星分担广州善世部分业务,业务转型为“互联网+”相关劳务业务后与发行人终止合作,芜湖善慧的业务于2019年下半年逐渐由共青城宜邦承接。发行人实际向其进行采购时亦主要根据项目涉及地域、业务需要等向不同主体发送采购需求。
(3)发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务
报告期内,发行人一直与广州善世开展业务合作,自报告期初至2019年12月与芜湖善慧开展业务合作,自2018年4月至2019年5月与广州才星开展业务合作,自2019年9月至今与共青城宜邦开展业务合作。报告期内各期发行人向广州善世、芜湖善慧、广州才星、共青城宜邦采购金额及占其营业收入比例具体如下:
年度 | 发行人采购金额(万元) | 供应商营业收入(万元) | 占比(%) |
2017 | 1,722.70 | 12,965.02 | 13.29 |
2018 | 3,324.46 | 15,551.30 | 21.38 |
2019 | 3,153.41 | 28,063.01 | 11.24 |
2020年1-9月 | 3,158.75 | 33,219.88 | 9.51 |
报告期内,发行人向广州善世及其受同一控制的同类业务主体采购额占其营业收入的比例较低,其从事业务经营与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
8-2-1-111
2、北京博睿驰信人力资源有限公司(以下简称“北京博睿”)、恩泽尔商贸有限公司(以下简称“恩泽尔”)、北京零点起航营销策划有限公司(以下简称“北京零点”)
(1)认定同一控制的依据
基于股权结构及委托经营管理的情况,北京博睿、恩泽尔、北京零点以及未和发行人开展业务合作的北京天创共盈科技发展有限公司、北京中惠商客科技有限公司为王驰同一控制,具体情况如下:
①北京博睿、恩泽尔为王驰的一人公司,王驰持有其100%股权;
②北京零点、北京零点的股东与王驰签署了《公司委托经营协议》,约定北京零点委托王驰统一经营管理,委托经营期限自2015年6月1日至2025年5月31日;
③北京天创共盈科技发展有限公司与王驰签署《公司委托经营协议》,约定北京天创共盈科技发展有限公司委托王驰统一经营管理,委托经营期限自2017年1月1日至2021年12月31日;
④北京中惠商客科技有限公司与王驰签署了《公司委托经营协议》,约定北京中惠商客科技有限公司委托王驰统一经营管理,委托经营期限自2016年10月1日至2021年9月30日。
(2)通过同一控制下不同企业开展业务的原因及合理性
王驰持有100%股权的北京博睿、恩泽尔开展业务主要系按照地域划分,北京博睿负责境内业务,恩泽尔负责境外业务。因王驰具有业务拓展能力和管理劳务公司的经验,北京零点、北京天创共盈科技发展有限公司及北京中惠商客科技有限公司委托王驰进行经营管理。因此,上述企业同受王驰控制具有合理性。
报告期初,发行人与北京零点仅发生少量采购。发行人一直根据境内、境外劳务服务的需求分别向北京博睿、恩泽尔进行采购。
(3)发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务
报告期内,发行人一直与北京博睿、恩泽尔开展业务合作,2017年初与北京零点发生少量合作。报告期内各年度发行人向北京博睿、恩泽尔、北京零点等同受王驰控制的同类业务主体采购金额及占其营业收入比例具体如下:
年度 | 发行人采购金额(万元) | 供应商营业收入(万元) | 占比(%) |
2017 | 849.57 | 1,999.85 | 42.48 |
2018 | 2,078.46 | 4,417.41 | 47.05 |
8-2-1-112
2019 | 1,573.46 | 5,271.08 | 29.85 |
2020年1-9月 | 1,231.12 | 3,075.82 | 40.03 |
备注:为计算占比,恩泽尔各期美元营业收入按照当期1月1日、12月31日或9月30日的汇率的平均值折算为人民币。
报告期内,发行人向北京博睿及其受同一控制的同类业务主体采购额占其营业收入的比例低于50%,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
3、北京冠华英才国际经济技术有限公司(以下简称“北京冠华”)
报告期内,发行人一直与其开展业务合作,各年度发行人向北京冠华采购金额及占其营业收入比例具体如下:
年度 | 发行人采购金额(万元) | 供应商营业收入(万元) | 占比(%) |
2017 | 662.12 | 19,260.30 | 3.44 |
2018 | 905.61 | 21,757.42 | 4.16 |
2019 | 388.90 | 25,976.91 | 1.50 |
2020年1-9月 | 184.45 | 20,000.00 | 0.92 |
注:上表中2020年1-9月份供应商营业收入为北京冠华所确认提供的营业收入概数。
报告期内,发行人向北京冠华的各年采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
4、信阳市联智网络科技有限公司(以下简称“信阳联智”)
(1)认定同一控制的依据,通过同一控制下不同企业开展业务的原因及合理性
信阳联智与未和发行人开展业务合作的信阳市晨曦电子科技有限公司(以下简称“信阳晨曦”)同受洪琪控制。洪琪持有信阳联智100%股权。基于洪琪的业务开拓能力和管理劳务公司的经验,信阳晨曦股东黄晨与洪琪签署《委托经营协议》,委托洪琪对信阳晨曦统一经营管理,委托经营期限自2017年9月15日至2020年12月31日。因此,信阳联智和信阳晨曦同受洪琪控制具有合理性。
(2)发行人采购额占其同类收入的比例,是否专门或者主要为发行人服务
报告期内,发行人一直与信阳联智开展业务合作向其采购数据服务,各年度发行人向信阳联智等同受洪琪控制的同类业务主体采购金额及占其营业收入比例具体如下:
年度 | 发行人采购金额(万元) | 供应商营业收入(万元) | 占比(%) |
8-2-1-113
2017 | 89.08 | 184.53 | 48.27 |
2018 | 98.66 | 472.62 | 20.88 |
2019 | 104.29 | 407.77 | 25.58 |
2020年1-9月 | 21.78 | 236.09 | 9.23 |
报告期内发行人向信阳联智及其同一控制的同类业务主体采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
5、SAKURA JAPAN LLC(以下简称“SAKURA”)
2017、2018 、2019年度以及2020年1-9月,发行人从SAKURA 采购金额分别为 150.69 万元、84.81 万元、114.55万元、40.04万元,分别约占其营业收入的
13.90%、11.82%、18.70%、12.46%。
报告期内发行人向SAKURA采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
6、THINKWILD STUDIOS, S.L.(以下简称“THINKWILD”)
发行人自 2018 年开始向THINKWILD采购数据服务。2018年度、2019年度,发行人采购金额分别为129.85万元、12.62万元,约占其营业收入的37%、3%,2020年1-9月未发生采购。
报告期内发行人向THINKWILD采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
7、TWIN STUDIOS
发行人自 2018 年开始向TWIN STUDIOS采购数据服务。2018年度、2019年度,发行人采购金额分别为229.97万元、125.08万元,2020年1-9月未发生采购。由于TWIN STUDIOS并非上市公司,无公开披露的财务数据,且未提供其营业收入数据,因此无法计算发行人采购金额占其营业收入的比例。根据TWIN STUDIOS确认,除向发行人提供劳务服务外,TWIN STUDIOS也为其他客户提供服务,且从事业务经营活动与发行人不存在任何关联,因此不存在专门或主要为发行人服务的情形。
8、Atrium Studio Medienproduktion GmbH(以下简称“Atrium”)
8-2-1-114
2017、2018 、2019年度,发行人采购金额为8.23万元、125.54万、138.71 万元,2020年1-9月未发生采购。由于Atrium并非上市公司,无公开披露的财务数据,且未提供其营业收入数据,因此无法计算发行人采购金额占其营业收入的比例。根据Atrium确认,除向发行人提供劳务服务外,Atrium也为其他客户提供服务,且从事业务经营活动与发行人不存在任何关联,因此不存在专门或主要为发行人服务的情形。
9、Voices.com Inc
2017、2018 、2019年度、2020年1-9月,发行人采购金额分别为25.01万元、
60.12万元、91.29万元、211.15万元,根据Voices.com Inc的确认,报告期内发行人各期采购金额占其当期营业收入的比例不超过1%。
报告期内发行人向Voices.com Inc采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
10、IVO EMEA LTD.
发行人自 2020 年开始向IVO EMEA LTD.采购数据服务。2020年1-9月,发行人采购金额为72.25万元,根据IVO EMEA LTD.的确认,2020年1-9月,发行人采购金额约占其当期同类业务营业收入的11%。
报告期内发行人向IVO EMEA LTD.采购额占其营业收入的比例较低,且从事业务经营活动与发行人不存在其他关联,因此不存在专门或主要为发行人服务的情形。
二、主要小外包人员的基本情况
发行人报告期内数据采集、标注服务公司涉及的主要小外包人员约80余人。小外包人员主要负责根据服务公司的安排寻找符合发行人要求的终端人,组织并管理终端人提供劳务,具体包括人员信息登记、终端人授权书签署、人员时间安排及现场引导、对终端人的服务进度和数据完整性进行把控等,并与其负责的终端人进行结算支付。由于采集、标注服务采购涉及的采集、标注人员众多,且具备一次性、临时性、需求多样性等特征,以及对人员响应速度要求较快,仅单纯依靠服务公司直接寻找终端人员难以满足发行人业务扩张所需要的人员寻找和管理的需求,服务公司通过小外包人员寻找符合需求的人员能够提高寻找和管理效率,提高响应速度,满足发行人的需求。
上述主要小外包人员并非专职为服务公司提供劳务,其主要为自由职业者、企业人力资源岗位人员、销售岗位人员、在校大学生等具有人脉资源的岗位身份,主要利用其自由时间根据服务公司需求寻找联系组织终端人员为发行人提供劳务,并获取劳务报酬。
8-2-1-115
上述工作的时间较灵活,主要通过人脉网络进行宣传,不需要较强的专业技术能力,不需要花费成本进行专门投资或投入专业设备,因此该项工作对上述人员具有吸引力。
三、服务公司及其关联方和主要小外包人员是否与发行人客户及其关键经办人员、发行人控股股东、实际控制人、发行人关联方、员工及前员工之间存在关联关系、关联交易、资金往来或其他利益安排,是否存在通过服务公司向客户进行商业贿赂的情形;根据发行人及其控股股东、实际控制人、发行人主要关联方、关键岗位人员(主要采购、销售及财务人员)、服务公司以及主要小外包人员书面确认并经核查服务公司、发行人及其控股股东、实际控制人、发行人主要关联方、发行人关键岗位人员报告期内的银行流水,基于上述核查,服务公司及其关联方和主要小外包人员与发行人客户及其关键经办人员、发行人控股股东、实际控制人、发行人关联方、员工及前员工之间不存在关联关系、关联交易、资金往来或其他利益安排。根据发行人及其实际控制人、总经理、主要销售人员、主要采购人员以及主要服务公司书面确认,不存在通过服务公司向客户进行商业贿赂的情形。
(9)服务公司作为扣缴义务人是否已替小外包人员或终端人员履行了代扣代缴税款义务,是否存在违反相关法律法规的情形
一、小外包人员和终端人员应税收入的范围
发行人通过服务公司采集和标注业务数据。资金支付方面,发行人按项目进度向服务公司结算采购费用。服务公司收到资金后,向小外包人员和其直接对接的终端劳务人员支付劳务费用。小外包人员收到资金后,向其对接的终端劳务人员支付费用。
在发行人采集和标注数据的业务开展过程中,小外包人员及终端劳务人员各自对其获得的收入承担个人所得税的纳税义务,但由于业务开展中的职责不同,二者的应税收入所有区别:终端劳务人员因其向发行人提供采集、标注劳务服务而获取收入,小外包人员因其向服务公司提供寻找、管理相关终端人员的劳务服务而获得收入。因此小外包人员作为终端劳务人员的组织者,其收到的服务公司付款中,大部分是代为收取的终端人员的劳务收入,该部分收入纳税义务主体为终端劳务人员,小外包仅对其自身取得的劳务报酬部分承担纳税义务。
二、发行人不同业务类型中小外包人员及终端人员的应税收入及缴纳情况
根据发行人的业务类型,对应的小外包人员及终端人员的应税收入及缴纳情况如下:
8-2-1-116
(一)采集服务
关于数据采集业务,存在以下两种情形:
(1)语音识别采集项目、计算机视觉类项目和自然语言类项目该等项目特点为采集人数众多、人均结算单价较低。报告期内,上述项目的人均结算单价(包含小外包人员及项目对应全部终端人员)分别是171.07元、254.74元、218.38元和247.43元,因此,此类个体(包含小外包人员和终端人员)平均收入较低,平均而言未达到劳务报酬个人所得税起征点。
(2)语音合成项目
该等项目特点为采集人数较少,人均结算单价(包含小外包人员及项目对应全部终端人员)较高,终端人员(即发音人)单次收入平均而言达到了个人所得税缴纳标准。2017年、2018年、2019年和2020年1-9月,发行人为采购此类采集服务向服务公司支付的数据服务费金额分别为293.49万元、380.42万元、224.40万元和360.26万元。假设终端人员(即发音人)人均需以全部劳务服务收入为应纳税所得额,按照20%的税率缴纳个人所得税,据此估算,服务公司需代扣代缴的个人所得税总额分别不超过
58.70 万元、76.08 万元、44.88 万元和72.05万元,服务公司所负有的代扣代缴义务对应的税款金额较低。
(二)标注服务
发行人智能语音类、计算机视觉类、自然语言类业务均采购了服务公司的标注服务。
标注人员主要为临时性兼职人员,单次劳务服务收入较低,与供应商签署劳务协议,按照劳务量领取劳务报酬。报告期内,上述标注项目的平均单个标注人员的年均劳务收入(包含小外包人员及项目对应全部终端人员)分别是2,154.48元、2,458.80元、2,363.35元和1,963.05元,金额较低,推断标注人员涉及个人所得税纳税义务的可能性较小,相关个人所得税扣缴义务人为服务公司。会计师核查事项
对于上述说明事项,会计师已经执行了与数据服务采购发生、准确性和截止性认定相关的审计程序及核查程序,具体请参见本问题的申报会计师核查事项。另外,针对上述发行人说明事项,申报会计师进一步执行了如下核查程序:
8-2-1-117
1、获取发行人业务人员事先垫付资金的具体明细,了解具体原因,检查资金流转的过程是否符合发行人的相关内控制度;
2、查阅中国境内主要服务公司及其同一控制主体营业执照、公司章程、报告期各期末员工花名册及财务报表、委托经营管理协议等,通过国家企业信用信息公示系统查询中国境内主要服务公司的基本信息;
3、获得发行人报告期内发生采购交易的主要服务公司的股东名单和主要小外包人员名单,与发行人报告期内的员工花名册进行核对,与发行人股东、实际控制人、发行人关联方进行核对,与发行人报告期内前十大客户的关键经办人员的名单进行核对,检查是否存在发行人服务公司及其股东和主要小外包人员,与发行人员工和前员工之间、与发行人股东、实际控制人、发行人关联方之间,与发行人客户关键经办人员之间的关联关系;
4、检查报告期内发生采购交易的主要服务公司的工商登记等公示信息,检查股东信息、办公地址与关联方信息,并与发行人报告期内前十大客户的工商登记信息等公开信息进行核对,检查主要服务公司与发行人主要客户之间是否存在关联关系;
5、取得发行人实控人个人银行账户、其他关联方(包括实控人控制的法人主体(中瑞安和创世联合)银行账户、发行人董监高个人银行账户)以及发行人关键岗位人员,包括主要采购人员、主要销售人员及主要财务人员银行账户在2017年、2018年、2019年的银行账户流水,检查是否存在与发行人服务公司及其股东和主要小外包人员的资金往来;
6、取得主要服务公司确认函,确认服务公司与发行人股东、实际控制人、发行人关联方、员工及前员工不存在关联关系、关联交易、资金往来或其他利益安排;
7、取得发行人及其实际控制人、总经理、主要销售人员、主要采购人员的书面确认函,确认不存在通过服务公司向发行人客户进行商业贿赂的情形;
8、获得发行人报告期内主要服务公司对外公示的工商登记信息及其他公开信息,检查主要服务公司及其股东是否存在因商业贿赂及其他违法行为造成受到处罚或刑罚的情况;
9、取得报告期内境内前五大服务公司的税务合规证明、涉税征信情况、涉税信息查询结果等当地税务局提供的信息,确认是否存在重大的税务违规情况。并取得境内前五大服务公司关于履行代扣代缴义务的书面确认文件。
8-2-1-118
经核查,申报会计师认为:
1、报告期内,发行人披露的采购数据采集和标注服务的人员管理、场地使用、进度管理和质量控制措施、验收标准、结算方式、结算对象和结算周期等情况与发行人实际情况相符,发行人与数据服务采购相关内部控制的设计合理、执行有效;
2、报告期内,服务公司小外包人员的数量变动情况合理,小外包人员不属于服务公司员工,不存在相互重合的情形;发行人不会对小外包人员进行直接的人员方面管理和控制,主要通过与服务公司的沟通合作实现劳务外包,并间接通过服务公司把控小外包对终端人员的寻找和组织管理工作;
3、发行人披露的事先垫付资金的具体原因、后续结算及差异调整情况与发行人实际情况相符,2017年、2018年垫付资金的金额较小,不会对发行人内部控制的有效性造成重大不利影响,2019年发行人对事先垫付资金的事项进行整改规范,不再存在上述由发行业务人员垫付资金的情形,符合发行人相关内部控制制度的规定;
4、发行人向服务公司支付服务管理费原因合理,加成率定价依据充分、公允,不同公司加成率之间的差异具备合理原因;
5、发行人采集和标注单价的确定依据和过程合理,同类型项目的采集和标注单价的差异原因合理;
6、发行人采集数据量、标注数据量和标产比相关的确定方法和具体依据合理,不存在随意修改或调整的情形,同类型项目的采集数据量、标注数据量和标产比的差异原因合理;
7、劳务数量及数据服务费用变动与发行人经营情况相匹配,数据服务费用的采购价格公允,劳务用工成本核算完整且不存在跨期,发行人建立的相关内部控制措施完善,且得到有效执行;
8、服务公司的基本情况和员工数量与发行人的采购规模相匹配,服务公司认定为同一控制的依据合理,通过同一控制下不同企业开展业务的原因合理,不存在服务公司专门或主要为发行人服务的情形;服务公司及其关联方和主要小外包人员,与发行人客户及其关键经办人员、发行人控股股东、实际控制人、发行人关联方、员工及前员工之间不存在关联关系、关联交易、资金往来或其他利益安排;发行人及其实际控制人、总经理、主要销售人员以及主要采购人员不存在通过服务公司向客户进行商业贿赂的情形;
8-2-1-119
9、报告期内,服务公司已经作为扣缴义务人替小外包人员或终端人员履行了代扣代缴税款义务,不存在违反相关法律法规的情形。会计师说明事项
(1)未将营业成本认定为关键审计事项的原因
根据《中国注册会计师审计准则第1504号——在审计报告中沟通关键审计事项》第九条规定:“注册会计师应当从与治理层沟通过的事项中确定在执行审计工作时重点关注过的事项。在确定时,注册会计师应当考虑下列方面:(一)按照《中国注册会计师审计准则第1211号——通过了解被审计单位及其环境识别和评估重大错报风险》的规定,评估的重大错报风险较高的领域或识别出的特别风险;(二)与财务报表中涉及重大管理层判断(包括被认为具有高度不确定性的会计估计)的领域相关的重大审计判断;(三)本期重大交易或事项对审计的影响。”第十条规定:“注册会计师应当从根据本准则第九条的规定确定的事项中,确定哪些事项对本期财务报表审计最为重要,从而构成关键审计事项。”
根据《中国注册会计师审计准则第1504号——在审计报告中沟通关键审计事项》应用指南29条规定:在确定某一与治理层沟通过的事项的相对重要程度以及该事项是否构成关键审计事项时,下列考虑也可能是相关的:(1)该事项对预期使用者理解财务报表整体的重要程度,尤其是对财务报表的重要性。(2)与该事项相关的会计政策的性质或者与同行业其他实体相比,管理层在选择适当的会计政策时涉及的复杂程度或主观程度。(3)从定性和定量方面考虑,与该事项相关的由于舞弊或错误导致的已更正错报和累积未更正错报(如有)的性质和重要程度。(4)为应对该事项所需要付出的审计努力的性质和程度,包括:①为应对该事项而实施审计程序或评价这些审计程序的结果(如有)在多大程度上需要特殊的知识或技能。②就该事项在项目组之外进行咨询的性质。(5)在实施审计程序、评价实施审计程序的结果、获取相关和可靠的审计证据以作为发表审计意见的基础时,注册会计师遇到的困难的性质和严重程度,尤其是当注册会计师的判断变得更加主观时。(6)识别出的与该事项相关的控制缺陷的严重程度。(7)该事项是否涉及多项可区分但又相互关联的审计考虑。例如,长期合同可能在收入确认、诉讼或其他或有事项等方面需要重点关注,并且可能影响其他会计估计。
根据审计准则的规定,申报会计师在审计工作中评价具有重大错报风险的领域包括:
(1)收入确认;(2)营业成本的核算。申报会计师将上述两个领域评估作为重大错报风险较高的审计领域予以重点关注。
8-2-1-120
其中,对于营业成本的核算这一重点领域,申报会计师考虑与其相关的重要会计科目和认定主要包括营业成本和存货的完整、真实和准确。对该领域相关的重要会计科目和认定,评估其固有风险主要包括存货和成本的金额未被完整记录以及结转成本的不及时和不准确,固有风险较高。申报会计师对发行人相关的内部控制进行了了解、测试和评价,由于发行人与营业成本核算相关的内部控制存在且运行有效,因此申报会计师将与营业成本核算相关的控制风险认定为低风险,并依赖控制测试的结果设计和执行适当的实质性审计程序和其他核查程序,主要包括抽凭检查、分析性复核、函证、走访和访谈、银行流水核查等。通过执行适当的审计程序和核查程序,将营业成本核算领域的重大错报风险降低至可接受的水平。
根据审计准则的相关规定,申报会计师需要从重点关注事项中选取对财务报表审计最为重要的领域和事项,作为关键审计事项。申报会计师认为收入确认事项是对财务报表审计最为重要的事项,因此将收入确认事项作为关键审计事项予以披露。
申报会计师考虑重点关注事项是否构成关键审计事项时,考虑的因素主要包括重要程度和重要性、相关会计政策的复杂程度或主观程度、以及审计程序的特殊性和复杂性等方面。申报会计师认为,收入是发行人的关键业绩指标之一,存在管理层为了达到特定目标或期望而操纵收入确认时点的固有风险或收入被确认于不正确的会计期间的错报风险,同时新实施的收入准则也需要管理层根据合同条款和业务安排评估对收入确认会计政策的影响,该评估涉及管理层重大判断,因此将收入确认认定为关键审计事项。对于营业成本核算,申报会计师考虑到与其相关的会计处理相比较而言并不复杂,不涉及管理层重大判断,因此未将营业成本核算认定为关键审计事项。
(2)对数据服务采购发生、准确性和截止性认定履行的具体审计程序
针对数据服务采购发生、准确性和截止性认定,申报会计师执行的具体审计程序及核查程序总结如下:
(一)与数据服务采购支出相关的内部控制测试
通过询问了解报告期内与数据服务采购相关的具体业务流程及关键财务报告相关内部控制,包括与签署框架协议、立项及预算管理、采购申请的审批、下达采购通知、验收结算及费用报销、费用支付、项目成本归集、成本结转、项目决算等关键业务环节相关的内部控制情况。报告期内分别选取样本执行穿行测试,获取与上述关键业务环节的内部控制相关的各项单据,包括采购框架协议、项目预算文件、采购通知、验收结算单、费用报销申请、付款凭据、财务记账记录等信息,检查关键内部控制是否设计有效并得到实施。按照相关内部控制发生的频率,在报告期内选取样本执行控制有效性测试,
8-2-1-121
检查相关内部控制是否在报告期内运行有效。另外,选择目前发行人在执行的项目,观察项目的实际采集和标注的流程与操作情况。根据上述控制测试的结果,发行人在报告期内保持了与采购支出相关的有效的内部控制。
(二)数据服务采购的平均单价分析
获取发行人报告期内的不同业务领域的数据服务采购总量,包括采购的采集数据量与标注有效工时,与各个业务领域的采集与标注的采购支出金额进行对比,分析报告期内的不同业务领域的采集与标注的平均单价是否存在波动,并询问管理层价格波动原因,分析其合理性。将最近一期的发行人的采集与标注的采购平均单价与市场上可获得的类似服务的公开价格进行比较,检查是否存在差异,并询问管理层差异原因,分析其合理性。
具体计算的不同业务领域的采集与标注的采购平均单价及波动分析,请参见本问题“发行人说明事项/(5)采集和标注单价的具体确定依据和过程,同类型项目的采集和标注单价是否存在差异并分析具体原因”。
采集与标注的平均单价与市场上可获得的类似服务的公开价格进行比较分析的具体情况,请参见本问题“发行人说明事项/(7)劳务数量及数据服务费用变动是否与发行人经营情况相匹配,数据服务费用的采购价格是否公允,劳务用工成本核算是否完整且不存在跨期,发行人建立的相关内部控制措施及执行情况”。
根据上述对报告期内的采集和标注的平均采购单价的计算及分析,以及与市场类似服务的公开价格比较,发行人报告期内的不同业务领域的采集与标注的平均采购单价合理,不存在重大异常情况。
(三)数据服务采购的采集损耗率和标注产出比分析
抽取项目将项目的数据服务采购量核对至该项目的销售量,通过二者的比较核对来分析采购量是否合理,是否与销售量配比。其中对于采集环节,统计分析采购端的供应商结算量与销售端的客户验收量的差额占后者的比例(“采集损耗率”),分析项目的采集损耗率是否合理;对于标注环节,统计采购端的标注有效工作时长与销售端的客户验收量的比例(“标注产出比”,简称“标产比”),分析项目的标产比是否合理。
1、采集环节的损耗率分析
抽取项目的收入覆盖比例如下:
8-2-1-122
年份 | 核查项目收入(万元) | 收入总额(万元)(注) | 同类收入覆盖比例 |
2020年1-9月 | 4,615.05 | 5,536.02 | 83.36% |
2019年 | 8,630.42 | 11,751.23 | 73.44% |
2018年 | 6,371.44 | 8,221.99 | 77.49% |
2017年 | 4,200.87 | 5,652.71 | 74.32% |
合计 | 23,817.78 | 31,161.95 | 76.43% |
注:同类收入的统计口径为当年或当期实现收入的训练数据定制服务和训练数据产品(不含重复销售)的收入,扣除了未包含采集环节的项目收入。具体执行程序:
对于采集而言,发行人以客户合同数量基础,按照总体约5%以内的冗余度控制实际采集的数量。因此通过计算和分析采集环节的损耗率,来确认发行人采集环节采购数量的完整性、准确性。
核查中,抽取报告期内不同业务类型下的不同项目,获取其采购的采集量和销售量,计算报告期内的抽取项目的平均的采集损耗率。对于语音识别采集项目,检查发行人报告期内项目的客户合同或订单、客户验收文件、项目采集信息表、供应商结算单等外部证据资料,统计核对客户验收发音人总人数、供应商采集总人数、供应商结算总人数等数据;对于语音合成项目,检查报告期内项目的客户合同或订单、客户验收文件、与客户之间的语料设计沟通邮件、供应商结算单等外部证据资料,统计核对向供应商采集的字词数量、发行人设计文本字词数量、交付客户并验收字词数量;对于计算机视觉类项目,检查报告期内项目的客户合同或订单、客户验收文件、供应商结算单等外部证据资料,统计核对客户验收数量、供应商结算数量等数据。
具体按照各个业务类型计算与分析所抽取项目的采集环节的损耗率情况如下:
(1)语音识别类项目
对于语音识别类型的抽取项目,通过将采购端的供应商结算人数与销售端的客户验收发音人人数进行对比分析,计算报告期内的抽取项目的平均的采集损耗率。采集损耗率=(供应商结算总人数-客户验收发音人总人数)/客户验收发音人总人数。各年抽查项目中,存在少数项目由于采集难度大、设备稳定性较差、部分发音人员多次录制等特殊因素,使得采集损耗率异常的情况,该等项目报告期各期分别为12个、17个、13个、17个。扣除该等项目影响后,其他抽样项目在报告期内的平均采集损耗率的计算结果如下,较为稳定,保持在5%的合理范围之内。
年份 | 客户验收发音人数(人) | 供应商结算人数(人) | 采集损耗率 |
8-2-1-123
2020年1-9月 | 25,050 | 26,087 | 4.14% |
2019年 | 31,424 | 32,712 | 4.10% |
2018年 | 41,378 | 43,074 | 4.10% |
2017年 | 33,811 | 35,184 | 4.06% |
(2)语音合成类项目
对于语音合成类型的抽取项目,通过将采购端的供应商结算字数与销售端的客户验收字数进行对比分析,计算报告期内的抽取项目的平均的采集损耗率。采集损耗率=(供应商结算字数-客户验收字数)/客户验收字数。抽取项目在报告期内的平均的采集损耗率的计算结果如下,较为稳定,保持在5%的合理范围之内。
年份 | 客户验收字数(字/词) | 供应商结算字数(字/词) | 采集损耗率 |
2020年1-9月 | 10,160,675 | 10,192,424 | 0.31% |
2019年 | 11,065,038 | 11,273,625 | 1.89% |
2018年 | 6,001,700 | 6,184,489 | 3.05% |
2017年 | 4,663,749 | 4,765,123 | 2.17% |
(3)计算机视觉类项目
对于计算机视觉类型的抽取项目,由于项目的数量单位较多,不同数量单位之间难以合并计算,因此抽查各年使用相对常见的数量单位(例如“张”或“人”)的项目进行分析。
抽取项目在报告期内的平均的采集损耗率的计算结果如下。采集损耗率=(供应商结算数量-客户验收数量)/客户验收数量。个别期间的采集损耗率略高于5%的一般正常范围,原因分析如下:(1)2019年以“人”为数量单位的采集损耗率略高,主要是由于个别项目涉及唇语、人物动作准确率要求高等难度较大的采集,因此采集环节的作废率相对较高所致。(2)2020年1-9月以“人”为数量单位和以“张”为数量单位的采集损耗率略高,主要是由于部分项目客户需求中途变更或细化导致作废率较高所致。除此以外,报告期其他各个期间的计算机视觉类项目的平均采集损耗率较为稳定,保持在5%的合理范围之内。
年份 | 数量单位 | 客户验收数量 | 供应商结算数量 | 采集损耗率 |
2020年1-9月 | 张 | 254,268 | 267,884 | 5.35% |
人 | 600 | 635 | 5.83% |
8-2-1-124
2019年 | 张 | 103,697 | 105,029 | 1.28% |
人 | 6,850 | 7,287 | 6.38% | |
2018年 | 张 | 1,023,069 | 1,023,069 | 0.00% |
2017年 | 人 | 1,200 | 1,205 | 0.42% |
对于上述采集损耗率超出5%的少数项目,申报会计师执行了进一步的审计程序,包括与项目负责人进行访谈,了解损耗率超出一般水平的原因,获取项目文件、人员邮件往来、文件记录等支持性依据,分析判断原因的真实性与合理性。程序执行结果:
报告期内,抽取的各类项目的采集损耗率整体合理,发行人原料数据采集量与销售量相匹配,采集环节的数据服务采购交易相关的采购数量真实、准确。
2、标注环节的标产比分析
抽取项目的收入覆盖比例如下:
年份 | 核查项目收入(万元) | 收入总额(万元)(注) | 同类收入覆盖比例 |
2020年1-9月 | 6,922.84 | 8,525.83 | 81.20% |
2019年 | 14,032.38 | 16,930.51 | 82.88% |
2018年 | 10,982.16 | 13,582.50 | 80.86% |
2017年 | 6,553.50 | 8,228.96 | 79.64% |
合计 | 38,490.88 | 47,267.80 | 81.43% |
注:同类收入的统计口径为当年或当期实现收入的训练数据定制服务和训练数据产品(不含重复销售)的收入。
具体执行程序:
对于标注而言,发行人以客户合同销售数量基础,按照与供应商约定的标产比(即单位产出所需的标注工作量)进行采购结算。因此,通过计算各个业务类型中抽取项目的平均标产比并分析报告期内的变化情况,并通过选取同类型项目进行重新测速,与报告期内的抽取项目的平均标产比进行对比,来分析报告期内的标产比是否合理,分析和确认发行人标注工作量与销售量是否匹配。
核查中,抽取报告期内不同业务类型下的不同项目,获取其采购端的标注有效工作小时数量和销售端的客户验收量,按照不同业务类型分别计算抽取项目的平均的标产比,并进行报告期内的对比分析。项目采购端的标注有效工作小时数量的数据来源是供应商
8-2-1-125
的验收结算单等外部依据,销售端的客户验收数量的数据来源是与客户的验收文件或销售合同或订单等外部依据。具体按照各个业务类型计算与分析所抽取项目的标注环节的标产比情况如下:
(1)语音识别采集类项目的标产比分析
对于语音识别采集类型的抽取项目,通过将采购端与供应商结算的标注有效工作小时数与销售端的客户验收数量,即音频小时数,进行对比分析,计算报告期内的抽取项目的平均的标产比。标产比=标注量/销售量。计算结果显示如下。
2020年1-9月 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
读文本 | 59,902.40 | 42,793.50 | 1.4 |
自由对话 | 61,888.86 | 7,033.25 | 8.8 |
其他 | - | - | - |
合计 | 121,791.26 | 49,826.75 | 2.4 |
2019年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
读文本 | 92,916.52 | 40,978.00 | 2.3 |
自由对话 | 148,303.43 | 16,262.00 | 9.1 |
其他 | 12,859.45 | 2,155.10 | 6.0 |
合计 | 254,079.40 | 59,395.10 | 4.3 |
2018年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
读文本 | 215,925.88 | 72,914.40 | 3.0 |
自由对话 | 25,070.99 | 2,231.60 | 11.2 |
其他 | 3,291.57 | 2,997.00 | 1.1 |
合计 | 244,288.45 | 78,143.00 | 3.1 |
2017年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
读文本 | 99,617.35 | 34,272.12 | 2.9 |
自由对话 | 135,656.99 | 6,635.00 | 20.4 |
其他 | 857.72 | 1,260.00 | 0.7 |
合计 | 236,132.06 | 42,167.12 | 5.6 |
8-2-1-126
报告期内,发行人语音识别采集项目以读文本和自由对话类项目为主,其他类型项目销售量较低。自由对话标注的复杂程度及难度明显高于读文本,因此标产比较高。发行人2017年语音识别采集自由对话项目中,存在部分语种稀缺、辨识难度较高、客户对数据要求高的项目,提高了2017年语音识别采集自由对话项目的标产比。2018年开始,发行人逐步引入工具进行预标注和自动检测,标注速度有所提升。为了进一步分析报告期内标产比的合理性,抽取2020年语音识别采集读文本项目和语音识别采集自由对话项目,分别进行测速得出标产比,并与上述抽取项目计算的平均标产比进行比较。测得语音识别采集读文本项目标产比为2.4,语音识别采集自由对话项目标产比为9.7。由于2018年开始,发行人逐步引入工具进行预标注和自动检测,标注速度有所提升,因此测速得出的标产比与2019年和2020年1-9月的数据可比。经比较,测速得到的标产比与2019年抽取的语音识别采集项目的平均标产比基本一致。2020年1-9月抽取的读文本类语音识别采集项目中存在部分根据客户需求或产品设计安排无需标注或仅需进行简单标注的项目,共涉及标注量1,710小时,销售量19,561小时,扣除该等项目影响后,其他抽样项目的标产比为2.5,与测速得到的标产比基本一致。
(2)语音合成类项目的标产比分析
对于语音合成类型的抽取项目,通过将采购端与供应商结算的标注有效工作小时数与销售端的客户验收数量,即音频小时数,进行对比分析,计算报告期内的抽取项目的平均的标产比。标产比=标注量/销售量。计算结果显示如下。
年度 | 标注量(小时) | 销售量(小时) | 标产比 |
2020年1-9月 | 45,691.31 | 1,861.51 | 24.5 |
2019年 | 125,504.13 | 2,748.54 | 45.7 |
2018年 | 67,795.49 | 1,513.86 | 44.8 |
2017年 | 71,470.29 | 1,006.69 | 71.0 |
语音合成项目的细分标注环节较多,包括词性、韵律、音素边界标注、校对,整体标产比为各环节标产比的累加,环节越多,所需标注时长越长。同时,中文和外语种的标注难度有所差异,中文的标产比低于外语种。因此项目的复杂性造成了上述报告期内计算的抽取项目的平均标产比存在差异的情况。
为了进一步分析报告期内标产比的合理性,申报会计师抽取2020年语音合成项目,分别按词性标注、韵律标注、音素边界标注、校对4个环节进行了测速,测得标产比情况如下:
8-2-1-127
明细环节 | 中文项目平均标产比 | 外语种项目平均标产比 |
词性标注 | 13.2 | 14.7 |
韵律标注 | 6.7 | 10.0 |
音素边界标注 | 40.6 | 54.6 |
校对 | 7.7 | 14.4 |
对于上述报告期内抽取的项目,按照包含的明细标注环节,分为不同类型的标注项目。对于其中的两种主要类型计算平均标产比,并将其与测速项目的标产比进行对比如下:
序号 | 项目包含的明细标注环节 | 样本均值2020年1-9月 | 样本均值2019年 | 样本均值2018年 | 样本均值2017年 | 中文项目测速标产比 | 外语种项目测速标产比 |
1 | 韵律+词性+音素边界+校对 | 78.5 | 106.5 | 67.6 | 97.9 | 68.2 | 93.7 |
2 | 韵律+音素边界+校对 | 48.0 | 61.9 | 53.1 | 82.8 | 55.0 | 79.0 |
由上表可以看出,发行人语音合成项目标产比基本介于测速得到的中文和外语种标产比数值之间,不存在显著异常。
另外,上述两种类型的语音合成项目的标产比就总体而言,自2018年开始随着发行人预标注技术和工具的普遍应用而呈现降低趋势。但是上述主要类型1在2019年标产比较高的原因是部分重点客户的语音合成项目标注质量要求高、难度大所致。上述主要类型2的标产比还受到项目语种结构的影响;2017年标产比较高是由于当年主要为外语种业务,而外语种项目标产比相对较高所致;2018年均为中文业务;2019年主要为中文业务,2020年1-9月主要为中文相关业务,因此标产比相对较低。
(3)语音识别转写类项目的标产比分析
对于语音识别转写类的抽取项目,通过将采购端与供应商结算的标注有效工作小时数与销售端的客户验收数量,即音频小时数,进行对比分析,计算报告期内的抽取项目的平均的标产比。标产比=标注量/销售量。计算结果显示如下。
2020年1-9月 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
短音频 | 615,511.32 | 48,486.69 | 12.7 |
长音频 | 208,376.62 | 12,856.69 | 16.2 |
8-2-1-128
合计 | 823,887.94 | 61,343.37 | 13.4 |
2019年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
短音频 | 649,548.80 | 61,797.70 | 10.5 |
长音频 | 249,456.59 | 16,911.46 | 14.8 |
合计 | 899,005.39 | 78,709.16 | 11.4 |
2018年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
短音频 | 847,732.21 | 70,774.67 | 12.0 |
长音频 | 288,698.46 | 20,148.72 | 14.3 |
合计 | 1,136,430.67 | 90,923.39 | 12.5 |
2017年度 | |||
类型 | 标注量(小时) | 销售量(小时) | 标产比 |
短音频 | 337,673.87 | 36,166.29 | 9.3 |
长音频 | 199,813.38 | 12,318.81 | 16.2 |
合计 | 537,487.25 | 48,485.10 | 11.1 |
报告期内,发行人语音识别转写项目分为短音频类项目和长音频类项目。长音频通常语速较快且变化更为复杂,人物角色和领域较为多样,标注难度高于短音频,因此标产比较高。报告期内语音识别转写项目标产比相对较为稳定。语音识别转写短音频项目2017年标产比较低的原因是当年存在一定规模的短音频项目要求简单,仅需整理数据,因此标产比很低,拉低了短音频项目整体标产比。
进一步抽取2020年语音识别转写短音频项目和语音识别转写长音频项目,分别进行测速得出标产比,测得上述短音频项目的标产比区间为10.7-11.8,长音频项目的标产比区间为14.6-19.5,与上述语音识别转写项目的标产比基本一致。
(4)计算机视觉项目和自然语言项目的标产比分析
抽取项目中,如果是与客户确认标产比的项目,则根据客户邮件确认的标产比×交付数据量,计算得出客户认可的工作小时,作为销售量。同时以统计的供应商完成标注等业务环节的有效工时,作为标注量。
抽取项目中,如果不是与客户确认标产比的项目,则直接根据客户验收确认的销售量和与供应商结算的标注有效工作小时来作为销售量和标注量。
8-2-1-129
将上述与客户确认标产比的项目的标注量与销售量进行对比,计算抽取项目的平均的标产比。标产比=标注量/销售量。计算结果显示如下。
年份 | 标注量(小时) | 销售量(小时) | 标产比 |
2020年1-9月 | 88,541.37 | 69,017.56 | 1.3 |
2019年 | 256,082.18 | 237,135.98 | 1.1 |
2018年 | 71,137.00 | 53,879.00 | 1.3 |
2017年 | 34,740.00 | 27,402.00 | 1.3 |
上述与客户确认标产比的抽样项目实际采购标注工作小时大于客户认可的销售工作小时,即标产比大于1,主要原因是与客户约定的工作量中不包含质检环节,而发行人需要进行质检保证标注质量,因此实际采购标注工作小时略大于客户认可的销售工作小时。
此外,进一步抽取2020年的计算机视觉简体中文手写体项目和繁体中文手写体项目分别进行测速。对于2020年1-9月计算机视觉的简体中文和繁体中文手写体项目,分别将其标产比与抽取项目的测速结果进行了对比,简体中文手写体项目标产比0.50,与测速结果0.48基本一致,繁体中文手写体项目标产比0.99,与测速结果0.96基本一致。
程序执行结果:
报告期内,发行人抽取的各类项目的标产比整体合理,发行人原料数据标注量与销售量相匹配,标注环节的数据服务采购交易相关的采购数量真实、准确。
(四)核查主要数据服务供应商的采购支出的主要支持性依据
发行人与数据服务供应商的采购交易的主要支持性依据包括以下几种:(1)发行人与供应商签署的框架合作协议,约定双方的权利与义务等,并约定数据服务管理费费率和结算方式;(2)发行人向供应商下达的采购通知,采购通知的内容包括项目简介、服务工期、符合项目预算的原料数据采集、标注服务量(标注服务量根据需要标注的数据量与双方协商确定的标产比相乘计算得出)、采集或标注的人员要求和特别要素等;
(3)报销明细,发行人对供应商提供的劳务服务验收合格后会进入采购结算环节,项目人员会在系统中进行报销,相关信息会录入报销明细,报销明细会载明项目财务编号、项目支出的类型,对应的项目任务环节和采购的任务需求,并记录对应采购的数量、单价和报销金额;(4)验收结算单,系统根据报销明细表生成验收结算单,并发送给供应商,由供应商确认后作为双方结算依据。验收结算单是发行人与供应商的结算依据,
8-2-1-130
验收合格后双方签订验收结算单。验收结算单会载明项目财务编号、采购劳务内容、采购劳务的数量及对应金额,并由双方加盖公章;(5)供应商支付依据,供应商在对外付款时,一般会按发行人要求将银行回执进行截图并邮件发送给发行人。截图的银行回执会载明收款人信息、付款时间、付款金额等。因此对于报告期内的主要服务公司(各期采购金额占比5%以上)的数据服务费采购交易,检查至其支持性依据,包括采购框架合同、下达的采购通知、经审核的报销明细、经双方盖章确认的验收结算单、供应商付款依据等,并核对供应商名称与结算金额等信息是否与账面记录一致。
上述核查采购交易金额的覆盖比例如下:
年份 | 核查数据服务费采购支出金额(万元) | 数据服务费采购支出总额(万元)(注) | 覆盖比例 |
2020年1-9月 | 4,439.50 | 5,646.32 | 78.63% |
2019年 | 5,110.19 | 6,099.95 | 83.77% |
2018年 | 6,262.67 | 7,352.66 | 85.18% |
2017年 | 3,159.40 | 4,057.31 | 77.87% |
合计 | 18,971.76 | 23,156.24 | 81.93% |
上述核查程序执行结果显示,抽取检查的数据服务采购交易的金额与各项支持性证据的金额核对一致。
(五)采购支出在资产负债表日前后的截止性测试
从资产负债表日前后的数据服务费采购支出明细中选取样本执行截止性测试,通过检查双方盖章确认的验收结算单,来评价接近资产负债表日前后入账的数据服务费采购交易是否记录于恰当期间。
根据上述测试的执行结果,未发现数据服务费采购支出的重大截止性差异。
(六)信息系统相关测试
引用信息系统专家对报告期内的业务与财务相关的信息系统进行测试。相关信息系统包括一体化数据处理平台、业务管理平台和用友财务系统,测试内容包括信息系统一般性控制测试、信息系统应用控制测试、业务数据与财务数据相结合进行的数据分析。其中,信息系统的一般性控制测试和应用控制测试的结果均显示未发现重大异常,发行人信息系统的一般性控制和应用控制总体有效。
8-2-1-131
对于业务数据与财务数据的结合进行的数据分析程序,包括两类程序,一类是系统间的数据核对,将发行人报告期内业务管理平台的项目收入和成本信息与用友财务系统中确认收入与成本的信息进行比较,未发现重大差异。另一种类型是将业务数据与财务数据结合进行项目指标分析,通过分层方法随机抽样选取2018年、2019年和2020年1-9月的项目执行该程序。项目指标分析中采用的具体抽样方法及结果如下:
分层方法 | 总体项目收入金额(注) | 抽样核查项目收入金额 | 收入覆盖率 | |||||
项目收入金额分层 | 抽样比例 | 2020年1-9月(万元) | 2019年(万元) | 2018年(万元) | 2020年1-9月(万元) | 2019年(万元) | 2018年(万元) | 合计 |
200万元以上 | 100% | 214.29 | 4,562.15 | 1,137.57 | 214.29 | 4,562.15 | 1,137.57 | 100% |
200万元以下 | 50%以上 | 8,311.54 | 12,368.36 | 12,444.93 | 5,574.32 | 8,254.94 | 6,219.42 | 61% |
合计 | 8,525.83 | 16,930.51 | 13,582.50 | 5,788.61 | 12,817.09 | 7,356.99 | 67% |
注:总体项目收入金额为发行人当年训练数据定制服务收入和训练数据产品销售收入(不含重复销售)的金额。
对于上述抽样选取的2018年、2019年和2020年1-9月的项目,结合业务数据与财务数据进行数据分析,计算各项指标数据,包括项目的设计/导入/交付等环节文件数量一致性、废弃率、单位长度语音标注字节数量、项目标注效率、采集单价、单位语音时长采购成本、项目毛利率等,并进一步分析各项目的指标数据的波动或整体分布情况,其中识别出部分项目的指标数据与该类项目指标数据的一般情况相比存在偏离的情况,并执行进一步分析和核查程序,了解和确认这些被识别的项目指标存在偏离的主要原因,是否与实际情况相符,是否存在异常。经核查,所抽查项目的数据分析结果未发现异常,业务与财务指标在核查期间的变动趋势或表现在重大方面呈现一致性。
对于指标分析过程中所识别的指标偏离项目的具体的情况及执行的进一步审计程序,请参见本问题“会计师核查事项/(3)对IT审计报告中存在的异常项目履行的进一步审计程序”。
(七)主要数据服务供应商的函证程序
对报告期内的主要数据服务供应商进行函证,就于资产负债表日的往来款项余额及报告期间的采购金额进行确认。具体执行的供应商函证程序的情况请参见本问题会计师核查事项的第四项内容“对服务公司、小外包人员和终端人员履行的具体核查程序、核查过程、核查比例和核查结论”。
(八)主要数据服务供应商的访谈走访程序
8-2-1-132
选取主要数据服务供应商进行实地走访或其他形式的访谈,询问其与发行人的主要交易情况,是否与发行人存在关联关系,检查重要供应商及其交易的真实性,识别是否存在异常情况。具体执行的供应商走访程序的情况请参见本问题会计师核查事项的第四项内容“对服务公司、小外包人员和终端人员履行的具体核查程序、核查过程、核查比例和核查结论”。
(九)对服务公司、小外包人员和终端人员执行的进一步的穿透核查程序
对服务公司、小外包人员和终端人员执行进一步的穿透核查,具体核查程序包括:
(1)对2017年、2018年和2019年的主要服务公司的主要银行账户的银行流水进行核查,检查是否存在发行人实际控制人、其他关联方及关键岗位人员向服务公司支付款项的情形;(2)抽取样本将2017年、2018年和2019年发行人内部留存的支付小外包人员和终端人员的项目付款依据,核对至主要服务公司的主要银行账户的银行流水支出,对小外包和终端人员的款项支付进行穿透核查;(3)抽取样本对2017年、2018年和2019年为发行人提供服务的小外包人员进行访谈;(4)抽取样本对2019年为发行人提供服务的终端人员进行访谈;(5)抽取样本对2019年终端人员就其所提供劳务工作量等信息进行签字确认的单据进行核查。具体执行的上述穿透核查程序的情况请参见本问题会计师核查事项的第四项内容“对服务公司、小外包人员和终端人员履行的具体核查程序、核查过程、核查比例和核查结论”。
上述执行的审计程序和核查程序的结果汇总如下:
序号 | 审计程序和核查程序 | 程序目的 | 结果及覆盖比例 |
1 | 与数据服务采购支出相关的内部控制测试 | 确认与数据服务采购支出相关的关键内部控制存在且执行有效 | 报告期内与采购支出相关的关键内部控制存在且得到有效执行。 |
2 | 数据服务采购的平均单价分析 | 通过检查数据服务采购单价的合理性,确认数据服务采购支出的真实性与完整性 | 报告期内的不同业务领域内全部原料数据采集与标注的平均采购单价整体合理。 |
3 | 数据服务采购的采集损耗率和标注产出比分析 | 通过检查数据服务采购量与销售量是否配比,确认数据服务采购支出的真实性与完整性 | 报告期内进行采集损耗率分析的抽取项目的收入合计占报告期训练数据业务总体收入(不含训练数据产品重复销售)比例为76.43%,进行标产比分析的抽取项目的收入覆盖比例为81.43%。抽取项目的采集损耗率和标注产出比整体合理,采集量、标注量与销售量相匹配,数据服务采购交易相关的采购数量真实、准确。 |
4 | 核查主要数据服务供应商的采购支出的主要支持性依据 | 检查与确认数据服务采购支出的真实性与准确性 | 报告期内核查采购支出的主要支持性依据的金额合计占发行人报告期数据服务采购支出金额合计比例为 |
8-2-1-133
81.93%,核查结果显示抽查的交易金额与各项支持性依据的金额核对一致。 | |||||
5 | 采购支出在资产负债表日前后的截止性测试 | 检查与确认数据服务采购支出的完整性 | 未发现在资产负债表日前后数据服务费采购支出存在重大截止性差异。 | ||
6 | 信息系统相关测试 | 确认与数据服务采购支出相关的信息系统运行有效,并通过数据分析程序确认系统记录数据的真实性和准确性 | 信息系统的一般性控制测试和应用控制测试的结果显示发行人信息系统总体有效。数据指标分析的抽查项目收入覆盖比例为67%,系统记录数据真实、准确。 | ||
7 | 主要数据服务供应商的函证程序 | 确认服务公司采购支出的真实性、完整性和期末余额的准确性 | 报告期各期间回函确认相符的数据服务费采购金额占比均在85%以上,核查结果显示,与服务公司的采购交易真实、完整、准确。 | ||
8 | 主要数据服务供应商的访谈走访程序 | 核实与服务公司采购交易的真实性,识别是否存在未披露的关联交易 | 报告期各期间走访的供应商的数据服务费采购金额占比均在85%以上,核查结果显示,与服务公司的采购交易真实、完整。 | ||
9 | 对服务公司、小外包人员和终端人员执行的进一步的穿透核查程序 | 核查主要服务公司2017年、2018年和2019年的银行流水 | 核实与服务公司、小外包人员和终端人员的采购交易的真实性,识别是否存在未披露的关联交易,识别是否存在发行人关联主体体外承担成本的情形 | 识别是否存在未披露的关联交易,是否存在关联主体体外承担成本的情形 | 核查银行流水的服务公司的数据服务费采购金额占发行人2017年至2019年数据服务采购合计金额的比例为71.82%。核查结果显示,发行人不存在未披露的关联交易,不存在发行人关联主体体外承担成本费用的情形。 |
核查2017年、2018年和2019年主要服务公司对小外包和终端人员的款项支付情况 | 核实与小外包和终端人员的采购交易的真实性 | 核查至服务公司银行流水的支付小外包和终端人员的金额占发行人2017年至2019年数据服务采购合计金额(不含数据服务管理费)的比例为63.62%,核查结果显示,与小外包和终端人员的采购交易真实、准确。 | |||
抽样对2017年、2018年和2019年的小外包人员进行电话访谈和深度访谈 | 核实与小外包采购交易的真实性 | 访谈核查的小外包人员在2017至2019的人数覆盖比例为88%,覆盖通过小外包途径采购的数据服务金额比例为89%,访谈核查覆盖2020年1-9月重点小外包人数比例达82.14%。核查结果显示,与小外包的采购交易真实、准确。 | |||
抽样对2019年完成项目的终端劳务人员进行电话访谈 | 核实与终端人员的采购交易的真实性 | 访谈核查的终端人员在2019年的人数覆盖比例62%,核查结果显示,与终端人员的采购交易真实发生。 | |||
抽样对2019年终端人员提供劳务的签字文件进行核查 | 核实与终端人员的采购交易的真实性 | 核查签字文件的相关项目在2019年、2020年1-9月覆盖训练数据业务收入(不含训练数据产品重复销售)金额比例分别为74%和98%,核查结果显示, |
8-2-1-134
(3)对IT审计报告中存在的异常项目履行的进一步审计程序对于业务数据与财务数据相结合进行的数据分析程序,信息系统专家选取主要项目计算各项指标数据,包括项目的设计/导入/交付等环节文件数量一致性、废弃率、单位长度语音标注字节数量、项目标注效率、采集单价、单位语音时长采购成本、项目毛利率等,并进一步分析各项目的指标数据的波动或整体分布情况,其中识别出部分项目的指标数据与该类项目指标数据的一般情况相比存在偏离的情况,并执行进一步分析和核查程序,了解和确认这些被识别的项目指标存在偏离的主要原因是由于项目的特殊要求或出现的特殊情况导致的(具体分析如下),其指标偏离情况反映了项目的实际情况,因此数据分析程序的整体结论是所抽查项目的数据分析未发现异常。
对于上述数据分析中识别的项目指标出现偏离的情况,其原因主要是由于以下因素导致:1)客户对项目的质量要求较高,如语音采集的高准确率要求、图片标注的高贴合度要求等,造成项目的废弃率、成本占比等指标偏高,标注效率指标偏低;2)项目有一定的特殊专业性要求,例如歌曲、小语种、重口音、地域、医学特殊专业词等,造成项目的采集单价、单位语音时长采购成本等指标偏高,标注效率指标偏低;3)项目有特殊环境要求,如录音棚环境、车载/噪音环境等,造成项目的采集单价、单位语音时长采购成本等指标偏高;4)项目时间紧急,如交付时间比较紧张等,造成项目的采集单价、单位语音时长采购成本等指标偏高;5)项目有特殊场景要求,如唤醒词/指令、自由对话等,造成项目的采购单价、单位语音时长的平均字数、标注效率等指标偏低或偏高;6)项目在执行过程中出现了特殊情况,如设备问题、文件存储格式问题、客户提供的数据文件与项目设计不一致等情况,造成项目的设计、导入、交付等环节文件数量不一致。针对上述识别出的指标偏离项目,申报会计师执行了进一步的审计和核查程序:
1、根据项目编号,检查项目的收入和成本支出的相关依据,包括项目合同、客户验收文件、采购支付明细、与供应商的采购验收结算单等,确认交易的真实性。
2、根据系统记录的客户名称,检查客户背景信息,了解是否存在异常客户。项目的客户大部分是发行人十大客户品牌相关客户的项目,这些客户在人工智能领域属于开拓性创新企业,对定制服务项目的专业性、环境、场景等存在更多的特殊要求,易导致相关项目的指标出现不同的偏离情况。
8-2-1-135
3、访谈项目负责人,了解项目负责人对相关项目的理解、项目的管理情况、执行过程的特殊情况及处理等。查阅其与客户联系人、项目执行人员/机构的沟通邮件或记录,以核实项目的要求及执行情况,了解项目指标出现偏离的原因,判断原因的合理性。
4、对于训练数据产品,查阅数据文件,如语音、图片、文本等,并与项目的具体要求进行比对。例如,抽取其中的录音,听取录音是否符合项目的小语种或重口音方言的要求、听取录音的内容是否与对应的文本信息一致、是否与项目的特殊场景一致;抽取其中的图片,观察其图片及标注是否与项目要求一致等。
通过执行上述的进一步审计和核查程序,对于上述数据分析程序中识别的指标偏离项目,申报会计师未发现舞弊情形,且不存在会计确认和处理方面的重大错报。
(4)对服务公司、小外包人员和终端人员履行的具体核查程序、核查过程、核查比例和核查结论
发行人与服务公司、小外包人员和终端人员之间的采购路径如下:
报告期内,发行人向自然人和服务公司(包括服务公司采取小外包和直接对接两种形式)的采购金额情况如下:
单位:万元
采购方式 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
采购金额 | 占比 | 采购金额 | 占比 | 采购金额 | 占比 | 采购金额 | 占比 | |
通过服务公司采购 | 5,375.77 | 95.21% | 5,912.58 | 96.93% | 7,231.42 | 98.35% | 3,816.55 | 94.07% |
其中:通过小外包采购 | 3,747.80 | 66.38% | 4,281.03 | 70.18% | 4,567.55 | 62.12% | 1,949.36 | 48.05% |
直接对接采购 | 1,627.97 | 28.83% | 1,631.55 | 26.75% | 2,663.87 | 36.23% | 1,867.19 | 46.02% |
直接向自然人采购 | 270.55 | 4.79% | 187.37 | 3.07% | 121.24 | 1.65% | 240.76 | 5.93% |
数据服务费采购额 | 5,646.32 | 100.00% | 6,099.95 | 100.00% | 7,352.66 | 100.00% | 4,057.31 | 100.00% |
注:以下核查手段覆盖比例均以本数据表中采购金额作为计算基础
8-2-1-136
(一)核查程序
对服务公司、小外包人员和终端人员履行的核查程序的目的、结果及覆盖比例,请参见前述“(2)对数据服务采购发生、准确性和截止性认定履行的具体审计程序”中(七)
(八)(九)的内容。
(二)核查过程和核查比例
1、对主要服务公司的函证程序
申报会计师对发行人报告期内的主要服务公司执行了函证程序。函证主要通过邮寄方式发放,对于少部分的海外服务公司或受疫情影响无法纸质寄达的国内服务公司采用电子邮件函证,采用电子函证的服务公司采购支出占采购支出总额的比例为1.59%,占比较低。询证函中所列示的信息通常包括:截至资产负债表日针对该服务公司的应付账款(或预付款项)、当年/当期向该服务公司实现的采购额,以核实公司与服务公司之间的交易金额、期末往来余额信息。对未回函服务公司执行了相应的替代程序。
对于通过邮寄方式发放的函证,核对被询证者的名称、地址的真实性,以确保询证函中的名称、地址等内容的准确性。
对于通过电子邮件发放的函证,控制措施包括但不限于(1)将收件人邮箱的后缀与被询证者官网显示的企业邮箱后缀进行比对;(2)获取海天瑞声与服务公司在日常沟通时的邮件,确认该邮箱地址的使用者确实是被询证者与发行人日常业务的联系人,其对双方的交易情况知情及了解;(3)将盖章纸质函证扫描成PDF文件作为电子邮件附件。
对于通过邮寄方式收到的回函(1)核对被询证者确认的询证函是否是原件,是否与注册会计师发出的询证函是同一份;(2)核对回函是否由被询证者直接寄给注册会计师;(3)核对寄给注册会计师的回邮信封或快递信封中记录的发件方名称、地址是否与询证函中记载的被询证者名称、地址一致;(4)核对回邮信封上寄出方的邮戳显示发出城市或地区是否与被询证者的地址一致;(5)核对被询证者加盖在询证函上的印章以及签名中显示的被询证者名称是否与询证函中记载的被询证者名称一致。
对于通过电子邮件收到的回函,(1)核对收到函证的发件人是否与发函时的收件人一致;(2)核对服务公司回复函证附件是否与发函文件一致。
对于回函金额核对至发函金额,如果存在差异,通过询问管理层了解差异原因,并抽查支持性依据确认财务记录的准确性。
8-2-1-137
执行函证程序的数据服务费采购金额及覆盖比例如下:
单位:万元
年度 | 服务公司发函情况 | 服务公司回函情况 | |||
采购金额 | 发函金额 | 发函比例 | 回函且回函相符金额 | 回函且回函相符比例 | |
A | B | B/A | C | C/A | |
2020 年1-9月 | 5,646.32 | 5,156.82 | 91% | 5,156.82 | 91% |
2019 年 | 6,099.95 | 5,874.03 | 96% | 5,840.31 | 96% |
2018 年 | 7,352.66 | 7,143.03 | 97% | 6,990.60 | 95% |
2017 年 | 4,057.31 | 3,571.23 | 88% | 3,489.15 | 86% |
2、对主要服务公司的访谈走访程序
申报会计师对发行人主要服务公司进行了实地走访、视频访谈或邮件访谈,了解服务公司与发行人之间的合作时间、合作方式、提供服务类型、各年交易规模、发行人采购占其同类销售占比、验收结算方式、与外部劳务人员是否签订协议、与发行人是否存在关联关系等情况,并取得对方签字确认的访谈纪要。通过上述访谈,未发现发行人与服务公司之间采购业务存在异常情形。报告期内,实地走访或视频访谈的服务公司对应的数据服务费采购金额及覆盖比例如下:
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
实地走访服务公司数量 | 7 | 6 | 6 | 6 |
视频访谈服务公司数量 | 0 | 4 | 4 | 4 |
邮件访谈服务公司数量 | 2 | 1 | 1 | 1 |
实地/视频/邮件访谈服务公司数据服务费采购额 | 5,244.51 | 5,529.27 | 6,820.37 | 3,474.15 |
数据服务费采购总额 | 5,646.32 | 6,099.95 | 7,352.66 | 4,057.31 |
覆盖比例 | 93% | 91% | 93% | 86% |
3、核查主要服务公司2017年、2018年和2019年的银行流水
获取2017年、2018年、2019年为发行人提供数据服务的主要服务公司(各年数据服务采购金额占比5%以上)提供的主要银行账户流水,同时取得发行人实控人个人银行账户、其他关联方(包括实控人控制的法人主体(中瑞安和创世联合)银行账户、
8-2-1-138
发行人董监高个人银行账户)以及发行人关键岗位人员,包括主要采购人员、主要销售人员及主要财务人员银行账户在2017年、2018年、2019年的银行账户流水,并执行以下核查程序:
(1)在服务公司的银行流水交易明细中检查是否出现发行人实控人、其他关联方以及关键岗位人员的银行账号,检查交易对手方是否出现发行人三年内的前十大销售客户名称。
(2)在发行人实控人、其他关联方以及关键岗位人员上述三年银行账户流水中,对于单笔支出超过10万元的交易对手方,检查该交易对手方是否出现在服务公司的银行流水中,即判断是否存在上述主体将款项支付给中间方后由其转入给发行人供应商的情形。
(3)在发行人实控人、其他关联方以及关键岗位人员银行流水支出项中检查是否出现供应商支出项交易对手方的银行账号信息,以判断上述主体与终端劳务提供者领款人之间是否存在资金往来的情形。
已执行上述核查程序的服务公司的银行账户情况及核查比例如下:
单位:万元
年份 | 已核查服务公司数量(个) | 已核查服务公司银行账户数量(个) | 已核查银行账户的服务公司当年采购额 | 数据服务费采购支出总额 | 已核查银行账户的服务公司的采购额占比 |
2019年 | 5 | 20 | 4,721.30 | 6,099.95 | 77.40% |
2018年 | 5 | 10 | 5,357.06 | 7,352.66 | 72.86% |
2017年 | 5 | 8 | 2,497.28 | 4,057.31 | 61.55% |
总计 | 12,575.64 | 17,509.92 | 71.82% |
4、核查2017年、2018年和2019年主要服务公司对小外包和终端人员的款项支付情况
获取2017年、2018年、2019年发行人的数据服务费支出明细,以及发行人按照项目逐笔归集的服务费支出的支持性依据,包括供应商验收结算单、付款明细表、报销明细表。同时获取2017年、2018年、2019年主要服务公司(各年数据服务采购金额占比5%以上)提供的主要银行账户流水及相关支付信息,并执行以下核查程序:
(1)逐笔检查发行人数据服务费支出的报销依据,包括报销明细表和验收结算单,确认其支出性质均是与具体项目相关,其发生具有业务真实性。
8-2-1-139
(2)由于服务公司在将款项支付给小外包和终端人后,会向发行人提交付款明细表或银行付款回执截图,确认已将服务费款项支付给小外包和终端人员。因此进一步逐笔检查发行人数据服务费支出已经发放给小外包和终端人员的支付依据,包括付款明细表或银行付款回执截图,确认其支出已经发放至小外包或终端人员。
(3)根据上述数据服务费的支付信息,进一步检查是否与服务公司的银行账户流水信息,核对支付给小外包或终端人员的金额是否相符。
已执行上述核查程序的数据服务费支出的情况及核查比例如下:
单位:万元
年度 | 已核查至银行流水的数据服务费支出金额 | 数据服务费采购支出总额 | 数据服务费采购支出总额(不含支付给服务公司的管理费) | 已核查至银行流水的金额占数据服务采购支出金额的比例(不含管理费) |
2019年 | 4,092.24 | 6,099.95 | 5,891.65 | 69.46% |
2018年 | 4,619.22 | 7,352.66 | 7,075.89 | 65.28% |
2017年 | 2,036.31 | 4,057.31 | 3,926.82 | 51.86% |
总计 | 10,747.77 | 17,509.92 | 16,894.36 | 63.62% |
5、抽样对2017年、2018年和2019年的小外包人员进行电话访谈和深度访谈
根据发行人业务部门留存的2017年、2018年和2019年小外包人员的名称及联系方式,对全体小外包人员随机抽样进行电话访谈核查,就其组织终端人员提供服务的情况,领款金额等信息进行确认;同时对于重点小外包人员(各年覆盖数据服务费支出金额在100万元以上、或当年组织终端劳务人员数量达500人以上的重点小外包人群),采取深度访谈方式,深入了解其组织终端人员为发行人提供服务的具体业务模式及其必要性,了解小外包通过供应商为发行人提供服务的定价情况、结算方式,并向其核实各年其为海天瑞声寻找的终端采集/标注人员的数量、结算金额。
2017年、2018年和2019年发行人三年小外包数量分别为269人、293人及706人,通过①电话等直接联系方式及②深度访谈方式开展访谈的覆盖情况如下:
(1)人数覆盖情况
项目 | 小外包人员总数 | 核查小外包人员数量 | 核查人数覆盖率 | ||||
领取劳务费金额 | 2019年 | 2018年 | 2017年 | 2019年 | 2018年 | 2017年 | 三年合计 |
100万元以上 | 6 | 8 | 1 | 6 | 8 | 1 | 100% |
8-2-1-140
50-100万元之间 | 12 | 18 | 3 | 12 | 16 | 3 | 94% |
10-50万元之间 | 75 | 66 | 44 | 69 | 62 | 42 | 94% |
10万元以下 | 613 | 201 | 221 | 578 | 148 | 167 | 86% |
合计 | 706 | 293 | 269 | 665 | 234 | 213 | 88% |
(2)金额覆盖情况
金额单位:万元
年度 | 数据服务费采购总额 | 其中:通过小外包途径采购的数据服务费金额 | 核查金额覆盖 | 核查金额覆盖率 |
2019年 | 6,099.95 | 4,281.03 | 3,966.96 | 92.66% |
2018年 | 7,352.66 | 4,567.55 | 4,004.37 | 87.67% |
2017年 | 4,057.31 | 1,949.36 | 1,667.92 | 85.56% |
合计 | 17,509.92 | 10,797.94 | 9,639.26 | 89.27% |
访谈核查覆盖2020年1-9月重点小外包人数比例达82.14%,覆盖当期领取劳务费金额前20名小外包的人数比例达90.00%。
6、抽样对2019年完成项目的终端劳务人员进行电话访谈
由于发行人采购的劳务服务大多数属于一次性交易,除少量直接对接终端人员外,发行人主要通过服务公司?小外包?终端人的形式对终端人进行分层管理,2017、2018年留存的终端人有效联系方式数量较少。因此,针对2019年确认了收入(不含训练数据产品重复销售)的项目,对其数据服务采购涉及的终端人员按照领取劳务费用金额区间进行了分层随机抽样,对于抽样样本执行了电话访谈程序。
前述核查范围的终端劳务人员合计约为5.14万人,包括发行人直接对接的终端人员以及通过服公司?小外包?终端人和服务公司?终端人三种类型。通过对全量总体样本分层抽样合计对3.18万名终端人员进行了电话访谈。
具体为:对于领取劳务费用金额在9万元以上的终端人,按80%的覆盖率执行随机抽样核查;对于领取劳务费用金额在1-9万元区间的终端人,按70%的覆盖率执行随机抽样核查;对于领取劳务费用金额低于1万元的终端人,按60%的覆盖率执行随机抽样核查。
领取劳务费用金额区间 | 抽样比例 | 终端劳务人员总体数量(万人) | 抽样核查的终端劳务人员数量(万人) | 抽样核查比例 |
① | ② | ②/① |
8-2-1-141
9万元以上 | 80% | 0.004 | 0.003 | 80% |
1-9万元 | 70% | 0.06 | 0.04 | 70% |
1万元以下 | 60% | 5.07 | 3.13 | 60% |
合计 | 62% | 5.14 | 3.18 | 62% |
中介机构通过聘请外部第三方机构等方式对抽样选择的3.18万终端人员进行电话访谈,并进行录音,电话访谈的内容主要包括:是否确认为发行人提供过劳务及工作内容,是否领取报酬及具体金额。申报会计师对通话过程进行了观察和抽样监听。
已执行上述核查程序的2019年终端人员的核查情况如下:电话接通的终端劳务人员数量约为1.28万人,根据接听者的性别、方言、环境等因素可以判断为不同终端自然人;前述接通人群合计覆盖核查人群的人数比率约为40%。未接通原因主要为:电话访谈过程中往往存在呼出号码被认定为陌生电话或被误认为骚扰电话而遭到拒接、号码占线或信号较差等原因导致无法接听的情形;也存在少量手机号码显示停机等,主要原因为发行人数据服务采购终端人员流动性较大,存在其提供劳务服务后更换联系方式的情形,导致此前预留的号码出现异常状态。具体核查比例如下:
领取劳务费用金额区间 | 抽样核查的终端劳务人员数量(万人) | 接通范围的终端劳务人员数量(万人) | 接通比率 人数 |
① | ② | ②/① | |
9万元以上 | 0.003 | 0.002 | 66% |
1-9万元 | 0.04 | 0.02 | 55% |
1万元以下 | 3.13 | 1.25 | 40% |
合计 | 3.18 | 1.28 | 40% |
7、抽样对2019年终端人员提供劳务的签字文件进行核查
对于提供数据服务的终端劳务人员,发行人2019年起要求其对于提供的劳务工作量等信息进行签字确认,以完善数据服务采购管理并充分留痕。对于发行人一体化数据处理平台上线终端人管理系统前,终端劳务人员签字确认主要为线下纸质形式;上线终端人管理系统后,采用线上电子签名的形式进行确认。因此会计师核查了2019年和2020年1-9月终端人员的线下签字单据和线上签字单据,检查上述签字文件是否包含了项目编号、劳务内容、劳务提供时间,是否有终端劳务人员的签字或电子签名,以确认是否与发行人的业务相关,是否经终端劳务人员签字确认。
已执行上述核查程序的2019年和2020年1-9月终端人员的核查比例如下:
8-2-1-142
核查了2019年、2020年1-9月终端人员确认所提供劳务工作量的签字文件80,761份、73,201份,并根据项目编号查找与核查的终端人员签字文件相关的项目收入金额。已核查的终端人员签字文件相关的项目收入占发行人总体收入(不含训练数据产品重复销售)的比例为74%和98%。
(三)核查结论
经核查,申报会计师认为:发行人与服务公司、小外包和终端人员之间的采购交易真实存在,发行人对数据服务费采购的核算真实、准确、完整。发行人不存在未披露的关联交易,不存在发行人关联主体为发行人体外承担成本费用的情形。
10.2关于采购情况
2017年、2018年、2019年,发行人采购总额分别为5,651.62万元、9,662.35万元及8,890.41万元。
请发行人结合说明事项修改招股说明书的相关披露内容。
请发行人说明:(1)发行人各类采购额计入的会计科目及核算情况、核算依据,与财务报表的勾稽关系;(2)项目租赁费用支出的具体内容、原因以及与具体项目之间的匹配关系;(3)其他的具体采购内容及金额,相关采购支出的原因;(4)办公房租与租赁房产之间的对应关系,相关租赁房产的具体用途,出租方与服务公司及其关联方和主要小分包人员之间是否存在关联关系、关联交易、资金往来或其他利益安排。
请申报会计师对上述事项进行核查并发表明确意见。发行人说明事项
(1)发行人各类采购额计入的会计科目及核算情况、核算依据,与财务报表的勾稽关系
一、发行人各类采购额计入的会计科目及核算情况、核算依据
8-2-1-143
单位:万元
类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | 计入的会计科目 | 核算内容 | 核算依据 |
数据服务费 | 5,646.32 | 6,099.95 | 7,352.66 | 4,057.31 | 存货 营业成本 研发费用 | 主要核算采购的数据服务费,其中(1)存货中核算的是当期未完工的训练数据定制服务项目累计发生的数据服务费;(2)营业成本中核算的是当期完工的训练数据定制服务项目当期结转的数据服务费;(3)研发费用中核算的是当期发生的训练数据产品开发项目的数据服务费。 | 项目报销申请单、验收结算单 |
办公房租 | 591.23 | 694.66 | 545.17 | 415.48 | 存货 其他流动资产 营业成本 管理费用 研发费用 | 主要核算支付的租用办公室房租的费用,其中(1)其他流动资产中核算的是预付的房租费用,再按照使用情况计入存货、营业成本、管理费用和研发费用;(2)存货中核算的是当期未完工的训练数据定制服务项目累计发生的房租费用;(3)营业成本中核算的是当期完工的训练数据定制服务项目当期结转的房租费用;(4)管理费用中核算的是管理部门和人员使用的租赁房屋的当期房租费用;(5)研发费用中核算的是研发部门和人员使用的租赁房屋当期的房租费用以及当期发生的训练数据产品开发项目的房租费用。 | 租房合同、房租支付申请单、项目报销申请单 |
资产采购 | 149.94 | 287.12 | 552.90 | 203.72 | 预付款项 固定资产 无形资产 | 主要核算采购的电脑、录音设备、软件等固定资产和无形资产支出,其中预付款项核算的是已支付的与资产采购相关的预付款项;固定资产和无形资产核算的是采购新增的资产,在获得正式发票后直接计入固定资产或无形资产,或从预付款项转入该类科目。 | 资产采购合同及订单、发票、支付申请单 |
项目租赁费 | 118.77 | 274.06 | 345.08 | 159.36 | 存货 营业成本 研发费用 | 主要核算为训练数据定制服务项目和训练数据产品开发项目专门租赁的采集或标注场地和设备等发生的费用支出。其中(1)存货中核算的是当期未完工的训练数据定制服务项目累计发生的项目租赁费;(2)营业成本中核算的是当期完工的训练数据定制服务项目当期结转的项 | 项目报销申请单、租赁合同、发票 |
8-2-1-144
目租赁费;(3)研发费用中核算的是当期发生的训练数据产品开发项目的项目租赁费。 | |||||||
岗位服务费 | 234.26 | 284.89 | 256.62 | 226.95 | 销售费用 管理费用 研发费用 | 主要核算根据语种扩展的需求聘请外部语言学家所发生的劳务费,及根据日常经营需要采购的临时岗位外包服务费,如保洁、临时招聘服务、少量实习生招聘等。其中(1)外部语言研究学家的费用均在研发费用中核算,(2)岗位外包服务的费用根据服务部门在销售费用、管理费用和研发费用中核算。 | 合同、发票、支付申请单 |
采购总额 | 6,740.53 | 7,640.69 | 9,052.42 | 5,062.82 |
8-2-1-145
二、发行人各类采购额与财务报表的勾稽关系
1、数据服务费与财务报表之间的勾稽关系
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
存货-数据服务费余额的增加/(减少)(扣除存货跌价准备的转销) | 563.50 | -990.51 | 996.11 | 242.36 |
营业成本-数据服务费 | 3,697.63 | 5,245.49 | 5,399.51 | 2,618.57 |
研发费用-数据服务费 | 1,385.19 | 1,844.97 | 957.04 | 1,196.38 |
合计 | 5,646.32 | 6,099.95 | 7,352.66 | 4,057.31 |
采购的数据服务费 | 5,646.32 | 6,099.95 | 7,352.66 | 4,057.31 |
差异 | - | - | - | - |
2、办公房租与财务报表之间的勾稽关系
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
存货-其他-房租费余额的增加/(减少)(扣除存货跌价准备的转销) | 8.48 | -30.76 | -7.00 | 17.90 |
其他流动资产-待摊房屋租赁费的增加/(减少) | 41.97 | 31.25 | 7.76 | -44.01 |
营业成本-其他-房租费 | 19.58 | 71.04 | 42.58 | 18.54 |
管理费用-租赁费 | 462.57 | 548.80 | 426.50 | 417.70 |
研发费用-房租费 | 58.63 | 74.34 | 75.33 | 5.35 |
合计 | 591.23 | 694.66 | 545.17 | 415.48 |
采购的办公房租 | 591.23 | 694.66 | 545.17 | 415.48 |
差异 | - | - | - | - |
3、资产采购与财务报表之间的勾稽关系
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
预付款项-其他-资产采购的增加 | -4.51 | 50.47 | - | - |
8-2-1-146
固定资产-本期/年购置(不含购置的房屋建筑物) | 122.67 | 166.92 | 408.00 | 200.80 |
无形资产-本期/年增加金额 | 31.78 | 69.73 | 144.90 | 2.92 |
合计 | 149.94 | 287.12 | 552.90 | 203.72 |
资产采购 | 149.94 | 287.12 | 552.90 | 203.72 |
差异 | - | - | - | - |
4、项目租赁费与财务报表之间的勾稽关系
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
存货-其他-项目租赁费余额的增加/(减少)(扣除存货跌价准备的转销) | 10.20 | -105.75 | 83.73 | 105.72 |
营业成本-其他-项目租赁费 | 108.08 | 373.49 | 251.17 | 35.96 |
研发费用-其他-项目租赁费 | 0.50 | 6.32 | 10.18 | 17.68 |
合计 | 118.77 | 274.06 | 345.08 | 159.36 |
采购的项目租赁费 | 118.77 | 274.06 | 345.08 | 159.36 |
差异 | - | - | - | - |
5、岗位服务费与财务报表之间的勾稽关系
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
销售费用-职工薪酬-劳务费 | 43.26 | 45.25 | 32.20 | 3.82 |
管理费用-职工薪酬-劳务费 | 84.33 | 98.67 | 81.00 | 60.18 |
研发费用-语言研究-劳务费 | 106.67 | 140.97 | 143.42 | 162.95 |
合计 | 234.26 | 284.89 | 256.62 | 226.95 |
8-2-1-147
采购的岗位服务费 | 234.26 | 284.89 | 256.62 | 226.95 |
差异 | - | - | - | - |
(2)项目租赁费用支出的具体内容、原因以及与具体项目之间的匹配关系项目租赁费支出核算训练数据定制服务和训练数据产品开发过程中临时需要的由发行人直接租赁场地和设备所发生的费用。报告期内项目租赁费用支出的具体内容、原因及与具体项目间的匹配关系见下表:
2020年1-9月:
单位:万元
序号 | 项目名称 | 项目租赁费 | 项目租赁支出的具体内容 | 租赁原因 |
1 | 中文女生多人语音合成与歌曲录音 | 29.91 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
2 | 中文女生语音合成 | 29.45 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
3 | 中文输入法数据采集 | 15.69 | 租赁场地 | 工期紧张,自有场地调配不开,租赁采集场地 |
4 | 语音合成歌曲录音及标注 | 10.63 | 租赁录音棚 | 工期紧张,自有录音棚调配不开,租赁录音棚 |
5 | 中文全消音录音室语音识别采集 | 9.31 | 租赁录音棚 | 项目要求特殊,租赁专业录音棚 |
6 | 中文短音频语音识别转写 | 7.94 | 租赁场地 | 项目规模大、工期长,客户对数据保密性有较高要求,租赁专用场地执行项目 |
7 | 中文女生语音合成与歌曲录音 | 4.16 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
8 | 中文女声多环节语音合成 | 3.14 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
9 | 中文女声语音合成 | 2.11 | 租赁录音棚 | 项目要求特殊,租赁专业录音棚 |
10 | 音阶录音校对语音合成 | 1.22 | 租赁录音棚 | 配合发音人特殊要求、提升录制效率,租赁录音棚 |
11 | 其他项目 | 5.21 | 租赁场地、设备 | 项目要求特殊,工期紧张,采集量大,租赁场地及专业设备 |
项目租赁费合计 | 118.77 |
2019年:
8-2-1-148
单位:万元
序号 | 项目名称 | 项目租赁费 | 项目租赁支出的具体内容 | 租赁原因 |
1 | 法语女声语音合成 | 57.66 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
2 | 法语男声语音合成 | 57.66 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
3 | 德语女声语音合成 | 48.21 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
4 | 德语男声语音合成 | 47.78 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
5 | 中文女生语音合成 | 11.30 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
6 | 中文女生语音合成 | 8.52 | 租赁录音棚 | 项目要求特殊,租赁专业录音棚 |
7 | 中文女童语音合成 | 6.48 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
8 | 中文全消音室语音识别采集 | 5.78 | 租赁录音棚 | 项目要求特殊,租赁专业录音棚 |
9 | 人脸车载视频数据采集标注 | 5.75 | 租赁汽车和设备 | 车载视频采集项目,租赁汽车、专业设备 |
10 | 多设备多场景语音识别采集 | 5.30 | 租赁汽车和录音场地 | 多场景采集,租赁汽车及场地 |
11 | 其他项目 | 19.60 | 租赁汽车、录音场地、设备 | 车载采集项目,租赁汽车;项目要求特殊,租赁专业录音棚、专业设备 |
项目租赁费合计 | 274.06 |
2018年:
单位:万元
序号 | 项目名称 | 项目租赁费 | 项目租赁支出的具体内容 | 租赁原因 |
1 | 德语女声语音合成 | 49.11 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
2 | 德语男声语音合成 | 49.11 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
3 | 中文女生语音合成 | 41.58 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
4 | 英国英语男声语音合成 | 34.44 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
5 | 法语女声语音合成 | 32.36 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
6 | 法语男声语音合成 | 29.96 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
7 | 中文手写体采集 | 29.71 | 租赁场地 | 项目要求采集城市,租赁当地专业场地 |
8 | 英国英语女声语音合成 | 23.53 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
8-2-1-149
9 | 中文男声语音合成 | 6.94 | 租赁录音棚 | 工期紧张,自有录音棚调配不开,租赁录音棚 |
10 | 中英文男女声语音合成 | 6.69 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
11 | 其他项目 | 41.63 | 租赁汽车、录音场地、设备 | 车载采集项目,租赁汽车;项目要求特殊,租赁专业录音棚、专业设备 |
项目租赁费合计 | 345.08 |
2017年:
单位:万元
序号 | 项目名称 | 项目租赁费 | 项目租赁支出的具体内容 | 租赁原因 |
1 | 中文唤醒词及家居环境语音识别采集 | 35.91 | 租赁场地 | 项目要求特殊场景录音,租赁场地 |
2 | 上海方言车载语音识别采集 | 17.29 | 租赁汽车 | 车载语音采集项目,租赁汽车 |
3 | 中文女生语音合成 | 14.99 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
4 | 英国英语女声语音合成 | 12.96 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
5 | 儿童唤醒词录音棚语音识别采集 | 8.37 | 租赁录音棚 | 工期紧张,自有录音棚调配不开,租赁录音棚 |
6 | 中文普通话语音识别采集 | 7.17 | 租赁录音棚 | 外地采集项目,租赁当地录音棚 |
7 | 英国英语男声语音合成 | 6.89 | 租赁录音棚 | 国外采集项目,租赁当地录音棚 |
8 | 中文车载语音识别采集 | 6.08 | 租赁汽车 | 车载语音采集项目,租赁汽车 |
9 | 中英文女声语音合成 | 4.62 | 租赁录音棚 | 工期紧张,自有录音棚调配不开,租赁录音棚 |
10 | 中文男生语音合成 | 2.69 | 租赁录音棚 | 工期紧张,自有录音棚调配不开,租赁录音棚 |
11 | 其他项目 | 42.40 | 租赁汽车、录音场地、设备 | 车载采集项目,租赁汽车;项目要求特殊,租赁专业录音棚、专业设备 |
项目租赁费合计 | 159.36 |
8-2-1-150
(3)其他的具体采购内容及金额,相关采购支出的原因
单位:万元
类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | 采购内容 | 采购原因 |
中介服务费及专利申请费等 | 187.94 | 286.52 | 170.75 | 31.88 | 管理咨询服务、招聘服务及安保服务、信息系统咨询服务、专利申请服务等 | 管理咨询费主要用于企业采购绩效管理体系优化设计等咨询服务,招聘费用于企业聘请专业机构进行人才招聘,安保服务费用于保安服务,信息系统咨询费主要用于企业信息系统平台的升级优化等,专利申请服务费用于协助企业申请专利等 |
市场宣传费 | 58.74 | 44.76 | 52.82 | 29.71 | 采购的市场宣传服务、展位展览服务及宣传资料印刷等 | 用于企业品牌形象的宣传推广,扩大企业知名度 |
押金及保证金 | 188.06 | 25.26 | 59.36 | 135.08 | 房租押金、投标保证金等 | 房租押金用于房屋租赁,投标保证金用于项目投标 |
装修费 | 1.19 | 64.83 | 44.24 | 15.91 | 办公室装修改造费用等 | 办公室装修 |
办公费 | 20.72 | 38.17 | 52.38 | 32.82 | 日常办公用品采购 | 用于维持企业日常办公经营的必要支出 |
水电费 | 32.85 | 36.78 | 31.08 | 20.55 | 日常水电费 | 用于维持企业日常办公经营的必要支出 |
邮寄费 | 7.92 | 8.76 | 14.24 | 9.47 | 日常快递物流服务 | 用于维持企业日常办公经营的必要支出 |
网络服务费 | 23.08 | 25.48 | 35.20 | 36.98 | 采购服务器、宽带支持服务 | 用于维持企业日常办公经营的必要支出 |
其他 | 76.63 | 142.14 | 104.48 | 113.37 | 通讯费、劳保用品等 | 用于维持企业日常办公经营的必要支出 |
采购支出其他小计 | 597.14 | 672.70 | 564.56 | 425.77 |
8-2-1-151
由于上述采购不属于与发行人经营直接相关的采购支出,因此将其从报告期披露的采购明细中删除,并同步更新招股说明书“第六节 业务和技术/四、采购情况和主要供应商/(一)报告期内采购情况/1、报告期内的分类采购明细数据”的相关披露。
8-2-1-152
(4)办公房租与租赁房产之间的对应关系,相关租赁房产的具体用途,出租方与服务公司及其关联方和主要小分包人员之间是否存在关联关系、关联交易、资金往来或其他利益安排发行人办公房租与主要租赁房产间的对应关系,及租赁房产的具体用途列示如下:
2020年1-9月:
序号 | 承租方 | 出租方 | 租赁房屋坐落 | 租赁期限 | 租赁面积 (m?) | 2020年1-9月房租支出(万元) | 用途 |
1 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、08 | 2017/06/17-2020/05/16 | 847.50 | 102.15 | 办公 |
2 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层807、09、11 | 2017/06/28-2020/05/16 | 408.13 | 49.19 | 办公 |
3 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、07、08、09、11 | 2020/05/17-2022/05/16 | 1,255.63 | 236.78 | 办公 |
4 | 发行人 | 赵峻 | 北京市海淀区成府路28号3-801、3-803、3-807、3-809 | 2018/10/23-2021/05/15 | 500.31 | 118.92 | 办公 |
5 | 发行人 | 徐小勇、苗英 | 北京市海淀区成府路28号12层4-1215 | 2019/04/19-2021/04/18 | 196.98 | 28.76 | 办公 |
6 | 发行人 | 荣成市科学技术局 | 荣成经济开发区海湾南路86号科技企业孵化器内 | — | 约400 | -(注1) | 办公 |
7 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1801、1803 | 2019/12/25-2021/12/24 | 152.71 | 8.20 | 办公 |
8 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1805 | 2019/06/25-2021/06/24 | 78.54 | 4.10 | 办公 |
其他(注2) | 43.13 | ||||||
合计 | 591.23 |
8-2-1-153
注1:2017年荣成市科学技术局为支持发行人进驻荣成科技企业孵化器内创办软件开发企业,向发行人提供办公场地租赁服务,同时给与发行人租赁费优惠,租赁期自2017年7月1日起计算,前三年荣成市科学技术局给与发行人免缴租金的优惠,满三年后租赁价格另行商定。2020年7月免租到期,荣成市科学技术局在对发行人进行综合评估后,决定继续给予发行人免缴租金的优惠政策,期限为两年。注2:其他租赁房产为发行人由于临时性办公需求的而进行短期租赁的房产。2019年:
序号 | 承租方 | 出租方 | 租赁房屋坐落 | 租赁期限 | 租赁面积(m?) | 2019年房租支出 (万元) | 用途 |
1 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、08 | 2017/06/17-2020/05/16 | 847.50 | 289.72 | 办公 |
2 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层807、09、11 | 2017/06/28-2020/05/16 | 408.13 | 139.18 | 办公 |
3 | 发行人 | 赵峻 | 北京市海淀区成府路28号3-801、3-803、3-807、3-809 | 2018/10/23-2020/05/15 | 500.31 | 168.70 | 办公 |
4 | 发行人 | 徐小勇、苗英 | 北京市海淀区成府路28号12层4-1215 | 2019/04/19-2020/04/18 | 196.98 | 59.67 | 办公 |
5 | 发行人 | 荣成市科学技术局 | 荣成经济开发区海湾南路86号科技企业孵化器内 | — | 约400 | - | 办公 |
6 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1801、1803 | 2018/12/25-2019/12/24&2019/12/25-2020/12/24 | 152.71 | 8.40 | 办公 |
7 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1805 | 2018/06/25-2019/06/24&2019/06/25-2021/06/24 | 78.54 | 4.20 | 办公 |
其他(注) | 24.8 | ||||||
合计 | 694.66 |
注:其他租赁房产为发行人由于临时性办公需求的而进行短期租赁的房产。
2018年:
8-2-1-154
序号 | 承租方 | 出租方 | 租赁房屋坐落 | 租赁期限 | 租赁面积(m?) | 2018年房租支出 (万元) | 用途 |
1 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、08 | 2017/06/17-2020/05/16 | 847.50 | 276.93 | 办公 |
2 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层807、09、11 | 2017/06/28-2020/05/16 | 408.13 | 133.36 | 办公 |
3 | 发行人 | 赵峻 | 北京市海淀区成府路28号3-801、3-803、3-807、3-809 | 2018/10/23-2020/05/15 | 500.31 | 53.61 | 办公 |
4 | 发行人 | 荣成市科学技术局 | 荣成经济开发区海湾南路86号科技企业孵化器内 | — | 约400 | - | 办公 |
5 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1801、1803 | 2017/12//25-2018/12/24&2018/12/25-2019/12/24 | 152.71 | 3.63 | 办公 |
6 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1805 | 2017/06/25-2018/6/24&2018/06/25-2019/06/24 | 78.54 | 2.10 | 办公 |
7 | 中瑞智 | 陈治宇 | 北京市海淀区成府路28号4座1002号房间 | 2017/01/03-2019/01/02 | 163.52 | 40.49 | 办公 |
其他(注) | 35.04 | ||||||
合计 | 545.17 |
注:其他租赁房产为发行人由于临时性办公需求的而进行短期租赁的房产。
8-2-1-155
2017年:
序号 | 承租方 | 出租方 | 租赁房屋坐落 | 租赁期限 | 租赁面积(m?) | 2017年房租支出 (万元) | 用途 |
1 | 发行人 | 北京臣仕物业管理有限公司 | 北京市海淀区成府路28号4座8层801、02、03、06、08 | 2015/09/01-2017/06/16 | 847.50 | 70.61 | 办公 |
2 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层801、02、03、06、08 | 2017/06/17-2020/05/16 | 847.50 | 150.23 | 办公 |
3 | 发行人 | 李宏 | 北京市海淀区成府路28号4座8层807、09、11 | 2017/06/28-2020/05/16 | 408.13 | 68.32 | 办公 |
4 | 发行人 | 荣成市科学技术局 | 荣成经济开发区海湾南路86号科技企业孵化器内 | - | 约400 | -(注1) | 办公 |
5 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1801、1803 | 2016/12/25-2017/12/24&2017/12//25-2018/12/24 | 152.71 | 3.63 | 办公 |
6 | 发行人 | 三河市城美房地产开发有限公司 | 维多利亚D座1805 | 2016/06/25-2017/06/24&2017/06/25-2018/6/24 | 78.54 | 2.02 | 办公 |
7 | 发行人 | 北京邦泰摩尔资产管理有限公司 | 北京市海淀区成府路28号4座13层1315 | 2015/08/10-2017/06/16&2017/06/17-2017/08/03 | 196.98 | 23.71 | 办公 |
8 | 中瑞智 | 陈治宇 | 北京市海淀区成府路28号4座1002号房间 | 2017/01/03-2019/01/02 | 163.52 | 49.19 | 办公 |
其他(注) | 47.77 | ||||||
合计 | 415.48 |
注:其他租赁房产为发行人由于临时性办公需求的而进行短期租赁的房产。
8-2-1-156
经核查主要服务公司2017-2019年的银行流水,同时出租方与服务公司均已出具确认函,主要小外包人员已接受访谈并确认,出租方与服务公司及其关联方和主要小分包人员之间不存在关联关系、关联交易、资金往来或其他利益安排。会计师核查事项申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于采购支出可能导致的重大错报风险,执行的主要程序如下:
1、了解发行人与采购相关的关键内部控制制度,评价内部控制的设计是否得到执行,并测试相关内部控制的运行有效性;
2、获取发行人的采购支出明细,核对至账务记录和财务报表,检查是否一致;
3、获取项目租赁费的支出明细,了解项目租赁费的支出原因,检查相关销售合同和租赁合同,查看是否存在异常,
4、获取房屋租赁的支出明细,了解租赁房产的用途,检查是否存在异常;
5、获取服务公司、出租方出具的确认函,核查主要服务公司2017-2019年的银行流水,并对主要小外包人员进行访谈,就服务公司和出租方及其关联方和主要小分包人员是否存在关联关系、关联交易、资金往来和其他利益安排进行确认。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人的采购额、核算情况和核算依据符合发行人的实际情况,采购额计入的会计科目核算准确,采购额与财务报表相关科目的余额及变动勾稽相符;
2、发行人的项目租赁费用支出原因合理,与具体项目之间存在匹配关系,符合发行人的实际情况;
3、发行人的其他类别采购支出原因合理;
4、发行人的办公房租采购额与租赁房产之间存在对应关系,相关租赁房产的具体用途符合发行人的实际情况,租赁房产出租方与服务公司及其关联方和主要小分包人员不存在关联关系、关联交易、资金往来和其他利益安排。
8-2-1-157
四、关于公司治理与独立性
12.关于关联方
招股说明书披露,报告期内,发行人注销或转让的关联方较多。请发行人说明报告期内注销或转让的关联企业的主要财务指标,与发行人客户和供应商之间是否存在交易、资金往来或其他利益安排,是否存在代垫成本或费用的情形。请保荐机构、发行人律师及申报会计师对上述事项进行核查,并发表明确意见。答复:
发行人说明事项
(1)报告期内注销或转让的关联企业的主要财务指标
一、报告期初至今发行人注销或转让的关联企业
发行人报告期初至今注销或转让的关联企业的主要情况如下:
序号 | 关联方名称 | 关联关系 | 备注 | 注销/转让原因 |
1 | Speechocean Ltd. | 发行人实际控制人贺琳持股100%并任董事 | 2017年10月已注销 | 终止业务经营 |
2 | 北京中科海讯软件科技有限公司 | 发行人实际控制人贺琳及其配偶蔡惠智合计持有50%股权的北京中科海讯科技有限公司持股100% | 2018年11月已注销 | 无实际业务经营 |
3 | 北京中科海讯数字设备有限公司 | 2018年11月已注销 | 无实际业务经营 | |
4 | 北京中科海讯声学科技有限公司 | 发行人实际控制人贺琳的配偶蔡惠智持股24%,并任执行董事、经理 | 2019年1月已注销 | 无实际业务经营 |
5 | 南京智亚源电力科技有限公司 | 发行人董事志鹏的配偶钟山曾持股0.98%并任董事 | 2018年12月已转让全部股权并离任 | 投资退出 |
6 | 重庆中康文化传播有限公司 | 由发行人董事志鹏的配偶钟山间接控制 | 2017年7月已注销 | 无实际业务经营 |
7 | 西藏微霜夜影视文化有限公 | 2019年9月已注销 | 终止业务经营 |
8-2-1-158
序号 | 关联方名称 | 关联关系 | 备注 | 注销/转让原因 |
司 | ||||
8 | 天津卓腾文化传媒有限公司 | 2019年12月已注销 | 无实际业务经营 | |
9 | 霍尔果斯耐飞影视有限公司 | 2020年1月已注销 | 无实际业务经营 | |
10 | 西藏新七组影视文化有限公司 | 2020年10月已注销 | 终止业务经营 | |
11 | 西藏雄关峻卡影视有限公司 | 2020年10月已注销 | 终止业务经营 | |
12 | 北京影娱互动科技有限公司 | 已于2020年11月转让全部股权 | 投资退出 | |
13 | 北京智能广宣科技有限公司 | 发行人董事志鹏的配偶钟山全资子公司西藏金钟达信息科技有限责任公司持股35.59%,钟山曾任董事 | 已于2020年11月转让全部股权并离任 | 投资退出 |
14 | 恩脉(上海)医疗科技有限公司 | 发行人董事黄宇凯持股54.35%的上海万彧企业管理中心(有限合伙)曾持股41.40% | 已于2020年9月转让全部股权 | 投资退出 |
15 | 飞米光年(北京)科技有限公司 | 发行人监事方彦彬持股60%,并任执行董事、经理 | 2019年11月已注销 | 无实际业务经营 |
16 | 杭州行止数据科技有限公司 | 飞米光年(北京)科技有限公司持股100%,发行人监事方彦彬任执行董事、总经理 | 2020年7月已注销 | 终止业务经营 |
17 | 上海兴丹投资管理中心(有限合伙) | 发行人原持股5%以上的股东上海兴富为有限合伙人,持有50.07%的出资 | 2017年1月已注销 | 投资项目退出 |
二、报告期内注销或转让的关联企业的主要财务指标
1、Speechocean Ltd.
Speechocean Ltd.于2016年12月启动注销,2017年1月注销银行账户,并于2017年10月完成注销。截至2017年10月6日/2017年1月1日—2017年10月6日,其经审计总资产为5.16万美元,净资产为4.44万美元,营业收入为0,净利润为-0.08万美元。
8-2-1-159
2、北京中科海讯软件科技有限公司
北京中科海讯软件科技有限公司于2018年11月完成注销,其主要财务数据如下:
单位:万元
项目 | 2018年9月30日/ 2018年1-9月 | 2017年12月31日 /2017年度 |
总资产 | 1.15 | 1.16 |
净资产 | 1.15 | 1.16 |
营业收入 | 0 | 0 |
净利润 | -0.01 | -0.01 |
3、北京中科海讯数字设备有限公司
北京中科海讯数字设备有限公司于2018年11月完成注销,其主要财务数据如下:
单位:万元
项目 | 2018年9月30日/2018年1-9月 | 2017年12月31日/2017年度 |
总资产 | 1.27 | 1.28 |
净资产 | 1.27 | 1.28 |
营业收入 | 0 | 0 |
净利润 | -0.01 | -0.01 |
4、北京中科海讯声学科技有限公司
北京中科海讯声学科技有限公司于2019年1月完成注销。根据其财务报表,该公司2017年度、2018年度总资产、净资产、营业收入、净利润均为0。
5、重庆中康文化传播有限公司
重庆中康文化传播有限公司于2017年7月完成注销。根据其股东北京联合网视文化传播有限公司确认,该公司财务文件保留不完整,根据报税单记载2017年1月至2017年6月未实际开展业务,无营业收入。
6、南京智亚源电力科技有限公司
2018年12月,发行人董事志鹏配偶钟山将其持有的南京智亚源电力科技有限公司
0.98%的股权对外转出并不再担任董事职务,截至2018年12月31日/2018年度,其主要财务数据为:总资产60.71万元、净资产64.62万元、营业收入119.28万元、净利润15.66万元。
8-2-1-160
7、西藏微霜夜影视文化有限公司
西藏微霜夜影视文化有限公司于2019年9月完成注销,其主要财务数据如下:
单位:万元
项目 | 2019年9月30日/2019年1-9月 | 2018年12月31日 /2018年度 | 2017年12月31日/ 2017年度 |
总资产 | 5.22 | 5.22 | 2.63 |
净资产 | 0 | 5.22 | -5.12 |
营业收入 | 0 | 0 | 0 |
净利润 | -5.87 | -4.57 | -5.12 |
8、天津卓腾文化传媒有限公司
天津卓腾文化传媒有限公司于2019年10月设立,于2019年12月完成注销。根据天津卓腾文化传媒有限公司注销前法定代表人确认,该公司自设立至注销无实际经营,无财务报表。
9、霍尔果斯耐飞影视有限公司
霍尔果斯耐飞影视有限公司于2017年12月设立,于2020年1月完成注销。根据霍尔果斯耐飞影视有限公司注销前法定代表人确认,该公司自设立至注销无实际经营,无财务报表。
10、西藏新七组影视文化有限公司
西藏新七组影视文化有限公司于2017年6月设立,于2020年10月完成注销,其主要财务数据如下:
单位:万元
项目 | 2019年12月31日/ 2019年度 | 2018年12月31日/ 2018年度 | 2017年12月31日/ 2017年度 |
总资产 | 3.45 | 5.20 | 2.58 |
净资产 | 3.45 | 5.20 | -4.92 |
营业收入 | 0 | 0 | 0 |
净利润 | -0.35 | -4.54 | -4.92 |
11、西藏雄关峻卡影视有限公司
8-2-1-161
西藏雄关峻卡影视有限公司于2017年6月设立,于2020年10月完成注销,其主要财务数据如下:
单位:万元
项目 | 2019年12月31日/ 2019年度 | 2018年12月31日/ 2018年度 | 2017年12月31日/ 2017年度 |
总资产 | 3.27 | 5.08 | 2.94 |
净资产 | 3.31 | 5.08 | -5.44 |
营业收入 | 0 | 0 | 0 |
净利润 | -0.35 | -0.35 | -5.44 |
12、北京影娱互动科技有限公司
发行人董事志鹏配偶钟山持股100%的西藏金钟达信息科技有限责任公司已于2020年11月转出其持有的全部北京影娱互动科技有限公司股权。北京影娱互动科技有限公司自2019年8月成为西藏金钟达信息科技有限责任公司子公司后的主要财务数据如下:
单位:万元
项目 | 2020年9月30日/2020年1-9月 | 2019年12月31日/2019年度 |
总资产 | 3.40 | 14.03 |
净资产 | -46.79 | -18.51 |
营业收入 | 0 | 0 |
净利润 | -28.28 | -26.01 |
13、北京智能广宣科技有限公司
发行人董事志鹏配偶钟山持股100%的西藏金钟达信息科技有限责任公司已于2020年11月转出其持有的全部北京智能广宣科技有限公司股权、钟山离任董事。北京智能广宣科技有限公司2018年8月设立后的主要财务数据如下:
单位:万元
项目 | 2020年9月30日 /2020年1-9月 | 2019年12月31日 /2019年度 | 2018年12月31日 /2018年度 |
总资产 | 2,696.11 | 2,713.10 | 188.06 |
净资产 | 520.09 | -2,513.29 | -207.89 |
8-2-1-162
营业收入 | 178.52 | 253.36 | -- |
净利润 | -1,966.62 | -2,405.39 | -207.89 |
14、恩脉(上海)医疗科技有限公司
发行人董事黄宇凯为有限合伙人并持有54.35%出资的上海万彧企业管理中心(有限合伙)于2020年9月转让其持有的全部恩脉(上海)医疗科技有限公司股权。恩脉(上海)医疗科技有限公司的主要财务数据如下:
单位:万元
项目 | 2020年9月30日/2020年1-9月 | 2019年12月31日/2019年度 | 2018年12月31日 /2018年度 | 2017年12月31日/ 2017年度 |
总资产 | 355.34 | 226.76 | 459.77 | 135.13 |
净资产 | 310.10 | 45.80 | 284.69 | 133.21 |
营业收入 | - | - | - | - |
净利润 | -68.51 | -338.89 | -198.52 | -155.28 |
15、飞米光年(北京)科技有限公司
飞米光年(北京)科技有限公司设立于2019年4月,于2019年11月完成注销。根据飞米光年(北京)科技有限公司注销前法定代表人确认,该公司自设立至注销未实际开展业务,无营业收入。
16、杭州行止数据科技有限公司
杭州行止数据科技有限公司设立于2019年4月,于2020年7月完成注销,其主要财务数据如下:
单位:万元
项目 | 2020年6月30日/2020年1-6月 | 2019年12月31日/2019年度 |
总资产 | 2.20 | 2.20 |
净资产 | 2.20 | -47.85 |
营业收入 | 0 | 0 |
净利润 | -26.77 | -47.85 |
17、上海兴丹投资管理中心(有限合伙)
8-2-1-163
上海兴丹投资管理中心(有限合伙)于2017年1月完成注销,其自2017年1月1日至注销前没有财务数据。
(2)与发行人客户和供应商之间是否存在交易、资金往来或其他利益安排,是否存在代垫成本或费用的情形
根据上述13个注销关联方报告期内的主要财务数据,该等企业报告期内均未发生营业收入,财务报表上记载总资产、净资产较小。根据相关方确认,2017年1月1日至注销前,该等企业与发行人主要客户和供应商之间不存在交易、资金往来或其他利益安排,不存在代垫成本或费用的情形。
上述4个已转让关联方: (1)南京智亚源电力科技有限公司主要从事电力设备研发,报告期内营业收入、总资产、净资产较小。根据该公司确认,2017年1月1日至2018年12月发行人董事志鹏的配偶钟山转让股权时,该公司与发行人主要客户和供应商之间不存在交易、资金往来或其他利益安排,不存在代垫成本或费用的情形。(2)根据北京影娱互动科技有限公司、北京智能广宣科技有限公司的确认,2017年1月1日至今,其与发行人主要客户和供应商之间不存在交易、资金往来或其他利益安排,不存在代垫成本或费用的情形。(3)根据上海万彧企业管理中心(有限合伙)的确认,2017年1月1日至2020年9月上海万彧企业管理中心(有限合伙)转让股权时,恩脉(上海)医疗科技有限公司与与发行人主要客户和供应商之间不存在交易、资金往来或其他利益安排,不存在代垫成本或费用的情形。
根据发行人主要客户和供应商的访谈,报告期内与上述转让、注销的关联方之间不存在交易、资金往来。会计师核查事项
本所在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,对发行人注销或转让的关联方进行核查,执行的主要程序如下:
1、查阅发行人控股股东、实际控制人、董事、监事、高级管理人员出具的调查表,梳理其关联方情况;
2、查阅转让、注销的关联方的营业执照、公司章程、股权转让协议、注销文件等资料,在国家企业信用信息公示系统查询转让、注销的关联方的基本情况;
3、查阅转让、注销的关联方的财务报表或关于财务数据的说明等确认文件,取得相关主体的确认函;
8-2-1-164
4、与主要客户和供应商进行访谈。
基于我们所执行的审计和核查程序,申报会计师认为:
报告期内注销或转让的关联企业与发行人主要客户和供应商之间不存在交易、资金往来或其他利益安排,不存在代垫成本或费用的情形。
五、关于财务会计信息与管理层分析
13.关于营业收入
13.1关于收入确认政策
根据申报文件,申报会计师将营业收入认定为关键审计事项,招股说明书未披露关键审计事项。
招股说明书披露,发行人采用完工百分比法确认训练数据定制服务的收入,完工进度按照已经提供的劳务占应提供劳务总量的比例来确定。
请发行人补充披露:不同交付和验收方式下训练数据定制服务取得的验收确认凭据和收入确认时点,完工进度和收入金额的确定方法以及对应定制服务成本的结转方法。
请发行人说明:(1)结合与主要客户的合同约定、提供数据定制服务的实际过程,说明发行人是否满足采用完工百分比法确认收入的条件,是否符合企业会计准则的规定;
(2)完工进度的确认方法是否合理、准确,对应定制服务成本的核算流程和结转方法,是否符合企业会计准则的相关规定;(3)结合相关销售合同的具体约定,说明新收入准则下将每单元定制化训练数据识别为单项履约义务且属于某一时点履行的履约义务的原因及依据,认定新收入准则对首次执行日前各年度财务报表无影响的依据是否充分;
(4)同行业可比公司类似业务采用的收入确认政策,与发行人之间是否存在显著差异;
(5)报告期各期末未完工项目已确认的完工进度、营业收入、营业成本和毛利率,期后是否存在重大调整的情形。
请申报会计师对上述事项进行核查并发表明确意见。
答复:
发行人补充披露事项
8-2-1-165
不同交付和验收方式下训练数据定制服务取得的验收确认凭据和收入确认时点,完工进度和收入金额的确定方法以及对应定制服务成本的结转方法以下内容已在招股说明书“第八节 财务会计信息与管理层分析/四、报告期内主要采用的会计政策和会计估计/(十七)收入”中进行了补充披露:
在训练数据定制服务业务类型下,发行人为客户提供训练数据集定制服务,最终形成的训练数据集成品的知识产权由客户享有。该类型业务包含三类不同的交付和验收方式:
方式一:项目完成后向客户一次交付,客户一次性验收;
方式二:项目执行过程中分批交付数据给客户,客户收到最后一批数据后就所有数据整体验收;
方式三:项目执行过程中分批交付数据给客户,客户收到分批交付的数据后分次进行验收。
发行人之所以存在上述三种交付和验收的方式,主要是由项目特点以及根据客户的具体需求决定的。对于中小型的合同或订单,客户通常会约定一次性交付完成的定制化数据,客户也会一次性进行验收。对于较大额的合同或订单,客户通常会要求分批次提交定制化数据,一般客户在收到分批次提交的定制化数据后,会进行分批验收。但是也存在发行人分批提交定制化数据后,客户由于数据体量较大,质检验收耗费时间较长,会在收到全部数据后进行一次性验收的情况。
上述三种交付和验收方式下训练数据定制服务的验收确认凭据、收入确认时点、完工进度、收入金额的确定方法、对应成本的结转方法具体如下表所示:
类型 | 交付和验收方式 | 取得的验收确认凭据 | 收入确认时点 | 完工进度 | 收入金额的确定方法 | 对应定制服务成本的结转方法 |
方式一 | 一次交付,一次验收 | 项目全部完成后,客户对全部交付训练数据进行验收后出具的验收确认文件 | 客户对提交的训练数据验收确认的时点 | 100% | 收入金额为按照合同或订单约定的服务交易总额 | 该项目累计发生的支出全部结转至当期营业成本 |
方式二 | 多次交付,一次验收 | |||||
方式三 | 多次交付,多次 | 项目执行过程中,客户每次对 | 客户对分批交付的训练 | 按照已经提交并验 | 按照合同或订单约定的服务交易总额 | 按照提供服务预计总成本乘 |
8-2-1-166
验收(分次验收) | 分批交付的训练数据进行验收后出具的验收文件 | 数据每一次验收确认的时点 | 收的服务量占服务总量的比例确定 | 乘以完工进度扣除以前会计期间累计已确认提供的服务收入金额,确认当期的服务收入。 | 以完工进度扣除以前期间累计已确认服务成本后的金额,结转当期营业成本 |
发行人以上三种交付和验收方式对应的具体合同条款举例如下:
交付和验收方式 | 具体合同条款摘录 | |
交付 | 验收 | |
一次交付,一次验收 | 卖方应在本合同签订之日起【】个工作日内向买方一次性交付全部合同货物。 | 系统软件全部达到指定现场后【】个工作日内,买方将根据双方确认的验收测试标准进行验收,卖方应在指定日期自费派遣人员到买方现场参加验收。 |
乙方应在合同签订后的【】个工作日内完成第一条所约定的语音数据的录制工作并以硬盘或者FTP下载形式将数据交付给甲方。 | 甲方自项目录音交付之日起【】个工作日内根据数据验收规则对本次服务的质量进行验收。 | |
多次交付,一次验收 | 乙方应按照附件中工期及里程碑中约定的工期,对甲方提供数据服务;并按照附件中的时间点之前将可交付物交付给甲方。 | 甲方自收到乙方提交的语音库所有数据之日起【】个自然日内对数据的质量进行验收确认。 |
乙方应按约定的开发成果交付日期(“交付日”)如期交付各阶段的开发成果。 | 甲方应自乙方所有数据交付之日起【】日内,在甲方所在地或甲方指定的其他地点,依照附件中约定的验收标准和验收方法对开发成果进行验收。 | |
多次交付,多次验收 (分次验收) | 交付和验收A语种文本转语音数据库(女声),预计完成时间【】;交付和验收B语种文本转语音数据库(女声),预计完成时间【】;……;交付和验收C语种文本转语音数据库(女声)的全部资料,预计完成时间【】 | 交付和验收A语种文本转语音数据库(女声),预计完成时间【】;交付和验收B语种文本转语音数据库(女声),预计完成时间【】;……;交付和验收C语种文本转语音数据库(女声)的全部资料,预计完成时间【】 |
交付时间以附件《项目任务书》为准,实际交付周期按实际收到的批 | 甲方应自收到数据之日起【】个工作日内对数据的质量进行确认和验 |
8-2-1-167
次数据量经双方邮件确认为准。 | 收。 |
注:【】为合同条款中具体的日期信息。
发行人说明事项
(1)结合与主要客户的合同约定、提供数据定制服务的实际过程,说明发行人是否满足采用完工百分比法确认收入的条件,是否符合企业会计准则的规定;
1、发行人训练数据定制服务的主要合同约定中对服务总量、服务金额、验收标准、付款条款等与收入确认相关的核心要素均进行了明确约定
根据发行人与主要客户签订的合同或者订单的约定,发行人向客户提供定制化的用于人工智能训练的训练数据。在合同或者订单中双方的主要约定内容包括:(1)提供的训练数据的数量及要求,数量一般会以小时及句或图片数等作为数据单位;(2)合同总价格或者单位数据单价与总价格;(3)项目工期与验收标准;(4)付款条款,一般的付款节点包括合同签订时点、交付50%或其他比例数据量的数据、项目完成时点等多个节点;(5)交付物,例如智能语音业务交付物一般包括音频文件、标注文本文件和说明及技术文档。
2、发行人提供训练数据定制服务的实际过程中,可以以小时数、图片张数等单位衡量的每个单元训练数据作为交付和客户验收的最小单位,并以其作为计算完工百分比的依据
单元训练数据是指按不同数据形态呈现的每计量单位的训练数据,如1小时语音、1张图片等。例如,对于10小时中文方言语音识别采集项目,发行人向客户交付的训练数据集包括10小时中文方言音频和其对应的标注文本,其中,每1小时中文方言音频及其标注文本构成一个单元训练数据。
发行人提供数据定制服务的实际生产过程主要包括四个环节:(1)设计:一般根据客户要求确定采集数据环节的采集内容和采集要求;(2)采集:获取语音等原料数据;(3)加工:对语音等原料数据进行标注;(4)质检:数据质量的检测。由于单元训练数据之间不存在高度关联关系(例如发音人A的语音录制、标注、质检,不需要依赖发音人B的相关工作而进行,发音人A录制的前50句话也不需要依赖发音人A录制的后50句话的相关工作而进行),因此在设计阶段之后,采集、加工和质检的环节均可以以单元训练数据为基础进行,并以单元训练数据为基础进行数据交付。
8-2-1-168
发行人完成上述四个环节的数据生产流程后,将形成的训练数据进行交付和验收。例如智能语音业务的交付物一般包括音频文件、标注文本文件和说明及技术文档。其中音频文件和标注文本文件是核心交付物,也是客户用来进行人工智能模型训练的数据文件。音频文件和标注文本文件一般以小时及句或字词作为数量标准,每小时或每句、每字词的音频文件和其对应的标注文件构成单元训练数据。发行人可以以单元训练数据为基础对定制服务进行分拆交付、分拆验收,客户也可以分拆用于人工智能训练。说明及技术文档一般作为附加文件同时提供给客户,作为音频文件、标注文本文件等数据文件相关标准、规范、使用的说明,不直接应用于客户的人工智能模型训练。发行人完成合同约定的全部数据量的交付和验收后即该定制服务全部提供完毕。
3、发行人满足采用完工百分比法确认收入的条件,符合企业会计准则的规定
发行人对训练数据定制服务收入,从性质上属于提供劳务,采用完工百分比法确认收入,符合企业会计准则的要求,具体分析如下:
根据《企业会计准则第14号——收入》第十条:企业在资产负债表日提供劳务交易的结果能够可靠估计的,应当采用完工百分比法确认提供劳务收入。
根据《企业会计准则第14号——收入》第十一条:提供劳务交易的结果能够可靠估计,是指同时满足下列条件:收入的金额能够可靠地计量;相关的经济利益很可能流入企业;交易的完工进度能够可靠地确定;交易中已发生和将发生的成本能够可靠地计量。
结合上述发行人与主要客户的合同约定、提供数据定制服务的实际过程来分析训练数据定制服务是否满足上述准则规定的完工百分比法确认收入的条件:
需满足条件 | 具体分析 | 结论 |
收入的金额能够可靠地计量 | 根据准则要求,该条件是指提供劳务收入的总额能够合理地估计。 发行人通过合同或者订单同客户约定提供的服务内容、服务总量以及交易总额,因此收入的金额能够根据合同约定可靠计量。 | 满足 |
相关的经济利益很可能流入企业 | 根据准则要求,该条件是指提供劳务收入总额收回的可能性大于不能收回的可能性。同时准则进一步解释,“通常情况下,企业提供的劳务符合合同或协议要求,接受劳务方承诺付款,就表明提供劳务收入总额收回的可能性大于不能收回的可能性。” 发行人根据合同或者订单约定来提供服务,并经客户验收后确认收入,因此可以合理估计交易相关的收入总额收回的可能性是大于不能收回的可能性。同时结合客户的信誉、以前的交易经验等因素分析,收回收入的可能性大于不能收回的可能性,因此,相关的经济利益很可能流入企 | 满足 |
8-2-1-169
业。 | ||
交易的完工进度能够可靠地确定 | 根据准则要求,该条件是指交易的完工进度能够合理估计。 发行人根据已验收的服务量占服务总量的比例来确定完工进度。由于客户的验收是实质性验收,在验收中如果发现数据存在问题,或者未达到客户的验收标准,发行人需要一直对交付数据进行改进及修正,直至满足客户的验收标准。因此在客户验收之前,发行人无法合理确认其向客户交付的训练数据是否符合合同或订单规定的条件和要求,因此在客户验收之前也无法合理可靠地估计交易的完工进度。 已验收的服务量根据发行人获得的客户的验收文件来确定。客户的验收文件会明确说明已验收的数据量,例如小时数、图片张数等,而且发行人与客户签订的合同或订单中也明确规定了总数据量,因此发行人可以根据客户的验收文件合理确认已验收的服务量占服务总量的比例。 因此交易的完工进度能够合理估计。 | 满足 |
交易中已发生和将发生的成本能够可靠地计量 | 根据准则要求,该条件是指交易中已经发生和将要发生的成本能够合理地估计。 由于发行人实际提供定制数据服务的过程中,工作内容较为明确,因此可以合理预计项目需要投入的对外采购数据服务数量、人工工时和其他需要投入的资源等。另外项目需要采购的数据服务、人工投入、租赁费用等成本的价格均比较稳定,因此可以做到合理预计项目成本。同时,发行人已经建立了良好的内部项目成本核算制度和财务预算及报告制度(如工时系统及项目预算机制),在项目正式启动前,编制相应的项目支出预算。从历史上的项目预算执行情况来看,交付数据后被要求反复修改的情况较少,实际项目成本与预算成本之间一般不存在重大差异。 因此交易中已发生和将发生的成本能够可靠的计量。 | 满足 |
综上所述,结合发行人与主要客户的合同约定、提供数据定制服务的实际过程,发行人对于训练数据定制服务采用完工百分比法符合企业会计准则的规定。
(2)完工进度的确认方法是否合理、准确,对应定制服务成本的核算流程和结转方法,是否符合企业会计准则的相关规定;
1、完工进度的确认方法采用准则中规定的“已经提供的劳务占应提供劳务总量的比例”,符合发行人业务特点,合理、准确
根据《企业会计准则第14号——收入》第十二条,企业确定提供劳务交易的完工进度,可以选用下列方法:已完工作的测量;已经提供的劳务占应提供劳务总量的比例;已经发生的成本占估计总成本的比例。
8-2-1-170
训练数据定制服务的收入确认中,发行人采用上述准则中规定的“已经提供的劳务占应提供劳务总量的比例”来确定完工进度,具体来讲就是根据已验收的服务量占服务总量的比例来确定完工进度。由于客户的验收是实质性验收,在验收中如果发现数据存在问题,或者未达到客户的验收标准,发行人需要一直对交付数据进行改进及修正,直至满足客户的验收标准,因此在客户验收之前,发行人无法合理确认其向客户交付的训练数据是否符合合同或订单规定的条件和要求,因此在客户验收之前也无法合理可靠地估计交易的完工进度。发行人根据获得的客户的验收文件来确定验收的服务量及其占服务总量的比例。由于客户的验收文件会明确说明已验收的数据量,例如小时数,而且发行人与客户签订的合同或订单中也明确规定了总数据量,因此发行人可以根据客户的验收文件合理确认已验收的服务量占服务总量的比例。
综上所述,发行人完工进度的确认方法是合理和准确的,而且符合企业会计准则的相关规定。
2、对应定制服务成本的核算流程和结转方法,符合企业会计准则的相关规定
报告期内发行人的定制服务成本的核算流程和结转方法如下:
报告期内,发行人训练数据定制服务的各项支出,包括职工薪酬、数据服务费、折旧与摊销等,均按照所属项目在“制造费用”中进行归集与核算。在项目分批验收或一次全部验收并相应确认收入后,将该项目归集的项目成本中与确认的收入对应的部分,由制造费用结转至营业成本。
按项目归集成本:发行人严格按照项目为单位进行成本归集,在项目执行之前,每个项目需要编制项目预算,根据训练数据定制服务的具体内容,对项目所需人员及每人投入工时等直接人工内容,采集人数、采集单价、标注工时、标注单价等数据服务采购内容,折旧与摊销、租赁等项目所需场地、设备内容,差旅、交通、办公等其他项目相关支出内容制定详细预算。项目执行过程中,所有支出填写和报销均比照预算类型执行,对未及预算、超预算等情况设定完整的审批流程,并制定了严格的项目决算要求,在项目申请决算前,所有支出必须填写和报销完毕,经专人审核后进行项目决算。决算后,项目不允许发生额外支出。通过以上内部控制手段,保证每笔支出均可以按项目准确、完整归集。
成本结转:具体表现为两种情形,一种是在项目分批验收并确认收入的情况下,在每次验收并确认收入的同时,按照已经验收的服务量占服务总量的比例乘以预计项目总成本并扣除以前期间累计已结转成本后的金额来结转当期营业成本;另一种是在项目一次全部验收并确认收入的情况下,直接进行项目决算,按照实际发生和归集的项目总成
8-2-1-171
本全部结转至营业成本。制造费用中未结转至营业成本的部分,在财务报表中列示和披露为“存货-在产品”。
根据《企业会计准则第14号——收入》第十三条,企业应当在资产负债表日按照提供劳务收入总额乘以完工进度扣除以前会计期间累计已确认提供劳务收入后的金额,确认当期提供劳务收入;同时,按照提供劳务估计总成本乘以完工进度扣除以前会计期间累计已确认劳务成本后的金额,结转当期劳务成本。
报告期内,发行人已经将定制服务项目的成本进行合理归集,并按照完工进度和预计项目总成本结转定制服务成本,因此相关会计处理符合企业会计准则的规定。
(3)结合相关销售合同的具体约定,说明新收入准则下将每单元定制化训练数据识别为单项履约义务且属于某一时点履行的履约义务的原因及依据,认定新收入准则对首次执行日前各年度财务报表无影响的依据是否充分;
一、新收入准则下将每单元定制化训练数据识别为单项履约义务的原因及依据
根据《企业会计准则第14号——收入(修订)》(以下简称“新收入准则”)第九条,履约义务,是指合同中企业向客户转让可明确区分商品的承诺。履约义务既包括合同中明确的承诺,也包括由于企业已公开宣布的政策、特定声明或以往的习惯做法等导致合同订立时客户合理预期企业将履行的承诺。企业为履行合同而应开展的初始活动,通常不构成履约义务,除非该活动向客户转让了承诺的商品。
根据新收入准则第十条,企业向客户承诺的商品同时满足下列条件的,应当作为可明确区分商品:(一)客户能够从该商品本身或从该商品与其他易于获得资源一起使用中受益。(二)企业向客户转让该商品的承诺与合同中其他承诺可单独区分。下列情形通常表明企业向客户转让该商品的承诺与合同中其他承诺不可单独区分:1、企业需提供重大的服务以将该商品与合同中承诺的其他商品整合成合同约定的组合产出转让给客户。2、该商品将对合同中承诺的其他商品予以重大修改或定制。3、该商品与合同中承诺的其他商品具有高度关联性。
根据前述发行人与客户签订的合同或订单的分析,发行人向客户提供的定制化训练数据集可以拆分为若干个单元训练数据。发行人根据上述准则规定将每个单元训练数据识别为单项履约义务,具体理由如下:
1、客户可以将每一单元训练数据用于训练人工智能模型,因此能够从该单元训练数据的使用中受益;
8-2-1-172
2、发行人转让每一单元训练数据的承诺在合同中可以明确区分,主要是因为(1)在转让每一单元训练数据之前,发行人无须提供重大服务以对单元训练数据之间进行整合;(2)发行人转让的每一单元训练数据不会影响其他单元训练数据或对其他单元训练数据做出重大修改;(3)不同的单元训练数据之间不存在高度关联性,发行人可以对不同的单元训练数据分批提交,客户可以分批验收,而且分批提交已验收完成的数据可以用于客户的模型训练。综合上述分析,发行人根据新收入准则的规定,将每单元定制化训练数据识别为单项履约义务。
二、属于某一时点履行的履约义务的原因及依据
根据新收入准则第十一条,满足下列条件之一的,属于在某一时段内履行履约义务;否则,属于在某一时点履行履约义务:(一)客户在企业履约的同时即取得并消耗企业履约所带来的经济利益。(二)客户能够控制企业履约过程中在建的商品。(三)企业履约过程中所产出的商品具有不可替代用途,且该企业在整个合同期间内有权就累计至今已完成的履约部分收取款项。
根据前述发行人与客户签订的合同或订单的分析,发行人根据上述准则规定,认为对识别的单项履约义务,即单元定制化训练数据,不满足一段时间内履行履约义务的条件,属于某一时点履行的履约义务。具体理由分析如下:
1、发行人在履约的同时,客户无法取得并消耗企业履约所带来的经济利益。因为在发行人交付和验收训练数据之前,发行人履行合同义务所进行定制数据的生产活动,包括设计、采集、加工、质检等,客户并未同时取得也无法消耗发行人履约所带来的经济利益;
2、发行人生产数据过程处于发行人控制之下,且验收后交付物的所有权才归客户所有,因此客户无法控制发行人履约过程中产生的数据;
3、由于训练数据是定制的,发行人所生产的数据只能提供给相关的客户,满足具有不可替代用途,但是如果合同由于客户的原因被终止,在合同终止时点,发行人已生产但未交付完成验收的工作量,发行人无权主张补偿截止该时点为止的已发生成本以及合理利润,因此不满足“该企业在整个合同期间内有权就累计至今已完成的履约部分收取款项”的要求。
8-2-1-173
综合上述分析,发行人根据新收入准则的规定,认为识别的单项履约义务,即每单元定制化训练数据,不满足一段时间内履行履约义务的条件,属于某一时点履行的履约义务。
三、认定新收入准则对首次执行日前各年度财务报表无影响的依据是否充分
财政部于2017年颁布了《企业会计准则第14号——收入(修订)》(“新收入准则”),发行人自2020年1月1日起执行新收入准则,对会计政策相关内容进行调整。新收入准则取代了财政部于2006年颁布的《企业会计准则第14号——收入》及《企业会计准则第15号——建造合同》(统称“原收入准则”或“旧准则”)。
发行人根据业务条款和合同模式评估了新收入准则对各类业务的收入确认时点和确认金额的影响。具体分析如下:
业务类型 | 原收入准则 | 新收入准则 | 新旧准则下是否存在差异 |
训练数据定制服务 | 训练数据定制服务收入主要是指公司根据客户需求为客户提供训练数据定制服务而收取的收入。公司与客户通过合同或订单约定提供的服务内容、服务总量及交易总额。 | ||
公司采用完工百分比法确认训练数据定制服务的收入。完工进度按照已经提供的劳务占应提供劳务总量的比例来确定。在资产负债表日,公司统计已经按照合同或订单提供给客户并经客户验收和确认的服务量占服务总量的比例,计算和确定完工进度。 | 每单位定制化训练数据被识别为单项履约义务,属于某一时点履行的履约义务,公司在将定制化训练数据向客户交付并经客户验收确认时确认收入。 | 新旧收入准则下的收入确认时点均为训练数据的验收时点,因此收入确认时点无差异。 由于合同或者订单中规定了训练数据的单价和数量,或者规定了收入总额和数量,因此可以按照验收的训练数据数量和单价来确认新准则下的收入金额,该金额也同时是旧准则下按照完工进度确认的收入金额,因此新旧准则下收入确认金额也无差异。 | |
训练数据产品 | 训练数据产品收入主要是指公司授权客户永久使用公司已经开发完成并拥有所有权的训练数据产品而向客户收取的收入。公司与客户签订合同约定授权客户使用的训练数据产品及其交易金额。 | ||
公司按照合同约定向客户提交训练数据产品并经客户验收确认后,按照合同约定的交易金额 | 公司不从事对训练数据产品有重大影响的后续活动,因此训练数据产品属于某一时 | 新旧收入准则下的收入确认时点均为训练数据产品(数据库)的交付和验收 |
8-2-1-174
确认训练数据产品收入。 | 点履行的知识产权许可授权,公司在向客户交付合同中约定的训练数据产品并经客户验收确认后,按照合同约定的交易金额确认训练数据产品收入。 | 时点,金额均为合同约定的价格,因此收入确认时点和确认金额均无差异。 | |
训练数据相关的应用服务 | 训练数据相关的应用服务收入主要是指公司根据客户需求为其提供应用软件的定制开发服务或者是应用软件的授权使用,以及配套硬件的销售(如有)等,而向客户收取的收入。公司与客户通过签订合同,约定向客户提供的应用软件的定制开发或授权使用,以及配套硬件销售(如有)等服务内容及交易金额。 | ||
公司按照合同约定向客户交付开发完成或者授权使用的应用软件和配套硬件(如有),并经客户验收确认后,按照合同约定的交易金额确认收入。 | 应用软件的定制开发或者授权许可、配套硬件的销售属于可明确区分的单项履约义务,并且属于在某一时点履行的履约义务;应用软件的定制开发或者授权使用、以及配套硬件的销售,均是在向客户交付并经客户验收确认时确认收入,并按照合同约定的单项履约义务分摊的交易价格确认收入金额。 | 新旧收入准则下的收入确认时点均为应用软件和配套硬件(如有)的交付和验收时点,金额均为合同约定的价格,因此收入确认时点和确认金额均无差异。 |
根据上述分析,发行人认为新收入准则对首次执行日前各年度财务报表均无影响的依据是充分合理的。
(4)同行业可比公司类似业务采用的收入确认政策,与发行人之间是否存在显著差异;
代码 | 信息技术服务类上市公司 | 收入确认政策 |
300290.SZ | 荣科科技 | 本公司提供劳务主要包括定制化软件开发收入和技术服务收入,其收入的具体确认原则如下: (1)定制化软件开发收入是指公司接受客户委托,针对客户提出的软件需求进行研究开发所获得的收入。定制化软件一般是公司基于自主研发的软件平台基础上,按照客户的特定需求,进行定制化开发而形成的应用软件。该类软件一般不具有通用性,该类业务实质上属于提供劳务。 对于专业程度较高且能够取得客户确认的完工进度依据的定制化软件开发收入,提供定制软件劳务交易的结果在资产负债表日能够 |
8-2-1-175
可靠估计的,采用完工百分比法确认提供劳务的收入,并按已经发生的成本占估计总成本的比例确定提供劳务交易的完工进度;提供定制软件劳务交易的结果在资产负债表日不能够可靠估计的,若已经发生的劳务成本预计能够得到补偿,按已经发生的劳务成本金额确认提供劳务收入,并按相同金额结转劳务成本;若已经发生的劳务成本预计不能够得到补偿,将已经发生的劳务成本计入当期损益,不确认劳务收入。 对于其他的定制化软件开发收入,本公司在按照合同约定内容实施了开发工作,为购买方完成了安装、调试工作,取得购买方的验收,并同时满足上述提供劳务收入确认条件时确认定制化软件开发收入。 | ||
300245.SZ | 天玑科技 | 数据中心 IT 基础设施服务收入确认的一般原则是:根据合同约定提供了相应服务,在相关的经济利益能够流入公司,收入的金额能够可靠地计量时,相关成本能够可靠计量时确认收入。软硬件销售及自有产品销售收入确认的一般原则是:在销售产品时的主要风险和报酬已转移给买方,不再保留与之相联系的管理权和控制权,在相关的经济利益能够流入公司,收入的金额能够可靠地计量时,相关成本能够可靠地计量时确认收入。根据合同约定条款的不同,分别按以下原则确认收入: (1)合同明确约定服务期限的,在合同约定的服务期限内按时间进度确认收入。 (2)合同明确约定验收条款的,按约定条款验收并确认收入。 (3)合同明确约定开发项目进度的确认条款的,期末按照提供定制软件开发收入的合同金额乘以经客户确认的开发项目进度的量化百分比扣除以前会计期间累计已确认提供劳务收入后的金额,确认当期提供定制软件开发收入;同时,按照提供劳务估计总成本乘以经客户确认的开发项目进度的量化百分比扣除以前会计期间累计已确认劳务成本后的金额,结转当期劳务成本。 |
300634.SZ | 彩讯股份 | 提供劳务收入确认的原则,本公司在资产负债表日提供劳务交易的结果能够可靠估计的,按照完工百分比法确认提供劳务收入。 B、定制工程化软件 合同中明确约定合同总金额中包含质保金的,在确认收入时, 先扣除质保金部分,然后按如下方法确认收入;质保期届满后, 再将该质保金确认收入。 a.取得初验报告开始确认收入。 定制工程化软件一般包括软件功能的开发、现场安装调试、旧系统数据迁移、系统培训、用户测试、初验(系统试运行)和终验等环节,其中初验和终验是客户对系统运行情况作出的评价(用户也可 |
8-2-1-176
直接终验),也是公司与客户结算的主要依据和环节。在初验阶段完成时,围绕项目的大部分工作均已完成, 之后只是在运行期间可能进行部分系统功能的修改,所涉工作内容很少、工作量也不大。因此,公司在取得初验报告后开始确认收入。 b.初验确认收入的比例。 由于公司定制工程化软件主要依靠项目实施人员及自有软件技术的整合来进行开发,因此,公司以投入工时为计算基础,以完工进度作为确认收入的依据。根据历年已完工典型合同统计, 初验时项目投入工时约为 80%左右,因此,公司按照以下标准孰低的原则确定初验收入的确认比例: Ⅰ、初验时合同约定的付款比例等于或高于 80%,则以 80%确认收入; Ⅱ、初验时合同约定的付款比例低于 80%,则以合同约定的比例确认收入。 公司每年年末会根据当年完工合同情况,对初验完工进度进行复核。 c.终验时的收入确认: 取得客户终验报告确认时,公司扣除终验前已确认的比例后, 将其余部分确认收入,如合同中明确约定合同总金额中包含质保金的,先扣除质保金部分,再按前述办法确认收入。 | ||
300468.SZ | 四方精创 | (1)软件开发收入的确认原则及方法 软件开发收入是指接受客户委托,根据客户的需要,对应用软件技术进行研究开发,由此开发出来的软件为定制软件、 不具有通用性。 软件开发收入的确认原则及方法分为两大类: ①根据合同按每月实际工作量(人/天数)收费,经客户确认实 际工作量后确认软件开发收入。 ②公司软件开发业务按照合同约定提交软件开发成果并经客户验收后确认收入,该业务若存在分阶段多次验收情况,则按该业务完成各阶段工作并经客户验收时,分别确认相应阶段工作成果的收入。 |
发行人 | 公司采用完工百分比法确认训练数据定制服务的收入。完工进度按照已经提供的劳务占应提供劳务总量的比例来确定。在资产负债表日,公司统计已经按照合同或订单提供给客户并经客户验收和确认的服务量占服务总量的比例,计算和确定完工进度。 |
上述内容是对原收入准则下发行人与同行业公司的收入确认政策的对比情况。
8-2-1-177
通过对比发现,从事信息技术服务类业务的上市公司中,通常将定制化软件开发收入定义为提供劳务收入,在资产负债表日提供劳务交易的结果能够可靠估计的,按照完工百分比法确认提供劳务收入。完工百分比的比例通常采取工作量法、已发生成本占预计总成本的比例确定、已经提供的劳务占应提供劳务总量的比例确定。发行人根据自身业务情况确定的验收及收入确认方式符合行业惯例,与同行业公司之间不存在显著差异。
发行人与同行业公司自2020年1月1日开始实施新收入准则。其中彩讯股份和四方精创已经披露了上市公司2020年半年度报告,其他两家同行业公司尚未披露半年度报告。彩讯股份在半年度报告中未披露新收入准则下具体业务相关的收入确认的具体方法。四方精创在半年度报告中披露了新收入准则下的软件开发收入的确认原则与方法,其与原收入准则下的软件开发收入的确认原则与方法相同,对收入确认时点与确认金额均未产生影响。由于发行人实施新收入准则后收入确认时点和收入确认金额也未发生变化,因此与同行业公司不存在显著差异。
(5)报告期各期末未完工项目已确认的完工进度、营业收入、营业成本和毛利率,期后是否存在重大调整的情形。
报告期各期末未完工项目已确认的营业收入、营业成本情况如下:
单位:万元
期间 | 累计确认收入 | 累计确认成本 |
2020年9月30日 | 713.14 | 563.96 |
2019年12月31日 | 1,170.79 | 418.01 |
2018年12月31日 | 883.54 | 400.59 |
2017年12月31日 | 73.44 | 33.15 |
报告期各期末未完工项目已确认的完工进度、毛利率以及期后(截至2020年11月30日)完工情况如下:
8-2-1-178
2020年9月30日:
单位:万元
2020年9月30日 | 完工百分比 | 毛利率 | 是否完工 | 完工毛利率 | 毛利率变动比例 | 差异大于>20%的原因分析 |
A | B | C=(B-A)/A | ||||
2020年一季度末未完工项目1 | 13.08% | -2% | 否 | —— | —— | —— |
2020年一季度末未完工项目2 | 67.31% | 17% | 否 | —— | —— | —— |
2020年一季度末未完工项目3 | 67.52% | 55% | 是 | 54% | -1% | —— |
2020年一季度末未完工项目4 | 71.96% | 21% | 是 | 24% | 11% | —— |
2020年一季度末未完工项目5 | 97.87% | 21% | 否 | —— | —— | —— |
2020年一季度末未完工项目6 | 63.20% | 78% | 否 | —— | —— | —— |
2020年一季度末未完工项目7 | 41.61% | 72% | 否 | —— | —— | —— |
2020年一季度末未完工项目8 | 5.03% | 60% | 否 | —— | —— | —— |
2020年一季度末未完工项目9 | 78.13% | -27% | 否 | —— | —— | —— |
2020年一季度末未完工项目10 | 53.78% | 8% | 是 | 11% | 40% | 项目进展顺利,效率提升,节省部分标注成本 |
2020年一季度末其他34个未完工项目 | 67.36% | 10% | —— | —— | —— | —— |
合计 | 45.50% | 21% | —— | —— | —— | —— |
2019年12月31日:
单位:万元
2019年12月31日 | 完工百分比 | 毛利率 | 是否完工 | 完工毛利率 | 毛利率变动比例 | 差异大于>20%的原因分析 |
8-2-1-179
A | B | C=(B-A)/A | ||||
2019年末未完工项目1 | 91.03% | 79% | 是 | 80% | 1% | —— |
2019年末未完工项目2 | 46.30% | 57% | 是 | 54% | -5% | —— |
2019年末未完工项目3 | 83.98% | 56% | 是 | 54% | -4% | —— |
2019年末未完工项目4 | 90.00% | 50% | 是 | 50% | 1% | —— |
2019年末未完工项目5 | 58.09% | 54% | 否 | —— | —— | —— |
2019年末未完工项目6 | 39.35% | 78% | 否 | —— | —— | —— |
2019年末未完工项目7 | 41.61% | 73% | 否 | —— | —— | —— |
2019年末未完工项目8 | 5.03% | 61% | 否 | —— | —— | —— |
2019年末未完工项目9 | 90.00% | 47% | 是 | 53% | 13% | —— |
2019年末未完工项目10 | 95.45% | 45% | 是 | 48% | 8% | —— |
2019年末其他19个未完工项目 | 64.63% | 44% | —— | —— | —— | —— |
合计 | 73.69% | 64% | —— | —— | —— | —— |
2018年12月31日:
单位:万元
2018年12月31日 | 完工百分比 | 毛利率 | 是否完工 | 完工毛利率 | 毛利率变动比例 | 差异大于>20%的原因分析 |
A | B | C=(B-A)/A | ||||
2018年末未完工项目1 | 10.00% | 33% | 是 | 47% | 42% | 优化渠道和项目流程,缩短了工期,减少了采集费用和项目租赁费等成本 |
2018年末未完工项目2 | 40.07% | 46% | 是 | 53% | 15% | —— |
8-2-1-180
2018年末未完工项目3 | 35.57% | 47% | 是 | 56% | 19% | —— |
2018年末未完工项目4 | 40.70% | 66% | 是 | 70% | 6% | —— |
2018年末未完工项目5 | 40.71% | 69% | 是 | 71% | 3% | —— |
2018年末其他7个未完工项目 | 95.48% | 52% | 是 | 52% | 0% | —— |
合计 | 37.19% | 55% | —— | 58% | —— | —— |
2017年12月31日:
单位:万元
2017年12月31日 | 完工百分比 | 毛利率 | 是否完工 | 完工毛利率 | 毛利率变动比例 | 差异大于>20%的原因分析 |
A | B | C=(B-A)/A | ||||
2017年末未完工项目1 | 87.36% | 84% | 是 | 82% | -2% | —— |
2017年末未完工项目2 | 86.94% | 20% | 是 | 34% | 70% | 由于发音人语速的原因,后期采集字数减少,相应的标注支出也有节省 |
2017年末未完工项目3 | 50.07% | 55% | 是 | 54% | -2% | —— |
2017年末未完工项目4 | 73.89% | 23% | 是 | 16% | -30% | 期后客户数据量减少,但发生少量人工支出,因此毛利率降低 |
合计 | 76.60% | 55% | —— | 61% | —— | —— |
8-2-1-181
发行人报告期各期末未完工项目以语音合成项目为主,已确认的毛利率与发行人报告期各期语音合成业务毛利率较为接近。同时,报告期各期末未完工项目在该期末按完工百分比确认的毛利率与期后实际完工毛利率基本一致,不存在重大差异,且期后确认的完工收入合理,不存在冲回等异常情形。此外,上述未完工项目期后实际结转成本与预算成本基本一致,不存在重大差异,报告期各期末前十大未完工项目的实际完工成本与预算成本的差异情况请参见本问询函回复问题20“发行人说明事项/(2)报告期各期末主要未完工项目的客户名称、项目内容、成本结构、合同金额和预计总成本,分析各项目成本结构的差异原因,说明预计总成本的确认方法,与实际完工成本之间是否存在差异,是否存在应计提而未计提存货跌价准备的情形”。
综上,发行人在各报告期的期后不存在对项目已确认的收入和成本进行重大调整的情形。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于收入确认可能导致的重大错报风险,执行的主要程序如下:
1、了解并评价与收入确认相关的关键财务报告内部控制的设计和运行有效性;
2、选取样本,检查销售合同或订单,识别与风险和报酬转移或控制权转移相关的合同或订单条款,评价发行人的各类收入的收入确认政策是否符合企业会计准则的相关要求;对比公司收入确认原则和收入确认具体方法在原收入准则下和新收入准则下的差异,分析新收入准则实施后对公司的业务模式、合同条款、收入确认等方面的影响;
3、查阅同行业上市公司的收入确认政策,核查发行人收入确认政策是否符合行业惯例;
4、选取重要客户,实地走访或视频访谈,了解客户的客户的规模、业务经营等基本情况、其与发行人之间的业务模式、结算方式等;
5、在抽样的基础上,将各期记录的收入核对至相关的销售合同或订单、客户验收文件、发票等相关支持性依据,以评价相关收入是否按照发行人的收入确认政策予以确认;
8-2-1-182
6、从资产负债表日前后的收入交易中选取样本,检查与收入确认相关的销售合同或订单、客户验收文件、发票等相关支持性依据,评价接近资产负债表日前后记录的收入是否记录于恰当期间;检查接近资产负债表前后发生的项目实际成本,核对至相关支持性文件,包括经管理层审批的人员工时记录,费用报销单据、结算单等,以评价相关成本费用是否记录于恰当的会计期间;
7、对于报告期各期末未完工项目的完工进度和营业收入,检查相应的合同或订单,及验收文件,检查已验收的服务量和合同约定的服务总量及交易总额,复核完工百分比和营业收入计算的准确性;
8、对于报告期各期期末未完工项目的营业成本,检查报告期经管理层审批的项目预算总成本计算表及预算的实际执行情况,检查期后实际完工结算成本与期末预算总成本是否存在重大差异,期后预算是否存在重大调整。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人对训练数据定制服务收入,采用完工百分比法确认收入,符合《企业会计准则14号——收入》的规定;
2、发行人完工进度的确认方法是合理和准确的,符合企业会计准则的相关规定;发行人已经将定制服务项目的成本进行合理归集,并按照完工进度和预计项目总成本结转定制服务成本,相关会计处理符合企业会计准则的规定;
3、采用新收入准则之后,将每单元定制化训练数据识别为单项履约义务且属于某一时点履行的履约义务的原因合理,依据充分,新收入准则对首次执行日前各年度财务报表无影响的依据充分;
4、公司根据自身业务情况确定的验收及收入确认方式符合行业惯例,与同行业公司之间不存在显著差异;
5、发行人在各报告期的期后不存在对项目已确认的收入和成本进行重大调整的情形。
8-2-1-183
13.2关于营业收入波动
报告期内,训练数据定制服务的营业收入6,297.23万元、12,369.55万元和14,232.91万元,训练数据产品的营业收入5,489.31万元、6,601.67万元和9,176.47万元,逐年上升。
请发行人补充披露:(1)各类别服务和产品的销量、价格与结构变化的原因,进一步分析营业收入变动的原因;(2)各期合同数量、完成量和未完成量与营业收入的匹配关系;(3)营业收入的季节性分布,与同行业可比公司之间是否存在差异。
请申报会计师对上述事项进行核查并发表明确意见。
答复:
发行人补充披露事项
(1)各类别服务和产品的销量、价格与结构变化的原因,进一步分析营业收入变动的原因
发行人训练数据定制服务和训练数据产品的三大应用领域为智能语音、计算机视觉和自然语言。
智能语音领域的训练数据定制服务和训练数据产品的销量、价格与结构变化情况,发行人已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/4、主要产品和服务的销量和价格分析/(1)智能语音领域”中进行了分析和披露。
计算机视觉和自然语言领域的服务和产品涉及多种类型数量单位,例如点、线、框格、词、句等,因此发行人按照销售的单个数据库作为销量单位,在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/(一)营业收入分析/4、主要产品和服务的销量和价格分析/(2)计算机视觉和自然语言领域”中对计算机视觉和自然语言领域的训练数据定制服务和训练数据产品的销量、价格与结构变化情况进行了分析和披露。以下对计算机视觉和自然语言领域内部分主要细分类别的销量、价格与结构变化情况进行分析,进一步说明这两类应用领域的营业收入变动情况。
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(一)营业收入分析/4、主要产品和服务的销量和价格分析”中进行了补充披露:
一、计算机视觉领域
8-2-1-184
计算机视觉领域的三类主要细分类别为手写体、光学字符识别、行车相关视频。报告期内上述三类细分类别的销量和价格情况如下:
细分 类别 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
销量 | 平均售价(元) | 销量 | 平均售价(元) | 销量 | 平均售价(元) | 销量 | 平均售价(元) | |
手写体 | 7,615.80 | 564.70 | 28,005.45 | 285.78 | 2,740.00 | 494.90 | 3,875.00 | 1,238.89 |
光学字符识别 | 2,830.54 | 1,015.34 | 83,532.02 | 54.42 | 47,419.86 | 65.13 | 13,238.04 | 48.40 |
行车相关视频 | 37,724.76 | 3.68 | 1,630,134.90 | 2.50 | 1,188,754.20 | 4.77 | - | - |
注:手写体、光学字符识别、行车相关视频的销量单位分别为千词组、百张、十个目标。
1、手写体
报告期内,公司手写体业务2019年销量显著增长,主要来源于某国际消费电子产品厂商的移动设备滑行输入业务。
报告期内,公司手写体业务平均售价在2017-2019年逐年下降,2020年1-9月回升,主要是由于该类业务的细分类别差异及语种差异所导致的。2017年,手写体业务语种涉及日语、英语、德语等,且为手写输入方式。2018年和2019年,该项业务主要涉及滑行输入数据,较传统手写输入方式的数据采集和标注难度更低,且主要语种开始从外语种转向简体中文,采集难度明显降低,因此价格也显著下降。2020年1-9月,该类业务中一部分为多地区繁体中文手写体,对被采集人年龄、性别、学历、设备使用经验等均有要求,难度较大,且为华语项目,发行人议价能力较强,因此单价较高,另一部分涉及中文拼音输入数据,相对难度较低,因此单价较低,两者综合作用下平均售价较2019年有所回升。
2、光学字符识别
报告期内,随着光学字符识别的应用场景得到了较大规模的发展,公司在该类业务方面也实现了较快拓展,销量持续增长。
报告期内,公司光学字符识别业务在2017-2019年平均售价呈现小幅波动,2020年1-9月平均售价非常高,是由于业务收入70%以上来源于某大型光学字符采集项目和某财务文档采集标注项目,该类项目相较于一般光学字符识别项目环节更多,且客户
8-2-1-185
指定特定采集设备拍摄,或采集内容为指定领域的实况图片、财务文档等,采集难度大,后期需标注或质检图片多项内容信息,流程复杂,因此单价非常高。
3、行车相关视频
行车相关视频业务是公司在2018年新拓展的业务类别。2019年,公司继续拓展该类业务,销量有所增长,同时由于竞争较为激烈,为保持市场占有率,平均售价有所降低。2020年1-9月,该项业务中含采集环节的项目对采集场景、时段、设备均有较高要求,因此使得平均售价有所回升。
二、自然语言领域
自然语言领域的一类主要细分类别为语义理解。报告期内上述三类细分类别的销量和价格情况如下:
细分类别 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
销量 (小时) | 平均售价(元) | 销量 (小时) | 平均售价(元) | 销量 (小时) | 平均售价(元) | 销量 (小时) | 平均售价(元) | |
语义理解 | 53,971.16 | 51.29 | 86,505.88 | 55.28 | 110,407.88 | 45.90 | 79,522.18 | 47.04 |
报告期内,公司语义理解业务销量在2018年较高,主要是由于个别重要客户根据其业务需要明显提升了采购规模所致;2019年,虽然个别重要客户在2019年仍保持了较高的采购规模,但由于其他客户采购规模有所减少,因此2019年销量较2018年下降。
报告期内,公司语义理解业务平均售价在2019年和2020年1-9月上升的原因是新增了医疗专业领域标注、文本编写、粤语分词、词性标注等高难度项目和外语种项目,需要相关专业的标注员进行标注,因此售价较高。
(2)各期合同数量、完成量和未完成量与营业收入的匹配关系
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(一)营业收入分析/6、合同及订单数量与营业收入的匹配关系”中进行了补充披露:
报告期内,发行人执行的合同数量、合同对应的具体订单数量及对应的营业收入情况如下:
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
合同数量(个) | 451 | 511 | 466 | 406 |
合同对应具体订单数量(个) | 1,311 | 1,552 | 1,378 | 926 |
8-2-1-186
其中:完成数量(个) | 976 | 1,341 | 1,111 | 709 |
未完成数量(个) | 335 | 211 | 267 | 217 |
营业收入(万元) | 14,277.35 | 23,755.81 | 19,265.77 | 11,907.09 |
报告期各期,发行人收入的变动趋势与完成的具体订单个数变动趋势基本相符,单个完成的具体订单贡献的收入约为14-18万元,较为稳定,合同完成数量与营业收入之间具备匹配关系。
(3)营业收入的季节性分布,与同行业可比公司之间是否存在差异
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(一)营业收入分析/7、营业收入的季节性分布”中进行了补充披露:
报告期内,发行人营业收入的季节性分布如下:
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
第一季度 | 3,126.09 | 21.90% | 3,124.09 | 13.15% | 2,848.45 | 14.79% | 1,224.00 | 10.28% |
第二季度 | 7,067.83 | 49.50% | 6,977.98 | 29.37% | 3,784.80 | 19.65% | 4,146.00 | 34.82% |
第三季度 | 4,083.44 | 28.60% | 3,473.16 | 14.62% | 5,483.29 | 28.46% | 2,759.39 | 23.17% |
第四季度 | - | - | 10,180.58 | 42.86% | 7,149.23 | 37.11% | 3,777.72 | 31.73% |
合计 | 14,277.35 | 100% | 23,755.81 | 100% | 19,265.77 | 100% | 11,907.09 | 100% |
同行业可比公司2019年各季度营业收入分布情况如下:
荣科科技 | 彩讯股份 | 天玑科技 | 四方精创 | 恒生电子 | 用友网络 | 万兴科技 | 泛微网络 | |
第一季度 | 19.00% | 20.73% | 18.31% | 20.38% | 15.29% | 14.72% | 24.43% | 15.97% |
第二季度 | 21.73% | 23.06% | 22.97% | 19.97% | 24.07% | 24.22% | 23.78% | 23.29% |
第三季度 | 22.91% | 24.03% | 19.58% | 22.02% | 19.97% | 19.93% | 25.02% | 21.77% |
第四季度 | 36.36% | 32.18% | 39.14% | 37.63% | 40.67% | 41.14% | 26.78% | 38.96% |
由上述表格可以看出,发行人作为软件和信息技术服务行业公司,与同行业可比公司在营业收入的季节性分布方面具有类似的特征,即根据下游客户的年度预算制定及结算需求的节奏,第一季度实现收入普遍较低,第四季度实现收入普遍较高,第二、三季度普遍居中。会计师核查事项
8-2-1-187
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于收入确认可能导致的重大错报风险,除上述13.1题有关收入的程序外,申报会计师执行的与营业收入波动有关的主要程序如下:
1、获取发行人报告期内收入明细表,汇总各类别服务和产品的销售收入、销量、单位价格等信息,按主要细分类别对销量、单位售价及其变化进行分析;
2、获取发行人报告期内合同信息表,汇总统计各期合同数量、已完成量和未完成量;并选取样本检查合同执行进度和收入确认情况;
3、查阅同行业可比公司招股说明书、定期报告,检查同行业可比公司营业收入的季节性分布情况。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人各类别服务和产品的销量、价格与结构变化具备合理原因;
2、发行人各期合同完成数量与营业收入之间具有匹配关系;
3、发行人报告期营业收入季节性波动与同行业可比公司之间不存在重大差异,且符合行业惯例。
14.关于营业成本
报告期各期,公司主营业务成本金额分别为3,303.47万元、6,786.78万元和7,067.52万元,主要为训练数据资源定制服务。
请发行人补充披露:(1)训练数据资源定制服务成本构成及变动原因;(2)结合项目复杂程度、采集标注量和单位价格变化等因素,分析各类别定制服务成本构成及变动原因。
请发行人说明:(1)定制服务成本和研发费用的核算流程和结转方法,相关费用和人工的归集和分配方式,是否符合企业会计准则的规定;(2)计入主营业务成本的人员部门、员工数量及其变动和人均薪酬,相关人员的具体职责以及在相关项目中的具体作用,人均薪酬与同行业可比公司的对比情况。
请保荐机构和申报会计师核查并发表明确意见。
答复:
8-2-1-188
发行人补充披露事项
(1)训练数据资源定制服务成本构成及变动原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(二)营业成本分析/4、按支出类型分类的主营业务成本分析”中进行了补充披露:
报告期内,公司按支出类型分类的主营业务成本情况如下:
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
数据服务费 | 3,697.63 | 83.71% | 5,245.49 | 74.22% | 5,399.51 | 79.56% | 2,618.57 | 79.27% |
职工薪酬 | 454.58 | 10.29% | 1,185.95 | 16.78% | 971.87 | 14.32% | 537.23 | 16.26% |
折旧摊销 | 28.00 | 0.63% | 141.62 | 2.00% | 58.14 | 0.86% | 45.25 | 1.37% |
差旅费 | 18.72 | 0.42% | 41.74 | 0.59% | 44.87 | 0.66% | 38.15 | 1.15% |
其他 | 218.20 | 4.94% | 452.72 | 6.41% | 312.39 | 4.60% | 64.27 | 1.95% |
合计 | 4,417.13 | 100.00% | 7,067.52 | 100.00% | 6,786.78 | 100.00% | 3,303.47 | 100.00% |
报告期内,公司按支出类型分类的训练数据定制服务成本情况如下:
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
数据服务费 | 3,669.33 | 86.01% | 5,245.49 | 75.39% | 5,395.72 | 80.25% | 2,616.47 | 79.70% |
职工薪酬 | 433.40 | 10.16% | 1,161.02 | 16.69% | 940.99 | 13.99% | 520.55 | 15.86% |
折旧摊销 | 21.10 | 0.49% | 129.79 | 1.87% | 47.27 | 0.70% | 45.24 | 1.38% |
差旅费 | 15.55 | 0.36% | 41.74 | 0.60% | 43.96 | 0.65% | 36.40 | 1.11% |
其他 | 126.59 | 2.97% | 379.65 | 5.46% | 296.09 | 4.40% | 64.18 | 1.96% |
合计 | 4,265.97 | 100.00% | 6,957.69 | 100.00% | 6,724.04 | 100.00% | 3,282.86 | 100.00% |
报告期内,公司主营业务成本绝大部分为训练数据定制服务成本,因此主营业务成本与训练数据定制服务成本的构成及变动情况一致。报告期内,公司主营业务成本主要由数据服务费和职工薪酬构成,另外存在少量折旧摊销、差旅费和其他类型的成本项目。其中,数据服务费是公司最主要的成本项目,是公司在提供训练数据服务过程中所需的、非核心技术环节的原料数据采集、标注服务,与公司主营业务收入变动总体保持一致,占报告期各年主营业务成本的比例分别为79.27%、79.56%、74.22%和83.71%,占比较为稳定。同时,职工薪酬占报告期各年主营业务成本的比例分别为16.26%、14.32%、
8-2-1-189
16.78%和10.29%,总体波动较小,2020年1-9月职工薪酬占比下降是由于当期完成验收的训练数据定制服务项目成本的职工薪酬中不包括年终奖金,因此职工薪酬相对较低所致。
(2)结合项目复杂程度、采集标注量和单位价格变化等因素,分析各类别定制服务成本构成及变动原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(二)营业成本分析/4、按支出类型分类的主营业务成本分析”中进行了补充披露:
报告期内,公司按支出类型分类的各应用领域训练数据定制服务成本情况如下:
单位:万元
应用领域 | 项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | ||
智能语音 | 数据服务费 | 2,785.51 | 87.11% | 3,957.92 | 74.60% | 4,286.41 | 80.54% | 2,069.47 | 81.41% |
职工薪酬 | 278.99 | 8.72% | 869.85 | 16.39% | 674.46 | 12.67% | 356.56 | 14.03% | |
折旧摊销 | 16.86 | 0.53% | 109.46 | 2.06% | 41.39 | 0.78% | 27.65 | 1.09% | |
差旅费 | 5.49 | 0.17% | 24.80 | 0.47% | 32.97 | 0.62% | 32.47 | 1.28% | |
其他 | 110.83 | 3.47% | 343.77 | 6.48% | 287.10 | 5.39% | 55.99 | 2.20% | |
合计 | 3,197.68 | 100.00% | 5,305.80 | 100.00% | 5,322.33 | 100.00% | 2,542.14 | 100.00% | |
计算机视觉 | 数据服务费 | 443.18 | 79.03% | 919.30 | 78.62% | 734.90 | 81.05% | 330.88 | 80.39% |
职工薪酬 | 88.11 | 15.71% | 179.13 | 15.32% | 150.60 | 16.61% | 64.04 | 15.56% | |
折旧摊销 | 3.99 | 0.71% | 19.69 | 1.68% | 4.36 | 0.48% | 13.58 | 3.30% | |
差旅费 | 9.94 | 1.77% | 15.74 | 1.35% | 10.63 | 1.17% | 1.58 | 0.38% | |
其他 | 15.55 | 2.77% | 35.50 | 3.04% | 6.24 | 0.69% | 1.50 | 0.37% | |
合计 | 560.77 | 100.00% | 1,169.35 | 100.00% | 906.74 | 100.00% | 411.59 | 100.00% | |
自然语言 | 数据服务费 | 440.63 | 86.82% | 368.27 | 76.32% | 374.41 | 75.64% | 216.12 | 65.67% |
职工薪酬 | 66.30 | 13.06% | 112.05 | 23.22% | 115.93 | 23.42% | 99.95 | 30.37% | |
折旧摊销 | 0.26 | 0.05% | 0.63 | 0.13% | 1.52 | 0.31% | 4.01 | 1.22% | |
差旅费 | 0.12 | 0.02% | 1.21 | 0.25% | 0.36 | 0.07% | 2.35 | 0.72% | |
其他 | 0.21 | 0.04% | 0.38 | 0.08% | 2.75 | 0.55% | 6.69 | 2.03% | |
合计 | 507.52 | 100.00% | 482.53 | 100.00% | 494.96 | 100.00% | 329.13 | 100.00% |
由上表可以看出,公司各应用领域的训练数据定制服务成本构成与训练数据定制服务总体成本构成基本一致,主要为数据服务费和职工薪酬,其中各应用领域各期数据服务费占比均在65%以上,是最重要的构成部分。
8-2-1-190
一、智能语音领域
(一)数据服务费变动分析
报告期内,发行人智能语音领域训练数据定制服务成本中的数据服务费具体情况如下:
成本项目 | 单位 | 2020年1-9月 | 2019年度 | ||||
数量 | 单价(元) | 金额(元) | 数量 | 单价(元) | 金额(元) | ||
采集 | 人 | 18,638 | 141.45 | 2,636,406 | 21,680 | 208.17 | 4,513,130 |
字/词 | 13,174,501 | 0.54 | 7,065,546 | 16,812,923 | 0.63 | 10,519,499 | |
标注 | 小时 | 901,545 | 19.99 | 18,025,975 | 1,139,448 | 20.72 | 23,608,395 |
成本项目 | 单位 | 2018年度 | 2017年度 | ||||
数量 | 单价(元) | 金额(元) | 数量 | 单价(元) | 金额(元) | ||
采集 | 人 | 43,895 | 174.99 | 7,681,443 | 28,458 | 137.54 | 3,914,176 |
字/词 | 14,327,056 | 0.53 | 7,539,168 | 10,138,911 | 0.36 | 3,645,430 | |
标注 | 小时 | 1,381,279 | 19.21 | 26,535,366 | 670,046 | 17.86 | 11,966,256 |
由于发行人训练数据定制服务“以销定采”的业务逻辑,上述采集数据量和标注数据量与销量相匹配,用于衡量采集数据量、标注有效工时相对水平的采产比和标产比合理,具体分析请参见本问询函回复问题10.1“发行人说明事项/(6)采集数据量、标注数据量和标产比相关的确定方法和具体依据,是否存在随意修改或调整的情形,同类型项目的采集数据量、标注数据量和标产比是否存在差异并分析具体原因/二、同类型项目的采集数据量、标注数据量和标产比的差异情况及原因分析”。
上述以“人”为单位的采集单价在2017-2019年逐年上升,主要是由于:(1)采集类型由相对简单的读文本向相对复杂的自由对话转变,采集难度提升;(2)语种向多元化方向拓展,中文逐步由普通话拓展到方言,外语种逐步由常见语种拓展到稀有语种,资源稀缺度提升。采集单价在2020年1-9月下降,主要是由于当期完成了部分较为简单的中文项目,例如中文唤醒词项目等,因此采集单价较低。
上述以“字/词”为单位的采集单价在报告期内单价较为稳定,整体略呈上升趋势,主要是因为各期执行项目对发音人的要求逐步细化提升、领域拓展逐步多样化。
上述标注单价在报告期内较为稳定,逐年略有变动主要是由于语种拓展、标注精细度提高、以及对标注人员能力要求的变化等因素所带来的标注难度的变化造成的。
(二)职工薪酬变动分析
8-2-1-191
发行人智能语音领域训练数据定制服务成本中的职工薪酬变动情况,与发行人营业成本中的职工薪酬变动情况基本一致,具体请参见本问题“发行人说明事项/(2)计入主营业务成本的人员部门、员工数量及其变动和人均薪酬,相关人员的具体职责以及在相关项目中的具体作用,人均薪酬与同行业可比公司的对比情况”。
(三)差旅费变动分析
报告期内,发行人智能语音领域训练数据定制服务成本中的差旅费与项目数量的对应关系如下:
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
差旅费(万元) | 5.49 | 24.80 | 32.97 | 32.47 |
差旅项目数量(个) | 19 | 49 | 35 | 33 |
单个差旅项目平均差旅费(万元) | 0.29 | 0.51 | 0.94 | 0.98 |
由于发行人项目执行范围涉及全国和境外部分国家和地区,对于采集要求较为复杂或采集场景、地区等较新的项目,项目负责人需要出差到现场进行监督、指导和沟通。2017年和2018年单个差旅项目平均差旅费较为接近,2019年单个差旅项目平均差旅费较低的原因是大部分差旅项目规模较小,同时远程沟通方式有效性增强,使得差旅周期缩短,因此费用较低,2020年1-9月受疫情影响,差旅项目很少且差旅周期很短,费用较低。
(四)成本结构变动分析
对于智能语音领域,2017年和2018年成本构成无明显变动;2019年数据服务费占比下降而职工薪酬占比上升,主要原因是:语音识别类业务收入下降,语音合成类业务收入虽然上升但其毛利率较高,综合导致营业成本中的数据服务费有所下降;同时项目数量上升使得发行人人工投入增长,且发行人持续看好智能语音领域业务的发展前景,在行业竞争加剧、业务规模未显著增长的情况下进行了必要的项目人才储备,并提升人均薪酬增强竞争力,以充分把握未来的业务机会,导致人工投入持续增长。2020年1-9月数据服务费占比上升而职工薪酬占比下降,主要原因是当期完成验收的训练数据定制服务项目成本的职工薪酬中不包括年终奖金,因此职工薪酬相对较低,拉升了数据服务费的占比。
二、计算机视觉和自然语言领域
8-2-1-192
报告期内,发行人计算机视觉和自然语言领域训练数据定制服务成本中的数据服务费与其收入规模基本保持了一致趋势,符合“以销定采”的业务逻辑,其中自然语言领域2019年由于稀有语种词典项目增多,毛利率提升,因此较2018年训练数据定制服务成本中的数据服务费基本持平而收入规模有所增长。对于计算机视觉领域,报告期内成本构成无明显变动。对于自然语言领域,报告期内数据服务费占比逐年上升而职工薪酬占比逐年下降,主要原因是该领域出于自身特点,项目规模普遍偏小,人工投入占比较高,在报告期内随着公司在该领域的深耕与拓展,单个项目规模呈现上升趋势,公司人工投入逐渐形成规模效应,使得职工薪酬占比下降。发行人说明事项
(1)定制服务成本和研发费用的核算流程和结转方法,相关费用和人工的归集和分配方式,是否符合企业会计准则的规定;
一、训练数据定制服务业务的成本核算流程和结转方法
报告期内,发行人训练数据定制服务的各项支出,包括职工薪酬、数据服务费、折旧与摊销等,均按照所属项目在“制造费用”中进行归集与核算。在项目分批验收或一次全部验收并相应确认收入后,将该项目归集的项目成本中与确认的收入对应的部分,由制造费用结转至营业成本。
按项目归集成本:发行人严格按照项目为单位进行成本归集,在项目执行之前,每个项目需要编制项目预算,根据训练数据定制服务的具体内容,对项目所需人员及每人投入工时等直接人工内容,采集人数、采集单价、标注工时、标注单价等数据服务采购内容,折旧与摊销、租赁等项目所需场地、设备内容,差旅、交通、办公等其他项目相关支出内容制定详细预算。项目执行过程中,所有支出填写和报销均比照预算类型执行,对预算变更、未及预算、超预算等情况设定完整的审批流程,并制定了严格的项目决算要求,在项目申请决算前,所有支出必须填写和报销完毕,经专人审核后进行项目决算。决算后,项目不允许发生额外支出。通过以上内部控制手段,保证每笔支出均可以按项目准确、完整归集。
成本结转:具体表现为两种情形,一种是在项目分批验收并确认收入的情况下,在每次验收并确认收入的同时,按照已经验收的服务量占服务总量的比例乘以预计项目总成本并扣除以前期间累计已结转成本后的金额来结转当期营业成本;另一种是在项目一次全部验收并确认收入的情况下,直接进行项目决算,按照实际发生和归集的项目总成
8-2-1-193
本全部结转至营业成本。制造费用中未结转至营业成本的部分,在财务报表中列示和披露为“存货-在产品”。报告期内,各相关费用和人工成本在各个项目上的归集和分配的方法如下:
(一)职工薪酬
职工薪酬按照工时积分制归集到各个项目。每月业务人员按其实际工作情况将工时积分填写到相应定制服务项目上,每人每月填写至所有项目(包括定制服务项目和训练数据产品开发项目等)的工时积分共计为8分/日*月工作日。各个项目应分摊的人工成本的计算方式为:各业务人员填写在该项目的积分*该人员所属级别的人工成本单价=该项目的人工支出。
(二)数据服务费
数据服务费指训练数据定制服务项目所需的原料数据采集与标注服务采购支出,业务人员按项目实际发生情况进行支出申请和报销。在进行支出申请和报销时,必须填报项目编号、涉及环节、采购量、采购单价、报销金额、供应商名称等关键信息,保证发生额直接归集到单个项目上,不得与其他项目存在交叉。因此数据服务费支出根据上述项目编号信息直接归集和分配至各个项目上。
(三)折旧与摊销
对于各项目使用的设备和软件的折旧和摊销费用,按各项目领用该设备、使用该软件时间的长短,由系统自动计算在各个项目上的分摊金额。计算方式为:项目折旧与摊销支出=项目领用天数/365天*设备全年折旧额或无形资产全年摊销额。
(四)差旅费等其他费用
差旅费等其他费用按项目实际发生情况报销,在报销时,必须选择项目编号及费用类别,费用发生额直接归集到单个项目上,不得与其他项目存在交叉。因此差旅费等其他费用支出也是根据项目编号信息直接归集和分配至各个项目上。
报告期内,发行人的定制服务发生的相关支出已经在相关项目中进行了适当的归集和分摊,采用了适当的方法进行成本结转,符合企业会计准则的规定。在2017年、2018年和2019年的报告期内,发行人执行财政部于2006年颁布的《企业会计准则第14号——收入》,根据该准则的规定,发行人采用完工百分比法确认收入,成本结转也应该“按照提供劳务估计总成本乘以完工进度扣除以前会计期间累计已确认劳务成本后的金额,结转当期劳务成本”,发行人的上述成本结转方法按照已验收服务量占服务总量
8-2-1-194
的比例来结转预计项目总成本,因此也反映了已验收的单位定制化训练数据的成本,与确认的收入金额相配比,发行人的上述成本结转方法符合该准则的规定。在2020年1-9月的报告期内,发行人执行财政部于2017年颁布的《企业会计准则第14号——收入(修订) 》的规定,根据该准则的规定,发行人将训练数据定制服务的合同或订单拆分为若干个履约义务,其中每一个单位定制化训练数据构成一个履约义务,并在提交单位定制化训练数据并经客户验收的时点确认收入,并应同时结转确认与该完成的履约义务相关的成本支出,符合企业会计准则的规定。
二、研发费用的核算流程和结转方法
报告期内,研发费用由训练数据产品开发支出及基础研发支出两部分构成。训练数据产品开发支出为发行人开发训练数据产品发生的各项支出,包括职工薪酬、数据服务费、折旧与摊销等,各项支出均按照所属项目在“研发费用–数据库产品开发”中进行明细核算。基础研发支出为公司研究开发训练数据开发生产所需的算法、技术以及工具、平台等的各项支出,包括职工薪酬、语言研究支出、折旧与摊销等,各项支出在“研发费用–基础研发支出”中进行明细核算。当期实际发生的研发费用各项支出均已计入当年/期的利润表“研发费用”科目予以反映。研发费用的相关费用和人工成本的归集和分配的方法如下:
(一)职工薪酬
参与训练数据产品开发的数据业务中心人员按照工时积分制将职工薪酬归集到各训练数据产品开发的项目中。每月业务人员按其实际工作情况将工时积分填写到相应训练数据产品开发项目上,每人每月填写至所有项目(包括定制服务项目和训练数据产品开发项目等)的工时积分共计为8分/日*月工作日。各个项目应分摊的人工成本的计算方式为:各业务人员填写在该项目的积分*该人员所属级别的人工成本单价=该项目的人工支出。
研发中心的人员按照各自的基础研发项目安排,将其薪酬直接、全部归集至基础研发支出。
(二)数据服务费
数据服务费与训练数据产品开发相关的原料数据采集与标注服务的采购支出。业务人员按项目实际发生情况进行支出申请和报销。在进行支出申请和报销时,必须填报项目编号、涉及环节、采购量、采购单价、报销金额、供应商名称等关键信息,保证发生额直接归集到单个项目上,不得与其他项目存在交叉。
8-2-1-195
(三)语言研究支出
语言研究支出与基础研发相关,主要是根据研发项目的需求聘请外部语言学家协助进行语言学基础研究所发生的费用。其发生额直接归集至基础研发支出。
(四)折旧与摊销
对于训练数据产品开发项目中使用的设备和软件的折旧和摊销费用,按各项目领用该设备、使用该软件时间的长短,由系统自动计算在各个项目上的分摊金额。计算方式为:项目折旧与摊销支出=项目领用天数/365天*设备全年折旧额或无形资产全年摊销额。对于基础研发活动中使用的设备和软件,将其折旧和摊销费用直接归集至基础研发支出。
(五)差旅费等其他费用
对于训练数据产品开发项目上发生差旅费等其他费用,按项目实际发生情况报销,在报销时,必须选择项目编号及费用类别,费用发生额直接归集到单个项目上,不得与其他项目存在交叉。对于基础研发活动中发生的差旅费等其他费用则直接归集至基础研发支出。
报告期内,发行人的研发费用在项目间进行了适当的归集和分摊,并且全部计入当期成本费用。根据《企业会计准则第6号——无形资产》的规定,企业内部研究开发项目研究阶段的支出,应当于发生时计入当期损益,企业内部研究开发项目开发阶段的支出,在满足条件的情况下才能确认为无形资产。基于谨慎性原则,发行人将报告期内的研发支出全部费用化并计入当期损益,相关会计政策和软件行业的同行业公司会计政策一致。
三、针对职工薪酬、数据服务费、折旧与摊销等训练数据定制服务、训练数据库产品开发均会发生的支出类型,不存在成本和研发费用划分不当的情形
发行人的训练数据定制服务、训练数据库产品开发均为项目制管理,每个项目立项之初,即需在业务管理平台中选择项目类型,每个项目只能选择一个类型,选择训练数据定制服务的项目,支出归集入“制造费用”,并按前述原则结转计入“主营业务成本”;选择训练数据产品开发的项目,支出归集入“研发费用”。因此不会出现训练数据定制服务和训练数据库产品开发共享一个项目的情形,相应的,两者的支出不会出现划分不当的情形。
8-2-1-196
(2)计入主营业务成本的人员部门、员工数量及其变动和人均薪酬,相关人员的具体职责以及在相关项目中的具体作用,人均薪酬与同行业可比公司的对比情况。报告期内,发行人主营业务成本中的薪酬情况如下:
类型 | 项目 | 单位 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
与主营业务成本相关 | 薪酬总额 | 万元 | 454.58 | 1,185.95 | 971.87 | 537.23 |
员工数量 | 人 | 23.25 | 40.41 | 35.02 | 26.52 | |
人均薪酬 | 万元/人 | 19.55 | 29.35 | 27.75 | 20.26 |
注1:计入主营业务成本中的员工数量按照训练数据定制服务项目在当期结转确认的成本金额中所对应的数据中心员工的项目工时占全年总工时的比例加总计算得出。
注2:人均薪酬反映当期确认成本的项目对应的数据中心员工,在项目周期覆盖的年度内的年化薪酬按项目工时进行加权平均计算后的年化薪酬。
报告期内,发行人计入主营业务成本核算的人员部门为数据业务中心。数据业务中心的主要职责为负责训练数据定制服务项目以及训练数据产品开发项目的需求分析、方案确定、预算制定、项目实施与监控、项目验收及项目决算等项目全流程的管控工作。数据业务中心按照业务领域下设语音识别采集业务部、语音识别转写业务部、语音合成业务部、计算机视觉业务部及自然语言处理业务部。各业务部门具体负责其相关业务领域下的项目管控工作。数据业务中心的员工由于同时负责训练数据产品开发项目和训练数据定制服务项目,因此在计算报告期各年/期间员工数量时,按照训练数据定制服务项目在当期结转确认的成本金额中所对应的数据中心员工的项目工时占全年总工时的比例加总计算得出,同时由于2020年1-9月验收决算的训练数据定制服务的项目较其他年度相比较少,因此2020年1-9月计入主营业务成本的员工人数较低。报告期内,发行人计入主营业务成本中的员工人均薪酬分别为 20.26 万元、27.75万元、29.35万元和19.55万元,除2020年1-9月外,员工数量、人均薪酬均呈现逐年增长的态势,这与公司收入和业务规模的增长态势较为吻合。
2020年1-9月的计入主营业务成本的人均薪酬为19.55万元,与2019年度相比金额较低,主要是由于2020年验收的训练数据定制服务项目以语音转写等短期项目为主,人工成本主要发生在2020年1-9月,而该期间的职工薪酬中不含年终奖,因此导致2020年1-9月计入主营业务成本的人均薪酬较低。
8-2-1-197
报告期内,同行业可比公司年报未直接披露计入主营业务成本的职工薪酬和员工人数,因此计算同行业可比公司的整体的人均薪酬。将发行人计入主营业务成本的人均薪酬与其进行对比,结果如下:
单位:万元
公司名称 | 2019年 | 2018年 | 2017年 |
荣科科技 | 22.26 | 19.04 | 18.68 |
彩讯股份 | 15.89 | 16.66 | 16.52 |
天玑科技 | 20.95 | 20.62 | 19.42 |
四方精创 | 18.70 | 18.25 | 15.31 |
恒生电子 | 28.78 | 26.82 | 24.56 |
用友网络 | 26.12 | 27.25 | 23.75 |
万兴科技 | 32.27 | 31.56 | 30.80 |
泛微网络 | 23.46 | 20.97 | 21.66 |
平均值 | 23.55 | 22.65 | 21.34 |
海天瑞声 | 29.35 | 27.75 | 20.26 |
注1:以上同行业可比公司年报未直接披露计入主营业务成本的职工薪酬和员工人数,因此按照年报中披露的职工薪酬总额除以披露的总员工人数计算同行业整体的人均薪酬。
注2:2020年1-9月无公开可比公司薪酬数据。如上表所示,报告期内发行人计入主营业务成本中的人均薪酬,与同行业可比公司整体的人均薪酬相比,2017年基本持平,2018年和2019年较高,主要是由于公司处于软件和信息技术服务业中成长性较高的人工智能板块,业务人员获得的平均薪酬逐年增长且高于所属行业整体平均薪酬水平,较为合理。会计师核查事项申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于营业成本可能导致的重大错报风险,执行的主要程序如下:
1、询问相关人员以了解公司的训练数据定制服务成本和研发费用相关的业务流程和会计核算方法;
2、了解和评价与训练数据定制服务成本和研发费用核算、归集、结转相关的关键财务报告内部控制的设计和运行有效性;
8-2-1-198
3、获取报告期内发行人制造费用和研发费用明细,检查计算准确性;并与明细账、总账及财务报表合计数核对一致;
4、复核训练数据定制服务成本倒轧表,了解成本构成,并分析其合理性;
5、对于训练数据定制服务成本和训练数据产品开发支出,获取报告期内业务管理平台导出的训练数据定制服务成本和训练数据产品开发的项目明细及其支出明细,检查项目的各项支出是否与对应项目相关;
6、对于基础研发支出,获取报告期内基础研发项目的支出明细台账,检查计入基础研发的各项支出是否与基础研发项目相关,同时检查相关支出归集为基础研发支出的支持性证据;
7、分析训练数据定制服务成本和研发费用的构成,检查是否存在异常或变动幅度较大的情况,分析其合理性;
8、对训练数据定制服务成本和研发费用的各项费用明细进行测试,包括抽样检查各项费用支出的支持性依据,并执行费用支出的截止性测试;
9、获取发行人员工花名册及公司组织架构图,了解计入主营业务成本的人员部门构成、人数、薪资构成等要素,与计入主营业务成本的人员进行核对;
10、对主营业务成本中的职工薪酬与员工人数进行对比分析,计算人均薪酬,并分析在报告期内的波动是否合理;
11、查阅同行业上市公司公开信息,将公司计入主营业务成本的人均薪酬与同行业上市公司人均薪酬相比,分析是否合理;
12、根据员工花名册、具体岗位职责、薪酬明细表等情况,对职工薪酬的计提和成本费用分配情况进行了检查;
13、选取工资支付明细与工资计提情况和支付的银行流水进行核对。基于我们所执行的审计和核查程序,申报会计师认为:
1、训练数据定制服务的成本构成及各类别成本构成变动原因合理;
2、训练数据定制服务成本和研发费用的核算流程和结转方法,相关费用和人工的归集和分配方式符合企业会计准则的规定;
3、计入主营业务成本的人员的人均薪酬逐年增长且高于所属行业整体平均薪酬水平,较为合理。
8-2-1-199
15.关于毛利率
报告期各期,发行人综合毛利率为72.26%、64.77%和70.25%,毛利率先减后增,主要是训练数据资源定制服务的毛利率波动所致。请发行人补充披露:(1)语音识别采集毛利率下降的原因,语音合成毛利率显著高于其他两类的原因;(2)计算机视觉毛利率逐年下降的原因;(3)自然语言毛利率波动较大的原因。
请发行人说明:结合主要项目的收入和成本构成,说明报告期各期主要训练数据资源定制服务前五大客户的毛利率情况及变动原因。
请申报会计师对上述事项进行核查并发表明确意见。
答复:
发行人补充披露事项
(1)语音识别采集毛利率下降的原因,语音合成毛利率显著高于其他两类的原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(三)毛利及毛利率分析/2、毛利率情况分析”中进行了补充披露:
语音识别采集的毛利率2018年、2019年和2020年1-9月较2017年有所下降。2017年毛利率较高的主要原因是由于行业下游各大公司在当年普遍加大投入,开发符合自身定位的智能音箱产品,产生了较多基于特殊设备的数据需求;除智能音箱外,部分客户还针对其机器人、车机等专有设备进行语音交互技术的研发,需要发行人为其提供专有设备数据。上述需求定制化程度较高,毛利率普遍高于一般水平,该等业务的毛利率水平如下:
特定业务 | 毛利率 | 收入占比 |
智能音箱定制设备 | 59.20% | 25.90% |
机器人定制设备 | 48.79% | 16.57% |
车机定制设备 | 53.57% | 7.74% |
扣除特殊项目后的语音识别采集业务 | 42.88% | 49.78% |
8-2-1-200
扣除该等特殊项目影响后,语音识别采集2017年毛利率为42.88%,与2018年和2019年毛利率接近。2018年开始随着下游语音识别产品及应用的广泛落地,及市场竞争者的增多,定制化程度高成为普遍需求,对公司毛利率不再有显著提升的效果。
2020年1-9月,公司承接的语音识别采集项目中,中文项目占比较高,且由于部分中文项目难度较低、市场竞争激烈,导致毛利率偏低,因此2020年1-9月语音识别采集毛利率略低于2019年。
语音合成业务涉及到高素质发音人及音素、韵律、词性等多种标注类型,相对复杂度较高,所需技术处理环节较多,因此毛利率相对高于语音识别采集业务和语音识别转写业务。语音合成的毛利率在2017-2019年较为稳定,2020年1-9月有所下降的原因一方面是当期外语种项目占比有所降低,而外语种项目毛利率普遍高于中文项目,另一方面是当期个别主要客户的项目类型较为新颖,如歌曲类、表达丰富类语音合成业务,对发音人及录音环境要求高,采集难度较大,成本偏高,因此毛利率偏低。
(2)计算机视觉毛利率逐年下降的原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(三)毛利及毛利率分析/2、毛利率情况分析”中进行了补充披露:
由于发行人在报告期内逐步调整计算机视觉类业务价格策略,适度降低毛利空间,以获取更多与客户合作的机会,从而在计算机视觉领域树立良好的口碑和品牌形象,为未来的深入拓展奠定基础,因此该类业务的毛利率在2017-2019年呈现逐年下降趋势。
计算机视觉领域细分类别报告期内的收入占比及毛利率情况如下:
细分类别 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
毛利率 | 收入占比 | 毛利率 | 收入占比 | 毛利率 | 收入占比 | 毛利率 | 收入占比 | |
手写体 | 57.34% | 40.79% | 48.19% | 38.51% | 40.02% | 8.13% | 57.92% | 58.38% |
光学字符识别 | 52.36% | 27.26% | 53.02% | 21.87% | 57.39% | 18.51% | 42.73% | 7.79% |
行车相关视频 | 38.05% | 1.32% | 36.26% | 19.57% | 41.30% | 33.97% | 24.53% | 0.49% |
就细分业务类别具体而言,手写体业务在2018年和2019年主要为中英文滑行输入法项目,相较于手写数据采集,滑行输入相对简单,因此发行人降低了报价,使毛利率较2017年有所下降;行车相关视频业务在2019年部分客户的订单竞争激烈,发行人通过较低报价争取业务机会;光学字符识别在2017年收入贡献较小,2018年和2019年毛利率基本稳定。
8-2-1-201
2020年1-9月,发行人计算机视觉类训练数据定制服务主要集中在手写体及光学字符识别项目,其中手写体涉及多国家、多地区繁体中文、简体中文手写体采集项目,对被采集人年龄、性别、学历、设备使用经验以及采集场地等均有要求,且为华语项目,发行人议价能力较强;光学字符识别涉及主要为实况图片采集项目,客户指定采集设备与图片类别,采集难度大,后期需质检图片多项内容信息,质检流程复杂。上述两类项目由于较为复杂、要求较高,且发行人在行业内具备一定的竞争优势,因此毛利率较高,提升了计算机视觉类训练数据定制服务的整体毛利率。
(3)自然语言毛利率波动较大的原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(三)毛利及毛利率分析/2、毛利率情况分析”中进行了补充披露:
由于自然语言类业务包含的细分项目类型较多,如语义理解、特定领域文本采集、发音词典、机器翻译、相关性标注等众多类型,同时自然语言类训练数据定制服务在报告期内整体业务规模较小,而项目个数则较多,因此毛利率受单个项目需求差异化特征影响,在报告期内呈现上下波动的情况。
自然语言类业务中,发音词典业务是毛利率较高的业务,该类发音词典项目主要解决发音与文本对应关系与规则的问题,需要较强的语音语言学研究基础,由于行业内能够处理该类语言数据的企业较少,而发行人经过多年积累,拥有多语种数据处理能力,较高的资源稀缺性使得该类项目毛利率较高,进而提升了自然语言类业务整体毛利率水平。2019年,随着外语种拓展的整体趋势,公司词典业务需求增加显著,且拓展到亚洲及欧洲的小语种,相继完成了印尼语、塔加路语、僧伽罗语、阿塞拜疆语等亚洲小语种,及巴西葡萄牙语、阿根廷西班牙语等欧洲语种的词典数据开发和销售,该类语种稀缺性高,市场同类竞品较少,因此毛利率较高。
上述外语种及方言词典业务的毛利率水平如下:
特定业务 | 年度 | 毛利率 | 收入占比 |
外语种及方言词典业务 | 2019年度 | 89.59% | 34.03% |
2018年度 | 65.12% | 3.07% | |
2017年度 | 58.48% | 14.82% | |
扣除特殊项目后的自然语言类业务 | 2019年度 | 44.62% | 65.97% |
2018年度 | 38.15% | 96.93% | |
2017年度 | 40.70% | 85.18% |
8-2-1-202
由上表可以看出,特殊词典业务毛利率随着项目具体执行情况具有较大的波动性。扣除该等特殊项目影响后,自然语言类业务毛利率水平在报告期内稳定在40%左右,波动较小。发行人说明事项
结合主要项目的收入和成本构成,说明报告期各期主要训练数据资源定制服务前五大客户的毛利率情况及变动原因
报告期内,发行人训练数据资源定制服务前五大客户的毛利率情况如下:
客户 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
前五大客户合计 | 37.48% | 56.45% | 48.21% | 49.21% |
发行人训练数据资源定制服务前五大客户的毛利率在2017年和2018年较为接近,2019年明显上升,2020年1-9月明显下降,主要有以下两方面原因:
第一,发行人某客户2019年收入在前五大客户收入占比中明显提升,2020年1-9月收入较少,未进入前五大客户,由于该客户主要涉及语音合成业务,毛利率较高,因此相应提升了2019年前五大客户整体毛利率,降低了2020年1-9月前五大客户整体毛利率;
第二,2020年1-9月前五大客户中部分客户由于项目难度较高使得成本偏高,或由于新签框架协议后销售价格下降,降低了2020年1-9月前五大客户整体毛利率。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,除上述第13题有关收入以及第14题有关成本的核查程序以外,申报会计师对发行人毛利率进行核查,执行的主要程序如下:
1、获取发行人报告期内收入成本明细表,对各主要类别产品和服务的销售收入、销售成本、产品结构、毛利率等明细及其变化进行分析;查阅并取得发行人与主要客户签订的合同,分析发行人训练数据定制服务前五大客户的销售收入、毛利率及变动趋势;
2、访谈发行人销售部门负责人,了解发行人主要客户需求、行业竞争因素、销售价格调整情况等,将了解的情况与收入成本明细表及分析情况进行比对;
3、对报告期内的主要客户进行实地走访或视频访谈,了解其和发行人之间的合作历史、合作模式、业务往来的发展情况。
8-2-1-203
基于我们执行的审计和核查程序,申报会计师认为:
1、发行人语音识别采集毛利率下降、语音合成毛利率显著高于其他两类、计算机视觉毛利率逐年下降、自然语言毛利率波动较大,具备合理原因;
2、报告期内,发行人主要训练数据定制服务前五大客户的毛利率变动存在合理原因。
16.关于期间费用
16.1关于销售费用
报告期各期,公司销售费用分别为741.50万元、874.48万元和925.28万元,销售费用率分别为6.23%、4.54%和3.89%。
请发行人补充披露:结合销售人员的主要职责,分析定制服务项目数量和训练数据产品销售数量与人员数量的匹配关系。
请发行人说明:报告期各期计入销售费用的人员部门构成、员工人数、人均薪酬,相关人员的绩效考核指标以及完成情况,人均薪酬是否与同行业可比公司存在显著差异,是否与营业收入增长匹配。
请申报会计师对上述事项进行核查并发表明确意见。
答复:
发行人补充披露事项
结合销售人员的主要职责,分析定制服务项目数量和训练数据产品销售数量与人员数量的匹配关系。
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(四)期间费用分析/1、销售费用分析”中进行了补充披露:
基于发行人所属行业专业化强、高速发展、客户定制服务需求种类日益丰富等特征,发行人对销售人员素质和能力要求较高,其主要职责为结合行业发展趋势、客户需求及公司特点,为客户提供高附加值的顾问式销售服务,提升公司在AI基础数据服务领域的口碑。具体包括:熟悉市场趋势、客户需求、发行人的产品与服务的技术特点等,通过行业会议、展会宣传、网络信息宣传等多种途径与客户初步建立合作关系;基于已有经验帮助客户细化需求,并将需求及时、准确的反馈给公司管理和技术人员,协助制定
8-2-1-204
基本解决方案;对整体合同的工期、内容和报价等与客户进行协商、完成合作协议的签署;持续跟进和维护客户长期合作关系等。报告期内,训练数据定制服务、训练数据产品等相关的合同数量与销售人员数量的情况如下表所示:
各期签订合同数量 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
合同数量 | 636 | 390 | 341 | 303 |
销售人员数量 | 15.76 | 12.18 | 11.25 | 8.42 |
销售人员人均合同数量 | 40 | 32 | 30 | 36 |
注:销售人员数量是按照当年/期营销中心各月份员工的在职情况计算的平均值。
报告期内,发行人的合同数量呈逐年上升的趋势,同时发行人的销售人员平均人数也逐年上涨,趋势相匹配,销售人员年人均合同数量基本维持在30-40个之间。发行人说明事项
报告期各期计入销售费用的人员部门构成、员工人数、人均薪酬,相关人员的绩效考核指标以及完成情况,人均薪酬是否与同行业可比公司存在显著差异,是否与营业收入增长匹配。
一、报告期各期计入销售费用的人员部门构成、员工人数、人均薪酬
报告期内,发行人将营销中心部门员工的薪酬归集到销售费用的职工薪酬中。销售费用中的职工薪酬的构成明细如下:
单位:万元
项目 | 2020 年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
工资 | 298.82 | 47.50% | 293.28 | 35.30% | 279.74 | 36.46% | 184.60 | 27.65% |
奖金 | 229.42 | 36.47% | 403.93 | 48.62% | 375.97 | 49.00% | 415.10 | 62.17% |
社保费用 | 57.58 | 9.15% | 88.27 | 10.63% | 79.32 | 10.34% | 64.19 | 9.61% |
小计 | 585.82 | 93.12% | 785.48 | 94.55% | 735.03 | 95.80% | 663.89 | 99.43% |
劳务费 | 43.26 | 6.88% | 45.25 | 5.45% | 32.20 | 4.20% | 3.82 | 0.57% |
合计 | 629.08 | 100.00% | 830.73 | 100.00% | 767.23 | 100.00% | 667.71 | 100.00% |
报告期内,销售费用中的职工薪酬(不含劳务费)、销售人员的员工人数及人均薪酬情况如下:
8-2-1-205
类型 | 项目 | 单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
与销售费用相关 | 职工薪酬(不含劳务费) | 万元 | 585.82 | 785.48 | 735.03 | 663.89 |
员工人数 | 人 | 15.76 | 12.18 | 11.25 | 8.42 | |
人均薪酬 | 万元/人 | 37.17 | 64.49 | 65.34 | 78.85 | |
剔除奖金后人均薪酬 | 万元/人 | 22.61 | 31.33 | 31.92 | 29.55 |
注 1:职工薪酬为销售费用中的职工薪酬剔除劳务费后的金额;注 2:员工人数为按照当年营销中心各月份员工的在职情况计算的平均值。
报告期内,发行人销售人员平均人数分别为8.42人、11.25人、12.18人及15.76人,逐年递增,但总体而言人数较少。基于发行人的顾问式营销模式,比较依赖于营销人员的素质和能力,而不是数量,因此公司营销团队人员数量相对较少,并匹配了较高的人均薪酬水平。
销售人员薪酬主要有基本工资和销售奖金组成,剔除销售奖金后,2017年至2019年销售人员人均薪酬分别为29.55万元、31.92万元、31.33万元,总体呈稳定增长趋势。总人均薪酬受到奖金变动影响呈现一定的波动,报告期内,销售人员的奖金发放情况主要是由其绩效考核指标的完成情况决定的。具体分析详见下述“二、相关人员的绩效考核指标以及完成情况”。
二、相关人员的绩效考核指标以及完成情况
发行人对销售人员的绩效考核指标主要为营业收入及营业毛利两个指标,并且按照指标完成情况发放销售奖金。销售人员的奖金主要由基础业绩奖金和超额业绩奖金构成。基础业绩奖金主要根据业绩考核指标的完成情况确定和发放,同时2019年起增加了客户及领域拓展力度的考核指标(包括新客户数量及收入贡献率、新领域数量及收入贡献率等);超额业绩奖金则根据实际业绩与预算的完成程度进行评估,如发生显著超额完成预算的情况,参考超额比例发放超额业绩奖金。
报告期内销售人员的绩效考核指标的完成情况如下:
2017年至2019年,发行人的营业收入和营业毛利两项绩效考核指标均逐年增长,因此销售人员的基础业绩奖金也随之增长。另一方面,2019年新增的客户及领域拓展力度的考核指标由于为新的执行要求,实现程度有限,因此拉低了2019年基础奖金的增幅。
8-2-1-206
超额业绩考核方面,在2017年由于通过有效的市场推广,发行人的训练数据产品销售实际业绩大幅超出预算业绩,发行人在2017年发放了较高的超额业绩奖金;在2017年业绩实现基础上,2018年及2019年发行人制定了较高的业绩预算,但未出现显著超额完成的情况,2018年和2019年未发生超额业绩奖金,因此造成了发行人2017年奖金总额高于2018年和2019年的奖金总额,同时也导致2018年和2019年销售人员人均薪酬较2017年下降。2020年前三季度的人均薪酬相比较而言较低,主要是因为未包含年终奖金造成的。
2017年至2020年前三季度,发行人绩效考核指标的完成情况及奖金情况具体如下:
单位:万元
项目 | 2020 年1-9月 | 2019 年 | 2018 年 | 2017 年 | |||
金额 | 同比增幅 | 金额 | 同比增幅 | 金额 | 同比增幅 | 金额 | |
销售人员奖金合计 | 229.42 | 30.83% | 403.93 | 7.44% | 375.97 | -9.43% | 415.10 |
其中:基础业绩奖金 | 229.42 | 30.83% | 403.93 | 7.44% | 375.97 | 58.50% | 237.20 |
超额业绩奖金 | - | - | - | -100.00% | 177.90 | ||
主要考核指标: | |||||||
营业收入 | 14,277.35 | 5.17% | 23,755.81 | 23.31% | 19,265.77 | 61.80% | 11,907.09 |
营业毛利 | 9,860.22 | 5.14% | 16,688.29 | 33.73% | 12,478.99 | 45.04% | 8,603.62 |
客户及领域拓展力度 | 有 | 有 | 无 | 无 |
三、人均薪酬是否与同行业可比公司存在显著差异,是否与营业收入增长匹配
报告期内,销售人员人均薪酬与同行业可比公司比较如下:
单位:万元
公司名称 | 2019年 | 2018年 | 2017年 |
荣科科技 | 36.63 | 28.73 | 23.12 |
彩讯股份 | 37.61 | 32.25 | 35.07 |
天玑科技 | 23.05 | 23.08 | 22.38 |
四方精创 | 21.42 | 16.76 | 21.33 |
恒生电子 | 31.92 | 29.27 | 23.60 |
用友网络 | 39.62 | 42.19 | 34.05 |
万兴科技 | 24.32 | 25.10 | 26.50 |
8-2-1-207
泛微网络 | 19.65 | 16.45 | 18.39 |
平均值 | 29.28 | 26.73 | 25.56 |
海天瑞声 | 64.49 | 65.34 | 78.85 |
注 1:同行业公司销售人员人均薪酬的计算方法,为其年报中披露的销售费用中职工薪酬总额除以销售人员数量;注 2:个别同行业公司某些年度销售人员数量无法准确取得,因此未进行列示,仅就可取得的数据计算了同行业公司销售人员人均薪酬平均值。注 3:2020年1-9月无公开可比公司薪酬数据
2017年至2019年发行人销售人员人均薪酬分别为78.85万元、65.34万元和64.49万元,同期可比公司销售人员人均薪酬平均值为25.56万元、26.73万元和29.28万元,发行人人均薪酬高于所属行业平均水平,主要是由于发行人处于软件和信息技术服务业中成长性和专业性较高的人工智能板块,并且推行和实施顾问式营销模式,对营销人员的专业性要求较高。虽然发行人的销售人员数量较少,但是均具有本科或研究生学历,平均从业年限10年左右,发行人给予了销售人员具备行业竞争力的基本薪酬水平。基于上述原因,发行人销售人员的人均薪酬高于所属行业平均水平较为合理。2017年至2019年发行人的营业收入逐年增长,分别为11,907.09万元、19,265.77万元、23,755.81万元,销售人员的奖金金额在2017年至2019年分别为415.10万元、
375.97万元和403.93万元,扣除2017年发放的超额业绩奖金177.90万元后,2017年至2019年基础业绩奖金金额分别为237.20万元、375.97万元、403.93万元,保持逐年增长,而且除2019年增幅低于营业收入的增幅之外,其他年度的基础业绩奖金增幅与营业收入增幅基本匹配。2019年度基础业绩奖金增幅低于营业收入增幅,主要是由于2019年发行人新增客户及领域拓展力度的考核指标,由于当年该新目标的完成情况有限,因此拉低了2019年基础业绩奖金的增幅。另外,超额业绩奖金主要与是否超额完成当年业绩预算目标有关,由于2017年发行人实现超额完成业绩预算目标,因此发放了超额业绩奖金,而2018年和2019年发行人制定了较高的业绩预算,但未出现显著超额完成的情况,因此2018年和2019年未发放超额业绩奖金。整体来看,发行人的销售人员奖金金额是与营业收入增长相匹配的。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于销售费用-职工薪酬可能导致的重大错报风险,执行的主要程序如下:
1、获取发行人薪酬管理制度、绩效考核政策,并访谈人力资源部门相关人员,了解人事薪酬循环相关流程,并执行了穿行测试和控制测试程序;
8-2-1-208
2、获取发行人员工花名册及公司组织架构图,了解销售费用的人员部门构成、人数、薪资构成等要素,与计入销售费用的人员进行核对;对销售费用中的职工薪酬实施实质性分析程序;分析人员薪酬总额、人均薪酬及其构成在报告期的波动;检查发行人计入销售费用的职工薪酬变动趋势与营业收入的变动趋势的一致性;
3、查阅同行业上市公司公开信息,将公司的销售人员人均薪酬与同行业上市公司销售人员人均薪酬相比,分析是否合理;
4、根据员工花名册、具体岗位职责、薪酬明细表等情况,对职工薪酬的计提和成本费用分配情况进行了检查;
5、选取工资支付明细与工资计提情况和支付的银行流水进行核对。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人训练数据定制服务项目数量和训练数据产品销售数量与销售人员数量相匹配;
2、发行人报告期各期销售费用中的职工薪酬变动情况与营业收入增长相匹配,销售人员人均薪酬与同行业公司的差异符合发行人的实际情况。
16.2关于管理费用
报告期各期,公司管理费用分别为1,866.24万元、2,180.65万元和3,155.96万元,管理费用率分别为15.67%、11.32%和13.28%,主要为职工薪酬、租赁费和中介机构费等。
请发行人补充披露:职工薪酬大幅上升的原因。
请发行人说明:(1)报告期各期计入管理费用的部门构成、员工人数及变动、人均薪酬,相关人员的绩效考核政策及执行情况,人均薪酬是否与同行业可比公司存在显著差异。
请申报会计师核查并发表明确意见。
答复:
发行人补充披露事项
8-2-1-209
报告期内职工薪酬大幅上升的原因以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(四)期间费用分析/2、管理费用分析”中进行了补充披露:
报告期内,发行人管理费用中职工薪酬主要包括发行人管理及行政人员、财务人员薪酬,及董事会会费、劳务费等管理活动相关人员薪酬。董事会会费、劳务费不涉及发行人全职员工,且在职工薪酬中占比较低,对职工薪酬变动不构成显著影响。报告期内职工薪酬大幅上升主要受发行人管理及行政人员、财务人员薪酬总额增长拉动,具体情况如下:
项目 | 单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
薪酬总额(管理及行政人员、财务人员) | 万元 | 927.77 | 1,587.97 | 1,205.39 | 935.79 |
员工人数 | 人 | 42.03 | 37.22 | 31.82 | 29.72 |
人均薪酬 | 万元/人 | 22.07 | 42.66 | 37.88 | 31.49 |
注:员工人数,按照当年计入管理费用核算薪酬的员工按照各年/期间的工时扣除其在服务项目和研发项目中所填列工时后的数量占总工时的比例加总计算。
报告期内,发行人管理费用中管理及行政人员、财务人员的职工薪酬金额分别为
935.79万元、1,205.39万元、1,587.97万元和927.77万元,管理费用相关的平均人数分别为29.72人、31.82人、37.22人和42.03人。除了2020年1-9月由于未包含年度奖金因此职工薪酬较低之外,2017-2019年逐年大幅增长,主要是由于一方面随着公司业务规模的扩张、对内部管理水平要求的提升和上市筹备事宜,管理及行政人员和财务人员数量增加,另一方面管理人员结构中的中层比例上升,且高级管理人员薪酬随公司业绩规模扩大而增长,管理人员平均薪酬有所提高。发行人说明事项
报告期各期计入管理费用的部门构成、员工人数及变动、人均薪酬,相关人员的绩效考核政策及执行情况,人均薪酬是否与同行业可比公司存在显著差异。
一、报告期各期计入管理费用的部门构成
报告期内,发行人主要将董事、监事及高级管理人员、董事会办公室、总裁办公室、财务部、审计部、人力资源部、行政部、采购部的薪酬归集到管理费用的职工薪酬中。
二、报告期各期计入管理费用的员工人数及变动及人均薪酬
报告期内,计入管理费用中的职工薪酬构成明细如下:
8-2-1-210
单位:万元
项目 | 2020 年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
管理及行政人员、财务人员薪酬总额 | 927.77 | 91.67% | 1,587.97 | 92.46% | 1,205.39 | 91.51% | 935.79 | 93.94% |
劳务费 | 84.33 | 8.33% | 98.67 | 5.74% | 81.00 | 6.15% | 60.18 | 6.04% |
董事会会费 | - | - | 30.88 | 1.80% | 30.83 | 2.34% | 0.17 | 0.02% |
合计 | 1,012.10 | 100.00% | 1,717.52 | 100.00% | 1,317.22 | 100.00% | 996.14 | 100.00% |
报告期内,公司管理费用相关的平均人数分别为29.72人、31.82人、37.22人及
42.03人,人数逐年增加,与公司稳步提升内部经营及管理水平的举措相匹配。
报告期内,管理人员中管理及行政人员、财务人员的薪酬总额和人均薪酬情况如下:
类型 | 项目 | 单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
管理及行政人员、财务人员 | 薪酬总额 | 万元 | 927.77 | 1,587.97 | 1,205.39 | 935.79 |
员工人数 | 人 | 42.03 | 37.22 | 31.82 | 29.72 | |
人均薪酬 | 万元/人 | 22.07 | 42.66 | 37.88 | 31.49 |
注1:薪酬总额为管理费用中的职工薪酬,不包括劳务费和董事会会费;注2:员工人数,按照当年计入管理费用核算薪酬的员工按照各年/期间的工时扣除其在服务项目和研发项目中所填列工时后的数量占总工时的比例加总计算。
报告期内,发行人管理费用的人均薪酬分别为31.49万元、37.88万元、42.66万元及22.07万元,除2020年前三季度因不含年终奖导致人均薪酬均偏低以外,报告期内管理费用相关的人均薪酬呈平稳上升趋势。这主要是由于一方面,随着公司业务规模的扩张、对内部管理水平要求的提升和上市筹备事宜,管理及行政人员和财务人员数量增加;另一方面,管理人员结构中的中层比例上升,且高级管理人员薪酬随公司业绩规模扩大而增长,管理人员平均薪酬有所提高。
三、相关人员的绩效考核政策及执行情况
发行人对管理相关人员的绩效考核指标由各岗位的岗位职责及工作目标决定,主要受员工职级、出勤、日常综合表现情况等影响。其中,分为高级管理人员和普通人员进行分别考核:
高级管理人员的考核机制根据发行人《高级管理人员薪酬与考核管理办法》执行,根据高级管理人员分管领域工作计划完成情况发放绩效奖金,根据公司整体业绩情况发
8-2-1-211
放效益奖金,董事会薪酬与考核委员会作为考核方,并将考核结果和奖金金额报董事会审批通过。2017-2019年,高级管理人员的考核均按该制度执行。
普通管理人员按照发行人相关制度规定,每季度结束后两周内,以及最后一个季度考核结束后两周内分别进行季度考核和年度考核,考核指标根据不同部门、不同岗位职责确定,考核流程为员工自评后提交直属领导,直属领导根据被考核人的实际表现进行打分,提交部分分管总审核,经人力资源部及总裁审批后,提交人力资源部备案,作为奖金发放的依据。2017-2019年,普通管理人员均按发行人相关制度执行。
四、人均薪酬与同行业可比公司的比较
报告期内,管理人员人均薪酬与同行业可比公司比较如下:
单位:万元
公司名称 | 2019年 | 2018年 | 2017年 |
荣科科技 | 19.63 | 21.25 | 24.90 |
彩讯股份 | 17.25 | 19.05 | 22.62 |
天玑科技 | 15.99 | 18.28 | 14.39 |
四方精创 | 19.31 | 15.24 | 12.23 |
恒生电子 | 44.81 | 36.67 | 35.71 |
用友网络 | 28.05 | 28.70 | 26.36 |
万兴科技 | 30.38 | 37.78 | 30.27 |
泛微网络 | 69.77 | 60.34 | 54.88 |
平均值 | 30.65 | 29.66 | 27.67 |
海天瑞声 | 42.66 | 37.88 | 31.49 |
注 1:同行业公司管理人员人均薪酬的计算方法,为其年报中披露的管理费用中职工薪酬总额除以管理人员数量;注 2:个别同行业公司某些年度管理人员数量无法准确取得,因此未进行列示,仅就可取得的数据计算了同行业公司管理人员人均薪酬平均值。注3:2020年1-9月无公开可比公司薪酬数据
2017年至2019年发行人管理人员人均薪酬分别为31.49万元、37.88万元和42.66万元,同期软件和信息技术服务业管理人员的人均薪酬分别为27.67万元、29.66万元和30.65万元。发行人人均薪酬高于所属行业平均水平,主要是由于公司处于软件和信息技术服务业中成长性和专业性较高的人工智能板块,因此平均薪酬高于所属行业平均水平较为合理。会计师核查意见
8-2-1-212
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于管理费用-职工薪酬可能导致的重大错报风险,执行的主要程序如下:
1、获取发行人薪酬管理制度、绩效考核政策,并访谈人力资源部门相关人员,了解人事薪酬循环相关流程,并执行了穿行测试和控制测试程序;
2、获取发行人员工花名册及公司组织架构图,了解管理费用的人员部门构成、人数、薪资构成等要素,与计入管理费用的人员进行核对;对管理费用中的职工薪酬实施实质性分析程序;分析人员薪酬总额、人均薪酬及其构成在报告期的波动。
3、查阅同行业上市公司公开信息,将公司的管理人员人均薪酬与同行业上市公司管理人员人均薪酬相比,分析是否合理。
4、根据员工花名册、具体岗位职责、薪酬明细表等情况,对职工薪酬的计提和成本费用分配情况进行了检查;
5、选取工资支付明细与工资计提情况和支付的银行流水进行核对;
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人管理费用中职工薪酬大幅上升具备合理原因,符合发行人的实际情况;
2、发行人管理人员人均薪酬与同行业公司的差异符合发行人的实际情况。
16.3关于研发费用
报告期各期,公司研发费用分别为2,527.99万元、2,734.53万元和4,169.61万元,研发费用率分别为21.23%、14.19%和17.55%。研发费用主要由数据服务费和职工薪酬构成,合计占研发费用的比例分别为90.09%、85.25%和88.83%。
请发行人补充披露:(1)训练数据产品开发和基础研发的费用构成并分析变动原因;(2)报告期各期训练数据产品开发的开展情况,2019年度支出大幅上升的原因;
(3)报告期各期训练数据产品的库存量、新增量和销售量,是否存在将定制服务产生的数据直接或修改后用于训练数据产品的情形。
请发行人说明:(1)报告期各期计入研发费用的部门构成、人员数量及其变动情况,并结合人均薪酬变化分析职工薪酬逐年大幅上升的原因,人均薪酬与同行业可比公司之间是否存在显著差异,发行人如何区分训练数据产品开发和基础研发的人员薪酬支出;(2)报告期发行人向税务机关申请研发费用加计扣除优惠政策的研发费用金额与发行人实际发生的研发费用金额之间的差异并逐项定量分析原因。
8-2-1-213
请申报会计师对上述事项进行核查并发表明确意见,进一步说明:(1)对报告期内发行人的研发投入归集是否准确、相关数据来源及计算是否合规的核查过程及核查结论;(2)对发行人研发相关内控制度是否健全且被有效执行核查过程及核查结论。答复:
发行人补充披露事项
(1)训练数据产品开发和基础研发的费用构成并分析变动原因
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(四)期间费用分析/3、研发费用分析”中进行了补充披露:
报告期内,发行人的研发费用主要由训练数据产品开发支出及基础研发支出两部分构成,训练数据产品开发支出主要为开发训练数据产品相关的人工成本、数据服务费及其他相关费用支出。基础研发支出主要为研究开发训练数据所需的算法、技术以及工具、平台等的人工成本和其他费用支出。报告期内这两类支出的金额及占比如下:
单位:万元
分类 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
训练数据产品开发支出 | 1,628.32 | 56.89% | 2,217.81 | 53.19% | 1,264.60 | 46.25% | 1,455.04 | 57.56% |
基础研发支出 | 1,233.85 | 43.11% | 1,951.79 | 46.81% | 1,469.94 | 53.75% | 1,072.95 | 42.44% |
合计 | 2,862.17 | 100.00% | 4,169.61 | 100.00% | 2,734.53 | 100.00% | 2,527.99 | 100.00% |
一、训练数据产品开发支出
报告期内训练数据产品开发支出的费用构成、金额、占比情况如下:
单位:万元
类别 | 2020 年1-9月 | 2019年 | 2018年 | 2017年 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
职工薪酬 | 224.05 | 13.76% | 320.01 | 14.43% | 225.37 | 17.82% | 204.40 | 14.05% |
数据服务费 | 1,385.19 | 85.06% | 1,844.97 | 83.19% | 957.04 | 75.68% | 1,196.38 | 82.22% |
折旧与摊销 | 10.37 | 0.64% | 19.88 | 0.90% | 15.89 | 1.26% | 25.95 | 1.78% |
8-2-1-214
房租费 | 4.83 | 0.30% | 7.70 | 0.35% | 8.69 | 0.69% | 5.35 | 0.37% |
其他 | 3.88 | 0.24% | 25.24 | 1.14% | 57.60 | 4.55% | 22.96 | 1.58% |
合计 | 1,628.32 | 100.00% | 2,217.81 | 100.00% | 1,264.60 | 100.00% | 1,455.04 | 100.00% |
2017至2019年随着发行人加大训练数据产品开发的力度,巩固在自有知识产权训练数据产品规模性和多样性上的优势,训练数据产品开发总支出及各项费用构成总体呈上升趋势。其中,2018年训练数据产品开发支出各项费用构成出现一定波动,原因如下:(1)2018年数据服务费的金额及占比均有所降低,职工薪酬占比提高,主要是由于2018年发行人在拥有的资源和产能的基础上优先满足客户增加的定制化需求,训练数据产品开发规模的增速有所放缓,导致发行人2018年度投入训练数据产品的开发支出有所减少,发生的数据服务费也随之降低,而由于投入的研发职工薪酬受人均薪酬增长的影响并未同比减少,因此也导致了2018年职工薪酬占比较高;(2)2018年其他支出的占比略高,主要是由于2018年发行人同乐乐创新签订抵债协议,发行人及附属子公司以人民币40万元购买乐乐创新中文女声语音合成数据库的永久使用权和授予第三方使用的权利及相关收益权,发行人应支付的人民币40万元直接冲抵乐乐创新所欠公司债务,乐乐创新向公司开具相应发票,公司将不含税金额人民币37.74万元计入训练数据产品开发支出的其他支出,因此造成了2018年其他支出占比较高。
二、基础研发支出
报告期内基础研发支出的费用构成、金额、占比情况如下:
单位:万元
类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | |
职工薪酬 | 868.17 | 70.36% | 1,538.93 | 78.85% | 1,148.87 | 78.16% | 876.78 | 81.72% |
语言研究 | 106.67 | 8.65% | 182.04 | 9.33% | 175.46 | 11.94% | 166.77 | 15.54% |
折旧与摊销 | 94.55 | 7.66% | 108.25 | 5.55% | 53.96 | 3.67% | 14.62 | 1.36% |
房租费 | 53.80 | 4.36% | 66.63 | 3.41% | 66.63 | 4.53% | - | 0.00% |
其他 | 110.66 | 8.97% | 55.94 | 2.86% | 25.02 | 1.70% | 14.78 | 1.38% |
合计 | 1,233.85 | 100.00% | 1,951.79 | 100.00% | 1,469.94 | 100.00% | 1,072.95 | 100.00% |
报告期内,基础研发支出各项费用构成的变化及原因如下:(1)2020年1-9月职工薪酬占比出现明显降低,主要是由于2020年1-9月职工薪酬中不含年终奖,因此占比降低;(2)语言研究支出占比在报告期内逐年降低,主要是由于随着公司自身在语言学研究方面的积累加强,对外采购语言学专家服务方面的支出在各年间基本稳定,未
8-2-1-215
发生显著增长;(3)折旧与摊销占比在报告期内有所增加,主要是由于各年均有新购入的房产或设备用于从事研发活动,因此导致分摊的折旧费用逐年增加;(4)房租费从2018年开始发生,之后保持稳定,主要是由于公司自2018年开始为研发部门设立专属办公场地并将房租费用在研发费用中进行分摊;(5)其他支出占比在报告期内逐年增长,主要是由于2019年开始专利申请和系统平台升级相关的支出逐年增加,因此导致其他支出占比逐年增长。
(2)报告期各期训练数据产品开发的开展情况,2019年度支出大幅上升的原因以下内容已在招股说明书“第八节 财务会计信息与管理层分析/九、经营成果分析/
(四)期间费用分析/3、研发费用分析”中进行了补充披露:
报告期内,公司持续研发训练数据产品,丰富自身训练数据库资源。报告期内各期处于开发过程中的训练数据产品的个数如下:
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
训练数据产品开发支出(万元) | 1,628.32 | 2,217.81 | 1,264.60 | 1,455.04 |
当期进行开发的训练数据产品个数(注) | 153 | 149 | 112 | 112 |
单位训练数据产品开发支出(万元/个) | 10.64 | 14.88 | 11.29 | 12.99 |
注:当期进行开发的训练数据产品个数为当期有研发支出的训练数据产品个数。
2019年训练数据产品开发支出大幅上升,从2018年的1,264.60万元增长到2,217.81万元,增幅为75%,主要是由于以下两方面原因:一方面是由于下游客户对外语种训练数据产品的需求有所增长,公司准确把握市场趋势,推进了训练数据产品储备,2019年进行开发的训练数据产品个数明显增长,从112个增长至149个,增幅达33%;另一方面是由于2019年训练数据产品的增长主要是来源于外语种智能语音训练数据产品,这类产品需要由母语发音人进行录音,且标注难度较高,相关数据服务费用支出较一般产品更高,因此2019年的单位训练数据产品开发支出也有明显增长,进一步导致了训练数据产品开发支出的大幅上升。
2020年1-9月,公司继续推进训练数据产品储备,进行开发的训练数据产品个数进一步增长,达到153个,已超过2019年全年开发数量。
(3)报告期各期训练数据产品的库存量、新增量和销售量,是否存在将定制服务产生的数据直接或修改后用于训练数据产品的情形
以下内容已在招股说明书“第六节 业务与技术/三、销售情况和主要客户/(一)报告期内销售情况/3、训练数据产品销售情况”中进行了补充披露:
8-2-1-216
报告期内,发行人各期间训练数据产品的库存量、新增量和销售量如下:
单位:个数/次数
类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
期末 / 年末库存量(个数) | 699 | 619 | 516 | 465 |
新增量(个数) | 80 | 103 | 51 | 87 |
销售量(个数) | 264 | 293 | 183 | 166 |
销售量(授权次数) | 352 | 414 | 265 | 263 |
报告期内,发行人不存在将定制服务产生的数据直接或修改后用于训练数据产品的情形。训练数据定制服务为发行人根据客户的个性化要求,为客户量体裁衣地提供定制化训练数据集的设计及开发服务,训练数据定制服务所形成的训练数据所有权在销售时已经转移至客户,公司不再拥有该等训练数据的所有权,并且根据公司内部相关业务制度,由专人在有效期截止日清除训练数据定制服务已交付的业务数据,有效期需要根据合同约定确定,合同中无明确约定的,有效期为6个月。发行人严格执行上述规定,不存在将定制服务形成的训练数据直接或修改后用于训练数据产品的情形。发行人说明事项
(1)报告期各期计入研发费用的部门构成、人员数量及其变动情况,并结合人均薪酬变化分析职工薪酬逐年大幅上升的原因,人均薪酬与同行业可比公司之间是否存在显著差异,发行人如何区分训练数据产品开发和基础研发的人员薪酬支出
一、报告期内计入研发费用的部门构成、人员数量及其变动情况:
部门 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
研发中心人员数量 | 32.87 | 26.98 | 25.29 | 20.71 |
语言研究部人员数量 | 4.61 | 3.21 | 2.75 | 1.63 |
质量保证部人员数量 | 2.44 | 2.42 | 2.00 | 1.58 |
数据业务中心参与研发活动的人员数量(注) | 10.40 | 12.07 | 8.75 | 10.93 |
合计 | 50.32 | 44.68 | 38.79 | 34.86 |
注:数据业务中心参与研发活动的员工人数根据其在工时表中填列的训练数据产品开发工时数占该员工当年/期总工时数的比例加总。
报告期内,发行人投入研发活动的研发人员数量分别为 34.86 人、 38.79 人、
44.68人及50.32人,呈逐年上升趋势,主要由于发行人持续增加和完善研发和技术人员数量和结构,提升研发和技术人员能力与水平,支撑公司技术、平台及工具迭代和拓
8-2-1-217
展的研发需要,以及持续增长的训练数据产品的开发需求,以保持公司领先的技术优势及市场地位。
二、报告期内,发行人研发费用中的薪酬总额和人均薪酬情况如下:
类型 | 项目 | 单位 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
与研发费用相关 | 薪酬总额 | 万元 | 1,092.21 | 1,858.94 | 1,374.24 | 1,081.18 |
员工数量 | 人 | 50.32 | 44.68 | 38.79 | 34.86 | |
人均薪酬 | 万元/人 | 21.71 | 41.61 | 35.43 | 31.02 |
报告期内,发行人研发费用中薪酬成本金额分别为1,081.18万元、1,374.24 万元、1,858.94万元及1,092.21万元,2017年至2019年呈持续增长趋势,是由员工数量与人均薪酬双双逐年增长驱动的。员工数量的变动情况及变动原因参见上述“一、报告期内计入研发费用的部门构成、人员数量及其变动情况”。报告期内,研发费用人均薪酬分别为 31.02 万元、35.43 万元、41.61万元及21.71万元,除2020年1-9月因不含年终奖导致薪酬总额和人均薪酬均偏低以外,报告期内研发相关的薪酬总额和人均薪酬呈平稳上升趋势,主要是由于发行人基于整体经营情况、技术研发成果、行业内平均市场薪酬水平等因素的考虑,适当增加研发人员薪酬水平所致。
三、报告期内,发行人研发人员人均薪酬与同行业比较如下:
单位:万元
名称 | 2019年 | 2018年 | 2017年 |
荣科科技 | 7.96 | 8.71 | 4.41 |
彩讯股份 | 6.57 | 6.35 | 6.72 |
天玑科技 | 13.01 | 11.91 | 11.31 |
四方精创 | 7.49 | 9.66 | 8.46 |
恒生电子 | 25.59 | 24.18 | 22.72 |
用友网络 | 25.57 | 22.65 | 19.53 |
万兴科技 | 44.14 | 35.73 | 29.22 |
泛微网络 | 22.69 | 21.87 | 21.70 |
平均值 | 19.13 | 17.63 | 15.51 |
海天瑞声 | 41.61 | 35.43 | 31.02 |
注 1:同行业公司研发人员人均薪酬的计算方式,是年报中披露的研发费用中职工薪酬除以研发人员数量;注2:2020年1-9月无公开可比公司薪酬数据。
如上表所示,发行人研发人员的人均工资高于所属行业平均水平,这主要是由于发行人处于软件和信息技术服务行业中成长性和专业性较高的人工智能板块,因此研
8-2-1-218
发人员的平均薪酬高于所属行业平均水平较为合理。
四、发行人如何区分训练数据产品开发和基础研发的人员薪酬支出:
训练数据产品开发的人员主要为数据业务中心人员,该等人员薪酬按照工时积分制归集到各个项目,参与训练数据产品开发的人员每月按其实际工作情况填写工时积分到训练数据产品开发项目,每人每月工时积分总量为8分/日*月工作日。各个项目应分摊的人工成本的计算方式为:各业务人员填写在该项目的积分*该人员所属级别的人工成本单价=该项目的人工支出。
基础研发人员主要为研发中心、语言研究部、质量保证部人员,按照各自的基础研发项目安排,将其薪酬全部直接归集至基础研发支出。
因此发行人通过上述部门区分、核算流程和制度安排,可以确保将人员薪酬支出在训练数据产品开发支出与基础研发支出之间进行合理和准确的区分,不存在无法区分或混同的情况。
(2)报告期发行人向税务机关申请研发费用加计扣除优惠政策的研发费用金额与发行人实际发生的研发费用金额之间的差异并逐项定量分析原因
报告期内,发行人研发费用与加计扣除金额的差异情况如下:
单位:万元
项目 | 公式 | 2020年1-9月 | 2019年 | 2018 年 | 2017 年 |
申请加计扣除的研发费用金额 | A | 1,137.30 | 1,826.71 | 1,342.80 | 955.56 |
实际发生的研发费用金额 | B | 2,862.17 | 4,169.61 | 2,734.53 | 2,527.99 |
差异金额 | C=B-A | 1,724.87 | 2,342.90 | 1,391.73 | 1,572.43 |
原因分析: | |||||
(1)训练数据产品开发费用 | 1,628.32 | 2,217.81 | 1,264.60 | 1,455.04 | |
(2)内部交易合并抵消影响 | -12.74 | -14.04 | -47.17 | - | |
(3)合并范围内亏损主体研发费用未申请加计扣除 | - | - | 74.17 | 117.39 | |
(4)其他不得计入加计扣除的费用 | 109.29 | 139.13 | 100.13 | - |
8-2-1-219
(1)-(4)项原因合计 | 1,724.87 | 2,342.90 | 1,391.73 | 1,572.43 |
1、训练数据产品开发支出
根据《财政部关于企业加强研发费用财务管理的若干意见》(财企〔2007〕194 号)的规定,企业研发费用(即原“技术开发费”)指企业在产品、技术、材料、工艺、标准的研究、开发过程中发生的各项费用。因此发行人数据库产品开发费用属于在产品开发过程中发生的费用,属于研发费用的范畴。
但是根据《国家税务总局关于研发费用税前加计扣除归集范围有关问题的公告》(国家税务总局公告 2017 年第 40 号)规定,企业研发活动直接形成产品或作为组成部分形成的产品对外销售的,研发费用中对应的材料费用不得加计扣除。发行人的训练数据产品是企业研发活动直接形成产品对外销售的,因此相关支出按照上述税法规定不得进行加计扣除。
2、内部交易合并抵消影响
实际发生的研发费用按抵消发行人合并范围内母子公司之间交易后的金额列示,加计扣除金额按照各个主体直接加总计算列示,合并抵消是造成研发费用与加计扣除金额存在差异的原因之一。
3、合并范围内亏损主体研发费用未申请加计扣除
发行人全资子公司中瑞智2017年、2018年未实现盈利,应纳税所得额为负数。与此同时,中瑞智研发费用金额不大,申请加计扣除对税负影响较小,故未申请享受研发费用加计扣除。2019年和2020年1-9月,中瑞智研发活动增加,申请进行研发费用加计扣除。
4、其他不得计入加计扣除的费用
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018 年 | 2017 年 |
房屋租赁费 | 82.86 | 102.72 | 66.63 | - |
工会经费和职工教育经费 | 26.43 | 36.41 | 24.06 | - |
委托研发费用的 20%部分 | - | - | 9.44 | - |
小计 | 109.29 | 139.13 | 100.13 | - |
注1:发行人2018年开始为研发部门设立专属办公场地并开始将房屋租赁费分摊计入研发成本,而且自2018年开始将工会经费、职工教育经费在研发费用中单独进行核算。
8-2-1-220
注2:不得计入加计扣除的房屋租赁费按照各个主体直接加总计算列示,基础研发费用构成中的房租费按抵消发行人合并范围内母子公司之间交易后的金额列示,合并抵消是造成两项房租费存在差异的原因。自2019年发行人开始用自有房产为中瑞智的研发活动提供房屋租赁服务,中瑞智支付的租赁费用在合并财务报表层面被抵消,2019年抵消金额为36.08万元、2020年1-9月抵消金额为29.05万元。根据《财政部 国家税务总局 科技部关于完善研究开发费用税前加计扣除政策的通知》(财税〔2015〕119 号)、《国家税务总局关于企业研究开发费用税前加计扣除政策有关问题的公告》(国家税务总局公告 2015 年第 97 号)和《国家税务总局关于研发费用税前加计扣除归集范围有关问题的公告》(国家税务总局公告 2017 年第40 号)规定,可以享受加计扣除的研发费用范围包括:直接从事研发活动人员的人工费用,研发活动直接投入费用,用于研发活动的折旧费用,用于研发活动的无形资产摊销费用,新产品设计试验费用,与研发活动直接相关的其他费用。
报告期内,发行人发生的与研发活动相关的房屋租赁费、工会经费和职工教育经费等不属于上述规定列举的加计扣除范围,因此不满足加计扣除条件,未申请加计扣除。
另根据财税〔2015〕119 号文件规定,企业委托外部机构或个人进行研发活动所发生的费用,按照费用实际发生额的 80%计入委托方研发费用并计算加计扣除。2018年,发行人发生委托研发费用47.17 万元,按照80%计算加计扣除金额,剩余20%部分即9.44万元因不符合加计扣除条件,未申请加计扣除。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于研发费用可能导致的重大错报风险,执行的主要程序如下:
1、访谈公司管理层和相关业务人员,了解公司主要的研发成果和研发投入情况;
2、了解和评价与研发活动相关的关键财务报告内部控制的设计和运行有效性;
3、获取报告期内发行人研发费用明细,检查计算准确性;并与明细账、总账及财务报表合计数核对一致;
4、对于训练数据产品开发支出,获取报告期内业务管理平台导出的数据库开发项目明细及其支出明细,检查计入数据库开发项目的各项支出是否与该数据库产品开发相关,同时抽样检查相关支出归集为训练数据产品开发支出的支持性依据,检查发行人是否存在将定制服务产生的数据直接或修改后用于训练数据产品的情形;
8-2-1-221
5、对于基础研发支出,获取报告期内基础研发项目的支出明细台账,检查计入基础研发的各项支出是否与基础研发项目相关,同时抽样检查相关支出归集为基础研发支出的支持性证据;
6、分析研发费用的构成,检查是否存在异常或变动幅度较大的情况,分析其合理性;
7、对研发费用进行实质性测试,包括检查所选样本的支持性文件及人力成本、折旧摊销的合理性测试及费用截止性测试;
8、获取报告期各期训练数据产品的库存量、新增量和销售量的明细,同各期训练数据产品开发项目明细进行比对,检查有无异常;
9、获取发行人员工花名册及公司组织架构图,了解研发费用的人员部门构成、人数、薪资构成等要素,与计入研发费用的人员进行核对;
10、对研发费用中的职工薪酬实施实质性分析程序;分析人员薪酬总额、人均薪酬及其构成在报告期的波动;
11、查阅同行业上市公司公开信息,将公司的研发人员人均薪酬与同行业上市公司管理人员人均薪酬相比,分析是否合理;
12、根据员工花名册、具体岗位职责、薪酬明细表等情况,对职工薪酬的计提和成本费用分配情况进行了检查;
13、选取工资支付明细与工资计提情况和支付的银行流水进行核对;
14、查阅发行人报告期各年度所得税汇算清缴报告、《2017年-2019年度企业研究开发费用加计扣除专项鉴证报告》,与发行人实际发生的研发费用逐项进行比较,并明确具体差异原因;
基于我们所执行的审计和核查程序,申报会计师认为:
1、报告期内,发行人训练数据产品开发和基础研发的费用构成稳定,变动原因合理,符合发行人的实际情况;
2、报告期内,发行人训练数据产品开发的开展情况与实际情况相符,2019年度训练数据产品开发支出大幅增长具备合理原因;
8-2-1-222
3、报告期内,发行人训练数据产品的库存量、新增量和销售量与发行人研发活动开展的实际情况相符,发行人不存在将定制服务产生的数据直接或修改后用于训练数据产品的情形;
4、报告期内,发行人研发费用的人员部门、员工数量和人均薪酬及变动情况与发行人的经营情况相符,职工薪酬逐年大幅上升具备合理原因;发行人研发人员人均薪酬略高于同行业公司,符合发行人的业务情况;
5、报告期内,报告期发行人向税务机关申请研发费用加计扣除优惠政策的研发费用金额与发行人实际发生的研发费用金额之间的差异主要为会计处理和税务部门认定口径的差异,差异原因合理,符合发行人的实际情况。会计师说明事项
(1)对报告期内发行人的研发投入归集是否准确、相关数据来源及计算是否合规的核查过程及核查结论
一、核查程序
针对上述核查部分相关事项,申报会计师执行了以下核查程序:
1、了解和评价与研发活动相关的关键财务报告内部控制的设计和运行有效性;
2、获取报告期内发行人研发费用明细,检查计算准确性;并与明细账、总账及财务报表合计数核对一致;
3、对于训练数据产品开发支出,获取报告期内业务管理平台导出的数据库开发项目明细及其支出明细,检查计入数据库开发项目的各项支出是否与该数据库产品开发相关,同时抽样检查相关支出归集为训练数据产品开发支出的支持性依据;
4、对于基础研发支出,获取报告期内基础研发项目的支出明细台账,检查计入基础研发的各项支出是否与基础研发项目相关,同时抽样检查相关支出归集为基础研发支出的支持性证据;
5、分析研发费用的构成,检查是否存在异常或变动幅度较大的情况,分析其合理性;
6、对研发费用进行实质性测试,包括检查所选样本的支持性文件及人力成本、折旧摊销的合理性测试及费用截止性测试;
8-2-1-223
二、核查结论
基于申报会计师所执行的审计和核查程序,申报会计师认为:报告期内发行人的研发投入归集准确、相关数据来源及计算过程合规。
(2)对发行人研发相关内控制度是否健全且被有效执行核查过程及核查结论。
一、发行人研发相关的内控制度
发行人针对研发活动制定了《海天瑞声研究与开发管理办法》和相关与研发活动相关的内控制度,包括《海天瑞声全面预算管理办法》、《海天瑞声项目管理办法》、《海天瑞声采购管理制度》等,对研发项目从研发计划制定与审批、研发预算建立、研发项目立项、可行性研究、研发费用管理、项目人员安排、实施方案的制定与审批、项目进度管理、项目测试、成果交付等环节进行了明确规范。具体来讲,发行人与研发活动相关的内控制度包含以下几方面的内容:
1、建立研发项目的跟踪管理系统,有效监控、记录各研发项目的进展情况
针对训练数据产品开发项目,发行人通过业务管理平台进行线上管理,实时跟踪项目进度、记录项目支出;对基础研发项目,发行人以专项研发项目组组长为责任主体,研发部门负责人对项目进度进行监督检查。项目组组长负责编写工作周报,以邮件方式发送给研发部门负责人汇报,定期与研发部门负责人沟通、汇报项目进度情况。
2、建立与研发项目相对应的人财物管理机制
发行人的研发活动均要求按项目进行管理,每个项目均指定了项目参与人员,采购数据服务、聘请外部专家、使用固定资产、占用租赁房屋时均需要按照项目口径进行,人财物管理机制与研发费用严格对应。
3、明确研发支出开支范围和标准,严格按照研发开支用途、性质据实列支研发支出,建立研发支出审批程序
报告期内,发行人在研发管理制度中明确了研发支出开支范围和标准,将研发费用管理纳入了公司全面预算体系,研发项目涉及费用支出时,均按照公司统一的财务支出管理办法执行,总体遵循“先预算,后动支”的管理原则,严格控制预算进度与时间进度或业务计划达成进度的匹配性,同时执行严格的层级审批制度,确保研发支出开支范围和标准有效执行,确保严格按研发开支用途、性质列支研发支出。若涉及重大研发项目或截至本项目本年度累计项目支出大于年度研发预算,还需经总经理办公会审批。
8-2-1-224
综上所述,发行人已建立与研发相关的内部控制制度,能有效监控、记录各研发项目的进展情况。
二、核查程序
针对发行人与研发相关的内控制度,申报会计师执行了下述核查程序:
1、了解发行人建立的与研发活动相关的内部控制制度,对研发流程及其控制活动的情况执行穿行测试;
2、对研发流程中识别的关键控制点执行控制有效性测试,选择样本检查关键控制点是否得到有效执行;
3、对研发流程涉及的业务管理系统平台及其相关控制活动,引入信息系统专家执行与信息系统相关的控制测试。
三、核查结论
基于所执行的内部控制审核程序,申报会计师认为,发行人与研发相关的内控制度健全且有效执行。
17.关于税务事项
报告期各期,发行人享受税收优惠的金额分别为1,129.34万元、2,080.29万元和2,097.82万元,占当期利润总额的比重分别28.22%、28.84%和22.96%,占比较高。
请发行人说明:(1)逐项对照说明发行人是否符合国家规划布局内重点软件企业的认定条件,相关认定到期后是否会对公司持续经营及业绩产生重大影响;(2)结合软件产品增值税优惠政策的相关规定,说明发行人销售软件产品的具体名称和销售收入金额以及是否符合条件,合并报表中各类别营业收入与增值税申报表申报的软件收入、增值税即征即退额之间的匹配关系,进项税额和销项税额与采购和销售的匹配关系,逐项分析差异原因及合理性;(3)“收到的税费返还”“支付的各项税费”与报表科目的勾稽关系。
请保荐机构和申报会计师对上述事项进行核查并发表明确意见
答复:
8-2-1-225
发行人说明事项
(1)逐项对照说明发行人是否符合国家规划布局内重点软件企业的认定条件,相关认定到期后是否会对公司持续经营及业绩产生重大影响
一、国家规划布局内重点软件企业的认定
根据《财政部、国家税务总局关于进一步鼓励软件产业和集成电路产业发展企业所得税政策的通知》(财税[2012]27 号),国家规划布局内的重点软件企业,如当年未享受免税优惠的,可减按 10%的税率征收企业所得税。
根据《财政部、国家税务总局、发展改革委、工业和信息化部关于软件和集成电路产业企业所得税优惠政策有关问题的通知》(财税〔2016〕49 号),享受财税〔2012〕27号文件规定的税收优惠政策的软件、集成电路企业,每年汇算清缴时应按照《关于发布修订后的<企业所得税优惠政策事项办理办法>的公告》(国家税务总局公告 2018年第 23 号)规定向税务机关备案。
《财政部、国家税务总局、发展改革委、工业和信息化部关于软件和集成电路产业企业所得税优惠政策有关问题的通知》(财税〔2016〕49号)以及《国家发展改革委、工业和信息化部、财政部、税务总局关于印发国家规划布局内重点软件和集成电路设计领域的通知》(发改高技[2016]1056号)规定的国家规划布局内重点软件企业的认定条件,以及发行人对照符合认定条件的具体情况如下:
认定条件 | 发行人(母公司)情况 | 是否符合 |
在中国境内(不包括港、澳、台地区)依法注册的居民企业 | 注册地址为北京市海淀区 | 是 |
汇算清缴年度具有劳动合同关系且具有大学专科以上学历的职工人数占企业月平均职工总人数的比例不低于40%,其中研究开发人员占企业月平均职工总数的比例不低于20% | 报告期内,具有劳动合同关系且具有大学专科以上学历的职工人数占企业月平均职工总人数的比例为100%,其中研发人员占企业月平均职工总数比例在报告期内分别为:34.04%,33.33%,32.17%及29.69%。 | 是 |
拥有核心关键技术,并以此为基础开展经营活动,且汇算清缴年度研究开发费用总额占企业销售(营业)收入总额的比例不低于6%;其中,企业在中国境内发生的研究开发费用金额占研究开发费用总额的比例不低于60% | 目前拥有24项已授权专利(22项发明专利授权、1项实用新型专利授权、1项外观设计专利授权)、131项软件著作权,核心技术覆盖基础研究、平台工具、训练数据生产三个层次,应用于训练数据生产的设计、采集、加工、质检全流程之中,构成了公司生产经营的基础, | 是 |
8-2-1-226
公司通过核心技术的成果转化形成了基于核心技术的训练数据相关产品和服务; 报告期内,符合条件的研究开发费用总额占企业销售(营业)收入总额的比例分别为8.03%、7.07%、6.92%及7.39%;其中,在中国境内发生的研究开发费用金额占研究开发费用总额的比例均为100%。 | ||
汇算清缴年度软件产品开发销售(营业)收入占企业收入总额的比例不低于50%(嵌入式软件产品和信息系统集成产品开发销售(营业)收入占企业收入总额的比例不低于40%),其中:软件产品自主开发销售(营业)收入占企业收入总额的比例不低于40%(嵌入式软件产品和信息系统集成产品开发销售(营业)收入占企业收入总额的比例不低于30%) | 报告期内,软件产品开发销售(营业)收入(包括软件产品销售和软件开发服务)占企业收入总额的比例均接近100%,其中:软件产品和服务自主开发销售(营业)收入占企业收入总额的比例接近100%。 | 是 |
主营业务拥有自主知识产权 | 目前拥有24项已授权专利(22项发明专利授权、1项实用新型专利授权、1项外观设计专利授权)、131项软件著作权,多年积累的核心技术使得发行人自成立至今一直从事训练数据产品和服务的开发与销售,能够更大规模、更有效率、更加精准地生产训练数据,提高了训练数据对于客户AI算法模型的改善、优化效果。 | 是 |
具有与软件开发相适应软硬件设施等开发环境(如合法的开发工具等) | 拥有研究开发专用场地,及与软件开发相关的服务器、PC机、交换机、路由器等硬件设备,及拥有录音系统软件、音视频处理软件、数据标注平台等多个软件开发相关的软件设施。 | 是 |
汇算清缴年度未发生重大安全、重大质量事故或严重环境违法行为 | 截至目前,未发生重大安全、重大质量事故或严重环境违法行为。 | 是 |
在国家规定的重点软件领域内,汇算清缴年度软件产品开发销售(营业)收入不低于5000万元,应纳税所得额不低于 | 报告期在国家规定的重点软件领域内 软件产品开发销售(营业)收入为分别为9,961.05万元、15,915.86万元、 | 是 |
8-2-1-227
250万元,研究开发人员占企业月平均职工总数的比例不低于25%,企业在中国境内发生的研究开发费用金额占研究开发费用总额的比例不低于70% | 19,330.34万元及11,619.62万元。应纳税所得额分别为3,830.65万元、6,675.31万元、8,103.59万元及5,267.32万元。研究开发人员占企业月平均职工总数的比例分别为34.04%、33.33%、32.17%及29.69%,企业在中国境内发生的研究开发费用金额占研究开发费用总额的比例均为100%。 | |
国家规定的重点软件领域:(八)语言文字信息处理软件:汉语和少数民族语言相关文字编辑处理、语音识别/合成、机器翻译软件 | 智能语音及机器翻译领域的产品和服务属于该项重点软件领域。 | 是 |
选择领域的销售(营业)收入占本企业软件产品开发销售(营业)收入的比例不低于20% | 报告期内,属于上述领域的销售(营业)收入占软件产品开发销售(营业)收入的比例分别为83.67%、83.80%、82.38%及82.71%。 | 是 |
综上,发行人在报告期内符合国家规划布局内重点软件企业认定的相关条件,且发行人已按相关规定办理了2017年度、2018年度和2019年度的重点软件企业备案认定。
二、相关认定到期后若不能被持续认定对公司的影响
报告期内,发行人符合高新技术企业及国家规划布局内的重点软件企业的相关认定,按照相关税收优惠政策,可享有15%或10%的所得税优惠税率,发行人报告期内实际执行重点软件企业10%的所得税优惠税率。相应的税收优惠对经营成果的影响情况分别分析如下:
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
高新技术企业所得税税率优惠影响金额(15%优惠税率相较25%的法定税率) | 527.11 | 864.41 | 693.46 | 391.72 |
重点软件企业所得税税率优惠额外影响金额(10%优惠税率相较15%的高新技术企业税率) | 263.56 | 432.20 | 538.26 | - |
利润总额 | 5,796.79 | 9,135.95 | 7,212.51 | 3,994.18 |
高新技术企业所得税税率优惠影响金额占当期利润总额的比例 | 9.09% | 9.46% | 9.61% | 9.81% |
8-2-1-228
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
重点软件企业所得税税率优惠额外影响金额占当期利润总额的比例 | 4.55% | 4.73% | 7.46% | - |
企业所得税税收优惠影响占当期利润总额的比例合计 | 13.64% | 14.19% | 17.07% | 9.81% |
注:发行人于2017年享受高新技术企业的企业所得税优惠税率15%,并按照该税率进行了2017年所得税的纳税申报。2018年10月发行人获得2017年国家规划布局内的重点软件企业认定,可以对2017年的所得税享受10%的所得税税率优惠政策,因此发行人按10%的优惠税率重新申报了2017年度的企业所得税,上表中2018年度重点软件企业所得税税率优惠额外影响金额包括当年收到退回的2017年度多缴纳的企业所得税191.53万元的影响。
报告期内,公司享受的企业所得税税率优惠影响金额占当期公司利润总额的比例分别为9.81%、17.07%、14.19%和13.64%,公司经营成果对该税收优惠不存在重大依赖。其中重点软件企业所得税税率优惠额外影响金额占当期公司利润总额的比例分别为0%、7.46%、4.73%和4.55%,占比较小。重点软件企业相关认定到期后若不能被持续认定,公司仍可享受高新技术企业15%的所得税优惠税率,因此预期不会对公司的生产经营产生重大影响。
发行人相关认定到期后若不能被持续认定,相关风险已于招股说明书 “第四节 风险因素/十一、税收优惠不确定的风险”进行了披露:
“报告期内,公司享受了增值税即征即退、高新技术企业和国家规划布局内的重点软件企业的企业所得税税率优惠、研发费用加计扣除等一系列税收优惠,如果未来公司所享受的税收优惠政策出现不利变化,或者公司不再符合税收优惠的条件,则公司将无法持续享受税收优惠或存在所享受的税收优惠减少的可能性。并进而导致公司未来经营业绩和现金流水平受到不利影响。”
(2)结合软件产品增值税优惠政策的相关规定,说明发行人销售软件产品的具体名称和销售收入金额以及是否符合条件,合并报表中各类别营业收入与增值税申报表申报的软件收入、增值税即征即退额之间的匹配关系,进项税额和销项税额与采购和销售的匹配关系,逐项分析差异原因及合理性
一、增值税即征即退的优惠政策
根据《财政部 国家税务总局关于软件产品增值税政策的通知》财税〔2011〕100 号规定:增值税一般纳税人销售其自行开发生产的软件产品,按 17%税率征收增值税后,对其增值税实际税负超过3%的部分实行即征即退政策。满足下列条件的软件产品,经主管税务机关审核批准,可以享受本通知规定的增值税政策:1)取得省级软件产业主
8-2-1-229
管部门认可的软件检测机构出具的检测证明材料;2)取得软件产业主管部门颁发的《软件产品登记证书》或著作权行政管理部门颁发的《计算机软件著作权登记证书》。
二、发行人适用即征即退优惠政策的软件销售收入
发行人2012-2018年完成了识别语音库软件V1.0.0.0、语音合成数据库软件V1.0.0.0、文本数据库软件V1.0.0.0、电子书记员系统服务软件V1.0.0、对话语音库软件V1.0.0.0、词典数据库软件V1.0.0.0、图形图像数据库软件V1.0.0.0、智能音频采集系统软件V1.1.4、视频数据库软件V1.0.1、智能会议系统软件V1.0.1、ASIORecord多通道录音软件V3.4共11个软件的优惠备案,均已获得相关部门的检测证明并取得计算机软件著作权登记证书。该类训练数据产品及其他软件销售享受财税〔2011〕100号规定的优惠政策,在销售合同及销售发票中注明软件著作权编号的训练数据产品及其他软件销售收入可享受增值税即征即退优惠政策。发行人申请并拥有软件著作权的上述软件是针对各类型训练数据产品的结构设计、数据管理与索引、数据在物理磁盘上的存储、定制化展示和导出等功能,以适配客户的不同算法和使用环境,并提高训练数据产品的易用性。由于同一类型训练数据产品具体数据内容和数量的变化不影响软件的整体框架及功能,因此同一软件著作权的软件可匹配其对应类型的不同训练数据产品。例如,软件著作权识别语音库软件V1.0.0.0可以适用于发行人所有语音识别数据库产品。
报告期内,公司增值税申报表申报的上述软件产品销售收入金额如下:
单位:万元
软件名称 | 批号 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
识别语音库软件V1.0.0.0 | 海国税软字 [2015] 20151116091815号 | 6,259.28 | 4,833.84 | 4,412.17 | 3,722.13 |
语音合成数据库软件V1.0.0.0 | 海国税软字 [2015] 20151116091816号 | 748.70 | 774.90 | 290.02 | 627.30 |
文本数据库软件V1.0.0.0 | 海国税软字 [2015] 20151116091817号 | 25.17 | 322.53 | 40.91 | 132.85 |
电子书记员系统服务软件V1.0.0 | 税软字[2018]201803280 | 135.36 | 108.53 | 123.94 | - |
对话语音库软件V1.0.0.0 | 海国税软字 [2015] 20151116091814号 | - | 88.58 | - | - |
词典数据库软件V1.0.0.0 | 海国税软字 [2015] 20151116091818号 | 144.91 | 53.97 | 85.15 | 117.69 |
图形图像数据库软件V1.0.0.0 | 税软字[2016]201611090 | 24.02 | 48.88 | 22.82 | 25.50 |
智能音频采集系统软件V1.1.4 | 税软字[2018]201803280 | - | - | 51.52 | - |
8-2-1-230
智能会议系统软件V1.0.1 | 税软字[2018]201812240 | 1.04 | - | - | - |
合计 | 7,338.48 | 6,231.24 | 5,026.53 | 4,625.47 |
上述软件产品销售收入符合增值税即征即退优惠政策的相关条件。
三、合并报表中各类别营业收入与增值税申报表申报的软件收入、增值税即征即退额之间的匹配关系
报告期内,发行人软件产品销售收入按照产品类别分别计入训练数据产品和训练数据相关的应用服务。
对于训练数据产品和训练数据相关的应用服务销售,主管税务机关认为,销售合同条款中是否包含软件著作权编号是判断该类业务适用税率选择的重要标志:
1、包含软件著作权编号的,属于销售软件产品,适用17%(2018 年5 月1日起变更为 16%,2019年4月1日起变更为13%)的销项税率,在增值税申报表中列示在17%/16%/13%税率的销售收入中;
2、未包含软件著作权编号的,属于提供特许权使用服务,适用 6%的销项税率,在增值税申报表中列示在6%税率的销售收入中。
发行人销售合同是否包含软件著作权编号,是根据与客户双方协商的结果确定的。通常销售合同条款中会记载软件著作权编号,针对上述销售合同发行人按销售软件产品进行增值税销项税纳税处理;但部分客户因其自身原因,如部分大型科技公司不同意在其制式化的销售合同条款中加入软件著作权编号,针对上述销售合同发行人按提供特许权使用服务进行增值税销项税纳税处理。
以上两种不同的处理方式只针对增值税销项税额的纳税处理,不影响发行人训练数据产品和训练数据相关的应用服务销售的业务实质,在收入确认等财务处理上不存在区别。
报告期内,合并报表中符合即征即退优惠政策的各类别营业收入与增值税申报表申报的软件收入具体情况如下:
单位:万元
类别 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | |
合并报表中享受即征即退优 | 训练数据产品收入 | 6,413.19 | 7,501.50 | 4,477.32 | 4,848.76 |
训练数据相关的应用服务收入 | 198.14 | 162.30 | 239.26 | - |
8-2-1-231
惠政策的软件收入 | 合计 | 6,611.33 | 7,663.80 | 4,716.58 | 4,848.76 |
调节过程 | 加:当期开票尚未验收 | 1,124.93 | 676.26 | 503.43 | 278.78 |
加:当期开票前期验收 | 1,910.84 | 292.01 | 370.06 | 105.51 | |
减:当期验收前期开票 | 672.81 | 499.04 | 277.94 | 238.46 | |
减:当期验收尚未开票 | 1,635.81 | 1,901.80 | 285.60 | 369.12 | |
增值税申报表申报的软件收入 | 7,338.48 | 6,231.24 | 5,026.53 | 4,625.47 |
注:上述合并报表中的软件收入只包括训练数据产品和训练数据相关的应用服务收入中包含软件著作权编号的,适用销售软件产品税率为17%(2018年5月1日起变更为16%,2019年4月1日起变更为13%)的收入。合并报表中的软件收入与增值税申报表中的软件收入存在差异的原因系合并报表中的软件收入金额为当年/期已验收确认的符合即征即退税收优惠条件的收入,增值税申报表中的软件收入为当年/期开具发票并按享受即征即退的软件收入进行增值税申报的销售额,两者存在会计确认收入时点与开具发票时点的时间性差异。
报告期内报表中享受即征即退优惠政策的软件收入与增值税纳税申报表中的软件收入总体差异为618.75万元,差异较小,基本匹配。
报告期内,公司增值税申报表中的软件收入和即征即退税额的匹配关系如下:
单位:万元
项目 | 适用税率 | 计算公式 | 报告期 合计 | 2020年 1-9月 | 2019年度 | 2018年度 | 2017年度 |
增值税申报表申报的软件收入 | 17% | ① | 7,006.67 | - | - | 2,381.20 | 4,625.47 |
16% | ② | 3,814.49 | - | 1,169.15 | 2,645.34 | - | |
13% | ③ | 12,400.57 | 7,338.48 | 5,062.09 | - | - | |
小计 | 23,221.73 | 7,338.48 | 6,231.24 | 5,026.53 | 4,625.47 | ||
名义税率 | 17% | ④=①*17% | 1,191.13 | - | - | 404.80 | 786.33 |
16% | ⑤=②*16% | 610.32 | - | 187.06 | 423.25 | - | |
13% | ⑥=③*13% | 1,612.07 | 954.00 | 658.07 | - | - | |
小计 | 3,413.52 | 954.00 | 845.14 | 828.06 | 786.33 | ||
实际税负 | 3% | ⑦=(①+②+③)*3% | 696.65 | 220.15 | 186.94 | 150.80 | 138.76 |
即征即退收入对应的进项税额 | ⑧ | 38.47 | 4.18 | 10.52 | 2.42 | 21.35 | |
按3%税负计算应退税额 | ⑨=④+⑤+⑥-⑦-⑧ | 2,678.40 | 729.66 | 647.68 | 674.84 | 626.21 | |
实际收到即征即退税款 | ⑩ | 2,752.93 | 736.46 | 638.49 | 747.86 | 630.12 | |
差额 | ?=⑨-⑩ | -74.53 | -6.79 | 9.19 | -73.02 | -3.91 |
8-2-1-232
注:销售合同中注明软件著作权编号,按照 17%税率(2018 年 5 月1日起变更为 16%,2019年4月1日起变更为13%)缴纳增值税的销售收入可享受增值税即征即退优惠政策。
报告期内,发行人实际收到的增值税即征即退额分别为630.12万元、747.86万元、
638.49万元和736.46万元,与按照按 3%税负计算的应退税额之间的差异主要是由于实际退税有一定的滞后性,从而导致年度之间产生差异,报告期内总体差异为74.53万元,差异较小。公司于实际收到即征即退税款时计入当期“其他收益”进行核算。
8-2-1-233
四、进项税额和销项税额与采购和销售的匹配关系,逐项分析差异原因及合理性;
(一)发行人进项税额与采购的匹配关系
报告期内,发行人进项税额与采购商品或劳务金额之间的勾稽关系如下表所示:
单位:万元
采购类型 | 进项税率 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
采购金额 | 进项税额 | 采购金额 | 进项税额 | 采购金额 | 进项税额 | 采购金额 | 进项税额 | ||
数据服务费 | 6% | 4,700.06 | 282.00 | 5,349.19 | 320.95 | 6,273.79 | 376.43 | 3,223.96 | 193.44 |
3%-小规模纳税人 | 120.36 | 3.61 | 471.36 | 14.14 | 290.53 | 8.72 | 373.88 | 11.22 | |
0%-无增值税专票 | 825.90 | - | 279.40 | - | 788.33 | - | 459.47 | ||
办公房租 | 5% | 522.74 | 26.14 | 625.49 | 31.27 | 487.31 | 24.37 | 335.93 | 16.80 |
0%-无增值税专票 | 68.49 | - | 69.17 | - | 57.86 | 79.55 | |||
资产采购 | 17% | - | - | - | - | 142.34 | 24.20 | 55.33 | 9.41 |
16% | - | - | 60.82 | 9.73 | 310.92 | 49.75 | - | - | |
13% | 127.21 | 16.54 | 188.10 | 24.45 | - | - | - | - | |
6% | 19.48 | 1.17 | 38.20 | 2.29 | 99.06 | 5.94 | |||
0%-无增值税专票 | 3.25 | - | - | - | 0.58 | - | 148.39 | - | |
岗位服务费 | 6% | 148.87 | 8.93 | 177.60 | 10.66 | 145.26 | 8.72 | - | - |
0%-无增值税专票 | 85.39 | - | 107.29 | - | 111.36 | - | 226.95 | - | |
不动产 | 4%-税务局代开 | - | - | - | - | 2,008.57 | 80.87 | - | - |
其他采购 | — | 1,033.44 | 16.70 | 1,523.78 | 108.19 | 955.01 | 27.80 | 748.16 | - |
8-2-1-234
进项税转出 | — | - | -0.01 | - | -1.00 | - | -4.10 | - | -0.36 |
增值税加计抵扣 | — | - | 40.24 | - | 40.75 | - | - | - | - |
合计 | — | 7,655.19 | 395.32 | 8,890.41 | 561.44 | 11,670.92 | 602.70 | 5,651.62 | 230.50 |
注1:2018年公司购置建筑物支出2,102.20万元,其中房产原值2,008.57万元适用4%税率;中介费(不含税)33.38万元适用6%税率,包括在上表其他采购额中;剩余部分60.25万元为契税及印花税。注2:资产采购中定制化无形资产的适用税率为6%,其他无形资产及有形动产的适用税率为17%16%/13%。
整体来看,公司采购业务支出与增值税进项税额勾稽关系是合理的。
(二)发行人销项税额与销售产品或提供劳务的匹配关系
报告期内,发行人的销项税额与销售产品或提供劳务金额之间的勾稽关系如下表所示:
单位:万元
销售业务 | 适用 税率 | 2020年1-9月 | 2019年 | 2018年 | 2017年 | ||||
销售金额 | 销项税额 | 销售金额 | 销项税额 | 销售金额 | 销项税额 | 销售金额 | 销项税额 | ||
训练数据产品 | 17% | - | - | - | - | 2,270.12 | 385.92 | 4,848.76 | 824.29 |
16% | - | - | 1,969.94 | 315.19 | 2,207.20 | 353.15 | - | - | |
13% | 6,413.19 | 833.71 | 5,531.56 | 719.10 | - | - | - | - | |
6% | 600.69 | 36.04 | 1,674.97 | 100.50 | 2,124.34 | 127.46 | 640.55 | 38.43 | |
训练数据定制服务 | 6% | 6,996.73 | 419.80 | 14,272.43 | 856.35 | 12,369.55 | 742.17 | 6,297.23 | 377.83 |
训练数据相关的应用服务 | 17% | - | - | - | - | - | - | - | - |
16% | - | - | - | - | 309.38 | 49.50 | - | - | |
13% | 198.14 | 25.76 | 264.69 | 34.41 | - | - | - | - |
8-2-1-235
6% | 142.14 | 8.53 | 98.73 | 5.92 | 41.51 | 2.49 | 120.55 | 7.23 | |
其他业务 | 9% | 29.05 | 2.61 | 36.08 | 3.25 | - | - | - | - |
内部交易抵消 | — | -102.59 | — | -92.59 | — | -56.33 | — | - | — |
其他因素 | — | — | 115.78 | — | -13.79 | — | 118.58 | — | 51.00 |
合计 | — | 14,277.35 | 1,442.24 | 23,755.81 | 2,020.93 | 19,265.77 | 1,779.28 | 11,907.09 | 1,298.78 |
注:发行人2019年适用13%税率及2018年适用16%税率的训练数据相关的应用服务收入中分别包括102.39万元及70.12 万元涉及软件使用权与硬件配套销售,针对该业务适用税率应为13%或16%,但不符合《财政部国家税务总局关于软件产品增值税政策的通知》(财税[2011]100 号)关于即征即退条件的规定,无法享受销售软件产品增值税即征即退政策,因此在本问题“(2)/三、发行人适用即征即退优惠政策的软件销售收入”中未作为软件销售收入列示。
8-2-1-236
1、发行人主要收入类型及适用的销项税率
公司主要包括三大类主要业务,分别是训练数据定制服务、训练数据产品和训练数据相关的应用服务。训练数据定制服务:适用税率6%。训练数据产品:其中包含软件著作权编号的,适用销售软件产品税率为17%(2018年5月1日起变更为16%,2019年4月1日起变更为13%);未包含软件著作权编号的,适用提供特许权使用服务税率6%。训练数据相关的应用服务:其中应用软件的授权使用,以及配套硬件的销售(如有)适用税率17%(2018年5月1日起变更为16%,2019年4月1日起变更为13%);提供应用软件的定制开发服务适用税率6%。
2、其他因素说明
报告期内,按照销售业务类型和适用税率比例计算的销项税额与公司实际承担的销项税额存在一定的差额,具体影响金额详见上表“其他因素”所示。主要是由于公司严格按照税法规定,将会计确认销售收入时点、开具增值税发票时点、收到预收款时点三者中的最早时点作为增值税纳税义务的发生时点。因此会计确认收入时点和增值税纳税义务发生时点产生差异。差异原因分析通常有两种情形:
第一种情形:部分项目执行过程中收到客户支付的预收款,会计上尚未确认收入,发行人根据三个时点熟早原则在收到预收款时申报销项税,早于会计确认收入时点;
第二种情形:部分客户在支付预付款前,先要求发行人开具发票,因此开具发票时点既早于预收款时点,也早于会计确认收入时点。
对于上述两种情形,即预收款项影响和只开票税金影响,进一步核对与“其他因素影响金额”之间的勾稽关系:
其他因素影响金额=(期末预收账款产生的销项税-期初预收账款产生的销项税)+(期末开票销项税-期初开票销项税)
8-2-1-237
单位:万元
类型 | 适用税率 | 6% | 13% | 16% | 17% | 合 计 | 序号 | 计算公式 | 销项税额 | |||||
预收账款产生销项税 | 项目 期间(时点) | 预收金额 | 计提销项税 | 预收金额 | 计提销项税 | 预收金额 | 计提销项税 | 预收金额 | 计提销项税 | 预收金额 | 计提销项税 | 预收账款对当期销项税额的影响 | ||
2016-12-31/2016 年 | 1,068.80 | 64.13 | - | - | - | - | 231.26 | 39.31 | 1,300.06 | 103.44 | ① | — | — | |
2017-12-31/2017 年 | 2,350.75 | 141.05 | - | - | - | - | 234.35 | 39.84 | 2,585.10 | 180.89 | ② | a=②-① | 77.45 | |
2018-12-31/2018 年 | 3,178.68 | 190.72 | - | - | 618.59 | 98.97 | 53.98 | 9.18 | 3,851.25 | 298.87 | ③ | b=③-② | 117.98 | |
2019-12-31/2019 年 | 1,742.91 | 104.57 | 1,285.56 | 167.12 | - | - | - | - | 3,028.47 | 271.70 | ④ | c=④-③ | -27.17 | |
2020-09-30/2020 年前三季度 | 2,098.66 | 125.92 | 1,791.27 | 232.87 | - | - | - | - | 3,889.93 | 358.79 | ⑤ | d=⑤-④ | 87.09 | |
开票销项税 | 项目 期间(时点) | 开票金额 | 计提销项税 | 开票金额 | 计提销项税 | 开票金额 | 计提销项税 | 开票金额 | 计提销项税 | 开票金额 | 计提销项税 | 只开票销项税对当期销项税影响 | ||
2016-12-31/2016 年 | 893.44 | 53.61 | - | - | - | - | 8.75 | 1.49 | 902.19 | 55.10 | ⑥ | — | — | |
2017-12-31/2017 年 | 348.55 | 20.91 | - | - | - | - | 45.55 | 7.74 | 394.10 | 28.65 | ⑦ | e=⑦-⑥ | -26.45 | |
2018-12-31/2018 年 | 61.25 | 3.68 | - | - | 158.06 | 25.29 | 1.62 | 0.28 | 220.93 | 29.25 | ⑧ | f=⑧-⑦ | 0.60 | |
2019-12-31/2019 年 | 123.37 | 7.40 | 270.96 | 35.22 | - | - | - | - | 394.33 | 42.63 | ⑨ | g=⑨-⑧ | 13.39 | |
2020-09-30/2020 年前三季度 | 284.68 | 17.08 | 417.23 | 54.24 | - | - | - | - | 701.91 | 71.32 | ⑩ | h=⑩-⑨ | 28.69 | |
其他因素影响合计 | 2017 年 | — | — | — | — | — | — | — | — | — | — | — | i=a+e | 51.00 |
2018 年 | — | — | — | — | — | — | — | — | — | — | — | j=b+f | 118.58 | |
2019 年 | — | — | — | — | — | — | — | — | — | — | — | k=c+g | -13.79 | |
2020 年前三季度 | — | — | — | — | — | — | — | — | — | — | — | l=d+h | 115.78 |
8-2-1-238
上表中所列示的预收账款金额与财务报表列示的预收款项/合同负债金额之间的核对关系列示如下:
单位:万元
项目 | 2020年9月30日 | 2019年12月31日 | 2018年12月31日 | 2017年12月31日 |
计提销项税的预收金额 | 3,889.93 | 3,028.47 | 3,851.25 | 2,585.10 |
按照应收/预收净额列报的抵消金额 | -418.00 | -547.81 | -443.56 | -349.15 |
财务报表列示金额 | 3,471.93 | 2,480.66 | 3,407.69 | 2,235.95 |
(3)“收到的税费返还”“支付的各项税费”与报表科目的勾稽关系
报告期内发行人现金流量表中“收到的税费返还”“支付的各项税费”与其他报表科目的勾稽关系如下表所示:
一、收到的税费返还
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
所得税费用-按税法及相关规定计算的当年所得税(收到的多缴企业所得税) | - | - | 1.02 | 35.03 |
所得税费用-调整以前期间所得税的影响 | - | - | 191.53 | - |
其他流动资产-预缴企业所得税的减少 | - | 114.60 | - | - |
应交税费-企业所得税的(减少)/增加(预缴所得税退回的影响) | 10.67 | -1.09 | 57.43 | - |
应交税费-增值税的增加(预缴增值税退回的影响) | - | - | 15.34 | - |
应交税费-税金及附加的增加(预缴税金及附加退回的影响) | 0.32 | |||
合计 | 10.99 | 113.51 | 265.32 | 35.03 |
收到的税费返还 | 10.99 | 113.51 | 265.32 | 35.03 |
差异 | - | - | - | - |
8-2-1-239
二、支付的各项税费
单位:万元
项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
所得税费用-按税法及相关规定计算的当年所得税(不含代扣代缴境外所得税及收到的多缴企业所得税) | 527.39 | 810.36 | 666.76 | 621.38 |
其他流动资产-预缴企业所得税的增加 | - | - | 114.60 | - |
应交税费-企业所得税的减少/(增加) | 362.25 | -389.75 | 141.93 | 104.46 |
应交税费-增值税的减少 | 1,178.29 | 1,340.80 | 1,192.90 | 1,182.86 |
税金及附加(包括管理费用中核算的税费) | 145.05 | 215.34 | 141.27 | 166.17 |
应交税费-税金及附加的减少/(增加) | 14.27 | -15.80 | 5.98 | 10.98 |
合计 | 2,227.24 | 1,960.95 | 2,263.44 | 2,085.85 |
支付的各项税费 | 2,227.24 | 1,960.95 | 2,263.44 | 2,085.85 |
差异 | - | - | - | - |
会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于税务事项可能导致的重大错报风险,执行的主要程序如下:
1、与发行人财务部门相关人员访谈,了解发行人相关税务流程、核算方法及核算过程,并执行了穿行测试和控制测试程序;
2、获取发行人软件产品开发销售收入/研究开发费用专项审计报告、人员花名册、企业所得税申报表等重点软件企业认定的相关材料,及税务局优惠备案回执,逐项对照检查发行人是否符合重软企业的认定条件;
3、获取发行人享受增值税优惠政策的软件产品清单,及相应的计算机软件著作权登记证书、增值税优惠备案回执等相关文件,检查是否符合增值税优惠政策的相关规定;
4、了解发行人软件销售业务类型,获取软件收入明细表、了解软件收入情况、收入确认时点等,与增值税申报表申报的软件收入之间是否存在差异;
8-2-1-240
5、了解发行人软件增值税即征即退情况,包括退税基础及计算依据;获取公司申报增值税即征即退的相关资料,并与发行人账面记录核对;检查银行收款相关单据,确认软件增值税退税金额已确实收到且金额正确;
6、获取并检查发行人报告期内增值税纳税申报表,检查、核实增值税申报情况是否与账面情况一致,并将销售收入与销项税额、采购与进项税额进行勾稽检查;
7、检查了发行人报告期内“收到的税费返还”及“支付的各项税费”与对应的资产负债表项目、利润表项目的勾稽关系。
基于我们所执行的审计和核查程序,申报会计师认为:
1、报告期内,发行人符合国家规划布局内重点软件企业认定的相关条件,相关认定到期后若不能被持续认定,不会对公司持续经营及业绩产生重大影响,发行人已在招股说明书中充分披露相关风险;
2、发行人享受增值税即征即退优惠的软件产品符合增值税优惠政策的相关规定;发行人增值税即征即退金额与软件收入匹配关系合理; 进项税额和销项税额与采购和销售的匹配关系合理;
3、发行人“收到的税费返还” “支付的各项税费”与对应的资产负债表项目、利润表项目勾稽相符。
18.关于货币资金
报告期各期末,公司货币资金分别为1,301.73万元、4,669.16万元和16,325.52万元,公司货币资金主要为银行存款,报告期内发行人存在购买银行理财产品的情形。
请发行人说明:(1)结合报告期各期购买理财产品的具体情况,分析相关会计处理是否符合企业会计准则的相关规定,与报表相关科目的勾稽关系,理财产品购买履行的相关决策程序,发行人建立的与货币资金相关的内部控制及执行情况;(2)结合目前大额货币资金的使用计划,说明发行人需要进一步补充流动资金的原因及合理性。
请保荐机构核查并发表明确意见,请申报会计师对说明事项(1)核查并发表明确意见。
答复:
发行人说明事项
8-2-1-241
(1)结合报告期各期购买理财产品的具体情况,分析相关会计处理是否符合企业会计准则的相关规定,与报表相关科目的勾稽关系,理财产品购买履行的相关决策程序,发行人建立的与货币资金相关的内部控制及执行情况
一、报告期内公司购买理财产品的情况
2017年度购买理财产品情况:
单位:万元
银行名称 | 理财产品名称 | 理财产品类型 | 期初金额 | 本期购入 | 本期赎回 | 期末未收利息 | 期末金额 | 利息收入 | 年化收益率 | 是否保本 |
浦发银行 | 利多多对公结构性存款公司固定持有期 | 保证收益型 | - | 6,000.00 | 3,000.00 | - | 3,000.00 | 30.78 | 4.15%-4.25% | 是 |
平安银行 | 平安银行卓越计划滚动型人民币公司理财产品 | 非固定期限保本浮动收益型 | - | 7,500.00 | 3,000.00 | - | 4,500.00 | 100.40 | 3.50%-4.35% | 是 |
合计 | - | 13,500.00 | 6,000.00 | - | 7,500.00 | 131.18 |
2018年度购买理财产品情况:
单位:万元
银行名称 | 理财产品名称 | 理财产品类型 | 期初金额 | 本期购入 | 本期赎回 | 期末未收利息 | 期末金额 | 利息收入 | 年化收益率 | 是否保本 |
浦发银行 | 利多多对公结构性存款公司固定持有期 | 保证收益型 | 3,000.00 | 10,500.00 | 12,500.00 | - | 1,000.00 | 140.14 | 3.75%-4.55% | 是 |
8-2-1-242
平安银行 | 平安银行卓越计划滚动型人民币公司理财产品 | 非固定期限保本浮动收益型 | 4,500.00 | - | 1,700.00 | - | 2,800.00 | 111.68 | 3.50%-4.35% | 是 |
平安银行对公结构性存款(挂钩利率)开放型人民币产品 | 固定期限保本浮动收益型 | - | 13,500.00 | 9,000.00 | - | 4,500.00 | 86.62 | 3.10%-4.70% | 是 | |
合计 | 7,500.00 | 24,000.00 | 23,200.00 | - | 8,300.00 | 338.43 |
2019年度购买理财产品情况:
单位:万元
银行名称 | 理财产品名称 | 理财产品类型 | 期初金额 | 本期购入 | 本期赎回 | 期末未收利息 | 期末金额 | 利息收入 | 年化收益率 | 是否保本 |
浦发银行 | 利多多对公结构性存款公司固定持有期 | 保证收益型 | 1,000.00 | - | 1,000.00 | - | - | 3.54 | 3.75% | 是 |
浦发银行 | 利多多对公结构性存款(挂钩金融衍生品) | 固定期限保本浮动收益型 | - | 5,000.00 | - | - | 5,000.00 | - | 3.75% | 是 |
平安银行 | 平安银行卓越计划滚动型人民币公司理财产品 | 非固定期限保本浮动收益型 | 2,800.00 | - | 2,800.00 | - | - | 45.67 | 3.50%-4.35% | 是 |
平安银行对公结构性存款(挂钩利率)开放型人民币产品 | 固定期限保本浮动收益型 | 4,500.00 | 44,100.00 | 38,000.00 | 1.69 | 10,601.69 | 273.85 | 3.08%-4.15% | 是 |
8-2-1-243
中信银行 | 中信银行共赢利率人民币结构性存款产品 | 固定期限保本浮动收益型 | - | 19,950.00 | 19,950.00 | - | - | 132.61 | 3.45%-4.12% | 是 |
合计 | 8,300.00 | 69,050.00 | 61,750.00 | 1.69 | 15,601.69 | 455.67 |
2020年1-9月购买理财产品情况:
单位:万元
银行名称 | 理财产品名称 | 理财产品类型 | 期初金额 | 本期购入 | 本期赎回 | 期末未收利息 | 期末金额 | 利息收入 | 年化收益率 | 是否保本 |
浦发银行 | 利多多对公结构性存款(挂钩金融衍生品) | 固定期限保本浮动收益型 | 5,000.00 | 8,597.00 | 5,000.00 | 56.43 | 8,653.43 | 93.75 | 2.90%-3.75% | 是 |
平安银行 | 平安银行对公结构性存款(挂钩利率)开放型人民币产品 | 固定期限保本浮动收益型 | 10,600.00(注) | 500.00 | 11,100.00 | - | - | 34.47 | 3.20%-3.73% | 是 |
中信银行 | 中信银行共赢汇率人民币结构性存款产品 | 固定期限保本浮动收益型 | - | 19,204.00 | 16,400.00 | 4.73 | 2,808.73 | 256.16 | 2.40%-4.20% | 是 |
中信银行共赢利率人民币结构性存款产品 | 固定期限保本浮动收益型 | - | 32,500.00 | 15,200.00 | 106.84 | 17,406.84 | 204.62 | 2.90%-4.20% | 是 | |
合计 | 15,600.00 | 60,801.00 | 47,700.00 | 168.00 | 28,869.00 | 589.00 |
注:平安银行对公结构性存款(挂钩利率)开放型人民币产品2020年年初余额与2019年末的期末余额差异人民币1.69万元为截至2019年末公司未收的理财产品利息。
8-2-1-244
二、理财产品的会计处理是否符合相关会计准则的规定
报告期内,发行人购买的理财产品主要类型包括以下三种类型:保证收益型,非固定期限保本浮动收益型,及固定期限保本浮动收益型三类,具体如下:
1、保证收益型(如利多多对公结构性存款公司固定持有期),银行确保本金和约定收益,投资到期日一次性返还产品存款本金和支付约定的产品收益。
2、非固定期限保本浮动收益型(如平安银行卓越计划滚动型人民币公司理财产品),银行对产品的收益不提供保证承诺,发行人可在第二个理财期及之后的每个理财期的产品开放期提出申购与赎回申请,若发行人在产品开放日不提出赎回申请,将视为发行人选择继续理财。
3、固定期限保本浮动收益型(如平安银行对公结构性存款(挂钩利率)、中信银行共赢利率人民币结构性存款以及利多多对公结构性存款(挂钩金融衍生品),银行对产品的收益不提供保证承诺,银行与发行人约定固定投资周期,每个投资周期内,投资者无提前终止该投资周期内结构性存款计划的权利。
财政部于2017年颁布了 《企业会计准则第22号——金融工具确认和计量 (修订) 》、《企业会计准则第23号——金融资产转移 (修订) 》、《企业会计准则第24号——套期会计 (修订) 》及《企业会计准则第37号——金融工具列报 (修订) 》(统称“新金融工具准则”) 。新金融工具准则修订了财政部于2006年颁布的《企业会计准则第22号——金融工具确认和计量》、《企业会计准则第23号——金融资产转移》和《企业会计准则第24号——套期保值》以及财政部于2014年修订的《企业会计准则第37号——金融工具列报》(统称“原金融工具准则”) 。
发行人自2017年1月1日至2018年12月31日止执行原金融工具准则,自2019年1月1日起执行新金融工具准则。
根据原金融工具准则:
针对保证收益型理财产品,银行承诺本金和固定收益,表明可回收金额固定或可确定,且该理财产品再活跃市场中没有报价,故发行人将该理财产品归类为贷款和应收款项,发行人按实际利率法计提利息,并确认投资收益。
针对固定期限保本浮动收益型和非固定期限保本浮动收益型理财产品,由于投资收益的浮动性,理财产品不具有未来回收金额固定或可确定的性质,因此不能被划分为贷款及应收款项及持有到期投资,同时发行人购买理财产品的目的不是为了近期内出售,也不能被划分为交易性金融资产,因此该理财产品符合原金融工具准则下可供出售金融
8-2-1-245
资产的规定,故发行人将该理财产品分类为可供出售金融资产核算,在实际收到利息时确认为投资收益。上述三种理财产品的期限均在一年以内,故发行人将2017年末与2018年末未赎回的理财产品在资产负债表上列报为“其他流动资产”,理财产品取得的利息收入确认为投资收益符合企业会计准则的相关规定。
根据新金融工具准则:
企业应当根据其管理金融资产的业务模式和金融资产的合同现金流量特征,将金融资产划分为以摊余成本计量的金融资产;以公允价值计量且其变动计入其他综合收益的金融资产;以公允价值计量且其变动计入当期损益的金融资产。
针对上述保证收益型理财产品,银行承诺本金和固定收益,其合同现金流量特征与基本借贷安排一致,即相关金融资产在特定日期产生的合同现金流量仅为对本金和以未偿付本金为基础的利息的支付,同时发行人购买理财产品的目的不是为了近期内出售,而是以收取合同现金流量为目标,因此该理财产品可归类为以摊余成本计量的金融资产,发行人按实际利率法计提利息,在实际收到利息时确认为投资收益。
针对固定期限保本浮动收益型和非固定期限保本浮动收益型理财产品,其合同现金流量特征与基本借贷安排不一致,即相关金融资产在特定日期产生的合同现金流量不是对本金和以未偿付本金为基础的利息的支付,因此不能分类为以摊余成本计量的金融资产,故作为以公允价值计量且其变动计入当期损益的金融资产,在实际收到利息时确认为投资收益,理财产品在到期日前公允价值的变动计入公允价值变动收益。
公司于2019年末和2020年9月末持有的理财产品全部为固定期限保本浮动收益型理财产品,期限均在一年以内,故发行人于2019年末与2020年9月末将未赎回的理财产品在资产负债表上列报为“交易性金融资产”,符合企业会计准则的相关规定。
三、理财产品与报表科目的勾稽关系
各报告期期末,理财产品同报表科目的勾稽关系列示如下:
单位:万元
报表类型 | 财务报表科目 / 项目 | 项目 | 2020年1-9月 | 2019年度 | 2018年度 | 2017年度 |
资产负债表 | 其他流动资产 | 理财产品余额 | - | - | 8,300.00 | 7,500.00 |
交易性金融资产 | 28,869.00 | 15,601.69 | - | - | ||
现金流量表 | 投资支付的现金 | 购买理财产品 | 60,801.00 | 69,050.00 | 24,000.00 | 13,500.00 |
收回投资收到的现金 | 赎回理财产品 | 47,700.00 | 61,750.00 | 23,200.00 | 6,000.00 |
8-2-1-246
取得投资收益收到的现金 | 赎回理财产品 | 590.69 | 453.98 | 338.43 | 131.18 | |
利润表 | 投资收益 | 赎回理财产品 | 589.00 | 453.98 | 338.43 | 131.18 |
投资收益 | 期末未收利息 | - | 1.69 | - | - | |
公允价值变动损益 | 168.00 | - | - | - |
四、公司购买银行理财产品需要履行的决策程序
根据公司的《海天瑞声对外投资管理办法》和《海天瑞声非日常经营交易事项决策制度》,公司在年度预算中制定投资理财计划及预期收益,若购买理财产品预算金额占公司最近一期经审计总资产的比例未达到 50%的,由总经理办公会议讨论通过后,提交董事会审批决定;超过 50%的,由董事会讨论通过后,提交股东大会审议决定。若会计年度内购买理财产品金额在预算内,在每次购买时无需再次提交董事会审批。财务部根据未来一周、月度、季度的现金流变动情况编制投资理财报告。投资理财报告中包含对理财产品的考察、分析,从而选出最适宜的理财产品,财务人员将编制的投资理财报告交由财务部门经理审批,部门经理审批完成后由财务负责人审批,财务负责人审批通过后方可购买相关理财产品。
五、发行人建立的与货币资金相关的内部控制及执行情况
报告期内,发行人公司建立了《海天瑞声货币资金管理制度》、《海天瑞声对外投资管理办法》、《海天瑞声财务支出管理办法》、《海天瑞声财务报销及借款管理办法》和《海天瑞声第三方电子账户支付管理办法》作为资金管理工作的制度依据,发行人对货币资金相关的内部控制制度如下:
关键控制点 | 控制活动 |
职责分工和职权分离制度 | 发行人实施钱账分管制度,出纳人员不得兼任稽核、会计档案保管和收入、支出、费用、债权债务账目的登记工作,发行人严禁将办理资金支付业务的相关印章和票据集中一人保管。 |
库存现金管理 | 发行人建立了健全严密的库存现金内部控制制度,配备专职出纳人员,办理现金收付和结算业务,发行人对库存现金有明确的开支范围规定,对库存现金支付的审批权限有明确的规定,库存现金的管理实现日清月结,出纳人员每日对现金进行盘点,编制盘点表,财务部主管每月末对现金盘点进行监盘。 |
银行账户的开立与取消 | 发行人将所有银行账户均纳入用友-资金管理平台统一管理,财务部门资金会计定期梳理银行账户,及时根据需要,提出增加或清理账户申请,上报财务负责人审批。 |
银行存款收支管理 | 发行人实行严格的资金支付业务审批程序,资金支付的申请根据需要 |
8-2-1-247
经过部门负责人和财务经理审批,金额重大的需经财务负责人审批。 | |
银行对账管理 | 非出纳人员根据银行对账单或银行对账电子文件,与财务系统中的银行日记账相核对,编制上月《银行余额调节表》,《银行余额调节表》由财务经理及时进行复核。对银行存款日记账和银行对账单的差异,非出纳人员分析是否为月末未达事项或记账错误,经财务负责人复核后,对于记账错误,在发现问题当月进行调整。 |
电商平台企业账户收支管理 | 发行人因采购需要开通电商账户企业平台,由行政部专员发起申请,电商平台企业账户须经财务部审批后,由财务部在电商平台注册企业账号。行政部采购专员负责企业账户的日常管理与使用,定期更换密码,当电商账户余额不足时,向财务部提出账户充值申请,并经财务部审核。 |
综上所述,发行人根据《企业内部控制基本规范》的规定,针对货币资金的管理建立了完善的内控制度,实行钱、账分离以及收支两条线的管理制度,严格按照授权审批办理资金业务,确保了公司资金在使用上符合合理性、效率性、安全性的原则,确保为公司发展提供充足的资金支持。
(2)结合目前大额货币资金的使用计划,说明发行人需要进一步补充流动资金的原因及合理性
一、大额货币资金的使用计划及具体预算
截至2020年9月30日,发行人货币资金金额为7,585.96万元,主要使用计划及预算如下:
单位:万元
用途 | 金额 |
购买商品、接受劳务 | 3,500.00 |
支付职工薪酬 | 1,600.00 |
支付各项税费 | 1,000.00 |
支付其他与经营活动有关 | 800.00 |
购建固定资产、无形资产和其他长期资产 | 100.00 |
支付其他与筹资活动有关 | 300.00 |
合计 | 7,300.00 |
此外,截至2020年9月30日,发行人交易性金融资产余额为28,869.00万元,主要为发行人购买的理财产品。发行人后续拟相机决策,主要将前述资金运用于长期发展相关的各项支出:1、持续扩大产能,拓展境内外销售渠道,提供更为全面的训练数
8-2-1-248
据定制服务,完善训练数据库产品体系,提升训练数据相关的应用服务市场竞争力;2、在保持基础训练数据领域的优势外,投入专项资金建设行业训练数据研发体系并建立市场销售渠道。
二、发行人需要进一步补充流动资金的原因及合理性
结合上述大额货币资金使用计划情况,发行人的货币资金主要运用于购买商品、接受劳务及支付职工薪酬、税费等各项经营活动相关支出以及长期发展相关的各项支出。本次发行拟募集10,000万元补充流动资金,主要原因是随着公司收入增长,预计会产生一定的流动资金投入需求,另外一方面是下游行业快速发展,要求公司持续关注市场需求变化,拓展核心技术优势,预计也会增加流动资金投入需求,具体说明如下:
1、随着收入增长产生的流动资金需求
随着公司未来收入的增长,会产生一定的流动资金投入,具体测算如下:
根据公司历史年度收入增长情况及业务经营特点,结合2016年-2019年公司营业收入的平均增长率情况,预测公司2020-2022年的营业收入增长率为40%。
金额单位:万元
项目 | 2016年 | 2017年 | 2018年 | 2019年 |
营业收入 | 8,422.86 | 11,907.09 | 19,265.77 | 23,755.81 |
增长率 | 41.37% | 61.80% | 23.31% | |
平均增长率 | 42.16% | |||
复合增长率 | 41.29% | |||
测算用增长率 | 40.00% |
假设公司经营性流动资产、经营性流动负债主要项目与公司的销售收入呈一定比例。
根据上述基本假设,对未来三年公司新增流动资金需求测算如下:
8-2-1-249
金额单位:万元
项目 | 2016 | 2017 | 2018 | 2019 | 平均占比 | 2020年至2022年预计经营资产及经营负债数额 | 2022年期末预计数-2019年末实际数 | ||||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 2020年(预计) | 2021年(预计) | 2022年(预计) | |||
营业收入 | 8,422.86 | 100.00% | 11,907.09 | 100.00% | 19,265.77 | 100.00% | 23,755.81 | 100.00% | - | 33,258.14 | 46,561.39 | 65,185.95 | 41,430.14 |
应收账款 | 1,684.24 | 20.00% | 2,515.58 | 21.13% | 2,938.96 | 15.25% | 4,364.55 | 18.37% | 18.69% | 6,215.13 | 8,701.18 | 12,181.65 | 7,817.11 |
预付账款 | 64.10 | 0.76% | 45.16 | 0.38% | 83.57 | 0.43% | 419.96 | 1.77% | 0.84% | 277.86 | 389.01 | 544.61 | 124.65 |
存货 | 852.54 | 10.12% | 1,185.65 | 9.96% | 2,063.20 | 10.71% | 754.75 | 3.18% | 8.49% | 2,824.08 | 3,953.71 | 5,535.19 | 4,780.45 |
经营性流动资产合计 | 2,600.88 | 30.88% | 3,746.39 | 31.46% | 5,085.74 | 26.40% | 5,539.26 | 23.32% | - | 9,317.07 | 13,043.90 | 18,261.46 | 12,722.20 |
应付账款 | 43.42 | 0.52% | 40.66 | 0.34% | 193.46 | 1.00% | 359.69 | 1.51% | 0.84% | 280.64 | 392.89 | 550.05 | 190.35 |
预收账款 | 877.17 | 10.41% | 2,235.95 | 18.78% | 3,407.69 | 17.69% | 2,480.66 | 10.44% | 14.33% | 4,766.10 | 6,672.54 | 9,341.56 | 6,860.90 |
经营性流动负债合计 | 920.58 | 10.93% | 2,276.61 | 19.12% | 3,601.15 | 18.69% | 2,840.35 | 11.96% | - | 5,046.74 | 7,065.43 | 9,891.60 | 7,051.26 |
流动资金占用额 (经营资产-经营负债) | 1,680.30 | 19.95% | 1,469.78 | 12.34% | 1,484.59 | 7.71% | 2,698.91 | 11.36% | - | 4,270.34 | 5,978.47 | 8,369.86 | 5,670.95 |
注:上表测算不构成对发行人未来业绩的盈利预测。
由上表可知,未来三年发行人因业务规模扩张新增的流动资金需求预计为5,670.95万元。
8-2-1-250
2、下游行业快速发展、人才储备需要带来的流动资金投入需求除前述业务扩张引致的流动资金投入需求外,下游行业快速发展、人才储备需要等也将带来流动资金投入需求,储备一定规模的流动资金是发行人实施未来发展战略规划的需要,原因及合理性具体如下:
人工智能行业发展迅速,下游客户对训练数据产品及服务的需求可能持续变化升级,发行人需要紧跟行业发展趋势,持续关注市场需求变化,着力挖掘和培养自身核心技术优势并拓展自身产品及服务结构,提升公司核心竞争力,同时,为弥补竞争劣势,公司须加强海外市场拓展,拓展更丰富的营销渠道。因此,公司需要准备充足的流动资金以满足未来可能持续新增的研发和市场拓展投入需求。
发行人业务涉及基础研究、工具平台、训练数据生产多层次核心技术,也需要持续招揽相应行业的优秀人才,为保持有竞争力的薪酬水平以留住现有人才并引进优秀行业人才,发行人需要充足的资金支持。
3、小结
综上,随着公司业务规模的持续扩张,发行人对流动资金的需求预计将持续扩大,公司需补充流动资金,以优化公司资本结构、增强公司资金实力、提升公司的抗风险实力,为公司业务的稳定增长提供财务保障;同时,下游行业的迅速发展、人才储备等都将催生的流动资金需求,公司补充流程流动资金具备必要性和合理性。
通过本次募集资金补充营运资金缺口,一方面将有利于增强公司的营运能力和市场竞争能力,另一方面还将一定程度上改善公司流动性指标,提高公司偿债能力,降低公司财务风险,使公司财务结构更为优化。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于理财产品和货币资金可能导致的重大错报风险,执行的主要程序如下:
1、对发行人管理层、财务主管人员等进行访谈,获取发行人建立的与货币资金、购买理财产品相关的内部控制制度,对货币资金、购买理财产品相关的流程及其控制活动的情况执行穿行测试;
2、对货币资金、购买理财产品相关的流程中识别的关键控制点执行控制有效性测试,选择适当的样本,检查关键控制点是否得到有效执行;
8-2-1-251
3、获取发行人报告期内相关理财产品说明书、理财产品协议书、银行回单和相应凭证,核查理财合同金额、期限、预期收益率、风险等级、投资方向等信息与账面记录和披露信息是否相符,检查会计处理是否符合企业会计准则的规定;
4、获取报告期内理财产品购买和赎回交易记录及收益明细,测算理财收益计算是否准确;
5、检查理财产品的相关会计记录,并与财务报表的各个科目进行勾稽核对。
针对说明事项(一):基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人报告期内购买、赎回理财产品的相应的会计处理符合企业会计准则的规定,与报表相关科目勾稽相符;
2、发行人报告期内购买、赎回理财产品履行了必要的决策程序;
3、发行人建立的与货币资金和购买理财产品相关的内控制度健全且有效执行。
19.关于应收账款
报告期各期末,公司应收账款账面净额分别为2,515.58万元、2,938.96万元和4,364.55万元,逐年上升。
请发行人补充披露:预期信用损失率的确认方法。
请发行人说明:(1)信用额度等级的确定标准,客户信用政策的审批制度、审批程序及执行情况,报告期内发行人对主要客户的信用结算政策及变动情况;(2)前五大应收账款与前五大客户之间的匹配关系和差异原因;(3)期后回款的统计方法,是否存在将预付款项认定为应收账款回款的情形。
请申报会计师进行核查并发表明确意见。
答复:
发行人补充披露事项
(1)预期信用损失率的确认方法
发行人自2019年1月1日开始执行新金融工具准则。新金融工具准则以“预期信用损失”模型替代了原金融工具准则中的“已发生损失”模型。
8-2-1-252
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/四、报告期内主要采用的会计政策和会计估计/(八)金融工具/2、自2019年1月1日起执行新金融工具准则下的政策”中进行了补充披露:
发行人始终按照相当于整个存续期内预期信用损失的金额计量应收账款的减值准备,并以逾期天数与预期信用损失率对照表为基础计算其预期信用损失。预期信用损失率基于应收账款过去期间的实际信用损失经验计算,并考虑历史数据收集期间的经济状况、当前的经济状况与发行人所认为的预计存续期内的经济状况三者之间的差异。
第一步:确定客户群的构成
根据发行人的历史经验,发行人的客户群体比较稳定,主要为信誉良好的大型科技公司、研究机构等,客户群体发生信用损失的情况没有显著差异,因此在计算减值准备时未进一步区分不同的客户群体。
第二步:确定用于计算历史损失率的历史数据集合
资产负债表日,发行人选取截至资产负债表日为止的最近3个会计年度末应收账款账龄数据用以计算最新的历史损失率。对于截至2019年12月31日止的年度期间而言,发行人选择的是2017年至2019年这段期间。
报告期内,发行人最近三年末应收账款逾期账龄情况如下表所示:
单位:万元
项目 | 2019年12月31日 | 2018年12月31日 | 2017年12月31日 |
未逾期 | 3,493.65 | 2,699.02 | 1,706.67 |
逾期1年以内 (含1年) | 1,107.37 | 338.59 | 884.23 |
逾期1至2年 (含2年) | 2.44 | 59.14 | 116.67 |
逾期2年以上 | 56.90 | - | - |
合计 | 4,660.36 | 3,096.75 | 2,707.57 |
第三步:计算应收账款迁徙率
迁徙率是指在一个时间段内没有收回而迁徙至下一个时间段的应收账款的比例。发行人根据客户群最近3年期间的历史逾期情况,计算应收账款迁徙率。
8-2-1-253
发行人应收账款迁徙率计算过程如下:
单位:万元
项目 | 2019年12月31日 | 2018年12月31日 | 2017年12月31日 | 年末综合余额 | 注释 | 公式 | 迁徙率 |
未逾期 | 3,493.65 | 2,699.02 | 1,706.67 | 7,899.34 | A | B/A | 29.50% |
逾期1年以内 (含1年) | 1,107.37 | 338.59 | 884.23 | 2,330.20 | B | C/B | 7.65% |
逾期1至2年 (含2年) | 2.44 | 59.14 | 116.67 | 178.25 | C | D/C | 31.92% |
逾期2年以上 | 56.90 | - | - | 56.90 | D | D/D | 100.00% |
合计 | 4,660.36 | 3,096.75 | 2,707.57 | 10,464.69 |
第四步:计算历史损失率,并结合当前状况以及对未来经济状况的预测,确定预期信用损失率历史损失率代表在历史上每个时间段中最终不能收回的应收账款所占比例。发行根据历史数据经验判断认为逾期2年以上的应收账款确认无法收回,损失率为100%,在此基础上,发行人根据历史期间客户群体应收账款迁徙率计算得到各账龄段的历史损失率。同时管理层在历史损失率的基础上,基于当前经济状况以及对未来经济状况的预测,对计算出的历史损失率做出调整,确定各账龄段的预期信用损失率。发行人将预期信用损失率乘以应收账款余额来建立准备矩阵。
发行人预期信用损失率的计算过程如下:
单位:万元
项目 | 注释 | 迁徙率 | 历史损失率 计算过程 | 历史损失率 | 调整后的预期 信用损失率 | 同行业上市公司预期信用损失率区间(注) |
未逾期 | A | 29.50% | A*B*C*D | 0.72% | 3.00% | 0.01%-7.00% |
逾期1年以内 (含1年) | B | 7.65% | B*C*D | 2.44% | 12.00% | 1.71%-50.00% |
逾期1至2年 (含2年) | C | 31.92% | C*D | 31.92% | 50.00% | 5.00%-100.00% |
逾期2年以上 | D | 100.00% | D | 100.00% | 100.00% | 5.01%-100.00% |
注:同行业上市公司包括,包括荣科科技、彩讯股份、天玑科技、四方精创、恒生电子、用友网络、万兴科技、及泛微网络;对于上述同行业公司按照应收账款账龄划分预期信用损失率的情形,此处将应收账款账龄区间为1年以内的预期信用损失率作为未逾期和逾期1年以内 (含1年)的预期信用损失率,将应收账款账龄区间为1-2年的预期
8-2-1-254
信用损失率作为此处逾期1至2年(含2年)的预期信用损失率,将应收账款账龄区间为2年以上的预期信用损失率作为逾期2年以上的预期信用损失率。发行人运用迁徙法计算历史损失率,基于当前经济状况以及对未来经济状况的预测,同时对比了同行业可比公司信息后,对计算出的历史损失率做出调整,并基于谨慎性原则采用调整后的预期信用损失率计算应收账款坏账准备。
发行人于每年末根据更新的信息重新计算应收账款的预期信用损失率;如果用于计算预期信用损失率的信息在年内出现重大变化,发行人会重新评估预期信用损失率,必要时进行调整以准确反应应收账款的预期信用损失。发行人说明事项
(1)信用额度等级的确定标准,客户信用政策的审批制度、审批程序及执行情况,报告期内发行人对主要客户的信用结算政策及变动情况
一、信用额度等级的确定标准
发行人获取客户信用资料,对客户进行信用调查,进行信用等级评定,根据客户的信用等级制定不同的授信策略,具体如下:
信用额度等级 | 信用额度 | 信用期限 | 抵押/担保 |
特级 | 1000万 | 不超过90个工作日 | 无 |
一级 | 500万–1000万 | 不超过90天 | 无 |
二级 | 200万-500万 | 不超过60天 | 无 |
三级 | 0万–200万 | 不超过45天 | 无 |
四级 | 现销,如赊销则需提供与信用额度相同的抵押、担保 |
所有拟与发行人发生赊销交易的客户均需要进行信用等级评定。客户信用等级分为5个等级:特级、一级、二级、三级、四级。
(1)特级为优秀客户,指规模较大,信誉良好,经营情况和财务状况均较好的客户;(2)一级为良好客户,指有一定规模,与公司有长期业务往来,信誉较好的客户;
(3)二级为中等客户,指付款良好,经济实力较好,信誉较好,但与公司业务往来不多的客户;(4)三级为一般客户,指经营情况和付款情况一般,与公司有一定业务往来的客户;(5)四级为较差客户,指有不良付款记录、信誉较差的客户。
二、客户信用政策的审批制度、审批程序及执行情况
8-2-1-255
根据发行人制定的《销售信用管理规定》,销售部负责赊销活动的对外沟通及资料收集,并负责主导信用申请流程及信用档案的管理。财务部负责对信用申请的审核与建议、信用执行的日常监督管理。财务总监负责审核一般的信用额度申请/变更、信用解冻申请和信用冻结审批;对于额度超过1,000万、账期超过90个工作日的信用额度申请,在财务总监审核批准后仍需由总经理办公会终批,另外总经理办公会也负责对特殊信用额度申请/变更进行审批。所有客户的信用额度审批有效期均为一年,一年之后由销售部重新评估和申请授予客户的信用额度,由财务部对客户进行信用申请的审定与审核;一年之内如果客户发生重大变化,可以启动临时审定。
发行人在报告期内建立了完善的客户信用政策的审批制度和审批程序,并严格执行了相关制度规定。
三、报告期内发行人对主要客户的信用结算政策及变动情况
报告期内,发行人主要客户的信用政策与上述总体信用政策一致,信用额度在200万到1,000万之间,信用期限在45天到90个工作日之间,而且在报告期内未发生重大变动。
(2)前五大应收账款与前五大客户之间的匹配关系和差异原因
报告期内,发行人按照品牌统计的应收账款前五大客户及销售收入前五大客户情况具体如下:
单位:万元
2020年1-9月 | |||
应收账款前五大客户品牌 | 期末余额 | 销售收入前五大客户品牌 | 本期发生额 |
腾讯 | 801.59 | 微软 | 2,399.75 |
中国某大型科技公司 | 371.84 | 阿里巴巴 | 1,534.12 |
阿里巴巴 | 308.31 | 腾讯 | 1,079.09 |
小米 | 281.43 | 字节跳动 | 822.42 |
拼多多 | 279.00 | 某国际消费电子产品厂商 | 732.91 |
合计 | 2,042.17 | 合计 | 6,568.29 |
2019年 | |||
应收账款前五大客户品牌 | 年末余额 | 销售收入前五大客户品牌 | 本年发生额 |
中国某大型科技公司 | 711.73 | 三星 | 4,762.06 |
腾讯 | 424.47 | 微软 | 2,876.20 |
8-2-1-256
阿里巴巴 | 423.70 | 阿里巴巴 | 2,208.26 |
微软 | 380.13 | 亚马逊 | 1,492.98 |
亚马逊 | 290.52 | 腾讯 | 1,459.31 |
合计 | 2,230.54 | 合计 | 12,798.80 |
2018年 | |||
应收账款前五大客户品牌 | 年末余额 | 销售收入前五大客户品牌 | 本年发生额 |
阿里巴巴 | 1,261.62 | 阿里巴巴 | 5,179.07 |
腾讯 | 454.27 | 三星 | 2,436.81 |
亚马逊 | 351.94 | 腾讯 | 1,574.16 |
百度 | 289.80 | 微软 | 1,299.73 |
Info-communications Media Development Authority(“IMDA”) | 108.90 | 百度 | 888.29 |
合计 | 2,466.53 | 合计 | 11,378.06 |
2017年 | |||
应收账款前五大客户品牌 | 年末余额 | 销售收入前五大客户品牌 | 本年发生额 |
腾讯 | 836.63 | 腾讯 | 1,770.05 |
阿里巴巴 | 326.89 | 三星 | 1,553.08 |
乐乐创新 | 209.88 | 阿里巴巴 | 1,132.01 |
百度 | 202.76 | 微软 | 1,058.87 |
富士康 | 191.52 | 百度 | 585.29 |
合计 | 1,767.69 | 合计 | 6,099.29 |
报告期内,发行人应收账款与销售收入的前五大客户较为稳定,主要为人工智能产业链上的各类知名公司与机构,如阿里巴巴、腾讯、百度、微软、三星、亚马逊等。其中2017年,腾讯、阿里巴巴、百度既是应收账款前五大客户,又是销售收入前五大客户;2018年度,阿里巴巴、腾讯和百度既是应收账款前五大客户,又是销售收入前五大客户;2019年度,微软、阿里巴巴、腾讯和亚马逊既是应收账款前五大客户,又是销售收入前五大客户;2020年前三季度,腾讯和阿里巴巴既是应收账款前五大客户又是销售收入前五大客户。
应收账款前五大客户与销售收入前五大客户之间存在差异的情况及原因分析:
1、三星和微软通常采取提前预付款项的结算模式,因此与其的往来款余额通常体现为发行人的预收账款余额,因此也导致在2017年、2018年、2019年和2020年前
8-2-1-257
三季度,三星和微软虽然是发行人销售收入的前五大客户,但并不一定是应收账款前五大客户。
2、乐乐创新不在2017年度销售收入前五大客户之列,但在2017年末是应收账款前五大客户,主要原因是由于发行人在2016年向乐乐创新销售训练数据产品,产生应收款209.88万元截至2017年末仍未结算,因此2017年末应收账款余额虽然较高,但是收入金额并不在2017年反映。富士康不在2017年销售收入前五大客户之列,但在2017年末是应收账款前五大客户,应收账款余额为191.52万元。2017年与富士康的收入交易额为233.85万元,由于年末交付验收的收入尚未到付款结算时点,因此2017年末余额较高。
3、亚马逊与IMDA均为2018年度新发展的客户,不在2018年度销售收入前五大客户之列,但在2018年末进入应收账款前五大客户,原因主要是由于其项目均于2018年12月结束,并进行交付验收和确认收入,但截至2018年末尚未到付款结算时点,因此形成较大金额的应收账款。
4、中国某大型科技公司在2019年末及2020年三季度末是应收账款前五大客户,但不是销售收入前五大客户。虽然中国某大型科技公司在2019年末及2020年三季度末没有进入销售收入前五大客户,但仍然是销售收入的前十大客户,2019年及2020年前三季度分别产生销售收入1,019.94万元和514.72万元,销售额较高,而且由于其信用期较长,收入产生的应收账款于2019年末及2020年三季度末尚未到付款结算时点,因此2019年末及2020年三季度末应收账款余额较高。
5、某国际消费电子产品厂商与字节跳动为2020年前三季度销售收入前五大客户,但在2020年三季度末未进入应收账款前五大客户之列,原因主要是其交付验收的项目大部分于2020年三季度末已达到付款结算时点,并且发行人已经收到回款。
6、小米和拼多多分别为2016年度和2019年度新发展的客户,不在2020年前三季度销售收入前五大客户之列,但在2020年三季度末为应收账款前五大客户,原因主要是由于其项目均于2020年9月结束,并进行交付验收和确认收入,但截至2020年三季度末尚未到付款结算时点,因此形成较大金额的应收账款。
(3)期后回款的统计方法,是否存在将预付款项认定为应收账款回款的情形
发行人期后回款的统计主要是依据发票信息进行核对和对应,发票可以直接核对至单个合同,避免了同一客户的不同合同的回款相互间混淆的情况。对于每个合同而言,发行人确认收入前收取的款项对应为客户预付款项,确认收入后收到的款项对应为客户应收账款的回款,因此能够避免将客户的预付款认定为应收账款回款的情形。
8-2-1-258
在实际操作中,发行人的财务人员在单个合同下开具发票,并且对发票信息、客户名称、合同编号等信息进行核对并登记。开具发票后有专门的商务专员负责跟进,并积极与客户进行沟通。在收到应收账款的期后回款后,财务人员会与商务专员沟通并确认回款金额对应的发票信息、合同信息,并根据发票对应的合同信息记录入账。通过上述安排,发行人根据发票来进行期后回款的统计,避免了将预付款项认定为应收账款回款的情形。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于应收账款可能导致的重大错报风险,执行的主要程序如下:
1、了解发行人销售管理相关的内部控制,关注主要客户的信用情况,应收账款账龄表以及逾期账龄表的编制及审核等,并测试关键财务报告内部控制的运行有效性;
2、取得发行人报告期各期末应收账款账龄明细表、逾期明细表、应收账款坏账准备计算表,通过分析实际坏账损失情况,评估预期损失模型相关参数、方法、假设的合理性;同时比较新旧金融工具准则下计提的应收账款坏账准备金额是否存在显著差异,比较与同行业公司应收账款坏账计提政策是否存在重大差异;
3、向主要客户函证应收账款余额,并对主要客户进行实地走访,回函及走访结果未见重大异常情形;
4、针对应收账款的期后回款的核查,申报会计师检查了销售合同编号与开具发票的对应关系、客户回款金额与发票的对应关系、应收账款与销售合同的对应关系。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人在新金融工具准则下,根据预期信用损失模型,应收账款的坏账准备计提准确、充分,相关会计处理符合《企业会计准则》的要求;
2、发行人所说明的主要客户信用政策、执行情况、信用期变更等信息与申报会计师在审计过程中了解到的情况一致;报告期内发行人对主要客户的信用结算政策与总体信用政策一致,报告期内未发生重大变动;
3、发行人期后回款逐一匹配至相应的应收账款,不存在将预付款项认定为应收账款回款的情形。
8-2-1-259
20.关于存货
报告期各期末,发行人存货的账面价值分别为1,185.65万元、2,063.20万元和
754.75万元,为归集正在履行尚未完成验收的训练数据定制服务和数据资源相关的应用服务所发生的各项支出。
请发行人补充披露:各期末未完工项目的类别、数量、金额及对应的合同金额。请发行人说明:(1)各期末未完工的项目数量,未完工服务成本的具体构成及其后结转成本确认收入的情况,结合合同约定和具体项目实施周期,说明是否存在长期未结转或期后提前终止的情况及原因,存货跌价准备计提是否充分;(2)报告期各期末主要未完工项目的客户名称、项目内容、成本结构、合同金额和预计总成本,分析各项目成本结构的差异原因,说明预计总成本的确认方法,与实际完工成本之间是否存在差异,是否存在应计提而未计提存货跌价准备的情形。
请申报会计师对上述事项进行核查并发表明确意见并说明对存货存在、计价和分摊等相关认定履行的审计程序。答复:
发行人补充披露事项
各期末未完工项目的类别、数量、金额及对应的合同金额。
以下内容已在招股说明书“第八节 财务会计信息与管理层分析/十、资产质量分析/
(一)流动资产分析/6、存货”中进行了补充披露:
单位:万元
类型 | 领域 | 2020年9月30日 | ||||
项目数量 | 存货账面余额 | 存货跌价准备 | 存货账面净值 | 对应的合同金额 | ||
训练数据定制服务 | 智能语音 | 160 | 896.12 | -20.25 | 875.87 | 4,472.42 |
计算机视觉 | 40 | 330.76 | -25.59 | 305.17 | 1,175.30 | |
自然语言 | 46 | 51.00 | -1.40 | 49.60 | 293.89 | |
训练数据相关的应用服务 | 10 | 170.95 | - | 170.95 | 1,575.75 | |
合计 | 256 | 1,448.83 | -47.25 | 1,401.59 | 7,517.37 | |
类型 | 领域 | 2019年12月31日 | ||||
项目数量 | 存货账面余 | 存货跌价准 | 存货账面净 | 对应的合同 |
8-2-1-260
额 | 备 | 值 | 金额 | ||||
训练数据定制服务 | 智能语音 | 94 | 537.45 | -24.35 | 513.10 | 3,729.47 | |
计算机视觉 | 20 | 50.43 | - | 50.43 | 763.46 | ||
自然语言 | 32 | 83.95 | - | 83.95 | 319.55 | ||
训练数据相关的应用服务 | 5 | 109.17 | -1.90 | 107.27 | 1,359.82 | ||
合计 | 151 | 780.99 | -26.25 | 754.74 | 6,172.30 | ||
类型 | 领域 | 2018年12月31日 | |||||
项目数量 | 存货账面余额 | 存货跌价准备 | 存货账面价值 | 对应的合同金额 | |||
训练数据定制服务 | 智能语音 | 141 | 1,653.62 | -118.31 | 1,535.31 | 8,511.57 | |
计算机视觉 | 27 | 469.12 | -5.37 | 463.75 | 1,251.35 | ||
自然语言 | 46 | 210.01 | -167.13 | 42.88 | 304.77 | ||
训练数据相关的应用服务 | 10 | 43.88 | -22.63 | 21.25 | 1,479.49 | ||
合计 | 224 | 2,376.64 | -313.43 | 2,063.21 | 11,547.19 | ||
类型 | 领域 | 2017年12月31日 | |||||
项目数量 | 存货账面余额 | 存货跌价准备 | 存货账面价值 | 对应的合同金额 | |||
训练数据定制服务 | 智能语音 | 102 | 1,107.40 | -29.41 | 1,077.99 | 5,745.95 | |
计算机视觉 | 18 | 35.17 | - | 35.17 | 166.63 | ||
自然语言 | 50 | 68.39 | -0.75 | 67.64 | 311.69 | ||
训练数据相关的应用服务 | 8 | 4.85 | - | 4.85 | 62.79 | ||
合计 | 178 | 1,215.81 | -30.16 | 1,185.65 | 6,287.06 |
发行人说明事项
(1)各期末未完工的项目数量,未完工服务成本的具体构成及其后结转成本确认收入的情况,结合合同约定和具体项目实施周期,说明是否存在长期未结转或期后提前终止的情况及原因,存货跌价准备计提是否充分
一、各期末未完工的项目数量,未完工服务成本的具体构成及期后结转成本确认收入的情况
8-2-1-261
发行人各期末的未完工服务成本涉及训练数据定制服务和训练数据相关的应用服务两种业务类型。截至2017年12月31日、2018年12月31日、2019年12月31日及2020年9月30日,发行人未完工的项目数量分别为178个,224个、151个及256个,未完工项目成本的构成以及期后(截至2020年11月30日)结转成本、确认收入的情况详见下表:
8-2-1-262
单位:万元
类型 | 领域 | 2020年9月30日 | 期后结转成本,确认收入的项目 | ||||||||
项目数量 | 数据服务费 | 职工薪酬 | 折旧摊销 | 差旅费 | 其他 | 未完工服务成本小计 | 项目数量 | 期后结转成本 | 期后确认收入 | ||
训练数据定制服务 | 智能语音 | 160 | 705.07 | 96.68 | 14.28 | 8.52 | 71.56 | 896.12 | 44 | 341.49 | 747.84 |
计算机视觉 | 40 | 253.23 | 48.81 | 4.47 | 0.25 | 24.01 | 330.76 | 13 | 201.99 | 406.21 | |
自然语言 | 46 | 45.63 | 2.93 | 0.08 | - | 2.36 | 51.00 | 14 | 25.81 | 32.99 | |
训练数据相关的应用服务 | 10 | 47.29 | 95.62 | 10.30 | 14.65 | 3.09 | 170.95 | 1 | 1.22 | 1.84 | |
合计 | 256 | 1,051.22 | 244.04 | 29.13 | 23.42 | 101.02 | 1,448.83 | 72 | 570.50 | 1,188.87 |
注:2020年9月30日的未完工项目截至2020年11月30日尚有184个项目未结转成本和确认收入,项目均在执行周期内。
单位:万元
类型 | 领域 | 2019年12月31日 | 期后结转成本,确认收入的项目 | ||||||||
项目数量 | 数据服务费 | 职工薪酬 | 折旧摊销 | 差旅费 | 其他 | 未完工服务成本小计 | 项目数量 | 期后结转成本 | 期后确认收入 | ||
训练数据定制服务 | 智能语音 | 94 | 371.24 | 55.43 | 6.15 | 10.28 | 94.35 | 537.45 | 84 | 1,400.10 | 2,122.08 |
计算机视觉 | 20 | 31.19 | 13.13 | 0.96 | 1.64 | 3.52 | 50.43 | 17 | 269.26 | 597.70 | |
自然语言 | 32 | 63.60 | 16.49 | 0.07 | 0.12 | 3.66 | 83.95 | 32 | 132.22 | 245.41 | |
训练数据相关的应用服务 | 5 | 32.89 | 46.85 | 15.00 | 12.67 | 1.76 | 109.17 | 2 | 57.32 | 66.04 | |
合计 | 151 | 498.93 | 131.90 | 22.18 | 24.70 | 103.29 | 780.99 | 135 | 1,858.91 | 3,031.23 |
8-2-1-263
注:2019年12月31日的未完工项目截至2020年11月30日尚有16个项目未结转成本和确认收入,项目均在执行周期内。
单位:万元
类型 | 领域 | 2018年12月31日 | 期后结转成本,确认收入的项目 | ||||||||
项目数量 | 数据服务费 | 职工薪酬 | 折旧摊销 | 差旅费 | 其他 | 未完工服务成本小计 | 项目数量 | 期后结转成本 | 期后确认收入 | ||
训练数据定制服务 | 智能语音 | 141 | 1,254.42 | 220.88 | 4.98 | 12.47 | 160.88 | 1,653.62 | 139 | 3,074.05 | 7,074.15 |
计算机视觉 | 27 | 366.23 | 50.90 | 8.81 | 10.67 | 32.51 | 469.12 | 27 | 652.65 | 1,126.72 | |
自然语言 | 46 | 196.57 | 10.48 | 0.00 | 1.21 | 1.75 | 210.01 | 40 | 81.16 | 167.02 | |
训练数据相关的应用服务 | 10 | 9.84 | 28.73 | 0.54 | 2.01 | 2.76 | 43.88 | 5 | 23.30 | 37.97 | |
合计 | 224 | 1,827.06 | 311.00 | 14.32 | 26.36 | 197.90 | 2,376.64 | 211 | 3,831.15 | 8,405.86 |
注:2018年12月31日的未完工项目截至2020年11月30日尚有13个项目未结转成本和确认收入,其中10个项目(智能语音领域2个项目,自然语言领域6个项目,训练数据相关的应用服务2个项目)为日本纽康株式会社的项目,由于项目难度高于预期,双方已于2019年取消该合同;剩余的3个项目均为训练数据相关的应用服务,项目执行周期较长,截至2020年11月30日尚未完工。
单位:万元
类型 | 领域 | 2017年12月31日 | 期后结转成本,确认收入的项目 | ||||||||
项目数量 | 数据服务费 | 职工薪酬 | 折旧摊销 | 差旅费 | 其他 | 未完工服务成本小计 | 项目数量 | 期后结转成本 | 期后确认收入 | ||
训练数据定制服务 | 智能语音 | 102 | 767.29 | 214.31 | 1.80 | 12.09 | 111.91 | 1,107.40 | 101 | 2,405.20 | 5,070.33 |
计算机视觉 | 18 | 22.90 | 11.80 | - | - | 0.48 | 35.17 | 18 | 82.47 | 157.43 |
8-2-1-264
自然语言 | 50 | 40.25 | 25.00 | 1.20 | - | 1.95 | 68.39 | 44 | 115.87 | 176.27 | |
训练数据相关的应用服务 | 8 | 0.51 | 4.33 | - | - | - | 4.85 | 6 | 5.34 | 21.60 | |
合计 | 178 | 830.95 | 255.45 | 3.00 | 12.09 | 114.33 | 1,215.81 | 169 | 2,608.88 | 5,425.63 |
注:2017年12月31日的未完工项目截至2020年11月30日尚有9个项目未结转成本和确认收入,均为日本纽康株式会社的项目,由于项目难度高于预期,双方已于2019年取消该合同。
二、结合合同约定和具体项目实施周期,说明是否存在长期未结转或期后提前终止的情况及原因,存货跌价准备计提是否充分发行人从项目最初建立到最终验收,根据业务类别、项目内容和规模等因素,开发周期也有所不同。发行人训练数据定制服务和训练数据相关的应用服务项目开发周期通常不超过1年,部分项目比较复杂,项目难度较高,因此部分项目周期可达1-2年左右。按照项目所处的服务类型和业务领域区分,各类项目合同约定以及一般的开发周期如下:
服务类型 | 业务领域 | 合同关于项目实施周期的约定 | 一般项目实施周期 |
训练数据定制服务 | 智能语音 | 合同中直接对项目实施周期和里程碑日期做出约定,对于由于客户或被采集人等非发行人主观原因造成的延误,发行人可以免责顺延工期。 | 3个月至1年(部分长周期、采集难度高以及标注体系复杂项目开发周期为1-2年左右) |
计算机视觉 | 1至6个月 | ||
自然语言 | 1周至6个月 | ||
训练数据相关的应用服务 | -- | 1个月至1年(部分长周期、项目难度高的项目开发周期为1-2年左右) |
根据上述一般项目实施周期,结合期末未完工项目数量与期后结转成本项目数量的对比情况可以看出,报告期末,公司各类未完工项目均处于正常开发周期内,不存在长期未结转的项目。
报告期内,公司提前终止的主要项目情况及原因列示如下:
8-2-1-265
单位:万元
合同 | 项目数量 | 客户名称 | 取消年份 | 合同业务 | 业务类型 | 项目支出金额 | 报告期内存货跌价准备 | 取消原因 |
合同1 | 1 | 日本纽康株式会社 | 2019年 | 法语女声智能语音定制数据库开发 | 训练数据定制服务-智能语音 | 85.33 | 85.33 | 客户在项目实施中后期对口内噪音指标、环境噪音标准、发音标准度等临时提出更高要求,而发音人因身体情况不佳、个人其他工作安排等,使得无法短时间内满足客户需求,因此取消该项目。 |
合同2 | 1 | 美国英语男声智能语音定制数据库开发 | 89.03 | 89.03 | ||||
合同3 | 2 | 法语及西班牙语文本正则化处理 | 训练数据相关的应用服务 | 20.91 | 20.91 | 首次处理该两种语言的文本正则,且客户采用高于商用标准的高难度测试集对效果进行测试,导致测试通过效果不理想,因此取消该项目。 | ||
合同4 | 6 | 日本专有名词对泰语、越南语、印尼语、缅甸语、西班牙语、法语机器翻译及标注 | 训练数据定制服务-自然语言 | 165.15 | 165.15 | 试验性尝试小语种目标语言与非中英源语言搭配的特殊领域名词的翻译及标注项目,但拥有该领域能力的标注资源稀缺性超出预期,进而影响了工期。此外,在项目实施后期,客户临时提出了更有挑战性的超常规规则和标准,因此取消该项目。 |
上述项目自2017年开始启动,2019年取消,2017年发生支出人民币6.31万元, 2018年发生支出人民币302.43万元, 2019年发生支出人民币46.76万元。由于项目难度高于预期,发行人判断该合同预计能够全部收回收入的可能性较低,
8-2-1-266
因此发行人预计了未来可能收回的收入金额,扣除必要支出后,同存货的账面余额进行了比对,将低于存货账面余额的部分计提存货跌价准备。发行人于2017年和2018年计提存货跌价准备人民币289.78万元,2019年计提存货跌价准备人民币
65.72万元。截至2019年12月31日,上述项目累计发生支出人民币355.50万元,累计计提存货跌价准备人民币355.50万元,因此发行人在报告期内已对该类提前终止的项目计提了充分的存货跌价准备。
(2)报告期各期末主要未完工项目的客户名称、项目内容、成本结构、合同金额和预计总成本,分析各项目成本结构的差异原因,说明预计总成本的确认方法,与实际完工成本之间是否存在差异,是否存在应计提而未计提存货跌价准备的情形
1、报告期各期末前十大未完工项目的客户名称、项目内容以及成本结构如下:
单位:万元
序号 | 客户名称 | 项目内容 | 存货余额 | 成本结构 | |||||||||
数据服务费 | 职工薪酬 | 折旧摊销 | 差旅费 | 其他 | |||||||||
金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | 金额 | 占比 | ||||
2020年1-9月 | 微软、阿里巴巴等 | 语音识别转写、语音合成、手写体采集等 | 603.05 | 427.16 | 70.83% | 148.38 | 24.60% | 1.54 | 0.26% | 13.83 | 2.29% | 12.13 | 2.01% |
2019年 | 阿里巴巴、百度、微软 | 语音识别转写、语音合成等 | 380.74 | 297.4 | 78.11% | 69.97 | 18.38% | 0.72 | 0.19% | 12.64 | 3.32% | - | 0.00% |
2018年 | 某国际消费电子产品厂商、三星等 | 语音识别采集、语音合成、手写体采集等 | 1,023.51 | 753.19 | 73.59% | 103.89 | 10.15% | 11.36 | 1.11% | 19.35 | 1.89% | 135.73 | 13.26% |
2017年 | 三星、阿里巴巴、腾讯 | 语音识别采集、语音合成 | 496.27 | 324.26 | 65.34% | 102.54 | 20.66% | 0.70 | 0.14% | 2.20 | 0.44% | 66.57 | 13.41% |
8-2-1-267
2017年末,发行人前十大未完工项目的成本结构中数据服务费占比较低,职工薪酬和其他支出占比较高。数据服务费占比较低而职工薪酬占比较高主要是由于当年末前十大未完工项目中的部分智能语音项目尚未开始密集进行原料数据的采集和标注工作,而人工投入则在项目立项后持续发生,因此相对降低了数据服务费占比,提升了职工薪酬占比。其他支出占比较高主要是由于:(1)个别项目对录制环境有较高的要求,需要安静的环境和包含家居设备的真实家居场地,并需要在以下三个房间进行录音:客厅、厨房、卧室,因此导致发生的项目租赁支出较高,(2)个别项目录音需要租用客户指定中高端车型,包括奔驰、帕萨特、途观等,因此导致发生的项目租赁支出较高。
2018年末,发行人前十大未完工项目的成本结构中其他支出占比较高,主要是由于个别项目为国外采集项目,需要在当地租赁专业录音棚,因此导致发生的项目租赁支出较高。
2019年末,发行人前十大未完工项目的成本结构与发行人整体营业成本结构基本一致。
2020年9月末,发行人前十大未完工项目的成本结构中数据服务费占比较低,职工薪酬占比较高,主要是由于当期末前十大未完工项目中存在训练数据相关的应用服务项目,该等项目中公司负责协助客户进行AI算法模型训练,主要依赖于自身技术人员的投入,数据服务的采购较低。
2、报告期各期末前十大未完工项目的合同金额、预计总成本、实际完工成本,及其比较差异如下:
单位:万元
期间 | 合同金额 | 预计总成本 | 截至目前已完工项目 | 预计总成本与实际完工成本的差异 | ||
预计总成本 | 实际完工成本 | 金额 | 比例 | |||
2020年1-9月 | 1,942.96 | 1,175.63 | 112.75 | 90.71 | 11.55 | 4.03% |
2019年 | 755.42 | 449.31 | 252.79 | 238.12 | 14.67 | 5.80% |
8-2-1-268
2018年 | 3,313.51 | 1,539.68 | 1,539.68 | 1,403.06 | 136.60 | 8.87% |
2017年 | 1,444.50 | 693.52 | 693.52 | 701.88 | -8.38 | -1.21% |
报告期各期末,发行人前十大未完工项目中,截至目前已完工项目的预计总成本与实际完工成本的差异较小,不存在显著异常。
8-2-1-269
发行人预计总成本是根据项目预算及项目执行情况调整后综合判断得出,判断过程由项目负责人与财务部共同进行,经其签字确认后作为会计档案保存。其中项目预算纳入公司整体预算管理体系,由项目负责人按照项目具体内容,对项目所需人员及每人投入工时等直接人工内容,采集人数、采集单价、标注工时、标注单价等数据服务采购内容,折旧与摊销、租赁等项目所需场地、设备内容,差旅、交通、办公等其他项目相关支出内容制定详细预算。项目预算需要经过业务部门、财务部等多层级审批通过后才可执行。
3、发行人计提存货跌价准备的情况
报告期各期末,发行人已经充分考虑了存货中归集的未完工项目是否存在跌价准备的情形,并按照企业会计准则的要求,计算存货中未完工项目的可变现净值,对于可变现净值低于成本的金额计提存货跌价准备。计算可变现净值的方法是以合同价格为基础,同时考虑预计成本以及销售费用和相关税费的影响。根据上述方法,发行人于各报告期分别计提存货跌价准备人民币30.16万元、284.03万元、104.05万元、81.00万元,各报告期期末的存货的预计总成本金额较实际成本金额不存在重大差异,各报告期期末存货的账面价值能够合理反映存货的可变现净值,因此存货跌价准备计提充分,不存在应计提而未计提存货跌价准备的情形。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于存货可能导致的重大错报风险,执行的主要程序如下:
1、了解及评估存货相关的内部控制的设计和执行有效性、发行人存货归集及核算原则是否适当;
2、获取报告期各期末未完工项目明细,与存货的账面余额进行核对,并分析期末未完工项目的成本构成是否合理;
3、取得报告期各期末未完工项目期后结转收入确认成本的情况,检查是否存在长期未结转或提前终止的情况,通过检查相关销售合同,与项目人员进行访谈,了解项目运行情况,评价是否存在未充分计提存货跌价准备的情况;
4、取得管理层编制的存货跌价准备计算表,复核存货减值测试的过程,检查管理层在存货减值测试中使用的预计总成本,预计总收入金额的支持性依据,评估其合理性。
基于我们所执行的审计和核查程序,申报会计师认为:
8-2-1-270
1、发行人补充的披露各期末未完工项目的类别、规模、数量、金额及对应的合同金额等信息符合发行人实际情况;
2、报告期各期末未完工的项目数量、未完工服务成本的具体构成及期后结转成本确认收入情况真实、准确;报告期内不存在长期未结转的项目;期后提前终止的项目具备合理原因;不存在应计提而未计提存货跌价准备的情形;
3、报告期各期末主要未完工项目的客户名称、项目内容、成本结构、合同金额和预计总成本等信息符合发行人实际情况;
4、报告期各期末主要未完工项目间的成本结构差异具备合理原因,主要未完工项目的预计总成本的确认方法合理,预计总成本与实际完工成本之间的差异原因不存在异常,主要未完工项目的存货跌价准备计提充分,不存在应计提而未计提存货跌价准备的情形。会计师说明事项
针对存货存在、计价和分摊等相关认定,申报会计师执行的审计程序如下:
1、了解及评估与存货相关的内部控制的设计及执行有效性、发行人存货归集及核算原则是否符合会计准则规定;
2、获取并检查成本倒轧表,分析其合理性;
3、对制造费用执行实质性测试,选取样本,对数据服务费支出检查支持性依据,对人工成本、折旧摊销在项目之间的分摊进行合理性测试;
4、获取存货余额的项目明细表,同项目预算进行比较,分析存货构成的合理性;
5、分析存货账龄,对长账龄存货通过访谈及查看相关销售合同,分析其项目周期是否合理,评估是否存在减值;
6、对存货余额中的未完工项目,选取样本,进行存货监盘和函证,检查项目的状态,确认存货的真实性;
7、取得管理层编制的存货跌价准备计算表,复核存货减值测试的过程,检查管理层在存货减值测试中使用的预计总成本,预计总收入金额的支持性依据,评估其合理性;
8、取得存货期后实际对外销售时确认的收入金额和结转的成本金额,同存货跌价准备计算表中的预计收入金额和预计总成本进行比对,检查存货跌价准备的计提是否充分。
8-2-1-271
21.关于预收账款
报告期各期末,公司预收款项的金额分别为2,235.95万元、3,407.69万元和2,480.66万元,大幅波动。请发行人说明:(1)结合在手订单和项目执行进度,分析预收款项变动原因以及期后收入的实现情况;(2)超过合同执行周期的预收账款的情况,合同未履行完毕的原因。请申报会计师对上述事项进行核查并发表明确意见。答复:
发行人说明事项
(1)结合在手订单和项目执行进度,分析预收款项变动原因以及期后收入的实现情况
单位:万元
年份/期间 | 预收款项/合同负债对应在手订单总额 | 增长率 | 预收款项/ 合同负债 年/期末余额 | 增长率 | 期后确认收入金额 |
2020年1-9月 | 4,577.95 | 36% | 3,471.93 | 40% | 1,538.34 |
2019年度 | 3,374.52 | -28% | 2,480.66 | -27% | 1,100.41 |
2018年度 | 4,669.20 | 18% | 3,407.69 | 52% | 3,407.69 |
2017年度 | 3,952.94 | - | 2,235.95 | - | 2,235.95 |
注:期后确认收入截止日期为2020年11月30日。
发行人前五大预收款项/合同负债的具体构成情况如下:
单位:万元
客户名称 | 2020年9月30日余额 | 占预收款项/合同负债期末余额 合计数的比例 |
微软(中国)有限公司 | 2,558.31 | 73.69% |
Microsoft Corporation | 165.78 | 4.77% |
客户2 | 133.15 | 3.84% |
北京三星通信技术研究有限公司 | 108.93 | 3.14% |
北京三快在线科技有限公司 | 93.40 | 2.69% |
合计 | 3,059.57 | 88.13% |
8-2-1-272
单位:万元
客户名称 | 2019年12月31日余额 | 占预收款项/合同负债年末余额 合计数的比例 |
微软(中国)有限公司 | 1,990.59 | 80.24% |
北京大米未来科技有限公司 | 106.13 | 4.28% |
北京三星通信技术研究有限公司 | 100.67 | 4.06% |
客户2 | 47.03 | 1.90% |
国家计算机网络与信息安全管理中心 | 44.55 | 1.80% |
合计 | 2,288.97 | 92.27% |
单位:万元
客户名称 | 2018年12月31日余额 | 占预收款项/合同负债年末余额 合计数的比例 |
微软(中国)有限公司 | 1,429.38 | 41.95% |
SAMSUNG ELECTRONICS CO.,LTD. | 707.82 | 20.77% |
北京三星通信技术研究有限公司 | 480.59 | 14.10% |
SAMSUNG R&D INSTITUTE INDIA—BANGALORE PRIVATE LIMITED | 163.36 | 4.79% |
SOUNDHOUNDINC | 131.54 | 3.86% |
合计 | 2,912.69 | 85.47% |
单位:万元
客户名称 | 2017年12月31日余额 | 占预收款项/合同负债年末余额 合计数的比例 |
北京三星通信技术研究有限公司 | 655.88 | 29.33% |
SAMSUNG ELECTRONICS CO.,LTD. | 611.99 | 27.37% |
微软(中国)有限公司 | 434.82 | 19.45% |
杭州海康威视数字技术股份有限公司 | 57.50 | 2.57% |
北京羽扇智信息科技有限公司 | 55.11 | 2.47% |
合计 | 1,815.30 | 81.19% |
发行人按照合同对预收款项或者应收账款进行核算,对于每个合同而言,发行人确认收入前收取的款项对应为该合同的预收款项,确认收入后收到的款项对应为该合同应收账款的回款,因此能够避免出现预收款项与应收账款混同的情形,此外在每个合同预收款项或应收账款核算中,发行人亦不会进行抵消处理。根据上表所示,2018年末预收款项余额较上年末有较大增长,同时在手订单金额也有所增加。预收款项的上涨主要是微软和三星两个客户产生的,这两个客户的结算模式以预付为主,2018年这两个客
8-2-1-273
户均与发行人签订大额销售合同,根据合同约定采取向发行人提前预付账款的形式进行支付,且预付比例较高,因此2018年末的预收款项余额有所上升,增幅高于对应的在手订单金额;2019年末预收款项余额有所下降,同时对应的在手订单金额也基本同比例降低,主要是由于三星在2019年对项目进行了集中验收,使得其预收款项确认为收入,在手订单和预收账款余额均有较大的下降;2020年9月末预收款项余额较大增长,同时对应的在手订单金额也基本同比例增长,主要是由于微软等多个客户在2020年的订单规模较上年有明显增长,使得预收款项余额也有所增长。
发行人预收款项通常在1年以内结转确认收入。截至2020年11月30日,2017年末及2018年末的预收款项在期后已全部确认收入,2019年末及2020年9月末的预收款项余额在期后确认收入的比例也达到了44.36%和44.31%。
(2)超过合同执行周期的预收账款的情况,合同未履行完毕的原因。
发行人合同执行周期通常不超过1年,部分长周期、标注体系复杂的智能语音类项目周期为1-2年左右。报告期内无超过合同执行周期的预收账款的情况。会计师核查事项
申报会计师在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,以有效识别、评估和应对由于预收账款可能导致的重大错报风险,执行的主要程序如下:
1、获取了预收账款明细表,选取样本对期末预收账款实施了函证程序并查阅收款的银行回单,核对是否相符;
2、获取了期末预收款项对应的销售合同,检查与发行人披露的在手订单金额是否一致;
3、获取预收账款的账龄明细,检查长账龄预收账款及其合同,询问管理层合同未履行完毕的原因,并判断其合理性。
基于我们所执行的审计和核查程序,申报会计师认为:
1、发行人报告期各期预收款项余额的变动情况与发行人订单承接及项目执行情况相匹配,期后收入实现情况不存在异常;
2、发行人报告期内不存在超过合同执行周期的预收账款的情况。
8-2-1-274
22.关于现金流量表
报告期内,公司销售商品、提供劳务收到的现金占营业收入的比例分别为
114.29%、111.05%和96.74%。
请发行人说明:“销售商品、提供劳务收到的现金”“购买商品、接受劳务支付的现金”“支付给职工以及为职工支付的现金”“支付的其他与经营活动有关的现金”“收到的其他与经营活动有关的现金”的具体明细以及与报表科目的勾稽关系。
请申报会计师对上述事项进行核查并发表明确意见。
答复:
发行人说明事项
一、现金流量表中“销售商品、提供劳务收到的现金”的具体明细以及与报表科目的勾稽关系
现金流量表中“销售商品、提供劳务收到的现金”的具体明细如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
提供训练数据定制服务、销售训练数据产品以及提供训练数据相关的应用服务收到的现金 | 17,455.04 | 22,980.66 | 21,395.54 | 13,608.72 |
现金流量表中“销售商品、提供劳务收到的现金”与报表科目的勾稽关系如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
营业收入 | 14,277.35 | 23,755.81 | 19,265.77 | 11,907.09 |
应收账款账面余额的减少/(增加) | 1,073.21 | -1,563.61 | -389.18 | -934.69 |
应收账款账面余额的核销 | - | - | -64.88 | - |
应收账款非现金偿债 | - | - | -145.00 | - |
合同资产账面余额的增加 | -222.86 | - | - | - |
预收款项的(减少)/增加 | -2,480.66 | -927.03 | 1,171.74 | 1,358.78 |
合同负债的增加 | 3,471.93 | - | - | - |
应交税费 - 增值税 - 销项税 | 1,442.24 | 2,020.93 | 1,779.28 | 1,298.78 |
财务费用 – 净汇兑(亏损)/收益- 应收账款 | 3.59 | -131.13 | -173.40 | 7.89 |
财务费用 - 其他财务费用 - 现金 | -24.52 | -23.36 | -10.55 | -8.52 |
8-2-1-275
折扣 | ||||
所得税费用 - 代扣代缴境外所得税费用 | -85.25 | -150.94 | -38.24 | -20.61 |
合计 | 17,455.04 | 22,980.66 | 21,395.54 | 13,608.72 |
销售商品、提供劳务收到的现金 | 17,455.04 | 22,980.66 | 21,395.54 | 13,608.72 |
差异 | - | - | - | - |
二、现金流量表中“购买商品、接受劳务支付的现金” 的具体明细以及与报表科目的勾稽关系
现金流量表中“购买商品、接受劳务支付的现金”的具体明细如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
数据服务费 | 5,619.24 | 5,917.72 | 7,275.10 | 4,042.37 |
进项税(注1) | 285.61 | 335.09 | 385.15 | 204.66 |
项目租赁费 | 118.77 | 274.06 | 345.08 | 159.36 |
房租费用 (注2) | 32.89 | 40.27 | 35.58 | 36.44 |
其他(注3) | 10.28 | 101.22 | 140.58 | 2.86 |
合计 | 6,066.80 | 6,668.36 | 8,181.49 | 4,445.69 |
注1:此处进项税为当期采购数据服务费的进项税。注2:此处房租费用为与当期主营业务直接相关的房租费用。注3:其他主要为与当期主营业务直接相关的差旅费、交通费、燃料费等支出。
现金流量表中“购买商品、接受劳务支付的现金”与报表科目的勾稽关系如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
营业成本 | 4,417.13 | 7,067.52 | 6,786.78 | 3,303.47 |
研发费用 - 训练数据产品开发支出 | 1,628.32 | 2,217.81 | 1,264.60 | 1,455.04 |
存货账面余额的增加/(减少) | 667.84 | -1,595.64 | 1,160.82 | 362.57 |
存货跌价准备的转销 | 11.21 | 372.75 | - | 0.70 |
存货、营业成本以及研发费用-训练数据产品开发支出中的职工薪酬、折旧与摊销等 | -916.23 | -1,546.93 | -1,338.29 | -865.81 |
应付账款 - 数据服务费的减少/(增加) | -36.90 | -147.04 | -102.31 | 5.97 |
预付款项 - 数据服务费的增加/(减 | 9.83 | -35.19 | 24.74 | -20.91 |
8-2-1-276
少) | ||||
应交税费 - 增值税 - 进项税(注) | 285.61 | 335.09 | 385.15 | 204.66 |
合计 | 6,066.80 | 6,668.36 | 8,181.49 | 4,445.69 |
购买商品、接受劳务支付的现金 | 6,066.80 | 6,668.36 | 8,181.49 | 4,445.69 |
差异 | - | - | - | - |
注:此处进项税为当期采购数据服务费的进项税。
三、现金流量表中“支付给职工以及为职工支付的现金” 的具体明细以及与报表科目的勾稽关系
现金流量表中“支付给职工以及为职工支付的现金”的具体明细如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
职工薪酬 | 4,618.30 | 5,120.24 | 4,358.71 | 3,207.55 |
现金流量表中“支付给职工以及为职工支付的现金”与报表科目的勾稽关系如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
应付职工薪酬 - 当期支付金额 | 4,469.59 | 5,308.17 | 4,364.51 | 3,207.82 |
应交税费 - 个人所得税的减少/(增加) | 148.71 | -187.92 | -5.80 | -0.28 |
合计 | 4,618.30 | 5,120.24 | 4,358.71 | 3,207.55 |
支付给职工以及为职工支付的现金 | 4,618.30 | 5,120.24 | 4,358.71 | 3,207.55 |
差异 | - | - | - | - |
四、现金流量表中“支付的其他与经营活动有关的现金” 的具体明细以及与报表科目的勾稽关系
现金流量表中“支付的其他与经营活动有关的现金”的具体明细如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
房租费用(注1) | 558.34 | 654.39 | 509.59 | 379.04 |
中介费用 | 114.71 | 465.40 | 155.09 | 215.86 |
进项税(注2) | 33.06 | 129.88 | 60.89 | 16.80 |
市场宣传费 | 58.74 | 44.76 | 52.82 | 29.71 |
业务招待费 | 34.78 | 90.47 | 42.13 | 23.79 |
8-2-1-277
水电费 | 32.85 | 36.78 | 31.08 | 20.55 |
办公费 | 20.72 | 38.17 | 52.38 | 32.82 |
差旅费 | 17.29 | 76.43 | 67.74 | 41.51 |
财务手续费 | 8.75 | 9.70 | 7.89 | 8.63 |
邮寄费 | 7.92 | 8.76 | 14.24 | 9.47 |
押金及保证金 | 188.06 | 25.26 | 59.36 | 135.08 |
装修费 | 1.19 | 64.83 | 44.24 | 15.91 |
滞纳金支出 | - | - | - | 15.34 |
捐赠支出 | - | 15.00 | - | - |
其他(注3) | 205.17 | 204.48 | 180.06 | 281.46 |
合计 | 1,281.58 | 1,864.31 | 1,277.51 | 1,225.97 |
注1:此处房租费用为当期的管理部门和人员使用的租赁房屋的当期房租费用,以及研发部门和人员使用的租赁房屋的当期房租费用。注2:此处进项税为当期扣除数据服务费采购以外的与经营活动相关的支出的进项税。注3:其他主要为当期信息系统咨询服务、专利申请服务费、通讯费、劳保费等支出。
现金流量表中“支付的其他与经营活动有关的现金”与报表科目的勾稽关系如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
销售费用(不含职工薪酬、折旧与摊销) | 77.58 | 94.55 | 107.25 | 73.79 |
管理费用(不含职工薪酬、折旧与摊销) | 733.89 | 1,310.17 | 774.51 | 799.59 |
研发费用-基础研发支出(不含职工薪酬、折旧与摊销) | 164.46 | 163.36 | 123.68 | 14.78 |
财务费用 - 其他财务费用 - 手续费支出 | 8.75 | 9.70 | 7.89 | 8.63 |
营业外支出(不含非流动资产毁损报废损失) | 0.88 | 15.00 | 3.42 | 15.35 |
预付款项 - 其他(不含资产采购款)的增加/ (减少) | 12.95 | -16.15 | 13.67 | 1.97 |
其他应收款账面余额 - 经营相关的增加(注1) | 255.68 | 194.55 | 189.11 | 254.17 |
其他流动资产 -待抵扣及待认证进项税的增加/ (减少) | 21.42 | -39.57 | 39.77 | - |
其他流动资产 - 待摊房屋租赁费 | 41.97 | 31.25 | 7.76 | -44.01 |
8-2-1-278
的增加/ (减少) | ||||
应付账款 - 其他采购费的减少 | -73.10 | -19.19 | -50.49 | -3.22 |
应交税费 - 增值税 - 进项税(注2) | 33.06 | 129.88 | 60.89 | 16.80 |
其他应付款的(增加)/ 减少 | 4.04 | -9.24 | 0.05 | 88.12 |
合计 | 1,281.58 | 1,864.31 | 1,277.51 | 1,225.97 |
支付的其他与经营活动有关的现金 | 1,281.58 | 1,864.31 | 1,277.51 | 1,225.97 |
差异 | - | - | - | - |
注1:其他应收款账面余额 -经营相关的增加主要为其他应收款中押金保证金、员工备用金等与发行人日常经营活动相关的往来款的当期/年增加额。注2:此处进项税为当期扣除数据服务费采购以外的与经营活动相关的支出的进项税。
五、现金流量表中“收到的其他与经营活动有关的现金”的具体明细以及与报表科目的勾稽关系
现金流量表中“收到的其他与经营活动有关的现金”的具体明细如下:
单位:万元
项目 | 2020年1-9月 | 2019年 | 2018年 | 2017年 |
政府补助 | 775.26 | 803.69 | 762.46 | 680.73 |
利息收入 | 9.22 | 6.24 | 7.20 | 5.23 |
押金保证金 | 185.10 | 32.81 | 14.20 | 85.11 |
其他(注) | 59.58 | 13.29 | 64.23 | 11.58 |
合计 | 1,029.16 | 856.03 | 848.09 | 782.65 |
注:其他主要为当期收回的员工备用金、汇款退回等。
现金流量表中“收到的其他与经营活动有关的现金”与报表科目的勾稽关系如下:
单位:万元
项目 | 2020年1-9月 | 2019 年 | 2018 年 | 2017 年 |
其他收益 - 政府补助 | 736.46 | 791.49 | 747.86 | 630.12 |
财务费用 - 存款及应收款项的利息收入(不含股东利息收入) | 9.22 | 6.24 | 7.20 | 5.23 |
营业外收入 - 政府补助 | 38.80 | 12.20 | 14.60 | 50.61 |
营业外收入 - 其他 | 22.70 | 0.21 | 9.26 | 0.49 |
其他应收款账面余额 - 经营相关的减少(注) | 221.98 | 45.89 | 69.17 | 96.20 |
合计 | 1,029.16 | 856.03 | 848.09 | 782.65 |
8-2-1-279
收到其他与经营活动有关的现金 | 1,029.16 | 856.03 | 848.09 | 782.65 |
差异 | - | - | - | - |
注:其他应收款账面余额 -经营相关的减少主要为其他应收款中押金保证金、员工备用金等与发行人日常经营活动相关的往来款的当期/年减少额。
会计师核查事项本所在财务报表审计以及此次为回复反馈意见执行核查工作的过程中,按照中国注册会计师审计准则的要求,设计和执行了相关审计程序,与现金流量表相关的主要程序如下:
1、获取发行人编制现金流量表的底稿,核对其中各项目数据的计算过程及数据来源;
2、检查现金流量表中“销售商品、提供劳务收到的现金”“ 购买商品、接受劳务支付的现金” “支付给职工以及为职工支付的现金” “ 支付的其他与经营活动有关的现金”“ 收到的其他与经营活动有关的现金”等科目相关数据与资产负债表、利润表等科目的勾稽关系是否合理。
基于我们所执行的审计和核查程序,申报会计师认为:
报告期内,公司“销售商品、提供劳务收到的现金”“ 购买商品、接受劳务支付的现金” “支付给职工以及为职工支付的现金”“ 支付的其他与经营活动有关的现金”“ 收到的其他与经营活动有关的现金”的具体明细与发行人的实际情况相符,与报表科目之间勾稽相符。
8-2-1-280
本专项说明仅为北京海天瑞声科技股份有限公司向上海证券交易所提交就《关于北京海天瑞声科技股份有限公司首次公开发行股票并在科创版上市申请文件的审核问询函》的回复提供说明之用,未经本所的书面同意,不得用于任何其他目的。
毕马威华振会计师事务所 (特殊普通合伙) 中国注册会计师
雷江
中国 北京 张杨
2020年 月 日