中信建投证券股份有限公司关于南京云创大数据科技股份有限公司年报的二次问询函相关问题回复的核查意见
北京证券交易所上市公司管理部:
贵部于2023年5月30日出具的《关于对南京云创大数据科技股份有限公司年报的二次问询函》(年报问询函【2023】第014号)(以下简称“《二次问询函》”)已收悉。中信建投证券股份有限公司(以下简称“中信建投”或“保荐机构”)作为南京云创大数据科技股份有限公司(以下简称“公司”或“云创数据”)向不特定合格投资者公开发行股票的保荐机构,在收到二次问询函的第一时间对所列问题进行了专项核查并发表核查意见如下:
问题1、关于收入及毛利率
你公司2022年第四季度营业收入1.15亿元,营业成本9,834.71万元,你公司在问询函回复中解释第四季度亏损的原因系营业收入下滑以及计提信用减值损失所致。根据已披露信息,你公司第四季度毛利率14.62%,前三季度综合毛利率34.44%。
你公司本期对西北地区毛利率为41.03%,较上年同期下降49.94个百分点,你公司解释毛利率大幅下滑的原因系对西北地区硬件销售占比较高,而硬件毛利率远低于软件毛利率。
你公司第四季度销售费用、管理费用、研发费用分别为573.59万元、862.95万元、2,494.69万元,占全年比重分别为33.66%、29.60%、36.34%。
请你公司:
(1)结合市场需求变化、手持订单、主要项目验收进展,以及同行业可比
公司等的情况,详细说明你公司第四季度营业收入下滑的原因;
(2)结合主营业务的成本构成,你公司往年各季度的毛利率情况,说明本
期第四季度毛利率明显低于前三季度综合毛利率的原因及合理性;
(3)补充披露西北地区主要项目的明细情况,包括但不限于客户名称、交
易内容、收入确认金额、结转成本金额、毛利率、期末及期后回款情况,并说明毛利率明显下降的原因及合理性;
(4)结合往年各类费用项目的发生情况,说明2022年第四季度销售费用、
管理费用、研发费用发生额占全年比重偏高原因及合理性。
【回复】
一、结合市场需求变化、手持订单、主要项目验收进展,以及同行业可比公
司等的情况,详细说明你公司第四季度营业收入下滑的原因市场需求方面,由于2022年四季度疫情多点爆发,防控形势更为复杂多变,整体智慧城市和信息化建设方面需求放缓,加之公司市场人员出行、沟通效率受限,公司及客户单位人员陆续阳性居家,造成公司四季度营业收入下滑。此外,公司也对比了同行业可比公司的情况,例如:青云科技在《关于北京青云科技股份有限公司向特定对象发行股票申请文件的审核问询函的回复报告》公告中提出:由于宏观经济下行及芯片短缺等供应链紧张态势的压力导致部分终端客户采购意愿降低,且公司业务开拓、物流送货、项目交付等进展不及预期,导致2022年公司营业收入规模较低。同时,当虹科技、博汇科技、杰创智能等IT类上市公司也在其相关公告中提出:受宏观经济影响,市场需求下降,市场景气度低迷,造成业绩下滑。综上,公司2022年与同行业公司面临的市场需求变化情况一致。公司2020年四季度新增订单22,849.66万元,2021年四季度新增订单27,901.93万元。2022年截至9月30日,公司在手订单519.14万元,四季度新增订单13,922.88万元。2022年度四季度与2020年和2021年四季度相比,新增订单出现明显下滑。
公司项目的实施周期根据项目情况存在差异,以前五名客户为例:项目实施
周期跨度从10至95天,平均实施周期为50天左右,2022年四季度主要项目的验收情况如下:
单位:万元
序号 | 客户名称 |
项目名称 | 合同金额 |
Y-客户
测试平台项目
验收时间 | |
2,550.52 |
2022.12.16
Y-客户
人工智能实验平台项目
2022.12.22
Y-客户
云存储和网盘系统项目
758.02 |
579.48 |
2022.10.31
Y-客户
cStor超融合云存储系统项目
2022.12.13
Y-客户
人工智能分析平台项目
570.51
549.61
2022.10.28
549.61 | |
合计 |
对同行业可比公司2022年、2021年的四季度收入情况进行比较(如下表所示),2022年四季度收入金额较2021年均呈现不同程度的下降幅度,四季度收入占全年收入的比重也呈现不同幅度的下降趋势,云创数据与同行业公司变动趋势一致。
单位:万元
5,008.14单位
单位 | 2022年4季度收入 |
2021年4季度收入 | 收入增减幅度 |
2022年4季度占比 | 2021年4季度占比 |
云创数据 11,518.35 22,318.73 -48.39% 30.72% 46.83% -34.40%当虹科技 7,822.41 22,616.63 -65.41% 23.60% 54.08% -56.36%青云科技 7,212.44 12,905.96 -44.12% 23.65% 30.45% -22.33%海康威视 2,344,478.48 2,579,078.60 -9.10% 28.19% 31.68% -11.01%同有科技 13,789.22 14,209.02 -2.95% 31.68% 36.35% -12.85%
如上表所示,同行业可比公司收入均有不同程度的下降,公司与可比公司中相近体量的青云科技、当虹科技的收入变化趋势一致。
综上,2022年四季度受疫情影响及宏观经济终端市场需求放缓影响,公司2022年度四季度营业收入下滑具有市场合理性,符合行业变化情况及公司业务开展实际情况。
二、结合主营业务的成本构成,你公司往年各季度的毛利率情况,说明本期
第四季度毛利率明显低于前三季度综合毛利率的原因及合理性
公司主营业务的成本构成主要包括材料、直接人工、制造费用,公司主营业务的成本构成主要为材料成本,2022年与2021年相比主营业务成本构成无明显变化,具体情况如下表所示:
单位:万元
2021
成本构成 | 年 |
2022
年 | ||
金额 |
占比 | 金额 |
材料 28,754.34 99.50% 26,709.28 99.42%直接人工 123.12 0.43% 130.23 0.49%
制造费 19.18 0.07% 25.08 0.09%
合计 28,896.64 100.00% 26,864.59 100.00%
公司2021年及2022年各季度毛利率情况如下表所示:
占比年份
年份 | 一季度毛利率 |
二季度毛利率 | 三季度毛利率 |
2021年 33.95% 42.20% 44.10% 38.76%2022年 21.13% 35.88% 40.16% 14.62%公司2022年度第四季度毛利下降的原因系受到西北地区某项目(根据《北京证券交易所股票上市规则(试行)》第5.2.11条“上市公司及相关信息披露义务人拟披露的信息属于商业秘密、商业敏感信息,按照本规则披露或者履行相关义务可能引致不当竞争、损害公司及投资者利益或者误导投资者的,可以按照本所相关规定暂缓或者豁免披露该信息”)影响,由于2022年12月应急保障的需求,该终端用户单位需对前期公司实施完毕的项目进行紧急扩容和升级保障,考虑到该终端用户系公司在西北地区的长期重要客户,且后期仍将保持长期项目合作,公司及时响应了此次升级保障,此行为得到对方的高度认可,并向云创发来感谢信。扣除该项目的影响后,公司2022年四季度毛利率为31.57%,与前三季度的综合毛利率34.44%相比未出现明显波动。
三、补充披露西北地区主要项目的明细情况,包括但不限于客户名称、交易
内容、收入确认金额、结转成本金额、毛利率、期末及期后回款情况,并说明毛利率明显下降的原因及合理性
公司2022年度西北地区除前述西北地区某项目外,其他主要项目交易内容
包括人工智能平台、大数据处理平台、云存储系统等,收入确认总金额42,083,362.87元,结转成本总金额24,210,357.59元,综合毛利率42.47%,期末及期后回款47,554,200.00元,回款比例100%。
①上述西北地区其他主要项目截至2023年5月31日已全部回款,综合毛利
率为42.47%。由于前述西北地区某项目的影响,该项目2022年度成本1952万元,未产生收入,扣除该项目的影响因素后,公司2022年度西北地区的毛利率为46.91%;
②受软硬件销售占比影响,硬件毛利率远低于软件毛利率。公司2021年度
西北地区销售收入3,898.64万元,其中软件产品销售2,111.24万元,占比54.15%,硬件产品销售1,642.85万元,占比42.14%,2022年度西北地区销售收入5,309.23万元,其中软件产品销售2,265.02万元,占比42.66%,硬件产品销售2,888.22万元,占比54.40%。公司2022年度西北地区收入中硬件销售占比较2021年增加,导致毛利率有所下降。
上述两方面原因导致西北地区2022年度毛利率较2021年度出现明显下降,具有商业合理性。
四、结合往年各类费用项目的发生情况,说明2022年第四季度销售费用、
管理费用、研发费用发生额占全年比重偏高原因及合理性
公司2021年度各类费用情况具体如下表所示:
单位:万元
2021
科目 | 年第一季度 |
2021
2021
年第二季度 | 年第三季度 |
2021
年第四季度 | ||
金额 |
占全年比重 | 金额 |
占全年比重 | 金额 |
占全年比重 | 金额 |
销售费用 368.92 22.44% 313.96 19.10% 348.43 21.20% 612.59 37.26%管理费用 614.29 23.96% 632.46 24.68% 645.39 25.18% 670.99 26.18%研发费用 1,066.12 20.35% 999.07 19.07% 1,002.61 19.13% 2,172.00 41.45%合计 2,049.33 21.69% 1,945.48 20.60% 1,996.43 21.13% 3,455.58 36.58%
公司2022年度各类费用情况具体如下表所示:
单位:万元
2022
科目 | 年第一季度 |
2022
2022
年第二季度 | 年第三季度 |
2022
年第四季度 | ||
金额 |
占全年比重 | 金额 |
占全年比重 | 金额 |
占全年比重 | 金额 |
销售费用 391.25 22.96% 425.99 25.00% 313.34 18.38% 573.59 33.66%管理费用 665.96 22.84% 674.36 23.13% 712.30 24.43% 862.95 29.60%研发费用 1,810.28 26.37% 1,236.71 18.01% 1,324.04 19.28% 2,494.69 36.34%合计 2,867.49 24.97% 2,337.06 20.35% 2,349.69 20.46% 3,931.22 34.22%
①公司2022年四季度销售、管理、研发费用总额与2021年度不存在较大变
化,各季度费用占比与2021年基本一致,未出现明显的占比波动情况,2022年四季度费用占比与2021年四季度费用占比基本一致;
②公司四季度各项费用合计占全年比重较高,主要系公司四季度计提年终奖
所致。综上,公司2022年第四季度销售费用、管理费用、研发费用发生额占全年比重偏高具有合理性。
五、核查程序
(一)获取公司的前三季度和全年的销售明细表、主要项目的验收单以及
2022年第三季度末和第四季度公司在手订单情况等资料,访谈公司销售部门负责人袁高峰、财务部门负责人沈诗强,查阅相关研究报告及同行业公司年度报告,了解市场需求变化与同行业可比公司情况,分析公司第四季度营业收入下滑的原因;
(二)获取主营业务成本构成明细表、材料出库单、成本计算表等资料, 取
得了西北某单位出具的感谢信,复核西北地区某项目相关单位的回函,访谈公司财务部门负责人沈诗强,了解公司毛利率变动情况,分析公司第四季度毛利率明显低于前三季度综合毛利率的原因及合理性;
(三)获取西北地区项目的合同台账和收入台账,检查西北地区项目合同、
成本计算表、物流运输单、项目验收单等资料,访谈公司销售部门负责人袁高峰及财务部负责人沈诗强,分析毛利率明显下降的原因及合理性;
(四)获取公司各项费用支出的前三季度和全年明细账与明细表,对费用发
生凭证进行抽查和截止测试,访谈公司财务部负责人沈诗强,分析公司2022年第四季度销售费用、管理费用、研发费用发生额占全年比重偏高原因及合理性。
六、核查意见
(一)受疫情影响及宏观经济终端市场需求放缓影响,公司2022年度四季
度营业收入下滑具有市场合理性,符合行业变化情况及公司业务开展实际情况;
(二)公司2022年与2021年相比主营业务成本构成无明显变化;公司2022
年度第四季度毛利下降的原因系受到西北地区某项目影响,扣除该项目的影响后,公司2022年四季度毛利率为31.57%,与前三季度的综合毛利率34.44%相比未出现明显波动;
(三)公司毛利率下降系受到西北地区某项目的因素和受软硬件销售占比的
影响,具有合理性;
(四)公司2022年第四季度费用占比与2021年同季度占比基本一致;公司
第四季度各项合计费用占全年比重较高主要系公司第四季度计提年终奖所致,具有合理性。问题2、关于委外研发你公司本期研发费用下委外研发金额1,146.05万元,系公司将部分非核心研发内容委托第三方开发。其中,向前五大委外研发合作方采购金额608.27万元,占委外研发比例为53.08%。据查,你公司前五大委外研发合作中4家注册地在西安或兰州,公司注册资本及参保人员规模均较小。请你公司:
(1)补充披露委外研发合作方的具体情况,包括但不限于合作方技术能力、
合作背景、项目完成及成果产出情况;
(2)结合你公司委外研发相关的采购制度及供应商选择标准,说明你公司
选择规模较小、注册地较远的公司作为委外研发合作方的原因及合理性。【回复】
一、补充披露委外研发合作方的具体情况,包括但不限于合作方技术能力、
合作背景、项目完成及成果产出情况公司本期委外研发前五大合作方具体情况如下表所示:
单位:万元
合作单位 | 法人代表 |
注册资本 | 合作背景 |
技术能力证明材料 | 公司开始合作时间 |
项目完成及成果产出情况 | 2022年度采购金额 |
陕西格美信息科技有限公司
张阁 2,100.00
陕西格美信息科技有限公司成立于2017年,是一家集计算软件开发与销售于一体的高科技企业,主要面向政府、医疗、企事业单位进行软件开发、网站建设、托管及后期运维等服务,获取双软认证、医疗
信息系统相关认证等。公司针对自研智慧医疗项目中需要大量人工进行数据清洗、标注、标签、可视化等医疗行业基础业务需求,通过市场化咨询比价,最终选择该公司成为该部分的软件
研发合作单位。
国家高新
技术企业,具有智慧医疗相关软著
6项
2022年6
月
相关技术成果已研发完成,主要产出为:医学数据标注、单病种多病种数
据结构化、数据命名标签、结构可视化等,主要
用于公司“基于知识图谱
的智慧医疗数据分析系统”研发项目。
194.17 194.17
陕西祥泰锦和电子科技有限公司
朱小琴 300.00
陕西祥泰锦和电子科技有限公司成立于2020年,是一家从事计算机网络、系统集成、安全防范、视频会议、楼宇智能化系统及计算机软硬件开发、UPS电源销售等的民营高新技术企业。公司致力于视频会议、楼字智能化、计算机网络、机房、系统集成、校园网络、安全防范领域、网格化管理,同时逐步在这些领域拥有了丰富
的经验。公司针对自研存储系统中需要增加快照和磁盘修复用以辅助研发,以及智慧路灯伴侣产品中需辅助信息发布,通过市场化咨
与国内规模较大的软件企业
长期合作,如:
陕西普超网络技术有限公司
等
2020年8
月
相关技术成果均已研发完成,主要产出为:存储快照功能模块与磁盘修复模块开发,以及信息发布模块、对接广告屏、声光电等交互功能开发。主要用于公司“面向多类型云存储架构的高并发融合存储系统研发”和“面向平安城市的智慧路灯伴侣系统研发和产业化”研发项目。
507.12 688.01
合作单位 | 法人代表 | 注册资本 |
合作背景 | 技术能力证明材料 | 公司开始合作时间 | 项目完成及成果产出情况 |
2022
年度采购金额 | 累计采购金额 |
询比价,最终选择该公司成为该部分的软
件研发合作单位。
甘肃德润信息科技有限公司
李景兰 500.00
甘肃德润信息科技有限公司成立于2020年,位于兰州高新技术产业开发区,主要经营互联网数据服务、互联网公共服务平台、信息系统集成和物联网技术服务、运行维护服务、信息技术咨询服务等。公司针对自研青少年实训系统中需要增加部分课程内容,以及工业检测系统中需要标准印刷电路板的行业特征信息采集,通过市场化咨询比价,最终选择该公司成为
该部分的软件研发合作单位。
与兰州城市学院信息工程学院产学研合作,2项正在申请的相关软著
2020年11月
相关技术成果均已研发完成,主要产出为:青少年学习知识库课程制作开发,以及标准印刷电路板检测功能开发。主要用于公司“新一代青少年智能实训系统及配套设备研发”和“基于人工智能的工业质量检测系统”研发项
目。
107.36 116.27
西安铭顺电子科技有限公司
李俊 500.00
西安铭顺电子科技有限公司成立于2015年,位于古都西安,公司主要经营范围包括计算机软硬件的开发与设计、计算机网络工程、楼宇监控系统、智能化系统工程
的设计、研发、销售及施工、维护等。公司针对自研存储系统中需要自动精简配置以辅助研发,以及智慧路灯伴侣产品中需增加展示功能与效果,通过市场化咨询比价,最终选择该公司成为该部分的软件
研发合作单位。
为中国电子科技集团公司第二十研究所等单位进行软件技术开发
2020年5
月
相关技术成果均已研发完成,主要产出为:存储自动精简配置功能开发,以
及全景影像功能模块开发。主要用于“面向多类型云存储架构的高并发融合存储系统研发”和“面向平安城市的智慧路灯伴侣系统研发和产业化”研发
项目。
419.27 751.71
合作单位 | 法人代表 | 注册资本 |
合作背景 | 技术能力证明材料 | 公司开始合作时间 | 项目完成及成果产出情况 |
2022
年度采购金额 | 累计采购金额 |
南京奕荣芯科技有限公司
方天炜 550.00
南京奕荣芯科技有限公司成立于2020年,主要为客户提供人工智能、大数据、区块链、物联网等相关技术的应用软件技术开发、咨询等服务,具有“一种基于卷积神经网络算法的目标识别方法及系统”发明专利,在人脸比对算法、智慧交通、数据处
理等领域有着丰富的经验。公司针对自研人工智能感知决策系统中需面向个别特殊场景增加人脸比对的向量化描述,通过市场化咨询比价,最终选择该公司成为该部分的软件研发合作单位。
国家高新技术企业,具有人脸算法相关发明专利1项、软著2项、其他大数据及AI相关软著10
余项
2021年11月
相关技术成果已研发完成,主要产出为:新型人
脸局部线性嵌入算法开
发。主要用于公司“基于人工智能的智慧感知与决
策控制云平台研发”研发
项目。
88.30 88.30
二、结合你公司委外研发相关的采购制度及供应商选择标准,说明你公司选
择规模较小、注册地较远的公司作为委外研发合作方的原因及合理性公司的采购制度及供应商选择标准如下:公司采购内容主要包括产品开发、测试及项目实施所需的材料(如CPU、GPU、硬盘、内存、显卡等)以及所需的第三方技术服务。采购需求通常由研发部门、销售部门等业务部门提出申请,经采购部门结合仓库管理员反馈的库存情况以及项目实施所需服务情况等确认采购品类及数量,报总经理审批并实施采购工作。采购部门负责材料物资的询价、比价,对于金额较大的采购需求需比较至少3家合格供应商的报价,针对仅有一家供应商提供的特定物资,采购部门通常选择单一供应商来源采购。公司通过建立供应商管理制度以筛选合格供应商,并且定期对供应商提供物资的质量、价格、交货及时性、供货条件及其资信、经营状况等进行管理和综合评价,根据评价结果对供应商进行合理调整。
公司委外研发主要系公司为了加快新产品市场化步伐,更致力于核心技术优化、产品创新等方面的研发,通过与第三方单位合作快速实现产品与行业应用的结合,对于应用性研发的合作需求同步增加;同时,在公司技术人员基本稳定的情况下,公司将其中非核心的应用性研发项目更多地委托第三方,公司研发人员可以将更多的精力集中于自身核心技术的研发方面,提升总体研发效率。例如:
需要大量人工的数据清洗标注类工作、行业中已经相对成熟的功能模块、定制化的行业应用软件等。
公司选择的委外研发单位多为规模较小的企业,所属地区主要集中在西安和兰州,公司选择该区域单位的主要原因系:1.西安、兰州教育资源集中,有诸多知名高校和科研院所,研发人员资源丰富;2.西安、兰州人力资源成本相对较低,当地的公司具备研发成本价格优势,经过市场询价,这类注册地较远、规模较小的公司软件研发报价相对较低。
公司委外研发合作单位的选择严格按照相关采购制度执行。公司首先评估委外研发需求,在能够满足研发要求的情况下,通过询价比较至少3家合格供应商,选择出最终合作方。同时,在研发完成后,公司相关部门组织对委外研发内容按照合同要求进行验收。公司定期会根据供应商管理制度对合作单位进行综合
考核评价。综上,公司选择规模较小、注册地较远的公司作为委外研发合作方系公司严格按照采购制度及供应商选择标准,注重委外研发性价比,具有商业合理性。
三、核查程序
(一)获取公司研发台账及研发成果产出资料,查询委外研发合作方工商资
料,访谈公司总经理刘鹏、研发部门负责人张堃,了解公司委外研发合作方技术能力、合作背景、项目完成及成果产出情况;
(二)获取公司的采购制度及供应商选择标准,访谈公司总经理刘鹏、研发
部门负责人张堃,了解委外研发单位的选取原因,分析是否具备合理性。
四、核查意见
(一)公司与委外研发合作方开展合作具备合理的商业背景,具备一定技术
能力,相关技术已研发结束并完成研发成果的产出;
(二)公司选择规模较小、注册地较远的公司作为委外研发合作方系公司严
格按照采购制度和供应商选择标准以及注重委外研发性价比后的选择结果,具有合理性。
问题3、关于新产品情况根据年报问询函回复,你公司称“cVector向量一体机实现的功能与业内‘向量数据库’类似”(以下称“cVector一体机”),但相较于向量数据库是一种采用软件方法实现向量数据管理合计算的数据库,cVector一体机采用硬件加速方式进行向量计算,有助于解决前者在数据入库、检索环节的效率及准确性问题。同时,你公司称cVector一体机“主要目标客户群体包括:国内外做语言大模型提供类ChatGPT生成式AI服务的企业、需要通过自然语言搜索文献资料的单位、以及有大规模人脸识别需求的政企单位等”。报告期内,你公司cVector一体机在部分智慧城市、智慧校园中有实际应用,产生经济效益696.03万元。请你公司:
(1)结合成本构成、原材料内容等,描述cVector一体机的生产过程,并
说明核心零部件及技术的具体内容及来源;结合报告期内cVector一体机在智慧园区的实际应用,说明其在各类人工智能场景中的具体应用环节,如何服务于各类生成式AI相关的企业;
(2)说明你公司在年报中披露cVector一体机“能够支持类ChatGPT等人
工智能技术对算力要求极高的卡脖子难题”的依据及合理性,相关表述是否准确。
【回复】
一、结合成本构成、原材料内容等,描述cVector一体机的生产过程,并说
明核心零部件及技术的具体内容及来源;结合报告期内cVector一体机在智慧园区的实际应用,说明其在各类人工智能场景中的具体应用环节,如何服务于各类生成式AI相关的企业
公司“cVector向量计算一体机”主要包括了硬件设备和软件系统两大部分,其中:硬件设备系向第三方单位定制,以一体机中主要的5U高度比对节点为例,其核心零部件主要包括:主板、内存、CPU,硬盘、可插拔的48/60个向量计算卡(CPU)、以及电源、网卡、风扇等配套组件,主要向相关主流品牌供应商询价采购;软件系统则是由公司自主研发,主要包括了高维向量计算硬件加速算法软件和分布式并行计算框架软件等,高维向量计算硬件加速算法软件能够将需要几千个时钟周期的向量计算缩短至几个时钟周期,而分布式并行计算框架软件能够将更多计算过程并行,进一步提升处理效率,能够协同调度一体机中的各个计算单元。“cVector向量计算一体机”的主要生产过程是:公司研发设计产品的技术规格,并研发核心算法和软件系统;选择第三方单位提出技术规范并委托定制生产硬件设备,并检验所交付设备的质量合格情况,再将上述自研的相关算法和软件系统安装在定制硬件设备上;最后,根据实际需求组装成单节点、半柜或整柜式的标准化一体机产品,经软硬件各项指标综合检验合格后形成合格产品。
公司已于2021年10月25日获得了“cVector向量计算一体机”中的自研软件部分的软件著作权(2021SR1552144,云创cVector向量并行比对系统V1.0);
同时,公司于2022年11月7日对该软件算法及一体机设备申请了发明专利(2022113813387,一种分布式并行向量比对计算方法及系统,目前处于已受理状态)。“cVector向量计算一体机”主要能够应用于人工智能领域中的大规模图像检索和生成式AI两大主要场景。
(一)大规模图像检索场景
以人脸比对应用为例,其本质是将待识别的人脸图像转化为高维特征向量数据,然后将之与特征向量库中的所有人脸数据进行比对。目前主流的人脸比对主要用于车站、机场等场所的人证核验,通过读取身份证照片信息与拍摄到的人脸数据进行1:1验证,对算力的需求量不大;而在公共安全领域中,更大算力的需求是针对城市每一个摄像机拍摄的画面,判断其中是否存在逃犯等不法分子,通过实时预警进一步提升城市安全,这就需要将大量实时产生的人脸图像数据和逃犯库的人脸数据进行实时M:N比对,对算力的需求十分庞大,如果用传统基于GPU的图像识别特征比对方法,达到实时处理对GPU算力需求高,成本代价高昂。而“cVector向量计算一体机”则通过CPU硬件加速和并行处理的方式,能够将特征向量的比对次数最高提升到7亿次/秒,同等算力所需成本大幅下降。报告期中,“cVector向量计算一体机”相关产品应用于某地智慧园区项目,提供基于人脸的向量并行比对等功能,为园区提供智能化地安全保障及更强更实时的管控能力。提供诸如面向园区中特定区域存在非授权人员进入时给予实时告警,对园区中指定人员车辆进行实时追踪等智能化功能。
综上“cVector向量计算一体机”能够应用于人工智能领域中大规模图像识别比对的应用场景,有力支撑大规模图像的向量比对需求。
(二)生成式AI场景
生成式AI主要依赖大语言模型。大语言模型本质上是将互联网上的数据通过人工智能技术处理后,转化成对应的向量数据,并依托神经网络算法建立了向量间的推理机制。当用户提出问题时,大模型先将问题转化成向量,然后经过推理生成结果向量,再把结果向量转化成文字呈现给用户。创建大语言模型的阶段
称为训练,使用大语言模型的阶段称为推理,这两个阶段涉及大量的矩阵计算,算力开销巨大。训练阶段需要大规模的GPU集群,且耗时较长,训练好的大模型可持续使用。推理阶段回答每个问题的计算开销相对较少,但在需要实时面对大量用户的并发访问环节对GPU的算力需求十分巨大,算力开销成本高昂,由此导致服务质量受限。因此,目前ChatGPT、AutoGPT等主流的生成式AI普遍采用了向量数据库技术以缓解对GPU集群的访问压力、提升对用户的服务质量。
对于生成式AI相关企业,“cVector向量计算一体机”主要面向大模型推理应用:(1)减轻大模型的访问压力。用户所提的80%问题都是相似的常见问题,向量计算一体机可以缓存热点问题,不需要经过大模型推理即可返回结果,从而大幅降低算力成本;(2)提升大模型理解互联网实时数据的能力和服务质量。大模型基于历史数据训练而成,向量计算一体机存储海量实时数据所转化成的向量数据,可以让大模型理解掌握实时情况,并能够支持用户上传更多数据,更好地学习理解用户请求;(3)提高生成式AI的输出准确性。大模型的输出结果是根据概率推理而成,向量计算一体机可将可信来源的数据转化成向量数据进行存储,以校准大模型推理输出的结果,从而使大模型输出的结果更加准确,防止AI对敏感问题做出不恰当的回应。
综上,“cVector向量计算一体机”能够应用于人工智能领域中生成式AI的推理应用场景,为生成式AI企业提供高性价比的产品和解决方案。
二、说明你公司在年报中披露cVector一体机“能够支持类ChatGPT等人
工智能技术对算力要求极高的卡脖子难题”的依据及合理性,相关表述是否准确
公司“cVector向量计算一体机”主要依托自主研发的加速算法和并行计算算法,用算法+CPU代替GPU实现基于硬件加速的向量计算,具有类似向量数据库的功能,致力于满足亿级以上向量规模的大模型推理应用中所需的向量计算性能需求。例如:
在人工智能大规模图像检索场景中,“cVector向量计算一体机”较之GPU服务器,同等算力所需成本大幅下降。有助于解决当前同等投入规模情况下,仅依靠GPU算力不足以支撑大规模图像检索应用的难题。
在生成式AI场景中,主要工作是对大模型的训练和推理,其中大模型训练仍是主要依赖GPU的领域,而“cVector向量计算一体机”能够在大模型推理环节中,帮助大模型减轻访问压力、提升理解实时数据能力、提高输出准确性、提升服务质量、过滤敏感内容等。有助于辅助解决仅依靠GPU不足以支撑大模型推理所需算力的难题。近期,“cVector向量计算一体机”接受了中国软件评测中心组织的性能测试。该中心系工业和信息化部直属的国家一级科研事业单位,首家获得中国实验室国家认可委员会实验室认可资质,迄今已完成万余款软硬件产品和数千项信息系统工程项目测试,是国家级软硬件产品和信息系统测试实验室。。中国软件评测中心对比测试了“cVector向量计算一体机”与3款主流向量数据在入库速度、查询速度、准确性等维度的性能对比,本次测试系中国软件评测中心依据相关标准和规则设置测试环境,同在CPU平台(非GPU平台)下进行的性能对比测试。
(一)性能测试结果
1、数据入库性能
“cVector向量计算一体机V1.0”、向量数据库A、向量数据库B、向量数据库C入库,当向量数据是256维,使用Python3.7.8版本编写代码测试,调用对应库、模块和函数入库,测试情况如表所示:
(万条) |
A
向量数据库 | 向量数据库 |
B
C
cVector
向量数据库 | 向量计算一体机 |
100.00 154.85s 1620.25s 4049.05s 181.14s1,000.00 1591.91s 18964.35s 44192.62s 303.59s2,000.00 3123.89s 36582.62s 93229.53s 803.5s3,000.00 4851.97s 59652.69s 135513.97s 1202.91s4,000.00 6593.53s 77965.79s 1735.33s5,000.00 8211.22s 96682.68s 2185.59s6,000.00 9504.72s 2299.87s8,000.00 12898.12s 3349.46s10,000.00 17295.49s 4484.55s
12,000.00 5996.17s
2、数据查询性能
“cVector向量计算一体机V1.0”、向量数据库A、向量数据库B、向量数据库C查询,当向量数据是256维,使用Python3.7.8版本编写代码测试,调用对应库、模块和函数查询,统计返回10条与查询向量距离最接近向量的查询时间,测试情况如表所示:
查询向量总量 (万条) | 向量数据库 |
A
B
向量数据库 | 向量数据库 |
C
100 0.049s 0.727s 0.0308s 0.0431s1000 21.377s 4.845s 0.0308s 0.0661s2000 43.729s 9.052s 0.0287s 0.0992s3000 66.124s 14.174s 0.0361s 0.12s4000 156.672s 19.165s 0.149s5000 235.366s 24.035s 0.168s6000 287.69s 0.168s8000 385.189s 0.224s10000 512.8s 0.27s12000 0.1875s
3、准确度
在“cVector向量计算一体机V1.0”、向量数据库A、向量数据库B和向量数据库C中存储相同的1000万条的256维向量数据,分别查询与目标向量的欧氏距离最短的10条向量,对比结果显示各自返回的10条向量与目标向量的距离值均相同。
(二)测试结论
“向量计算数据库验证平台V1.0”性能效率符合《向量计算数据库验证平台测试需求V1.0》的相关要求,在现场测试过程中,系统运行稳定,通过了中国软件评测中心(工业和信息化部软件与集成电路促进中心)的单项性能测试。
综上,根据中国软件评测中心测试报告结果,“cVector向量计算一体机”在千万级以上规模的入库和查询等方面具有更高的性能优势,可帮助提高大模型推理的服务性能和服务质量。
(三)风险提示
1、以上测试结论仅为中国软件评测中心的测试结果,该测试基于CPU平台
进行,测试条件和实际运行环境存在一定差异,产品技术先进性尚有待进一步验证;
2、公司非芯片制造企业,“cVector向量计算一体机”中的CPU等原材料需
要对外采购,芯片技术存在依赖性;
3、公司产品从推出到具体业务落地会受各类市场因素影响,“cVector向量
计算一体机”能够为公司带来的直接经济效益存在一定的不确定性。
三、核查程序
(一)获取“cVector向量计算一体机”的产品资料,访谈公司总经理刘鹏、
研发部门负责人张堃、销售部门负责人袁高峰、财务部门负责人沈诗强,了解“cVector向量计算一体机”的生产过程、核心零部件及技术的具体内容和来源,分析该产品的实际应用场景、具体应用环节以及服务于终端客户的情况;
(二)获取中国软件评测中心对“cVector向量计算一体机”的测试报告结
果,访谈公司总经理刘鹏、研发部门负责人张堃,了解人工智能技术发展情况,分析“cVector向量计算一体机能够支持类ChatGPT等人工智能技术对算力要求极高的卡脖子难题”的依据及合理性。
四、核查意见
(一)“cVector向量计算一体机”硬件设备来源主要为对外采购,软件系统
和核心技术是由公司自主研发;“cVector向量计算一体机”能够应用于人工智能领域中大规模图像识别比对的应用场景,有力支撑大规模图像的向量比对需求;“cVector向量计算一体机”能够应用于人工智能领域中生成式AI的推理应用场景,为生成式AI企业提供高性价比的产品和解决方案;
(二)根据中国软件评测中心测试报告结果,“cVector向量计算一体机”在
千万级以上规模的入库和查询等方面具有更高的性能优势,可帮助提高大模型推理的服务性能和服务质量。
(此页无正文,为《中信建投证券股份有限公司关于南京云创大数据科技股份有限公司年报的二次问询函相关问题回复的核查意见》之盖章页)
中信建投证券股份有限公司
年 月 日