chaguwang.cn-查股网.中国

查股网.CN

 

海天瑞声(688787)最新消息公司新闻

 

查询最新消息新闻报道(输入股票代码):

公司报道☆ ◇688787 海天瑞声 更新日期:2025-05-05◇ 通达信沪深京F10 ─────────┬──────────────────────────────────────────────── 2025-04-27 17:26│海天瑞声(688787)2025年4月27日-28日投资者关系活动主要内容 ─────────┴──────────────────────────────────────────────── 1、2025年第一季度,公司收入增长的驱动因素是什么? 答:随着多模态大模型的快速迭代及行业应用渗透提速,公司计算机视觉业务和自然语言业务分别同比实现高速增长。其中,在 国家对“AI+数据要素”政策同步发力的背景下,以运营商、互联网平台公司为代表的大型客户持续加码高质量图像/视频等多模态数 据采购,为其通用多模态大模型训练提供有力支撑;同时,政务、法律合规等场景应用的落地,带动场景类文本数据需求快速增加。 在全球化布局方面,公司去年在东南亚新增建设的数据交付体系已进入爬坡运营阶段,通过拓展海外定制服务市场,不仅带来了可观 的增量收入,并有望成为海外业务扩展新的战略支点。上述因素,共同驱动公司2025年第一季度营业收入显著增长。 2、目前公司是否有在尝试新的业务或者商业模式? 答:当前,在国家大力推进“人工智能+”行动和“数据要素X”的战略指引下,公司正积极探索与实践数据产业新业务和新模式 。一是按照国家推动公共数据资源的开发利用,发挥海天瑞声的技术优势,与多地政府、地方运营商等开展战略合作,共同探索数据 要素市场化与产业化的创新路径,通过构建“数据可信空间”,协助地方政府打造安全、高效、合规的数据治理与流通体系,推动数 据要素的价值释放。二是发挥海天瑞声的行业经验和积累,联合当地高校,培训和培养数据标注人才,提升就业率的同时夯实区域数 字经济发展人才基础。三是,发挥海天瑞声的生态优势,助力地方及产业园区打造数据标注基地和构建数据标注产业新生态。 3、公司与运营商的合作进展如何? 答:在国家"AI+数据要素"战略的指引下,尤其是国务院国资委连续两年开年启动部署中央企业“AI+”专项行动以来,以运营商 为代表的重点央企自2024年起加速布局通用+垂向大模型研发,带动了高质量图像、视频等训练数据的规模化采购需求。公司凭借在 数据领域的核心优势,已快速成为运营商类客户重要的数据服务供应商。未来,随着以运营商为代表的重点央企在多模态大模型方向 的持续加码,以及其基座大模型在更多传统行业的应用落地,预计相关数据需求将进一步增长,为公司收入带来持续的增长动能。 4、与客户自建数据团队相比,海天的优势是什么? 答:相较于客户自建团队,海天瑞声历来都是对接众多大型科技公司、头部人工智能企业、科研院所等,获得的信息是广泛的, 项目经验丰富,同时积累了大量的know-how,对数据的理解更广、更深刻,同时我们搭建了成熟的数据处理算法平台,通过更高效的 人机交互实现降本增效,保证数据质量的同时能有效降低成本,为客户提供更高性价比的训练数据产品/服务。 5、行业的竞争格局现在及未来是什么样的?未来市场集中度将如何变化? 答:目前来看,市场上数据服务市场主要由品牌数据服务商、客户自建团队以及一些中小数据服务商构成。 未来,公司预判整个数据服务市场将进行重新洗牌,集中度将进一步提升。市场各类主体将会通过在技术研发投入、资源能力建 设等主要方面的竞争,逐步淘汰掉那些研发能力弱、资源势力差的品牌服务商和中小玩家。此外,国家对于数据安全及合规要求的进 一步趋严,会将那些不具备数据安全合规能力或尚未进行此方面布局的企业逐渐淘汰出局。 在客户自建团队部分,出于其自身对数据和业务的敏感性、保密性需求,可能会与品牌服务商长期共存。 6、公司的业务是否存在规模效应? 答:公司业务是存在规模效应的,一方面随着公司在研发方面加大投入,自研平台的能力逐步提升,可以赋能数据处理过程中的 人机协作朝着更加智能化的方向前进,这就使得公司进行更大规模的数据生产成为可能。同时,数据产品的积累、平台以及工具的研 发,在公司业务规模逐渐上升的情况下,相关的研发费用、管理费用将被摊薄; 从成本端看,数据生产的成本还有很大的下沉空间,对于成本控制我们会在两方面进行持续投入:一方面是继续加大技术投入, 采用更为合理的人机协同比例完成数据处理任务,降低人员投入,提高处理效率;另一方面是加强供应链资源管理能力,扩大资源供 给,降低单位成本。 此外,数据集产品一直是我们公司所坚持的重点方向,公司开发大量通用型、复卖率高的标准化产品数据集,反复给公司带来利 润,也能实现训练数据产品的规模化效应。 7、成本结构里最大的部分是什么?如何能够持续性的优化成本结构? 答:公司最大的成本就是原料数据采购费用,即:采集、标注成本。一方面,公司通过继续加大研发投入的力度,全面提升公司 的算法能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同,这样能够做大规模、提升效率、降低成本; 另一方面是加强供应链资源管理能力,扩大资源供给,降低单位成本。 8、公司提供的训练数据整体解决方案中,各个环节的技术难度如何? 答:首先,训练数据集的设计和原料数据采集环节是存在相当的技术难度的,比如语音类采集,文本设计是否贴合实际场景、如 何实现最小采集量且确保场景覆盖丰富度等因素均是设计和采集环节需要考虑和解决的;在视觉类采集方面,复杂的人像采集、物体 影像采集,同样具有如何设计合理的数据浓度达到最小成本最高训练效果,如果是垂直行业数据集的采集,例如交通行业内的自动驾 驶领域,则存在准入资质、技术难度(包括但不限于对于交通场景、车辆传感器等要素的综合理解和实施能力)等方面的门槛。 数据标注环节的难度在于面对大量的数据标注需求,如何快速的找到充足的资源,而且通过算法平台实现机器的辅助标注,并在 人机协作过程中,寻找效率与质量的最佳平衡,在提升数据标注效率、保证数据质量的同时降低成本。 9、定制数据逐渐积累,是否可以转化为自有的数据产品? 答:客户定制服务涉及的训练数据在交付给客户并完成验收后,所有权完全转移给客户,海天瑞声是不能用于自身产品建设的, 这一点是公司始终遵循的知识产权要求。 在定制数据集的生产过程中,积累下来的经验、know-how会帮助公司各方面能力的提升,例如工具平台因为处理了大量的定制数 据集,使平台完善性有很大的增益,加强了公司的数据处理能力;再如,在一些情况下,公司在生产定制数据集时,也会根据对行业 需求的判断,在保障数据权属划分清晰的前提下,利用团队管理、资源获取的便利性,同步安排额外的设计、采集和标注工作,完成 产品数据集的开发。 https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202504/61892688787.pdf ─────────┬──────────────────────────────────────────────── 2025-04-26 10:09│海天瑞声(688787)一季度净利润37.16万元 ─────────┴──────────────────────────────────────────────── 格隆汇4月26日丨海天瑞声(688787.SH)发布一季报,2025年一季度实现营业总收入6980.95万元,同比增长71.75%;归属母公司 股东净利润37.16万元,上年同期亏损63.41万元;基本每股收益为0.01元。 https://www.gelonghui.com/news/4989737 ─────────┬──────────────────────────────────────────────── 2025-04-26 02:49│图解海天瑞声一季报:第一季度单季净利润同比增158.60% ─────────┴──────────────────────────────────────────────── 海天瑞声2025年一季报显示,公司主营收入6980.95万元,同比上升71.75%;归母净利润37.16万元,同比上升158.6%;扣非净利 润-68.48万元,同比上升74.12%;负债率8.22%,投资收益42.05万元,财务费用-49.56万元,毛利率47.41%。以上数据为证券之星根 据公开信息整理,不构成投资建议。 https://stock.stockstar.com/RB2025042600001092.shtml ─────────┬──────────────────────────────────────────────── 2025-04-26 01:28│图解海天瑞声年报:第四季度单季净利润同比增335.08% ─────────┴──────────────────────────────────────────────── 海天瑞声2024年年报显示,公司主营收入2.37亿元,同比上升39.45%;归母净利润1133.61万元,同比上升137.31%;扣非净利润 497.35万元,同比上升111.44%。2024年第四季度,公司主营收入8752.55万元,同比上升31.03%;归母净利润754.74万元,同比上升 335.08%;扣非净利润691.18万元,同比上升827.73%。负债率8.06%,投资收益655.29万元,财务费用30.18万元,毛利率66.46%。 https://stock.stockstar.com/RB2025042600000601.shtml ─────────┬──────────────────────────────────────────────── 2025-04-26 00:49│海天瑞声(688787)发布2024年度业绩,归母净利润1134万元,同比扭亏为盈 ─────────┴──────────────────────────────────────────────── 智通财经APP讯,海天瑞声(688787.SH)披露2024年年度报告,报告期公司实现营收2.37亿元,同比增长39.45%;归母净利润1134 万元,同比扭亏为盈;扣非净利润497万元,同比扭亏为盈;基本每股收益0.19元。公司拟向全体股东每10股派发现金股利3.50元(含税 )。 http://www.zhitongcaijing.com/content/detail/1285658.html ─────────┬──────────────────────────────────────────────── 2025-04-26 00:45│海天瑞声(688787)发布一季度业绩,归母净利润37万元,同比扭亏为盈 ─────────┴──────────────────────────────────────────────── 智通财经APP讯,海天瑞声(688787.SH)披露2025年第一季度报告,报告期公司实现营收6981万元,同比增长71.75%;归母净利润3 7万元,同比扭亏为盈;扣非净利润亏损68万元,同比收窄。基本每股收益0.01元。 http://www.zhitongcaijing.com/content/detail/1285656.html ─────────┬──────────────────────────────────────────────── 2025-04-07 13:49│异动快报:海天瑞声(688787)4月7日13点40分触及跌停板 ─────────┴──────────────────────────────────────────────── 4月7日,海天瑞声(688787)触及跌停板,股价下跌20%至75.17元,所属的IT服务行业整体下跌,领涨股为中国软件。该股涉及 无人驾驶、车联网、阿里巴巴概念股等热点概念。当日主力资金净流出1914.29万元,占总成交额13.92%,游资和散户资金分别净流 入577.81万元和1336.47万元。近5日资金流向显示,主力资金持续流出。以上信息由证券之星根据公开资料整理并由智能算法生成, 仅供参考,不构成投资建议。 https://stock.stockstar.com/RB2025040700018549.shtml ─────────┬──────────────────────────────────────────────── 2025-04-03 16:26│海天瑞声(688787):已开展知识库方向的研发工作 ─────────┴──────────────────────────────────────────────── 格隆汇4月3日丨海天瑞声(688787.SH)在投资者互动平台表示,我司已开展知识库方向的研发工作,未来择机考虑投入商业场景 。 https://www.gelonghui.com/news/4972059 ─────────┬──────────────────────────────────────────────── 2025-04-03 16:22│海天瑞声(688787):AI数据业务在海外市场的推广可以基于多个海外子公司完成 ─────────┴──────────────────────────────────────────────── 格隆汇4月3日丨海天瑞声(688787.SH)在投资者互动平台表示,海天瑞声目前已经有3个海外子公司:美国子公司、新加坡子公司 、香港子公司。公司的AI数据业务在海外市场的推广可以基于多个海外子公司完成,从未、也将不受美国新关税政策的影响。 https://www.gelonghui.com/news/4972050 ─────────┬──────────────────────────────────────────────── 2025-03-13 20:00│海天瑞声(688787)2025年3月13日、3月19日、3月24日投资者关系活动主要内容 ─────────┴──────────────────────────────────────────────── 1、2024年收入增长的驱动因素是什么? 答:受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互联网公司等为代表的国内外科技巨头纷纷加 大多模态数据投入以支撑其智能终端、内容生成等领域的 AI 能力建设。在此背景下,以多语种、多音色为代表的智能语音业务需求 、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长,整体上驱动公司营业收入同比显著增加。 2、DeepSeek出来后,对数据需求的影响如何?是否会降低AI行业对数据的需求? 答:(1)Deepseek推出了一系列模型,其中V3模型依然使用了预训练、以及SFT等训练方式,其中预训练阶段的token使用量达 到了14.8T,远超GPT4等同类可比大模型预训练阶段的数据使用量,且在后训练阶段也使用了一定规模的标注数据,这也更加说明海 量以及高质量数据对于基础模型能力提升的重要意义。 (2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、 可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察 ,我们认为高阶的数据专家的参与依然非常重要。 (3)此外,数据质量不仅影响模型获取和表达知识的能力,还决定了模型生成内容的风格和准确性,帮助DeepSeek实现了在输 出端的文采能力提升。 其一,高质量数据可以提升模型表达和推理能力。优质数据包含准确、连贯且富有表现力的语言样本。例如,包含CoT数据可以 引导模型在推理时进行反思,进而在生成回答时展现出清晰的逻辑和优美的语言表达。这正是DeepSeek模型能够生成既准确又具有华 丽文风的关键因素之一。 其二,高质量数据可以降低噪音和确保一致性。数据中的错误、噪音或不一致信息会导致模型生成内容出现语法或逻辑问题。高 质量的数据则能有效减少这些问题,使模型更好地学习到语言规律,从而提高整体生成质量。 其三,高质量数据可以提升泛化能力。数据的多样性和全面性使得模型在面对不同领域和任务时都能生成高质量的回答。丰富且 准确的样本帮助模型在多种场景下自如切换风格,无论是精炼的技术解答还是文采斐然的创意写作,都能游刃有余。 (4)往未来看,Deepseek模型的出现,有望进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过 程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。 3、未来AI数据如果自动标注了,会对公司及行业产生影响吗? 答:首先,AI一定不会实现完全的自动化标注,因为机器如果想要持续演进,使其更接近于人类的判断和理解,就一定需要人类 作为引导,通过人工标注帮助其完成新知识的学习,所以只要人工智能在持续发展和进化就一定需要人类参与,即无法达到完全的自 动化标注。 另一方面,更加智能化的人机协作模式一直是数据服务行业的发展趋势,同时也是数据服务企业的核心竞争能力之一,自动化标 注的核心不是完全替代人类,而是提高人机协作效率,海天瑞声近年来在研发领域持续加大投入,不断提升公司数据生产的智能化水 平,并据此形成规模效应、实现降本增效。 4、公司的业务是否存在规模效应? 答:公司业务是存在规模效应的,一方面随着公司在研发方面加大投入,自研平台的能力逐步提升,可以赋能数据处理过程中的 人机协作朝着更加智能化的方向前进,这就使得公司进行更大规模的数据生产成为可能。同时,数据产品的积累、平台以及工具的研 发,在公司业务规模逐渐上升的情况下,相关的研发费用、管理费用将被摊薄; 从成本端看,数据生产的成本还有很大的下沉空间,对于成本控制我们会在两方面进行持续投入:一方面是继续加大技术投入, 采用更为合理的人机协同比例完成数据处理任务,降低人员投入,提高处理效率;另一方面是加强供应链资源管理能力,扩大资源供 给,降低单位成本。 此外,数据集产品一直是我们公司所坚持的重点方向,公司开发大量通用型、复卖率高的标准化产品数据集,反复给公司带来利 润,也能实现训练数据产品的规模化效应。 5、成本结构里最大的部分是什么?如何能够持续性的优化成本结构? 答:公司最大的成本就是原料数据采购费用,即:采集、标注成本。一方面,公司通过继续加大研发投入的力度,全面提升公司 的算法能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同,这样能够做大规模、提升效率、降低成本; 另一方面是加强供应链资源管理能力,扩大资源供给,降低单位成本。 6、公司提供的训练数据整体解决方案中,各个环节的技术难度如何? 答:首先,训练数据集的设计和原料数据采集环节是存在相当的技术难度的,比如语音类采集,文本设计是否贴合实际场景、如 何实现最小采集量且确保场景覆盖丰富度等因素均是设计和采集环节需要考虑和解决的;在视觉类采集方面,复杂的人像采集、物体 影像采集,同样具有如何设计合理的数据浓度达到最小成本最高训练效果,如果是垂直行业数据集的采集,例如交通行业内的自动驾 驶领域,则存在准入资质、技术难度(包括但不限于对于交通场景、车辆传感器等要素的综合理解和实施能力)等方面的门槛。 数据标注环节的难度在于面对大量的数据标注需求,如何快速的找到充足的资源,而且通过算法平台实现机器的辅助标注,并在 人机协作过程中,寻找效率与质量的最佳平衡,在提升数据标注效率、保证数据质量的同时降低成本。 7、标品化的产品数据集业务与定制化服务业务的区别是什么? 答:产品数据集是先于客户需求形成的模拟数据,是公司区别于其他竞争对手的一大特色,基于公司对市场的判断和通用化需求 的提取能力,其属于是一次性投入、未来重复授权销售,对于公司的营收、毛利有着重要作用;而定制业务的需求来源是客户的定向 化需求,有些定制业务的原始数据来源是客户提供的实网数据,公司提供纯加工的服务。 客户的AI产品在上线之前及初期,因为其自身尚未产生实网数据,通常需要采购模拟型数据集进行算法模型的训练,在产品上线 并运行一段时间、产生大量实网数据之后,则会提供实网数据给到我们进行数据加工,加工的数据反哺到客户的产品上从而促进其产 品的迭代、升级。之后,客户需要进行产品功能或语种的拓展,再次需要购买模拟数据集来支撑,后续再采购数据加工服务进行迭代 。 8、训练数据产品和服务的定价模式、收费模式是什么样的? 答:定制服务定价模式:一般采用成本加成定价法。公司根据客户的具体服务需求预估项目成本,在预估成本的基础上,参考公 司制定的指导毛利率水平,结合项目技术难度、复杂程度、时限要求等进行报价,并根据市场环境与客户协商,最终确定价格。 产品定价模式:一般采用需求导向定价法。公司综合考虑训练数据集的开发支出、市场需求程度、预计未来重复销售的频率等因 素,制定产品标准价格及价格区间,在销售过程中,根据客户的实际需求情况,以价格区间为基础向客户报价,经双方协商确定最终 销售价格。训练数据产品通常以单个数据集为单位进行定价,定价比较灵活。 9、定制数据逐渐积累,是否可以转化为自有的数据产品? 答:客户定制服务涉及的训练数据在交付给客户并完成验收后,所有权完全转移给客户,海天瑞声是不能用于自身产品建设的, 这一点是公司始终遵循的知识产权要求。 在定制数据集的生产过程中,积累下来的经验、know-how会帮助公司各方面能力的提升,例如工具平台因为处理了大量的定制数 据集,使平台完善性有很大的增益,加强了公司的数据处理能力;再如,在一些情况下,公司在生产定制数据集时,也会根据对行业 需求的判断,在保障数据权属划分清晰的前提下,利用团队管理、资源获取的便利性,同步安排额外的设计、采集和标注工作,完成 产品数据集的开发。 10、行业里的玩家增多,会不会出现价格战? 答:是否存在价格竞争主要取决于该领域是否较为存在较高壁垒。在较为成熟的细分方向,比如中文智能语音数据领域,确实存 在进入者增多、价格竞争的情况;但对于外语种领域,数据服务商则会有更高的议价空间。所以,未来公司将主攻有较高技术壁垒, 存在较大毛利空间的细分场景,尽力避免价格竞争带来的过度消耗。 此外,公司也将通过持续的专项研发投入及研发升级,进一步提高自研平台能力,通过智能化促进产能提升、效率提升、成本降 低实现规模效应和盈利能力的提升。 https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202503/59440688787.pdf ─────────┬──────────────────────────────────────────────── 2025-03-12 19:00│海天瑞声(688787)目前公司已经完成DeepSeek本地化部署 ─────────┴──────────────────────────────────────────────── 格隆汇3月12日丨海天瑞声(688787.SH)在投资者互动平台表示,目前公司已经完成DeepSeek本地化部署,主要用于公司数据内部 的生产业务,辅助公司进行数据预标注,进一步提升数据生产效率,降低处理成本。 https://www.gelonghui.com/news/4954616 ─────────┬──────────────────────────────────────────────── 2025-03-05 16:28│海天瑞声(688787)2025年3月5、7日投资者关系活动主要内容 ─────────┴──────────────────────────────────────────────── 1、2024年收入增长的驱动因素是什么? 答:受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互联网公司等为代表的国内外科技巨头纷纷加 大多模态数据投入以支撑其智能终端、内容生成等领域的 AI 能力建设。在此背景下,以多语种、多音色为代表的智能语音业务需求 、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长,整体上驱动公司营业收入同比显著增加。 2、DeepSeek出来后,对数据需求的影响如何?是否会降低AI行业对数据的需求? 答:(1)Deepseek推出了一系列模型,其中V3模型依然使用了预训练、以及SFT等训练方式,其中预训练阶段的token使用量达 到了14.8T,远超GPT4等同类可比大模型预训练阶段的数据使用量,且在后训练阶段也使用了一定规模的标注数据,这也更加说明海 量以及高质量数据对于基础模型能力提升的重要意义。 (2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、 可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察 ,我们认为高阶的数据专家的参与依然非常重要。 (3)此外,数据质量不仅影响模型获取和表达知识的能力,还决定了模型生成内容的风格和准确性,帮助DeepSeek实现了在输 出端的文采能力提升。 其一,高质量数据可以提升模型表达和推理能力。优质数据包含准确、连贯且富有表现力的语言样本。例如,包含CoT数据可以 引导模型在推理时进行反思,进而在生成回答时展现出清晰的逻辑和优美的语言表达。这正是DeepSeek模型能够生成既准确又具有华 丽文风的关键因素之一。 其二,高质量数据可以降低噪音和确保一致性。数据中的错误、噪音或不一致信息会导致模型生成内容出现语法或逻辑问题。高 质量的数据则能有效减少这些问题,使模型更好地学习到语言规律,从而提高整体生成质量。 其三,高质量数据可以提升泛化能力。数据的多样性和全面性使得模型在面对不同领域和任务时都能生成高质量的回答。丰富且 准确的样本帮助模型在多种场景下自如切换风格,无论是精炼的技术解答还是文采斐然的创意写作,都能游刃有余。 (4)往未来看,Deepseek模型的出现,有望进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过 程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。 3、有部分专家说可用的训练教据已经用完了,未来训练数据会不会出现瓶颈? 答:可用的训练数据面临枯竭主要指的是互联网上可以直接获取的数据,而在具有更大价值量、更大体量的数据并未在互联网进 行公开展示,例如政务数据、公共数据、各垂类公司的私城数据、以及个人信息数据等,但上述教据对于模型训练尤其是模型在向垂 类以及细分场景拓展时,起到重要作用,所以,并不会存在数据枯竭的问题。未来,随着国家政策对公共数据开放、治理、流通支持 力度的特续加大,以及国家对大模型行业化拓展的持续加码,训练数据源将会持续拓展,催生更大的训练数据市场。 4、标品化的产品数据集业务与定制化服务业务的区别是什么? 答:产品数据集是先于客户需求形成的模拟数据,是公司区别于其他竞争对手的一大特色,基于公司对市场的判断和通用化需求 的提取能力,其属于是一次性投入、未来重复授权销售,对于公司的营收、毛利有着重要作用;而定制业务的需求来源是客户的定向 化需求,有些定制业务的原始数据来源是客户提供的实网数据,公司提供纯加工的服务。 客户的AI产品在上线之前及初期,因为其自身尚未产生实网数据,通常需要采购模拟型数据集进行算法模型的训练,在产品上线 并运行一段时间、产生大量实网数据之后,则会提供实网数据给到我们进行数据加工,加工的数据反哺到客户的产品上从而促进其产 品的迭代、升级。之后,客户需要进行产品功能或语种的拓展,再次需要购买模拟数据集来支撑,后续再采购数据加工服务进行迭代 。 5、训练数据产品和服务的定价模式、收费模式是什么样的? 答:定制服务定价模式:一般采用成本加成定价法。公司根据客户的具体服务需求预估项目成本,在预估成本的基础上,参考公 司制定的指导毛利率水平,结合项目技术难度、复杂程度、时限要求等进行报价,并根据市场环境与客户协商,最终确定价格。 产品定价模式:一般采用需求导向定价法。公司综合考虑训练数据集的开发支出、市场需求程度、预计未来重复销售的频率等因 素,制定产品标准价格及价格区间,在销售过程中,根据客户的实际需求情况,以价格区间为基础向客户报价,经双方协商确定最终 销售价格。训练数据产品通常以单个数据集为单位进行定价,定价比较灵活。 6、公司标准数据集是如何积累的? 答:公司标准数据集产品的积累方式主要为基于公司对市场需求趋势的判断和共性需求的提炼能力,先于客户需求开发数据集。 数据集产品的这种商业模式在行业内往往具有较高壁垒,一方面需要公司对未来需求趋势有精准把握,另一方面由于产品开发属于先 投入后产出,因此需要公司具备充足的资金保障,只有具有大量行业经验+know-how积累以及资金充足的企业,才能具备产品开发能 力。因此,产品模式也成为公司区别于其他竞争对手的一大特色,目前公司产品数据集储备已处于行业头部水平,产品的积累对公司 未来的收入扩张和毛利提升都将起到重要作用。 7、定制数据逐渐积累,是否可以转化为自有的数据产品? 答:客户定制服务涉及的训练数据在交付给客户并完成验收后,所有权完全转移给客户,海天瑞声是不能用于自身产品建设的, 这一点是公司始终遵循的知识产权要求。 在定制数据集的生产过程中,积累下来的经验、know-how会帮助公司各方面能力的提升,例如工具平台因为处理了大量的定制数 据集,使平台完善性有很大的增益,加强了公司的数据处理能力;再如,在一些情况下,公司在生产定制数据集时,也会根据对行业 需求的判断,在保障数据权属划分清晰的前提下,利用团队管理、资源获取的便利性,同步安排额外的设计、采集和标注工作,完成 产品数据集的开发。 8、与客户自建数据团队相比,海天的优势是什么? 答:相较于客户自建团队,海天瑞声历来都是对接众多大型科技公司、头部人工智能企业、科研院所等,获得的信息是广泛的, 项目经验丰富,同时积累了大量的know-how,对数据的理解更广、更深刻,同时我们搭建了成熟的数据处理算法平台,通过更高效的 人机交互实现降本增效,保证数据质量的同时能有效降低成本,为客户提供更高性价比的训练数据产品/服务。 9、行业里的玩家增多,会不会出现价格战? 答:是否存在价格竞争主要取决于该领域是否较为存在较高壁垒。在

www.chaguwang.cn & ddx.gubit.cn 查股网提供数据 商务合作广告联系 QQ:767871486