金融界2024年3月5日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“数据标注方法、装置、计算机设备和存储介质“,公开号CN117649567A,申请日期为2024年1月。
专利摘要显示,本申请涉及一种数据标注方法、装置、计算机设备、存储介质和计算机程序产品。所述方法涉及人工智能技术,包括:从待标注数据集中获取至少一个待标注数据,并确定至少两种候选类目;针对每个待标注数据,从至少两种候选类目中确定与所针对待标注数据相匹配的至少两种初步匹配类目;当初步匹配类目中包括参考类目,基于至少两种初步匹配类目对所针对待标注数据进行标注,得到所针对待标注数据的已标注数据;参考类目通过统计已标注数据集中的已标注数据确定;通过得到的各个已标注数据更新已标注数据集,并继续进行标注,直至针对待标注数据集中的待标注数据完成数据标注。采用本方法能够确保标注数据的类目分布均衡。
来源:金融界