【全球报资讯】创新生态:「恺望数据」以“自动化产线+规模化人力”提升数据标注效率
数据标注解决方案公司「恺望数据」近日已完成新一轮战略融资,投资方为知名投资机构璞跃中国(Plug and Play China),天使轮投资方辰韬资本继续追投。恺望数据表示,新一轮融资后,恺望数据也会与璞跃中国(Plug and Play China)进一步合作,探索出海路径,并继续投入到产品迭代升级当中。
人工智能赛道的发展离不开大量人力和数据的哺育,而数据标注产业正是在AI产业链的上游——将大量的数据分类、标注,为AI公司提供经过加工的数据“原材料”。
(资料图片仅供参考)
「恺望数据」正是起家于自动驾驶领域,为车企和自动驾驶公司提供一站式数据解决方案的公司。恺望数据创始人于旭毕业于法国昂热大学,曾从0到1搭建起字节跳动、Momenta、Uber等企业数据生产及运营体系。
恺望数据希望能够解决数据标注行业供给不稳定、流程繁杂、工具低效等数据标注行业痛点。
自2022年2月成立后,恺望数据花费一年时间,建立起了一套以“自动化产线+规模化人力”为核心的生产体系。其形态为一个SaaS平台——相当于一个能够为算法提供稳定、高质量且低价数据供应链的"自动化产线"。而本轮融资完成之际,这一产线也已正式上线。
传统的数据标注行业,是一个人力密集型行业。在传统的数据标注厂商中,除了招募大量标注员外,还有大量的统筹、管理工作。而要做到“自动化产线+规模化人力”,恺望数据主要分为两部分来实现——首先建立了SaaS平台,拆分成管理和生产两个部分。
在前期的培训、第一道标注、审核等管理环节,以往很大程度都要依靠项目经理来进行统筹、编排,恺望通过建立统一的SaaS平台和规则,将这一部分数字化。
到了生产环节,恺望的SaaS平台已经内置了一套类似打车的机制,标注员能够在上面“接单”。值得注意的是,恺望在这一环节还引进了ChatGPT相关技术,用以提升数据标注作业流程的管理效率。
事实上,大模型技术的突破也让数据标注厂商迎来一次“产业升级”。创始人于旭表示,以往在数据标注中,大量数据都需要预标注,也即需要人工手动标注出来,再教会机器。数据厂商也会遇到不同厂商的任务,小的机器学习模型不能太适配的问题。但如今随着技术迭代,尤其是近期的大模型技术突破后,这将能够作为数据标准的基础。
“以前,如果人类用10分力,现在大模型能够贡献6-7分,把通用的数据都标注好,省下来的时间,人工可以重点投入到一些垂类场景的数据种类中。”于旭表示。
比如,近期Meta公布了用于图像分割的大模型——这就是自动驾驶中重要的一个标注环节。在以后,大模型可以用于CV(图像)方向的的预筛,到后面更为垂类的数据种类,再由人工来完成。
在上述种种的数字化技术升级下,恺望的“数据标注产线”实现了在持续提升数据生产规模化的同时,减少成本20%-50%。
技术提升也会加速人才培育的门槛。于旭认为,配合自动化产线,数据标注所需要的人才水平也会逐渐走高。从去年开始,恺望数据就推出了人才培训计划,与高职院校进行合作,希望培养有基础标注知识的人才。
在以前,一个零基础的学生,需要经历约为三周的“爬坡期”,背诵相关标注规则。而恺望将ChatGPT和规则库进行结合,引进到标注作业平台后,标注员在进行标注时,就能通过对话形式询问GPT助手,标注员再也不必背诵大量的规则,人才培育的“爬坡期”大幅减短。
这也同时解放了项目经理,他们不必同时管理资源、项目、培训等环节,其管理范围也会扩大。“随着AI行业这一轮产业升级,人才梯度会迅速分开,而数据标注领域也将会进入精细化分工阶段。”于旭表示。
从市场需求来看,2022年是自动驾驶行业纷纷进入量产阶段的一年,对数据标准的需求呈现爆发状态,算法迭代快,对每一批数据的质量要求越来越高。于旭表示,成立不到一年,恺望数据已经进入业务快速增长期,当前已经与三一集团在自动驾驶领域开展数据合作。
此外,恺望也与字节跳动、元戎启行、地平线、中交兴路、辉羲、易控、旷视及商汤科技等企业建立合作。近期,恺望单月订单已突破千万级别,并中标汽车主机厂长安汽车的数据标注服务。
除了自动驾驶领域外,恺望数据也在探索AI领域的市场机会。在最近半年的AI热潮席卷下,可以预见的是,对产业链上游的数据需求正在爆炸性增长。根据中国信通院,到2035年,全球数据量将达2142 ZB(Zettabyte,1ZB约十万亿亿字节),是2020年数据量的约45倍。随着AI所需的数据量和训练精度也逐渐走高,这对数据标注、算力优化等基础设施服务提供了更高要求。
此前,恺望数据曾于2022年9月宣布获得千万级天使轮战略融资,投资方包括辰韬资本、三一集团和溪山天使汇。
加入璞跃中国
科技创新生态
添加微信小助手 pnp_china
加入创新者社群
及时掌握最新资讯
关于 Plug and Play China 璞跃中国
璞跃(Plug and Play)是全球知名的科技创新生态平台,拥有20余年的科创行业经验,致力于投资早期硬科技项目,并开展企业科技创新服务。公司曾成功早期孵化了Google,投资了PayPal、Dropbox 等多家科技巨头公司,在全球与戴姆勒、松下、开云等550余家龙头企业,基于其创新需求和文化生态,开展开放式创新合作,驱动企业由内而外的创新、发展。
2016年,随璞跃全球业务的拓展,“璞跃中国(Plug and Play China)”正式成立。当前,璞跃中国构建了国内领军的一站式创新服务和交流平台,开展创新服务 (企业创新、城市创新、国际创新)、创新空间、科技投资三类创新业务。
璞跃中国构筑的创新平台,联接多维度的创新伙伴,催化创新生态效应发生。目前平台上活跃着近百家引领行业科创风向和市场发展的领军企业,超3600家技术前沿、商业模式先进初创公司,100余位核心创新专家导师,众多海内外高校及科研院所,以及头部和前沿科技投资机构、投资人等科创行业人群。
迄今璞跃中国已投资培育了包括ApplyBoard、AutoX、非夕科技等逾百家硬科技企业。企业目前布局北京、上海、深圳等超一线城市,设立创新中心;并在武汉、南京基于当地产业生态,开展城市创新合作。
了解更多信息请访问 www.pnpchina.com
关键词:
相关阅读
- 06-14
最近更新
- 06-14
- 06-14
- 06-14
- 06-14