compatible是什么意思,大中华新闻网,小儿支原体肺炎
人工智能时代已然来临,伴随着人工智能在各个场景中的落地应用,算法、算力不再是高壁垒,为了不断提高算法精度,算法所必须的数据需求也空前爆发,一度催生了AI基础数据服务行业的繁荣。
行业繁荣的景象之下,还存在着一些问题,由于AI基础数据服务的数据标注业务相对门槛较低,玩家鱼龙混杂,使行业标准模糊,服务质量参差不齐。目前多以人工标注为主,传统标注工厂在“人工成本”方面的优势正不断被削弱。因此,增强数据处理平台持续学习和自学习能力,利用机器学习辅助人工提升标注维度和精度,同时降低人工成本已经成为产业共识。另外,数据采集层面,针对数据源的版权问题、采集标准问题还没有很好解决;数据库的建设及服务还保持着一定的壁垒,通用场景的AI技术不断成熟,如何建设高精尖数据库在行业当下也需要去解决。
希尔贝壳成立于2017年,深耕场景AI数据服务,做好数据服务的技术创新同时并开始思考数据产业的下一步方向。
疫情肆掠过后,人工智能应用落地速度加快,而这背后,身处AI基础数据行业的希尔贝壳也在加速前行。
用机器辅助做数据标注切入AI基础数据服务行业
希尔贝壳创业初始聚焦语音数据服务,和创始人的背景密切相关。希尔贝壳CEO卜辉从韩国高丽大学AI实验室硕士毕业后,就一直从事智能语音技术及数据库建设方向的工作,对语音数据库以及语音智能产品有着深入的研究。
AI的算法需要大量带标签的数据,数据标注则是由人工为主导,在“有多少人工就有多智能”的产业背景之下,革新技术,行业标准和门槛的提升则显得更为迫切。
在人工智能快速迭代更新的节点,卜辉发现AI技术成本的变化速度惊人且市场竞争激烈,“比如一套通用AI系统相比一年前,价格基本折了三分之一,但是成就技术的数据并没有贬值。相反,数据处理、采集和加工的人力成本越来越高”。
在这样的背景下,智能化辅助标注平台显得尤为重要。这和卜辉最开始切入行业的初衷不谋而合。希尔贝壳的数据标注平台在工作高峰期拥有上万人在并行做数据标注的工作,如何在降低人工成本的情况下保证数据质量,卜辉认为,应当基于一个强大的智能化工作平台,通过完善算法模型和利用大数据分析来提高数据质量的管控和质检,将重复的标注工作做到智能化管理,提高数据标注效率。成熟的算法好比智能车间里的机器人,大数据分析系统好比智慧大脑在24小时做项目管理工作。
对此,希尔贝壳2018年研发并应用了四套智能标注系统来降低数据处理的成本:语音数据质量评测系统、语音自动标注系统、音频检索系统、智能化标注众包大数据分析系统。在数据任务分发、自动纠错、数据质量跟踪上,提高了数据标注的效率,降低了1/3的人工成本,实现从人工到技术,再让技术辅助人工完成高效的标注工作。
但卜辉对数据的思考并不止于此,“让懂技术的人去做数据,可以看到数据完整的生命周期。另外在数据采集方面,要确定版权除了人为的协议,还需要技术的加持,我们已经在开发电子认证、数据加密,既要考虑版权也要重视数据流通的安全。”在卜辉看来,好的数据能够帮助算法更好的去落地。
本文地址:http://www.reviewcode.cn/bianchengyuyan/211461.html 转载请注明出处!