当前位置:伍佰目录 » 站长资讯 » 免费资源 » 技术文章 » 文章详细

让机器说话的背后,智能语音数据还需要做出哪些努力?丨艾肯家电网

来源:本站原创 浏览:242次 时间:2021-05-03

特步韩庚,贫铀弹危害,怎样用光盘重装系统

%d%9%9%9%9

人类对机器语音识别的探索始于20世纪50年代,迄今已逾70年。2016年,在深度神经网络的帮助下,机器语音识别准确率第一次达到人类水平,意味着智能语音技术落地期到来。

%d

智能语音即实现人与机器以语言为纽带的通信。完整的人机对话包括声音信号的前端处理、将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波,从而形成完整的人机语音交互。

%d

目前,智能语音已广泛应用于智能手机、智能音箱、智能车载等场景。

%d

http://img.cnmtpt.com/UEditor/Wordfile/20210430/2021043014323053/1/2021043014323053.001.png

%d

图源《2020年中国智能语音行业研究报告》

%d

在这些智能应用实现的背后,是数据对模型的训练发挥的巨大推动作用。目前,主流的方式以有监督模式为主。在该模式下,算法训练需要依靠标注数据进行反馈,对于数据有着强依赖性需求,这也带动了AI基础数据服务行业的繁荣。

%d

作为AI数据采集标注服务头部企业,云测数据致力于为人工智能提供场景化、高质量的AI数据服务。通过严格控制前端采集标准、专业精准化标注、数据质量审核把控等流程,大幅提升AI数据交付质量与效率。

%d

1、云测数据拥有语音场景的还原搭建能力

%d

随着智能语音应用在多个垂直场景领域实现落地,人工智能对于场景化数据的需求量也越来越高。

%d

云测数据的“场景化”服务模式,可以在语音类型的数据采集上满足特定人物(年纪、性别等)、特定场景(家居、办公、商业等)、不同方言的声音/文本数据采集;在数据标注上进行需求的梳理,通过先进的标注平台工具根据规则性的规范指导(如:同样一句话在不同交流目的中可能需要标注不同的内容)进行标注作业。

%d

以目前广泛应用的语音助手为例,为了提高语音助手在不同场景下的识别能力,需要采集特殊场景下语音数据,比如“室外对话”、“室内对话”、“情感语音”、“嘈杂环境下对话”、“ 车载噪音”、“ 远场语音”等场景下的数据,这对数据服务企业的语音场景搭建能力提出了新的要求。

%d

http://img.cnmtpt.com/UEditor/Wordfile/20210430/2021043014323053/1/2021043014323053.002.png

%d

2、云测数据拥有丰富的语音数据备采资源

%d

从业务流程角度来看,数据采集是人工智能数据服务行业全流程服务中的“第一步”,纯净、贴合AI应用场景的数据源可解决数据训练中90%的问题,之后将这些非结构化的数据经过精准的标注,才能被用于机器训练。

%d

以云测数据为例我们了解到,单是语音采集,按照语种的不同,可细分为普通话采集、方言采集、英语采集、小语种采集等,这对数据采集服务企业的备采资源能力提出了极高的要求。

%d

3、云测数据拥有对语音数据预处理的能力

%d

为了产出更专业高效的语音数据,在语音等类型的数据生产过程中,云测数据通过严格的条件限制从根源上确保数据的质量。

本文地址:http://www.reviewcode.cn/youxikaifa/204644.html 转载请注明出处!


伍佰目录声明:本站部分文章来源于网络,版权属于原作者所有。如有转载或引用文章/图片涉及版权问题,请联系我们处理.我们将在第一时间删除! 联系邮箱:tsk@qq.com

快速链接

最新收录

最新点入