如今的语音助理我们早已不陌生, 使用微信,语音可以转换为文字,在使用地图APP上小麦克风功能,或者客服里的直接说出问题…….让机器听懂人的语音已经是生活中的一部分,那么机器如何听懂人类的语音?这就要靠人机交互的重要技术-语音识别技术。
而语音识别技术的前期,则需要大量的人工标注这些“说出的话”所对应的“文字”,来教会机器,并且一点点修正语音和文字间的误差,这就是语音标注。
1.何为语音标注
语音标注是数据标注行业中一种比较常见的标注类型。
主要工作内容是将语音中包含的文字信息、各种声音“提取”出来,进行转写或合成,标注后的数据主要用于人工智能机器学习,应用在语音识别、对话机器人等领域。相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,使计算机实现精准的语音识别能力。
语音标注工作是人工智能化的重要基石,是所有基础数据的来源将语音转换成文字,将各种声音提取标注后,转换成计算机能够识别的编码计算机通过学习编码,就能具备语音识别的能力2.语音AI领域的主要方向
1.TTS(Text-to-Speech,语音合成),即“从文本到语音”,是人机对话的一部分,让机器能够说话。
2.ASR(Automatic Speech Recognition,语音识别),是将声音转换为文字。
语音识别,是数学概率的完美表现之一正确率高的识别系统一般对应着大数据量的人工标注数据,因此标注工作相当于将人工智慧转化为机器智慧,如果说声音点亮生活,那么标注将汇聚智慧,智慧生活。
3.语音项目专业名词解析
“截音”也可以叫做“切音”:是指录制开始/结束时,未将朗读的某个字录全。
比如:录制句子““去吃饭””,开头截音,只录了““u(音)吃饭”
截音情况,有的时候不易分辨,需要仔细听语音,才能确定是否截音如果听得不够仔细
可能就会被误判为“吃饭”,这样就直接影响标注结果。
4.智能语音市场规模
我们知道,语音识别有两个关键资源,语言模型和声学模型,其中声学模型需要经过人工标注语音数据,因此有了语音标注工作。
据中商产业研究院、广证恒生等数据显示,2020年全球智能语音及人工智能市场规模约200亿美元。
工业和信息化部信息技术发展司副司长杨宇燕表示,作为软件产业的重要组成部分,智能语音步入快速发展新阶段。工信部高度重视智能语音产业发展,出台规划措施,协调各方资源,建立专项资金,支持产业的可持续发展。
无人驾驶、智慧城市、智慧金融、智慧零售遍布全球。即便是一家传统企业的客服系统,也都已经配备上由人工智能驱动的问答系统。标注作为人工智能产业链中最前沿的生产力,必定是许多人关注的重点,下期小鸽继续给大家带来关于标注类型的其他讲解。
暂无评论内容