当前位置:网站首页>声纹技术(五):声纹分割聚类技术
声纹技术(五):声纹分割聚类技术
2022-06-25 07:36:00 【u013250861】
5.1 分割聚类:更好地理解对话语音
5.1.1 关于名称与历史
声纹分割聚类(speaker diarization)是声纹领域里仅次于声纹识别的第二大课题,其难度远大于声纹识别。声纹识别所解决的问题可以简单概括为——“这是谁说的”,而这其中便包含了一个假设,那就是已知待识别的语音中,有且仅有一个说话人的声音。而在声纹分割聚类问题中,我们却推翻了这个假设,也就是说,一段语音中可以包含多个说话人交替说话的声音。因此,声纹分割聚类所解决的问题可以概括为——“谁在什么时间说的”(who spoke when)。
英文中diarization 一词,来源于单词diary,也就是日记或日志。从diary 到动词diarize,再到名词diarization,从字面来说,可以理解为“使……成为日志”,或者说“日志化”。一般而言,一篇日志通常会记载在一天的时间里,什么人在什么时间做了什么事。那么引申到speaker diarization,自然就可以理解为“什么人在什么时间说了什么话”。
关于speaker diarization 这个名称最早的由来,已经难以考究了。一些早期的文献直接将该问题称作speaker segmentation and clustering [114,115],这也是为什么较多的中文文献将其翻译为“声纹分割聚类”[116]。不过随着该领域的发展,尤其是近年来监督式方法(见5.5 节)甚至是端到端模型(见5.5.6 节)的出现,“分割聚类”这个名称已经不再合适了。无论是分割还是聚类,都可以用其他方法来替代。笔者比较喜欢的另一个中文翻译是“声纹分时归档”
边栏推荐
- Exchange:管理日历权限
- [operation tutorial] how does the tsingsee Qingxi video platform import the old database into the new database?
- How to calculate the distance between texts: WMD
- Trendmicro:apex one server tools folder
- [summary] 1361- package JSON and package lock JSON relationship
- iframe简单使用 、获取iframe 、获取iframe 元素值 、iframe获取父页面的信息
- 城鏈科技平臺,正在實現真正意義上的價值互聯網重構!
- Super simple case: how to do hierarchical chi square test?
- Is there any risk in making new bonds
- Problems caused by Gil problems and Solutions
猜你喜欢
随机推荐
Problems caused by Gil problems and Solutions
Nodehandle common member functions
After using the remote control of the working machine, problems occurred in the use of the local ROS, and the roscore did not respond
Sharepoint:sharepoint 2013 with SP1 easy installation
如何成为一名软件测试高手? 月薪3K到17K,我做了什么?
How to analyze the coupling coordination index?
Hyper-v:hyper-v generation 1 or generation 2 virtual machines
How to calculate the D value and W value of statistics in normality test?
Stack awareness - stack overflow instance (ret2libc)
各种同步学习笔记
Trendmicro:apex one server tools folder
How to solve the 10061 error of MySQL in Linux
What are the indicators of entropy weight TOPSIS method?
Rank sum ratio (RSR) index calculation
C language "Recursion Series": recursively realizing the n-th power of X
Rosparam statement
How to design test cases
2021 "Ai China" selection
微信小程序_7,项目练习,本地生活
tp5与tp6的区别是啥呀?









