当前位置:网站首页>声纹技术(五):声纹分割聚类技术
声纹技术(五):声纹分割聚类技术
2022-06-25 07:36:00 【u013250861】
5.1 分割聚类:更好地理解对话语音
5.1.1 关于名称与历史
声纹分割聚类(speaker diarization)是声纹领域里仅次于声纹识别的第二大课题,其难度远大于声纹识别。声纹识别所解决的问题可以简单概括为——“这是谁说的”,而这其中便包含了一个假设,那就是已知待识别的语音中,有且仅有一个说话人的声音。而在声纹分割聚类问题中,我们却推翻了这个假设,也就是说,一段语音中可以包含多个说话人交替说话的声音。因此,声纹分割聚类所解决的问题可以概括为——“谁在什么时间说的”(who spoke when)。
英文中diarization 一词,来源于单词diary,也就是日记或日志。从diary 到动词diarize,再到名词diarization,从字面来说,可以理解为“使……成为日志”,或者说“日志化”。一般而言,一篇日志通常会记载在一天的时间里,什么人在什么时间做了什么事。那么引申到speaker diarization,自然就可以理解为“什么人在什么时间说了什么话”。
关于speaker diarization 这个名称最早的由来,已经难以考究了。一些早期的文献直接将该问题称作speaker segmentation and clustering [114,115],这也是为什么较多的中文文献将其翻译为“声纹分割聚类”[116]。不过随着该领域的发展,尤其是近年来监督式方法(见5.5 节)甚至是端到端模型(见5.5.6 节)的出现,“分割聚类”这个名称已经不再合适了。无论是分割还是聚类,都可以用其他方法来替代。笔者比较喜欢的另一个中文翻译是“声纹分时归档”
边栏推荐
- Find out the possible memory leaks caused by the handler and the solutions
- What about the exponential smoothing index?
- EasyPlayer流媒体播放器播放HLS视频,起播速度慢的技术优化
- What do various optimizers SGD, adagrad, Adam and lbfgs do?
- About i/o -- the relationship between memory and CPU and disk
- C language "recursive series": recursive implementation of 1+2+3++ n
- 某视频网站m3u8非感知加密分析
- 打新债的安全性 有风险吗
- 检测点是否在多边形内
- Home server portal easy gate
猜你喜欢

InfluxDB时序数据库

各种同步学习笔记

City Chain technology platform, really Realizing value Internet reconstruction!

How to calculate the independence weight index?

NIPS 2014 | Two-Stream Convolutional Networks for Action Recognition in Videos 阅读笔记

What are the indicators of DEA?
How to calculate the characteristic vector, weight value, CI value and other indicators in AHP?

Summary of NLP data enhancement methods

Exchange: manage calendar permissions

How to design test cases
随机推荐
钱堂教育商学院给的证券账户安全吗?能开户吗?
[515. find the maximum value in each tree row]
Super simple case: how to do hierarchical chi square test?
以科技赋能设计之美,vivo携手知名美院打造“产学研”计划
How to analyze the grey prediction model?
How to calculate the independence weight index?
How to calculate the positive and negative ideal solution and the positive and negative ideal distance in TOPSIS method?
How to calculate the information entropy and utility value of entropy method?
How to choose an account opening broker? Is it safe to open an account online?
开户券商怎么选择?在线开户是安全么?
How to calculate the correlation coefficient and correlation degree in grey correlation analysis?
GIL问题带来的问题,解决方法
浏览器查看当前页面所有的监听事件
打新债安全不 有风险吗
打新债真的安全吗? 风险大吗
Bluecmsv1.6- code audit
Hyper-v:Hyper-v 第 1 代或第 2 代虚拟机
物联网毕设(智能灌溉系统 -- Android端)
Is there any risk in the security of new bonds
Index analysis of DEMATEL model