当前位置:网站首页>声纹技术(六):声纹技术的其他应用
声纹技术(六):声纹技术的其他应用
2022-06-25 07:36:00 【u013250861】
6.1 声纹的力量
前面几章介绍的声纹识别与声纹分割聚类都属于声纹技术在音频信号处理中的最直接的应用。而除了这些直接应用,由于声纹本身包含着与说话人身份相关的信息,其在其他领域也能发挥出重要作用。
声纹信息在其他领域中发挥作用有很多种方式,其中一种比较经典的架构便是通过声纹嵌入码,将特定说话人的身份信息,作为该领域传统模型的辅助输入,融合到模型的训练过程中,如图6.1 所示。该架构中的辅助音频,来自该任务所对应的具体说话人。而基于从该辅助音频中提取的声纹嵌入码,能够让传统模型更精准地针对该说话人完成相应的任务。这里的声纹编码器可以采用第3 章介绍过的各种模型,不过现在一般都采用基于神经网络的声纹编码器。而架构中的输入与输出可以有很多种形式,既可以是音频,也可以是时频谱、文字、类别或其他信息,具体依应用而异。

6.2 用于语音识别
6.2.1 语音识别技术概述
5.5.7 节介绍声纹分割聚类与语音识别的联合训练时,简单介绍了一些关于语音识别的概念。语音识别本身可以算是音频信号处理领域下最庞大、最重要的一门学科。由于本书主要以介绍声纹技术及相关应用为重点,不可能单独对语音识别技术进行详尽的介绍。为了更好地描述将声纹信息应用于语音识别领域的方法,我们还是简略介绍一下语音识别中的一些常用架构。对语
边栏推荐
- Hyper-v:Hyper-v 第 1 代或第 2 代虚拟机
- 《树莓派项目实战》第五节 使用Nokia 5110液晶屏显示Hello World
- Common SRV types
- Is there any risk in making new bonds
- How to solve the 10061 error of MySQL in Linux
- 第五天 脚本与UI系统
- 4 reasons for adopting "safe left shift"
- Can I grant database tables permission to delete column objects? Why?
- LVS-DR模式多网段案例
- Is it safe to open an account online? Xiaobai asks for guidance
猜你喜欢
Easyplayer streaming media player plays HLS video. Technical optimization of slow starting speed
Bluecmsv1.6- code audit
Wechat applet_ 7. Project practice, local life
关于I/O——内存与CPU与磁盘之间的关系
城链科技平台,正在实现真正意义上的价值互联网重构!
Prepare these before the interview. The offer is soft. The general will not fight unprepared battles
How to calculate critical weight indicators?
GPU calculation
Scanpy (VII) spatial data analysis based on scanorama integrated scrna seq
Summary of NLP data enhancement methods
随机推荐
4个不可不知的采用“安全左移”的理由
Super simple case: how to do hierarchical chi square test?
How to design test cases
Rqt command
Word2vec, phrases, phraser, keyedvectors commonly used in gensim
Find out the possible memory leaks caused by the handler and the solutions
Is it really safe to pay new debts? Is it risky
How to solve the 10061 error of MySQL in Linux
mysql之Unknown table ‘COLUMN_STATISTICS‘ in information_schema (1109)
Getting to know the generation confrontation network (11) -- using pytoch to build wgan to generate handwritten digits
Fault: 0x800ccc1a error when outlook sends and receives mail
OpenFOAM:底层
以科技赋能设计之美,vivo携手知名美院打造“产学研”计划
Stimulsoft Ultimate呈现报告和仪表板
Unity addressable batch management
How to calculate the fuzzy comprehensive evaluation index? How to calculate the four fuzzy operators?
What are the indicators of entropy weight TOPSIS method?
Internet of things (intelligent irrigation system - Android end)
Similarity calculation method
浏览器查看当前页面所有的监听事件