当前位置:网站首页>华为机器学习服务语音识别功能,让应用绘“声”绘色
华为机器学习服务语音识别功能,让应用绘“声”绘色
2022-06-24 18:35:00 【51CTO】
随着人们对生活的仪式感的追求,移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统也变得越来越流行。在这些应用上,鼠标、键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互、驾驶模式等。因此,App里集成语音识别功能不仅能解放双手,也能得到很好的人机交互体验。
1. 业务简介
HMS Core 机器学习服务支持将实时输入的短语音(时长不超过60秒)转换为文本,可实时识别60秒内的语音。该服务使用行业领先的深度学习技术,随着算法和数据的不断迭代,目前在通用理想环境下的识别准确率可达95%以上。目前支持中文普通话(包括中英文混说)、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语、菲律宾语的识别。
 华为机器学习服务语音识别功能,让应用绘“声”绘色_语音识别](/img/61/3311d15959b9ad4bc8edfb9c196bd2.png)
DEMO演示 华为机器学习服务语音识别功能,让应用绘“声”绘色_搜索_02](https://s8.51cto.com/images/blog/202206/24142741_62b5595d4d94530658.gif)
2 . 场景介绍
HMS Core 机器学习服务覆盖日常生活及工作中的众多领域,并且深度优化了购物搜索、影视搜索、音乐搜索以及导航等场景中的识别能力,进一步提高这几类场景的识别准确率。在使用购物类App搜索商品时,可以将语音描述的商品名称或特征识别为文字从而搜索到目标商品。同样,在使用音乐类App时,可以将语音输入的歌名或歌手识别为文字进而搜索歌曲。另外,司机在驾驶过程中不方便输入文字时,可以将输入的语音转换为文字继而搜索目的地,让行车更加安全。
3 . 功能特点
• 支持实时出字 • 提供拾音界面、无拾音界面两种方式 • 支持端点检测,可准确定位开始和结束点 • 支持静音检测,语音中未说话部分不发送语音包 • 支持数字格式的智能转换,例如语音输入“二零二零年”时,能够智能识别为“2020年”。 如何接入华为机器学习服务? 华为 机器学习服务官网。
了解更多详情>>
访问 华为开发者联盟官网
获取 开发指导文档
华为移动服务开源仓库地址: GitHub
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- Why are life science enterprises on the cloud in succession?
- Architecture decryption from distributed to microservice: several common microservice architecture schemes
- 如何在 R 中使用 Fisher 的最小显着性差异 (LSD)
- JS picture switching case
- 干货 | 新手经常忽略的嵌入式基础知识点,你都掌握了吗?
- Knowledge points in T-SQL
- Get max value of a bit column - get max value of a bit column
- 如何在 R 中创建线性模型预测区间 并可视化
- 建立自己的网站(8)
- SAP license: ERP for supply chain management and Implementation
猜你喜欢

"2022" plans to change jobs and raise salary. It is necessary to ask interview questions and answers - browser

SDL: cannot play audio after upgrading openaudio to openaudiodevice

History object

Why is nodejs so fast?

JS deep understanding of scope

Mcu-08 interrupt system and external interrupt application

微服务系统设计——接口文档管理设计

Vite+web3: referenceerror: process is not defined

Get max value of a bit column - get max value of a bit column

Location object
随机推荐
SDL: cannot play audio after upgrading openaudio to openaudiodevice
What is business intelligence (BI)?
如何在 R 中执行幂回归
ASP. Net hosting uploading file message 500 error in IIS
Introduction to alos satellite
论文解读(SR-GNN)《Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data》
Stored procedures in sqlserver
为什么生命科学企业都在陆续上云?
JS picture switching case
微服務系統設計——子服務項目構建
1: Mosaic of 100W basic geographic information data
电源效率测试
Mental models: the best way to make informed decisions - farnam
SAP license: ERP for supply chain management and Implementation
香港服务器租用错误可能导致严重后果
Mqtt protocol usage of LabVIEW
UnityShader 世界坐标不随模型变化
Get max value of a bit column - get max value of a bit column
How do programmers do we media?
微服务系统设计——子服务项目构建