当前位置:网站首页>在线文本实体抽取能力,助力应用解析海量文本数据
在线文本实体抽取能力,助力应用解析海量文本数据
2022-06-24 12:59:00 【HMS Core】
随着信息化的发展,很多具有重要价值的知识隐藏分布在海量数据中,影响了人们获取知识的效率,如何处理繁杂的非结构化文本数据成为难题。
近日,HMS Core机器学习服务6.5.0版本新增在线文本实体抽取能力,该能力可以检测出文本中是否存在比如日期、姓名、专有名词等实体信息,并将此类实体抽取出来,即自动处理非结构化自然语言文本数据的能力。例如,影视行业的应用中常常会出现大量文字的影评、资讯等内容,使用在线文本实体抽取能力即可快速提取结构信息,帮助搭建知识图谱,便于用户清晰理解。

此外,文本实体抽取能力更多应用于问答系统、信息索引、知识图谱构建等领域。
问答系统
问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户提出的问题。在问答系统实现过程中,则需要用到文本实体抽取能力识别问题和知识库中的实体信息,再通过多种算法模型匹配出精准回答。
信息索引
使用在线文本实体抽取能力,可命名特定实体信息作为索引和超链接。比如用户在评论时提到的专有名词,可以生成超链接,便于其他用户检索了解相关内容。
知识图谱构建
知识图谱是由实体、关系和属性组成的一种数据结构,即具有有向图结构的一个知识库,文本实体抽取能力作为知识图谱构建过程中的底层能力,有着极其重要的作用。比如构建音乐知识图谱,首先需要大量的文本数据中提取出歌手、歌曲、作词、影视等相关信息,然后再进行知识图谱的搭建。
目前,华为机器学习服务在线文本实体抽取能力共支持人名、金钱、影视名、网页链接在内的16个实体类别,可根据实际语义场景应用于不同类别的App中。
集成步骤
- 开发准备
详细准备步骤可参考华为开发者联盟官网。
- 集成和配置apigateway鉴权
基于apigateway的鉴权机制:
"paths": {"/entityExtract": { "post": { "operationId": "entityExtract","parameters": [{"in": "body", "name": "req", "required": true,"schema": { "$ref": "#/definitions/NerEnterReq" } }, {"name": "X-Request-ID", "in": "header", "required": true,"type": "string"}, {"name": "X-Package-Name", "in": "header", "required": true,"type": "string" }, ……], "responses": {"200": { "description": "response of 200","schema": { "$ref": "#/definitions/ResponseEntityNerBodyVo"}}}}}- 创建在线文本实体构造器
// 使用自定义的参数配置创建语种检测器。 MLRemoteNerSetting setting = new MLRemoteNerSetting.Factory() .setSourceLangCode("zh") .create();MLRemoteNer ner = MLNerFactory.getInstance().getRemoteNer(setting);进行文本实体抽取。- 在线获取文本实体抽取
异步方法示例代码:
ner.asyncEntityExtract(input).addOnSuccessListener(new OnSuccessListener<RemoteNerResultItem[]>() { @Override public void onSuccess(RemoteNerResultItem[] remoteNerResults) { // 成功的处理逻辑。 if(remoteNerResults != null){ // 有识别结果 }else { // 识别结果为空 } } }).addOnFailureListener(new OnFailureListener() { @Override public void onFailure(Exception e) { // 识别失败,获取相关异常信息。 try { MLException mlException = (MLException) e; // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。 int errorCode = mlException.getErrCode(); // 获取报错信息,开发者可以结合错误码,快速定位问题。 String errorMessage = mlException.getMessage(); } catch (Exception error) { // 转换错误处理。 } } });同步方法示例代码:
try { RemoteNerResultItem[] remoteNerResults = ner.syncEntityExtract(input); // 识别成功逻辑 if(remoteNerResults != null){ // 有识别结果 }else { // 识别结果为空 } } catch (MLException mlException) { // 失败的处理逻辑。 // 获取错误码,开发者可以对错误码进行处理,根据错误码进行差异化的页面提示。 int errorCode = mlException.getErrCode(); // 获取报错信息,开发者可以结合错误码,快速定位问题。 String errorMessage = mlException.getMessage(); }- 完成后,释放资源
if (ner != null) { ner.stop();}了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
边栏推荐
- Jericho turns on shouting in all modes to increase mic automatic mute [chapter]
- kotlin 接口 泛型 协变 逆变
- Talk about GC of JVM
- kotlin 异步流
- MIT-6.824-lab4A-2022(万字讲解-代码构建)
- 返回新列表
- Cloud native essay solicitation progress case practice
- Use of kotlin arrays, collections, and maps
- 金鱼哥RHCA回忆录:DO447管理项目和开展作业--为ansible剧本创建一个项目
- 杰理之.睡眠以后定时唤醒系统继续跑不复位【篇】
猜你喜欢

《中国数据库安全能力市场洞察,2022》报告研究正式启动

初识云原生安全:云时代的最佳保障

万用表的使用方法

Hardware development notes (6): basic process of hardware development, making a USB to RS232 module (5): creating USB package library and associating principle graphic devices

HarmonyOS.2

AutoRF:从单视角观察中学习3D物体辐射场(CVPR 2022)

Seven challenges faced by data scientists and Solutions

位于相同的分布式端口组但不同主机上的虚拟机无法互相通信

**Unity中莫名其妙得小问题-灯光和天空盒

华为 PC 逆势增长,产品力决定一切
随机推荐
杰理之无缝循环播放【篇】
How to manage tasks in the low code platform of the Internet of things?
【R语言数据科学】(十四):随机变量和基本统计量
Kotlin anonymous function and lambda
Eight major trends in the industrial Internet of things (iiot)
#21Set经典案例
金鱼哥RHCA回忆录:DO447管理项目和开展作业--为ansible剧本创建一个项目
Autorf: learn the radiation field of 3D objects from single view (CVPR 2022)
Google Earth Engine——1999-2019年墨累全球潮汐湿地变化 v1 数据集
初识云原生安全:云时代的最佳保障
The hidden corner of codefarming: five things that developers hate most
2022年质量员-设备方向-岗位技能(质量员)复训题库及在线模拟考试
Android kotlin Encyclopedia
Home office should be more efficient - automated office perfectly improves fishing time | community essay solicitation
Promotion of Project Manager
PM should also learn to reflect every day
Kotlin inheritance, class, overload
Jerry's test mic energy automatic recording automatic playback reference [article]
源碼解析 Handler 面試寶典
Research and development practice of Kwai real-time data warehouse support system