华南农业大学红满堂社区

 找回密码
 注册

QQ登录

只需一步,快速开始

用新浪微博登录

只需一步,快速搞定

查看: 248|回复: 0

[网络技术] NLPIR在文本信息提取方面的优势介绍

[复制链接]
  • TA的每日心情
    开心
    2019-8-9 14:13
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2019-9-12 15:35:26 | 显示全部楼层 |阅读模式

    构建知识图谱需要满足三项要素要求,分别是实体,关系和属性。文本信息提取,则是在文本中提出三元信息,包括实体和关系的信息,实体和属性的信息,然后将这些关系设置成数据库的过程。
    进行信息提取的主要环节介绍:
    1、确定要进行信息提取的知识本体。
    2、为每一个目标知识点设立足够的训练语料,或是抽取足够的编写规则
    3、利用机器学习的方法,在训练语料和规则的基础上,建立模型。
    构建知识图谱最重要的环节,NLPIR平台KGB知识图谱在文本信息提取的优势:
    1、能够解析不同格式文档和图片
    KGB知识图谱引擎,能够对不同版本和格式的文档进行解析:TXT、DOC、EXCEL、PPT、PDF、XML等,对于图片,OCR可自动识别并抽取图片中的文字信息。
    2、对结构化表格数据知识抽取
    KGB能够自适应解读并抽取结构化表格数据,实现知识的快速生成。
    3、对非结构化文档知识抽取
    KGB知识规则引擎,能够快速定位非结构化文档中的关键信息(主体、时间、金额等),进行高效抽取知识。
    NLPIR大数据语义智能分析平台,是基于中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。

    免责声明:本论坛发布的任何言论仅代表网友个人观点,不代表红满堂BBS观点
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    小黑屋|手机版|Archiver|华南农业大学红满堂    合作Q:991788817 |

    GMT+8, 2019-11-15 21:53 , Processed in 0.736345 second(s), 15 queries , Gzip On, Xcache On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表