产品中心

Product Center

神通T-Miner文本挖掘系统

      

     神通T-Miner文本挖掘系统融合自然语言处理、机器学习、深度学习、知识图谱等多种AI智能分析技术,为用户提供高效、强大的非结构化数据分析挖掘工具,从海量文本信息中洞察数据价值和知识模式,打造企业级非结构化数据分析和智能挖掘解决方案。


产品主要特点


· 丰富的NLP算法

Ø 提供歧义消除、词性标注、句法分析、实体识别、时间推理、指代消解、新词识别等多种自然语言处理和语义分析技术,深入洞察和挖掘文本中蕴藏的潜在知识


· 强大的文本挖掘能力

Ø 提供特征抽取、文本分类、文本聚类、话题聚类、情感分析、关键词抽取、自动摘要、关系图谱分析、信息抽取、文本相似分析等10多种20多个实用的文本深度挖掘算法,满足个性化文本分析需求


· 庞大高质量的词库

Ø 内置百万级词汇量中文词库,包括通用词库、姓氏词库、行政区划词库、政府机构词库、世界城市词库、褒贬义词库、名人词库、领导人词库、同义词库、敏感词库、领域专属词库等精选词库,支持用户自定义扩展领域词库,为面向行业的文本数据挖掘分析提供词库支撑


· 丰富的数据源支持

Ø 支持无缝对接企业各类异构数据源,支持主流关系数据库、MPP数据库、本地文件系统、远程文件共享服务等文本数据源,为用户提供开箱即用的使用体验,快速构建企业级文本大数据分析平台。


· 领先的算法性能

Ø 文本挖掘算法经过团队10多年深度优化,运算速度和准确率达到业内领先水平

Ø 中文分词速度单线程可达6M/秒,单机并行计算可达30M/秒

Ø 文本自动分类、词性识别等算法,模型准确率高于90%。