您当前的位置:首页 > 博客教程

什么是文本挖掘_什么是文本挖掘

时间:2024-12-27 22:23 阅读数:3425人阅读

携程旅行已获得UGC文本内容形成专利。据金融界消息,2024年11月30日,国家知识产权局信息显示,携程旅行信息科技(上海)有限公司已获得UGC文本内容形成专利。 "系统、设备和存储介质"专利,授权公告号为CN113434767B,申请日期为2021年7月。

什么是文本挖掘

美云智树在舆论中申请新技术词发现专利文字,有效挖掘舆论中的新...旧技术文字 当单词与技术词实体的编辑距离相似度大于或等于第二相似度阈值时,判定该技术词实体为旧技术词的同义词;根据同义词对技术词实体提取结果进行语义相似度去重,得到新的技术词实体。 技术词提取结果。 这样可以有效挖掘舆情文本中的新技术词语,提高舆情文本中新技术词语发现的准确性。

>ω<

∪^∪

李自动申请了文本匹配相关的专利,系统化批量挖掘降低成本提高准确率,并对待匹配文本中的关键词进行图推理,确定待匹配文本对应的候选文本集合;确定 候选文本集合中的候选文本为与待匹配文本相似度最高的文本,则将相似度最高的候选文本对应的回复确定为待匹配文本的回复。 使用此应用程序提供的解决方案:可以批量系统地解决新问题......

ˇωˇ

≥﹏≤

...文本分类训练样本扩展方法帮助企业探索非结构化数据资产的内容价值。"基于词嵌入的文本分类训练样本扩展方法"荣获2023年大数据行业年度创新技术突破奖。奖项是什么? 什么样的技术?用在什么场景?公司解答...问题。广泛应用于文档数据资产的自动化内容标注、主题分类等场景,帮助企业挖掘非结构化数据资产的内容价值。 本文源自FinancialAIT电报

西安银信博瑞获得一项基于数据挖掘的用户数据分析方法避免阻尼的专利...西安银信博瑞信息科技有限公司获得一项名为"基于数据挖掘的用户数据分析方法"专利,授权公告号CN118378053B,申请日期为2024年6月。 专利摘要显示,本申请涉及数据处理技术领域,具体涉及一种基于数据挖掘的用户数据分析方法。该方法包括:获取用户浏览的网页的文本数据,并对文本数据进行分析……

(ˉ▽ˉ;)

高德软件申请了交通事故形成方法、装置及电子设备专利,提高确定性...高德软件股份有限公司申请了"交通事故形成方法、装置及电子设备"专利并予以公开。 编号CN118796906A,申请日期为2023年3月。 专利摘要显示,本申请提供了一种形成交通事件的方法、装置及电子设备。该方法包括:获取与交通事件相关的目标文本;根据目标文本确定事件网络,以及事件...

+△+

深圳前海微众银行获得质检例句生成专利,提高了质检例句挖掘的准确性...本发明公开了一种质检例句生成方法,包括:获取每个质检项目对应的各个质量 质检例句,并根据每个质检例句,在多个质检记录文本中查找多个质检例句;当接收到每个质检句子对应的标注信息时,根据标注信息,在每个质检句子中确定质检句子中的目标质检例句。 本发明还公开了一种质量检验例句句子挖掘...

⊙﹏⊙

安徽明盛恒卓申请了一种基于实体识别和关系抽取的数据挖掘分析方法...本发明公开了一种基于实体识别和关系抽取的数据挖掘分析方法,该方法收集档案材料并进行分类。 通过初步的数据识别和数据清洗,获得档案文本数据;采用BERT-BiLSTM-CRF实体识别模型对档案文本数据进行识别,并输出带有实体标签的结果;结合Pkuseg、CBOW和BiLSTM,引入词注意力...

∪△∪

...配置信息数据挖掘专利能够实现非结构化数据的有效挖掘和智能语义识别。本发明属于数据挖掘技术领域,具体涉及一种非结构化电厂配置信息的数据挖掘方法。 包括以下步骤:Step1:形成专业语料库;Step2:过滤有效文本数据;Step3:制作词典;Step4:构建词嵌入模型并训练词嵌入模型;Step5:建立字符串匹配。 编码识别规则;第6步:构建设备状态识别模型...

∩▂∩

腾讯获得文本分类专利,以提高分类效率。本申请公开了一种文本分类方法、装置、电子设备及存储介质,可应用于地图领域,涉及自然语言处理技术领域。 方法是:根据短文本训练集词汇挖掘处理得到的候选词汇集,进行词汇重组处理得到词汇组合集,对词汇组合集进行文本表达挖掘处理,得到初始文本表达集;分别...

猎豹加速器部分文章、数据、图片来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知删除。邮箱:xxxxxxx@qq.com