新闻文本侵权检测关键技术研究
发布时间:2024-01-20 18:49
由于微博、微信和门户网站等均是公开传播媒介,所以极易导致新闻内容被抄袭、篡改或非法扩散,继而给新闻内容原创者造成经济损失。文本相似度检测是用来解决新闻内容侵权问题的关键技术之一。然而,传统的文本相似度检测算法在处理海量新闻文本时难以进行高效的相似度检测。除此之外,传统方法一般是利用字符或词频来提取特征以实现文本相似度对比,难以解决因缺乏语义信息导致准确率不高的问题。为此,本文对新闻文本侵权检测方法进行研究,提出一种基于语义指纹的相似新闻文本筛选方法SF-SNTSM(Similar News Text Screening Method Based on Semantic Fingerprint)和基于BERT模型和交互推理网络的新闻文本相似度检测算法BERT-IIN-TSDA(Text Similarity Detection Algorithm Based on BERT and Interactive Inference Network),在此基础上设计了新闻版权保护原型系统,以帮助用户实现高效准确的侵权检测。本文主要工作包括以下几个方面:(1)针对海量新闻文本的检测效率问题,本文提...
【文章页数】:63 页
【学位级别】:硕士
本文编号:3881364
【文章页数】:63 页
【学位级别】:硕士
本文编号:3881364
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3881364.html