当前位置:主页 > 管理论文 > 社区管理论文 >

基于词对句交互机制与多任务学习的论坛重复问题检测算法研究

发布时间:2023-05-11 05:58
  社区问答论坛——如Stack Overflow,Stack Exchange,教育论坛——如大规模在线公开课(Massive Open Online Course,简称MOOC)论坛是网民学习交流中重要的媒介。人们对信息质量、信息时效性和反馈效率的追求,促使论坛管理的不断完善。对论坛中重复问题的检测识别是论坛管理中面对的主要任务之一。重复问题的精准识别和检测对构建常见问题库有重要意义,且影响着论坛平台能否有效地为用户检索相关答案,影响着能否为资深用户或论坛“领袖”推荐一些有挑战性、未被提问过的问题,这与用户的体验密切相关,甚至影响着用户的去留。借助语义匹配模型,可以解析问题对的释义,以识别问题对的语义是否对等,从而实现对重复问题的检测和判别,减少人工标记和管理的成本。但多数网络论坛分学科、分领域,领域数据不足等领域特殊性问题使现有语义匹配模型很少能直接应用于此类具有领域特殊性的论坛。为解决上述问题,本文提出将语义匹配模型与多任务学习集成的解决方案,多任务学习采用基于参数软共享的方法,利用大规模数据辅助目标领域任务,实现多学科、多领域论坛的重复问题检测。针对现有语义匹配模型对句子级别语义...

【文章页数】:78 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 重复问题检测
        1.2.2 深度语义匹配
        1.2.3 领域自适应的检测方法
    1.3 论文研究工作
    1.4 论文的组织结构
第二章 重复问题检测技术与迁移学习相关方法
    2.1 重复问题检测相关方法
        2.1.1 任务定义、框架与评价指标
        2.1.2 语义匹配的交互机制介绍
        2.1.3 Attention
        2.1.4 基于CNN的 n-grams交叉匹配方法
    2.2 迁移学习的方法概述
        2.2.1 INIT方法
        2.2.2 多任务学习
    2.3 本章小结
第三章 基于词对句交互机制的语义匹配模型设计
    3.1 hCNN
        3.1.1 上下文表示层
        3.1.2 金字塔结构
        3.1.3 上下文表示层与金字塔的融合
        3.1.4 推断层
    3.2 词对句交互机制
        3.2.1 交互机制的设计
        3.2.2 两种交互信息提取
    3.3 本章小结
第四章 基于参数软共享多任务学习的重复问题检测
    4.1 基于参数软共享机制的多任务学习方法
    4.2 基于软共享机制的参数优化与训练
    4.3 INIT与基于参数硬共享机制的训练
    4.4 本章小结
第五章 论坛重复问题检测实验
    5.1 数据集、评价指标与实验设置
        5.1.1 社区论坛与慕课论坛数据集
        5.1.2 慕课数据标注方法
        5.1.3 数据概况
        5.1.4 实验评价指标
        5.1.5 实验设置
    5.2 基于词对句交互机制的重复问题检测实验
        5.2.1 与经典算法对比实验
        5.2.2 词对句交互机制与Attention对比
        5.2.3 hCNN-Ⅰ与 hCNN-Ⅱ的结构差异影响
    5.3 基于参数软共享多任务学习的对比实验
        5.3.1 对比算法选取
        5.3.2 实验结果分析
    5.4 模型可解释性分析
    5.5 本章小结
结论与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件



本文编号:3814304

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/shequguanli/3814304.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户8e6e1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com