PVminer:一种用于检测患者生成数据中患者声音的领域特定工具

完整版
【译文内容】 患者生成的文本,如安全消息、调查和访谈,包含了丰富的患者声音(PV)表达,反映了沟通行为和健康的社会决定因素(SDoH)。传统的定性编码框架劳动密集且无法扩展到跨健康系统的患者撰写的大量消息。现有的机器学习(ML)和自然语言处理(NLP)方法提供了部分解决方案,但通常将以患者为中心的沟通(PCC)和SDoH视为独立任务,或者依赖于不适合面向患者语言的模型。我们引入了PVminer,这是一个针对领域自适应的NLP框架,用于结构化安全患者-提供者沟通中的患者声音。PVminer将PV检测公式化为一个多标签、多类预测任务,整合了患者特定的BERT编码器(PV-BERT-base和PV-BERT-large)、无监督的主题建模用于主题增强(PV-Topic-BERT)以及针对代码、子代码和组合级别标签的微调分类器。在微调和推理过程中,主题表示被纳入以丰富语义输入。PVminer在分层任务中实现了强大的性能,并优于生物医学和临床预训练基线,实现了82.25%(代码)、80.14%(子代码)和高达77.87%(组合)的F1分数。消融研究进一步表明,作者身份和基于主题的增强各自贡献了有意义的增益。预训练模型、源代码和文档将公开发布,且可根据请求提供用于研究用途的注释数据集。
评论
    公告

    AI千集是一个专注于科研服务的智能平台
    在这里您可以获得本平台自训练的
    科研智能体
    和小伙伴一起玩转AI,做自己的AI机器人
    来AI千集,赋能智慧快人一步
    扫一扫,快速获取解决方案与报价
    立即咨询

    积分排行