Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 1|回復: 0

自然语言处理的临床叙述

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-1-28 15:15:17 | 顯示全部樓層 |閱讀模式

自然语言处理(NLP)技术可让您实现流程自动化或从大量文本中提取价值。这正是国家癌症研究中心 (CNIO) 对西班牙语匿名临床病例相关文本进行语言注释的目的。 临床叙事研究 这是 IIC 开展的一项临床叙事研究,为未来检测文本中的药物、疾病、症状或其他医疗实体并通过这种方式建立它们之间的关系奠定了基础。 该研究是国家促进语言技术计划的一部分,并得到了数字发展国务大臣的支持。具体而言,超过 个不同的口号经过语言注释,以构建专业人员编写的信息。这样,分析工作就分三个层面进行: 文本被分成句子。 具体术语已进行词形还原。 带有形态句法信息的标签被分配给每个元素。

但首先,为了正确标记前三个级别中的每一个,工作的一个重要 手机号码数据 部分是创建注释指南,其中设置语言学家在手动标记和随后配置自动标记时要遵循的标准使用 NLP 技术进行标记。这些指南的开发可能会占用该项目的重要部分,因为它们随后必须由专家进行审查和验证,但它们为临床叙述中的质量注释奠定了语言基础。 医疗信息质量注释 这项工作的目标之一是向科学界和医疗行业提供详尽的生物医学语料库以及由语言学家与临床叙述专家合作设计和验证的注释方法。 这样,未来专业人士将更容易根据文本分析和讨论的关系做出决策,以及基于数据库中结构化的医疗信息进行高级搜索。 临床文本 在处理医疗信息等敏感信息时,确保数据质量至关重要。因此,我们选择将自动自然语言处理与单独的手动注释相结合,从而衡量注释者之间的一致性以获得更高的质量。



在这个项目中,最低标准要求很高,因为人类注释者和自动注释之间的一致性要求为:将文本分割为短语(分割)为 99%,分割为形状(标记化)为 98%,形态学为 96%。和词性(POS) 标签。IIC团队的成绩分别为99.3%、99.9%和98.3%。 适应医疗领域 这些指标的成功归功于 IIC计算语言学家团队的工作,他们深入研究了术语的具体案例,以使标准语言分析工具适应医学领域: 医学缩写 医学计量单位 缩写词 字母数字表达式 严格的流程,通过两个程序为医学注释工具提供所需的质量: 研究为英语开发的注释工具,并观察它们在面对医学文本的特殊性时的行为。 通过丰富基础资源,根据现有的西班牙语语言分析工具创建改编版本。 借助 IIC 的贡献,我们在开发能够自动分割和注释文本、适应特定领域并且也可以适应其他领域的综合工具的道路上又向前迈进了一步。

回復

使用道具 舉報

高級模式
B Color Image Link Quote Code Smilies

本版積分規則

延時噴霧劑|泰坦TITAN陰莖增硬|手機版|必利吉|樂威壯|威而鋼100mg|必利勁

GMT+8, 2024-5-6 23:26 , Processed in 1.313668 second(s), 18 queries .

抗攻擊 by GameHost X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |