识别文本中的实体问题(通常称为命名实体识别,Named Entity Recognition, NER)是指从非结构化文本中自动识别、定位并分类特定类型实体的任务。这些实体通常包括人名、地名、组织机构名、时间、日期、货币、百分比等具有明确语义意义的词汇或短语。识别文本中的实体任务还包括从大量文本中进行信息检索与抽取。
识别文本中的实体案例
| 编号 | 标题 | AI问题 | 数据集 | 解决方案 | 文件 |
|---|---|---|---|---|---|
| 1 | AiWin2022训练一多任务保险业务大语言模型 | 文本分类、识别文本中的实体、构建问答系统、文本相似度识别 | 支持包括文本分类、文本相似度、自然语言推断、命名实体识别和机器阅读理解等五大基础自然语言理解任务,具体为18个保险业务场景中的常见任务。 | 基于`pytorch/transformers,以中文T5(mT5)为基础模型实现多种自然语言处理任务。 | AiS-NLP-NER-Fin-AiWin2022-Insurance-MultiTasks-mT5-140MB |
| 2 | CCF-BDCI-2021银行产品用户评论数据集和观点提取 | 识别文本实体 | 知乎、理财贷款论坛、投资理财通、银行客服等公开真实金融产品评论数据集,包括7,530条训练数据和2,883条测试数据。精准提取产品评论观点。 | 基于模型chinese-bert-wwm-ext,使用simpletransformers开发框架进行命名实体识别(NER)和文本分类。 | AiS-NLP-NER-Fin-CCF-BDCI-2021-ZhongYuanBank-2MB |