文本生成(Text Generation)指通过算法让计算机自动生成符合语言规范、语义连贯且具有特定目标的可读文本。这里的文本生成分类包括问答和摘要。
| 编号 | 标题 | AI问题 | 数据集 | 解决方案 | 文件 |
|---|---|---|---|---|---|
| 1 | 蚂蚁金服2024全球AI攻防挑战赛-赛道1-大模型生图安全疫苗注入 | 文本生成安全 | 通过为大模型注入生成式“风险疫苗”,透视大模型生图潜在弱点和漏洞,进一步增强、健全大模型生图的安全免疫抵抗系统。 | 基于Qwen1.5-4B-Chat模型,使用HuggingFace Transformers开发框架,进行安全疫苗注入。 | AiS-NLP-GPT-AntGroup2024-AI-Defense1-Safe-Vaccine-1MB |
| 2 | 人民网2022赛题1-训练一个对话生成模型 | 文本生成 | 训练一个对话生成模型 | 基于百度中文对话模型PLATO-Mini,使用PaddleNLP开发框架,根据给定的数据集,训练一个对话生成模型,基于文本内容自动生成自然流畅、信息丰富、符合话题场景的回复内容。 | AiS-NLP-GPT-PeopleNet2022-1-Dialogue-Generation-13MB |
| 3 | CCF-BDCI-2021-客服通话文本摘要提取 | 文本摘要提取 | 联通客服中心通话文本数据集,包括25,001条训练数据和7,526条测试数据。挖掘海量客服通话数据,采用合适的算法精准提取文本摘要。 | 基于文本摘要提取PEGASUS模型、使用PaddleNLP开发框架进行文本摘要提取。 | AiS-NLP-GPT-CCF-BDCI-2021-Customer-Service-Text-Summary-60MB |
| 4 | AiWin2021构建基于理赔文本语义的问答系统 | 文本生成/问答 | 保险文本视觉认知问答任务数据集,已使用PaddleOCR识别并转换的保险文本视觉认知问答任务数据集,可直接用于阅读理解模型的训练。 | PaddleOCR、PaddleNLP框架、使用Ernie模型中的问答任务类ErnieForQuestionAnswering进行抽取式阅读理解构建问答系统。 | AiS-NLP-GPT-AIWin2021-Insurance-Claim-PaddleNLP-8MB |