文本检索系统是针对海量文本数据的基本分析工具,用于根据用户信息需求在大规模文档集中精准定位特定文本。近年来,基于深度神经网络的文本检索技术取得了突出进展,但仍然存在语义理解水平低、推理能力不足、依赖大规模标注数据等问题,难以充分满足实际业务应用需求。
本赛题面向大规模英语新闻数据的智能分析业务场景,针对现有文本检索技术存在的不足,设置语义检索和智能问答两类赛题任务:语义检索任务主要考察参赛系统篇章级语义理解能力;智能问答任务仅提供少量训练样本,不允许参赛者使用外部数据,重点考察参赛系统在小样本或迁移学习条件下的语义理解和推理能力。