首届“面向智能问答的篇章排序”比赛落幕搜狗搜索掀起智能问答研究热潮

作者：admin 发表时间：2021-01-01 浏览：19 海淘动态

7月12日至14日，第二十三届全国信息检索学术会议(简称CCIR2017)在上海召开。大会最后一天，由搜狗搜索与CCIR2017联合举办的全国首届面向智能问答的篇章排序比赛评测报告、九支代表队伍技术报告及颁奖典礼也隆重举行，标志着这场历时三个多月的大型评测比赛圆满落下帷幕。为了持续推动中文信息检索技术和自然语言处理技术的发展及应用，搜狗搜索于今年4月1日联合CCIR2017共同发起面向智能问答的篇章排序比赛。作为国内首次大规模真实用户问答数据集上的问答评测任务，本次大赛吸引了国内近85所高校学生及一批业内研究者的积极参与。按照赛制，参赛者需在给定问题下，设计排序方法对候选篇章进行排序，并尽可能将包含正确答案的篇章排在前面，最终按照篇章所含答案的完整度进行评定。本次大赛中，北京大学、华中科技大学、哈尔滨工业大学语言技术研究中心三支战队，从众多参赛队伍中脱颖而出荣膺三甲，分别获得由CCIR2017与中国计算机协会(CCF)提供的成绩证书，及搜狗搜索提供的丰厚奖金。作为大赛的联合主办方，搜狗搜索除了为广大高校学生、业内研究者提供展示和学习的平台外，更是借此机会，提供智能问答领域的大规模公开数据集，以促进学术界和业界在智能问答领域的研究发展，鼓励学术交流，提升研究水平。目前在智能问答研究领域，可用的大规模公开数据集，尤其是反映真实用户问答需求的中文数据集非常稀缺。这很大程度上限制了业界及学术界关于智能问答的研究，使其研究局限于事实性问答领域，而无法涉及以满足广泛用户的通用问答需求为目标的开放域智能问答领域。作为国内第二大搜索引擎，搜狗搜索是当前用户获取信息的重要手段，为大规模高质量问答数据的生成提供了可能性。据了解，构建开放域智能问答系统涉及到复杂的自然语言理解、大规模数据处理、机器学习、知识抽取和表示等人工智能研究领域的前沿技术，对这些技术的研究依赖大规模高质量的数据。此次面向智能问答的篇章排序比赛中，搜狗搜索先后公布了来自用户真实搜索需求的5万个问题，以及从搜狗搜索全网检索结果提供的50万条候选篇章。事实上，基于对用户搜索行为及需求的洞察，搜狗搜索早已前瞻性地指出，搜索的未来是智能问答。通过智能问答，用户可以用自然语言与机器交流，搜索引擎不再是返回10条结果，而是像人一样给出答案和建议。搜索结果不只是匹配，而更是走到了理解的角度。基于此，搜狗搜索的人工智能技术坚持以自然语言处理为核心，在语言的基础上做自然交互和知识计算，并着力问答方向的技术创新，切实推进产品落地，服务用户搜索场景。目前已经上线的搜狗立知问答系统就是搜狗研发的面向未来的搜索技术，在理解用户的问题或信息需求后，立知问答系统利用海量网络信息及大规模知识库，能够直接给用户提供答案。目前，搜狗立知不仅能精准回答事实性问题，在分析类问题、观点类问题、数字类问题等领域，都能直接返回精确答案。而立知问答系统直接给出答案的背后，则包含了语义分析、问题理解、信息抽取、知识图谱、信息检索、深度学习等众多人工智能技术。智能问答能够让信息和知识的获取变得更加便捷，是自然语言处理和人工智能领域的前沿研究课题。作为行业引领者的搜狗搜索，以开放态度向学术界及业界提供智能问答领域的大规模公开数据集，鼓励学术交流，对行业智能问答研究的推进意义重大。据悉，第二届CIPS-SOGOU问答比赛已经在筹备阶段。届时，作为主办方的搜狗搜索，将会公开更多数据集，为广大高校生和业内研究者提供更大的学习展示平台，从而引领学界和业界在智能问答研究领域不断取得突破。