1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

搜狗搜索“CIPS-SOGOU問答比賽”賽程加碼 正式啟動(dòng)“非事實(shí)類問答子任務(wù)”

 2018-05-22 11:25  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項(xiàng)重要前沿課題。近日,由搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動(dòng)了“非事實(shí)類問答子任務(wù)”。搜狗搜索將公開百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集,為參賽者提供一展身手的舞臺(tái),從而促進(jìn)學(xué)術(shù)界及業(yè)界交流,提升智能問答領(lǐng)域的研究水平,推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。

“CIPS-SOGOU問答比賽”,是國(guó)內(nèi)首檔基于大規(guī)模真實(shí)用戶問答數(shù)據(jù)集的問答評(píng)測(cè)任務(wù)。大賽根據(jù)問題類型將比賽任務(wù)分為“事實(shí)類問答子任務(wù)”和“非事實(shí)類問答子任務(wù)”,分別對(duì)應(yīng)事實(shí)類問題和非事實(shí)類問題。去年9月,該大賽伴隨著“事實(shí)類問答子任務(wù)”的啟動(dòng)已正式開賽。

而于近日啟動(dòng)的“非事實(shí)類問答子任務(wù)”,無疑又為大賽注入新機(jī),將賽事推向高潮。相較于“事實(shí)類問題”,“非事實(shí)類問題”包括更廣泛的問答內(nèi)容形式,包括列舉(list)、定義(definition)、方式(how)、原因(why)、假設(shè)(hypothetical)等等。

根據(jù)賽制,基于搜狗搜索提供的問題,以及相對(duì)應(yīng)的若干候選答案篇章,參賽者需設(shè)計(jì)算法從候選篇章中抽取合適的詞語、短語或句子,形成一段正確、完整、簡(jiǎn)潔的文本,作為預(yù)測(cè)答案,以正確、完整、簡(jiǎn)潔地回答該問題,答案文本長(zhǎng)度限定在500字內(nèi)。

針對(duì)大賽中的每個(gè)問題,參賽者只需提供一個(gè)預(yù)測(cè)答案。“非事實(shí)類問答子任務(wù)”將針對(duì)該預(yù)測(cè)答案與標(biāo)準(zhǔn)答案計(jì)算ROUGE-L和BLEU值,再以測(cè)試集上兩個(gè)指標(biāo)的平均值作為最終指標(biāo)。此次比賽將在2018年11月CIPS年會(huì)上舉行頒獎(jiǎng)儀式,授予獲勝者獎(jiǎng)金和榮譽(yù)證書。

(圖:CIPS-SOGOU問答比賽任務(wù)說明)

值得期待的是,此次“非事實(shí)類問答子任務(wù)”中,搜狗搜索將公開百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集。包含10萬個(gè)非事實(shí)型問題, 代表了最真實(shí)廣泛的網(wǎng)民信息需求;以及100萬個(gè)對(duì)應(yīng)問題的候選篇章及答案標(biāo)注 (每個(gè)問題對(duì)應(yīng)給出10個(gè)候選答案篇章),候選篇章都是從搜索引擎檢索真實(shí)網(wǎng)頁結(jié)果中抽取的文本。

實(shí)際上,搜狗搜索在此次任務(wù)中提供百萬級(jí)真實(shí)用戶數(shù)據(jù)集,除了促使大賽正常開展外,更有意義的是,此舉為構(gòu)建開放域智能問答系統(tǒng)的研究提供了剛需的數(shù)據(jù)支撐,有助于促進(jìn)智能問答領(lǐng)域技術(shù)的發(fā)展和應(yīng)用,從而推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù),讓用戶更加便捷地獲取信息和知識(shí)。

作為國(guó)內(nèi)第二大搜索引擎,搜狗搜索憑借自身數(shù)據(jù)優(yōu)勢(shì)及在人工智能領(lǐng)域研究的持續(xù)大力投入,已經(jīng)在智能問答領(lǐng)域處于領(lǐng)先地位,率先實(shí)現(xiàn)了“直接為用戶提供答案”。搜狗搜索已上線的“立知”智能問答系統(tǒng),就是其研發(fā)的面向未來的搜索。該系統(tǒng)能夠理解用戶搜索意圖,并直接提供答案。目前,“立知”智能問答系統(tǒng)在事實(shí)性問題、分析類問題、觀點(diǎn)類問題、數(shù)字類問題、隱式問題等方面,都能為用戶直接返回精確答案。

現(xiàn)在,作為智能問答領(lǐng)域的帶路黨,搜狗搜索開放技術(shù)能力,向?qū)W界及業(yè)界提供百萬級(jí)真實(shí)用戶問答數(shù)據(jù)集,助力行業(yè)向“非事實(shí)性問答”領(lǐng)域研究開拓,促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流。有興趣進(jìn)行技術(shù)切磋,提升研究水平的高校師生及業(yè)內(nèi)研究人員,均可通過“搜狗實(shí)驗(yàn)室”官網(wǎng) 提交報(bào)名信息參賽。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
搜狗搜索
搜狗問答

相關(guān)文章

  • 百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

    “AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

    標(biāo)簽:
    人工智能
    ai智能
  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • 宇樹科技加速?zèng)_刺科創(chuàng)板IPO,人形機(jī)器人龍頭估值飆至120億元

    “宇樹已形成硬件、算法、場(chǎng)景聯(lián)動(dòng)的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國(guó)力量。”首程資本管理合伙人朱方文在追加投資時(shí)如是評(píng)價(jià)。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉,國(guó)內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計(jì)劃于科創(chuàng)板IPO,預(yù)計(jì)

    標(biāo)簽:
    宇樹科技
  • OpenAI推出GPT-5:AI大統(tǒng)一時(shí)代的到來?

    推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個(gè)強(qiáng)大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開發(fā)者體驗(yàn)負(fù)

    標(biāo)簽:
    chatgpt

編輯推薦