- 您所在的位置:
- 海南農(nóng)業(yè)品牌網(wǎng)首頁(yè)
- 品牌資訊
- 文章頁(yè)
種業(yè)大語(yǔ)言模型“豐登·水稻”網(wǎng)站向全球開(kāi)放
發(fā)布時(shí)間:2025-06-04 11:28:21 作者:
全球?qū)樗旧镉N打造的大語(yǔ)言模型“豐登·水稻”近日正式向全球開(kāi)放網(wǎng)站(https://seedllm.org.cn/),該模型深度融合水稻生物學(xué)知識(shí)圖譜,率先構(gòu)建了全球大規(guī)模的水稻科研語(yǔ)料庫(kù)和全球水稻多組學(xué)知識(shí)圖譜,在信息檢索與知識(shí)理解等方面展現(xiàn)出顯著優(yōu)勢(shì),為構(gòu)建智能決策育種技術(shù)體系奠定了基礎(chǔ)。
崖州灣國(guó)家實(shí)驗(yàn)室和上海人工智能實(shí)驗(yàn)室聯(lián)合中國(guó)農(nóng)業(yè)大學(xué)在2024年發(fā)布了中國(guó)種業(yè)大模型“豐登”(SeedLLM),率先嘗試將大模型應(yīng)用于農(nóng)業(yè)育種研究,著力構(gòu)建一個(gè)真正理解作物生物學(xué)、具備專(zhuān)業(yè)推理能力的智能模型,以實(shí)質(zhì)性提升生物育種研究的效率與質(zhì)量。作為“豐登”的后續(xù)學(xué)術(shù)成果,2025年5月科研團(tuán)隊(duì)發(fā)表相關(guān)論文,以水稻為例,詳細(xì)解釋了“豐登”的技術(shù)和實(shí)現(xiàn)原理,系統(tǒng)展示了的研究成果,并正式向全球開(kāi)放了網(wǎng)站。
“豐登”科研團(tuán)隊(duì)率先構(gòu)建了全球大規(guī)模的水稻科研語(yǔ)料庫(kù),系統(tǒng)整合了全球超過(guò)140萬(wàn)篇中英文文獻(xiàn),覆蓋該領(lǐng)域超過(guò)98%的公開(kāi)發(fā)表成果。在此基礎(chǔ)上,科研團(tuán)隊(duì)以阿里發(fā)布的通義千問(wèn)模型為基礎(chǔ),通過(guò)持續(xù)訓(xùn)練與精調(diào)流程,成功開(kāi)發(fā)了豐登水稻種業(yè)大語(yǔ)言模型。為全面評(píng)估模型能力,科研團(tuán)隊(duì)構(gòu)建了一個(gè)大模型自動(dòng)生成的水稻知識(shí)問(wèn)答數(shù)據(jù)集SeedBench,共包含1975對(duì)問(wèn)答樣本,涵蓋問(wèn)答生成、摘要提取、語(yǔ)言理解與多項(xiàng)選擇等10類(lèi)任務(wù)。自動(dòng)化評(píng)估結(jié)果顯示,豐登模型在準(zhǔn)確率等指標(biāo)上均顯著優(yōu)于通義千問(wèn)等主流通用模型。
此外,研究團(tuán)隊(duì)還聯(lián)合水稻領(lǐng)域?qū)<?,設(shè)計(jì)了一個(gè)高質(zhì)量人工評(píng)測(cè)數(shù)據(jù)集HumanDesignRiceQA,包含253道專(zhuān)業(yè)問(wèn)題,聚焦基因功能、傳統(tǒng)雜交育種、分子設(shè)計(jì)育種等核心主題。評(píng)測(cè)由326名評(píng)審參與完成,其中83人為水稻研究領(lǐng)域的資深專(zhuān)家。結(jié)果表明,豐登模型在答題質(zhì)量上全面超越OpenAI GPT4及人類(lèi)本科生平均水平,展現(xiàn)出其在農(nóng)業(yè)垂直領(lǐng)域中的領(lǐng)先能力。
為進(jìn)一步提升模型的科研實(shí)用性,“豐登”科研團(tuán)隊(duì)構(gòu)建了全球水稻多組學(xué)知識(shí)圖譜,整合了1879篇關(guān)于水稻轉(zhuǎn)錄組和蛋白質(zhì)組的文獻(xiàn)數(shù)據(jù),系統(tǒng)匯聚基因表達(dá)水平、蛋白豐度與基因組功能注釋信息。圖譜包含超過(guò)40萬(wàn)個(gè)節(jié)點(diǎn)與157萬(wàn)條邊,覆蓋水稻研究中的關(guān)鍵知識(shí)單元與生物關(guān)系。
“豐登”科研團(tuán)隊(duì)有關(guān)負(fù)責(zé)人透露,大語(yǔ)言模型憑借強(qiáng)大的語(yǔ)言理解與知識(shí)推理能力,有望成為支撐水稻研究與智能育種的關(guān)鍵工具。“豐登”服務(wù)實(shí)現(xiàn)了圖譜協(xié)同推理,能夠跨越純文本的表達(dá)局限,調(diào)用結(jié)構(gòu)化圖譜執(zhí)行精準(zhǔn)查詢(xún)、整合多維證據(jù)。