5月15日,中文醫(yī)療大模型權(quán)威評測平臺MedBench公布最新自測榜單結(jié)果,云知聲基于山海大模型打造的醫(yī)療行業(yè)專用大模型(UniGPT-Med-U1)以綜合得分93.1的成績強勢衛(wèi)冕冠軍之位。尤為矚目的是,在醫(yī)學(xué)語言理解與醫(yī)學(xué)安全倫理雙項評測中,UniGPT-Med-U1分別斬獲122.3分與104.9分的佳績,雙雙榮登榜首,成為參評的眾多醫(yī)療大模型中的卓越典范。
“醫(yī)學(xué)語言理解”評測得分
“醫(yī)學(xué)安全倫理”評測得分
MedBench是由上海人工智能實驗室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機構(gòu)打造的中文醫(yī)療大模型權(quán)威評測平臺。作為全球AI醫(yī)療領(lǐng)域的重要參照標(biāo)準(zhǔn)之一,MedBench以其科學(xué)嚴(yán)謹(jǐn)?shù)脑u測體系,為全球超過387個醫(yī)療大模型提供了提供客觀科學(xué)的性能評估。評測維度涵蓋醫(yī)學(xué)知識問答、醫(yī)學(xué)語言生成、復(fù)雜醫(yī)學(xué)推理、醫(yī)學(xué)語言理解、醫(yī)療安全和倫理5大關(guān)鍵維度。
多步深度推理,讓診療決策有“根”可循
云知聲UniGPT-Med-U1的優(yōu)異表現(xiàn),源于其先進的技術(shù)架構(gòu)與創(chuàng)新技術(shù)。該模型基于山海大模型架構(gòu)完成系統(tǒng)性升級,依托云知聲在醫(yī)療行業(yè)深耕多年積累的海量診療數(shù)據(jù),進行增量式強化訓(xùn)練。采用的多步深度推理架構(gòu),將知識圖譜檢索與邏輯鏈驗證相結(jié)合,嚴(yán)格遵循循證醫(yī)學(xué)框架,建立起可信的知識溯源機制。通過雙重校驗的推理范式,該模型在診斷準(zhǔn)確性、臨床邏輯完備性和決策過程可解釋性等關(guān)鍵指標(biāo)上實現(xiàn)了突破性提升,為醫(yī)療決策提供了更可靠、精準(zhǔn)的支持,讓診療決策有“根”可循。
在技術(shù)創(chuàng)新方面,云知聲研發(fā)的引導(dǎo)式數(shù)據(jù)生成技術(shù)和可控驗證深度推理技術(shù),為UniGPT-Med-U1賦予了獨特優(yōu)勢。
針對傳統(tǒng)GRPO強化學(xué)習(xí)訓(xùn)練數(shù)據(jù)篩選效率低的問題,引導(dǎo)式數(shù)據(jù)生成技術(shù)采用動態(tài)答案預(yù)置機制,在生成階段引導(dǎo)模型輸出多樣化醫(yī)學(xué)回答,確保訓(xùn)練數(shù)據(jù)具備天然多樣性。這不僅大幅縮短數(shù)據(jù)篩選耗時,還增強了模型對錯誤答案的鑒別能力,顯著降低臨床決策支持任務(wù)中的誤診風(fēng)險。
而可控驗證深度推理技術(shù),則有效解決了現(xiàn)有大語言模型在醫(yī)療推理中的痛點。該技術(shù)采用“推理-反思-再推理”循環(huán)架構(gòu),并結(jié)合可驗證推理獎勵和可驗證反思獎勵機制,使模型在生成診斷建議時具備嚴(yán)格的自檢能力,實現(xiàn)精準(zhǔn)反思與可靠決策,避免出現(xiàn)邏輯漏洞和冗余信息。
技術(shù)落地賦能,推動醫(yī)療行業(yè)智慧化發(fā)展
從技術(shù)研發(fā)到場景應(yīng)用,云知聲基于醫(yī)療行業(yè)專用大模型、智能語音識別、自然語言理解、臨床知識圖譜等人工智能技術(shù),構(gòu)建了豐富的產(chǎn)品和解決方案體系,覆蓋醫(yī)政醫(yī)管、臨床診療、醫(yī)保管理、患者服務(wù)等多個業(yè)務(wù)領(lǐng)域,服務(wù)對象包括衛(wèi)健委、醫(yī)保局、醫(yī)院管理者、醫(yī)護人員、患者等多類用戶,全面賦能醫(yī)療智能化建設(shè)。
其中,基于醫(yī)療行業(yè)專用大模型推出的門診病歷生成、智能病歷質(zhì)控、DRG/DIP醫(yī)保支付管理等系統(tǒng),已在全國幾十家醫(yī)院成功落地應(yīng)用。
門診病歷生成系統(tǒng)能夠?qū)崟r捕捉醫(yī)患之間的對話內(nèi)容,智能提取關(guān)鍵問診信息,并自動生成結(jié)構(gòu)化病歷。醫(yī)生僅需進行簡單審核,即可完成病歷書寫工作。目前該系統(tǒng)已在北京友誼醫(yī)院順義院區(qū)廣泛應(yīng)用,單份病歷采納率高達98%,大幅降低了醫(yī)生文書負(fù)擔(dān);智能病歷質(zhì)控系統(tǒng)能夠精準(zhǔn)理解病歷內(nèi)容,并智能識別其中的書寫錯誤與缺陷。系統(tǒng)對影像描述、專業(yè)術(shù)語進行細(xì)致分析,并對檢查結(jié)果、檢查結(jié)論以及檢查依據(jù)進行深度解讀,從而實現(xiàn)高效、精準(zhǔn)的病歷質(zhì)控;DRG/DIP醫(yī)保支付管理系統(tǒng)以智能提醒和數(shù)據(jù)分析兩種方式,從診療過程中、醫(yī)保結(jié)算前到醫(yī)保結(jié)算后,為醫(yī)生、質(zhì)控員、編碼員和醫(yī)保處提供全流程、全方位的醫(yī)保支付管理服務(wù)。該系統(tǒng)成功助力中國人保財險完成核賠風(fēng)控AI醫(yī)療審核系統(tǒng)的全國性部署。
持續(xù)創(chuàng)新,引領(lǐng)AI醫(yī)療新未來
憑借領(lǐng)先的技術(shù)架構(gòu)與扎實的場景落地能力,云知聲醫(yī)療行業(yè)專用大模型在AI醫(yī)療賽道的專業(yè)技能比拼中屢獲佳績。在MedQA、CCKS醫(yī)學(xué)大模型評測、Medbench醫(yī)學(xué)大模型評測、全國醫(yī)保大賽等專業(yè)競賽中,始終保持大模型醫(yī)學(xué)能力全球領(lǐng)先的地位,充分展現(xiàn)了其在技術(shù)創(chuàng)新和實踐應(yīng)用方面的卓越實力。
此次再次登頂MedBench榜單,不僅是對云知聲技術(shù)實力的再次證明,更是對其在AI醫(yī)療領(lǐng)域持續(xù)創(chuàng)新的肯定。未來,云知聲將繼續(xù)深化專業(yè)技術(shù),進一步提升UniGPT-Med-U1的性能和應(yīng)用水平,攜手更多醫(yī)療機構(gòu)、科研單位,共同探索AI醫(yī)療的更多應(yīng)用場景。為提升醫(yī)療服務(wù)質(zhì)量和效率,改善患者就醫(yī)體驗,促進醫(yī)療行業(yè)智慧化、可持續(xù)發(fā)展貢獻更多力量。
本文僅供讀者參考,任何人不得將本文用于非法用途,由此產(chǎn)生的法律后果由使用者自負(fù)。如因文章侵權(quán)、圖片版權(quán)和其它問題請郵件聯(lián)系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經(jīng)授權(quán)禁止建立鏡像,違者將依去追究法律責(zé)任
大眾商報(大眾商業(yè)報告)并非新聞媒體,不提供任何新聞采編等相關(guān)服務(wù)
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2