极品一级毛片,中文在线а√在线,亚洲欧美自偷自拍,国产欧美三区,黄色大片视频网站,亚洲精品日韩在线,在线日韩成人

數(shù)字報
小程序
公眾號
國產(chǎn)健康大模型成功通過十二門核心學科的主任醫(yī)師筆試評測——“主任級AI醫(yī)生”,來了
2025-08-08 17:55:16
來源:人民日報海外版  作者: 劉少華

7月23日,夸克健康大模型成功通過12門核心學科的主任醫(yī)師筆試評測,成為國內首個完成這一挑戰(zhàn)的大模型。繼5月通過副主任醫(yī)師考試后,該模型實現(xiàn)能力再躍升,并已全面集成至夸克AI搜索,提供“主任級AI醫(yī)生”服務,用戶在查詢健康問題時,選擇深度搜索即可調用。

很多臨床專家對其表現(xiàn)給予高度評價,并指出它在輔助診療、患者教育、心理支持等方面展現(xiàn)出巨大潛力。在垂類模型與通用模型對比中,國產(chǎn)健康大模型呈現(xiàn)出難度越高領先優(yōu)勢越明顯的性能曲線,展現(xiàn)出在復雜醫(yī)學推理任務中的突破。

“給醫(yī)生提供更多的探索空間”

主任醫(yī)師的考試非常細致,此次夸克模型選取了12門最核心的學科作為模擬測試,如全科醫(yī)學等。在12門考試里,夸克健康大模型全部過關。

主任醫(yī)師考試難度很高。比如,其中的多選題,不僅要判斷各選項的概率,還要理解正確性的邊界,否則很容易漏選或錯選。而案例分析題,更是需要直接解決很細微的、辯證的問題,對于大模型來說一直都是個難點。

夸克健康算法負責人徐健介紹,理解夸克健康大模型,有三個關鍵點:一是知識性,構建優(yōu)質的大規(guī)模數(shù)據(jù)資源庫;二是正確性,通過技術系統(tǒng)性解決正確性這個大問題;三是推理能力,通過醫(yī)療慢思考推理能力解決復雜問題。

實現(xiàn)這三個關鍵點都不簡單。比如知識性,在這一模型中數(shù)據(jù)被分為四大類,資料、病例、知識以及在此基礎上的合成數(shù)據(jù)。這就要求將大量網(wǎng)頁數(shù)據(jù)、書籍、指南、藥品說明書等專業(yè)類數(shù)據(jù),將臨床上積攢的病例,將醫(yī)學專家結構化思維的結晶,統(tǒng)一進行合成。

“我們不是在訓練AI回答醫(yī)學問題,而是在訓練它學會醫(yī)學思維?!毙旖≌f?!拔覀兊腁I大模型可以做到從表象判斷到深度分析,這樣答題會更好,解釋性更強?!?/p>

這一成果背后是專業(yè)醫(yī)師團隊的深度參與,讓大模型有高質量數(shù)據(jù)支撐。目前,夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標注團隊,其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家,構建了十幾萬條精標的樣本數(shù)據(jù)。

前不久,大模型產(chǎn)業(yè)應用技術聯(lián)盟醫(yī)療專業(yè)委員會發(fā)布報告,推出了基于大模型的患者醫(yī)療服務能力分級框架,并將其分為五級——L1級是信息輔助,L2級是單任務智能輔助,L3級是多任務智能輔助,L4級是高級協(xié)同決策輔助,L5級是智慧協(xié)同創(chuàng)新輔助。

“確實可以看到在一些疑難病上,AI可以輔助醫(yī)生,給醫(yī)生提供更多的探索空間和建議。”徐健說。

數(shù)據(jù)顯示,在有檢驗檢查的疾病上,這一模型的回答準確率已經(jīng)達到90.78%,接近??漆t(yī)生水平;在疑難疾病上,其準確率達到85.51%。

憑借在醫(yī)學領域的專業(yè)性,夸克AI搜索已經(jīng)吸引了一大批醫(yī)學生和醫(yī)生群體??淇私】颠\營負責人趙存忠介紹,目前平臺在全國醫(yī)學生中月活用戶已突破200萬,覆蓋率過半。

“醫(yī)生跟AI的結合是大趨勢”

對于這位“主任級AI醫(yī)生”的水平,多位主任醫(yī)師給出了高度評價。

“用完之后,感到確實會改變診療的過程?!北本┐髮W醫(yī)學部皮膚與性病學系主任、北京大學人民醫(yī)院主任醫(yī)師李厚敏說。

李厚敏分享了她與健康大模型的一次互動。某一患者目前既要控制疾病,又需治療瘢痕,而且此前治療對患者皮膚屏障的破壞已經(jīng)影響到其生活質量,在向夸克提供了該患者的年齡、性別、診斷、用藥情況后,夸克給出了讓李厚敏覺得“非常全面”的四方面建議——既包括對治療方案的調整,也給出了對瘢痕、色素的管理建議,最后還提出要對這位患者進行心理疏導?!爸委煼桨负侠?,用藥方案規(guī)范,還有疾病的長期管理和患者的心理疏導?!?/p>

李厚敏認為,對皮膚科來說,與AI的結合非常容易取得成果?,F(xiàn)有的4000多種皮膚疾病都長在皮膚表面,甚至可以通過AI進行識別,很多疾病在AI指導下可以獲得很好的處理結果。她說,全國范圍內只有1萬多名皮膚科醫(yī)生,但皮膚科患者很多,而且有疾病種類多、發(fā)病率高的突出特點。她認為,在AI幫助下,大量全科醫(yī)生、基層醫(yī)生對皮膚問題的診療水平會大大提高,可以做好隨訪管理、慢病管理。

“以后AI可能取代不了醫(yī)生,但醫(yī)生跟AI的結合是大趨勢?!蔽錆h大學人民醫(yī)院精神衛(wèi)生中心主任、主任醫(yī)師王惠玲說。

王惠玲認為,對于抑郁癥患者來說,因為醫(yī)生很忙,很難時刻回答,可以有效借助健康大模型尋找答案。比如,有些患者顧慮是否會吃藥成癮,有些患者顧慮藥物的副反應,在應對這些問題的過程中,原本需要醫(yī)生反復告知,如今AI可以常伴左右。

在李厚敏看來,患者使用健康大模型同樣很重要。比如,面對皮膚科醫(yī)生經(jīng)常開出的激素藥物,很多患者會很猶豫,這時候AI反而可以通過詳細解釋,緩解大家的激素焦慮?!皩τ诨颊邅碇v,AI既可以緩解焦慮,也傳遞了更好的慢病管理理念。”

此外,不少患者對于心理疾病存在恥感,不好意思告訴醫(yī)生。王惠玲說,這種情況下患者可以去問AI,在其幫助之下正確找到方向,比如哪些問題自己鍛煉可以起效,哪些問題需要去看醫(yī)生,能夠有效幫助患者避免走彎路。

應用場景日漸廣泛

夸克健康以阿里巴巴通義千問大模型為基礎,走出了一條面向垂直場景的深度工程化路線。

其核心突破之一,是構建出“慢思考能力”。該能力融合了鏈式推理與多階段臨床演繹路徑建模,驅動模型在面對復雜醫(yī)療問題時,能夠分階段、層層深入地推導出最終回答。

構建慢思考能力的前提,是擁有高質量推理訓練數(shù)據(jù)。據(jù)了解,夸克構建了“雙數(shù)據(jù)產(chǎn)線+雙獎勵機制”的工程體系。一方面,將醫(yī)學數(shù)據(jù)劃分為“可驗證”和“不可驗證”兩類,分別對應診斷類任務和健康建議類任務;另一方面,在訓練方法上引入“過程獎勵模型”和“結果獎勵模型”,分別評估模型推理鏈的合理性與最終結論的準確性,顯著提升模型的臨床可解釋性和推理一致性。

該體系還設計了多階段強化學習流程,包括冷啟動數(shù)據(jù)的嚴格人工校驗、多輪樣本篩選與難度遞進訓練策略,以及用于防止“高分投機”的作弊識別機制。通過真實醫(yī)生標注、“問—思—答”整組數(shù)據(jù)驅動強化學習,大大強化了這一健康大模型的能力。

對于患者來說,通過AI的判斷,可以減少醫(yī)患信息差,讓他們更積極地參與到診療過程中。

趙存忠曾經(jīng)是一名醫(yī)生,如今做健康大模型的運營負責人,對于患者的需求有了新的看法。他發(fā)現(xiàn)隨著AI本身的發(fā)展,用戶尤其是年輕人表達出的需求正在變化。在醫(yī)療大模型出現(xiàn)初期,用戶搜索的都是簡單問題,但在深度思考技術發(fā)展之下,用戶表達越來越精細?!八麄冊跊]去醫(yī)院之前已經(jīng)與AI交流過,這樣可以迅速了解醫(yī)生在說什么,降低了溝通成本,有效提高了醫(yī)療資源的可用率和普及性。”

醫(yī)學生們也受益于健康大模型。趙存忠介紹,醫(yī)學生在夸克上面搜索了很多問題,比如專業(yè)的量表、泛知識的內容、臨床指南等。很多醫(yī)學生在做規(guī)培或者實習階段,遇到臨床案例分析時,會大量用到大模型的搜索功能。

隨著能力不斷提升、應用場景日漸廣泛,更多健康大模型正逐步走出“模擬考場”,走入真實診療場景。

編輯:韓夢晨
相關閱讀:
高新視頻 更多
高新熱榜 全部本月
編輯推薦 更多

友情鏈接: 政府 高新園區(qū)合作媒體

Copyright 1999-2025 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5

電信與信息服務業(yè)務經(jīng)營許可證060344號主辦單位:《中國高新技術產(chǎn)業(yè)導報》社有限責任公司