保觀 |聚焦保險創新
進入公眾號,可點擊右上【···】設為星標哦
毫無疑問,大模型應用正在加速進入2.0階段。
(資料圖)
在1.0階段,ChatGPT以強大的語言交互能力完成了一次屬于AI的破圈,也讓大模型進入了大家的視野。
雖然C端用戶的熱情在逐漸冷靜下來,對長于技術應用開發的中國市場來說,大模型在各垂直領域的落地才剛剛開始,這顯然是一條更實用、商業模式更清晰的路線。大模型的2.0階段,重點就是要讓大模型在業務流程中真正發揮作用。
我們可以明顯感受到垂直領域大模型的“爆發”:亞馬遜推出了智能家居全新的Alexa語音助手,背后有大語言模型支持;百度發布了中國首個“產業級”醫療大模型“靈醫大模型”。
盤點目前已經發布的大模型,金融、醫療健康是兩個非常重要、廣泛的應用賽道。
最近,醫療保險科技公司金仕達衛寧推出了專門用于解答醫保和商業健康險領域專業知識、報銷、理賠相關政策的大語言模型——“知問”,希望為客戶打造一款醫保與商保領域專業的智慧顧問。
圍繞“知問”和大模型的相關話題,我們對金仕達衛寧副總經理、產品臨床中心兼創新業務中心負責人王尚前進行了專訪,一起聊了聊他們對大模型的理解和應用,希望能為行業提供一些基于實踐的參考經驗。
深耕醫保與商保,“知問”讓信息問答化繁為簡
金仕達衛寧成立于2012年,是醫療保險和商業健康險數字化風險控制解決方案與服務提供商,業務包括醫?;鸨O管、醫保支付方式管理、醫?;疬\行與審計管理、商業健康保險智能風控、醫療機構精細化管理等,致力于通過運用大數據、人工智能等技術,服務于醫保管理部門、商業保險公司及醫療機構,打造智能化的醫療保險、商業健康險風控新模式。
在醫保領域,金仕達衛寧針對醫保管理推出多種一體化解決方案,包括醫保智能監控解決方案、醫?;疬\行與審計解決方案,以及宏觀決策大數據分析解決方案等。從2019年開始,金仕達衛寧參與建設和運維了國家醫保局醫保信息平臺醫保智能監管子系統、基金運行及審計監管子系統、宏觀決策大數據分析應用子系統、運行監測子系統、數據中臺,并為全國20多個省的醫保管理部門提供相關服務。
在商保領域,金仕達衛寧則提供了健康險智能核保與風險防范、智能核賠與反欺詐、人群畫像與風險模型、惠民保、保險產品精算、營銷推廣、長護險照護管家等服務。
經過十多年的發展,金仕達衛寧在醫保和商保領域已經有豐富的專業積累。
此次推出的“知問”專注于嚴肅、復雜的醫保和商保領域,是一款智能問答系統。關于為什么做“知問”大模型,王尚前告訴我們,首先是因為Transformer帶來了技術突破,使自然語言的應用有了更好的效果。他的團隊在使用ChatGPT時也發現了通用大模型的一個缺點,即在回答專業垂直領域問題的時候非常欠缺。因此,需要有垂直領域的大模型在通用大模型產品無法應對專業領域問題的時候,填補這一缺口。
金仕達衛寧在服務客戶的過程中發現,這幾年醫保政策變化比較多,藥品、耗材、醫療服務項目醫保報銷目錄和報銷比例更新很快,普通人要準確了解這些繁多瑣細的報銷細節和監管要求,需要掌握大量相關知識。而商業健康險產品范圍廣,從住院手術、門診治療到重疾保障,每一項都有獨特的保障內容、限額和免賠規定。普通人經常會被眾多的保險產品、復雜晦澀的保險條款搞的暈頭轉向。
基于上述這些痛點,金仕達衛寧在醫保領域有超過十年的經驗,醫保知識庫規則庫積累了大量的醫藥學知識、醫保政策規范、醫保管理規范、法律法規、醫保信息業務編碼和監管規則等,可以用于醫保垂直領域大模型的開發。
“知問”的主要功能是向醫保經辦人員、醫療機構工作人員,以及商業健康保險購買者和保險代理人提供不受時間和空間限制的高質量、化繁為簡的信息咨詢和決策參考服務。
在醫保領域,“知問”可以回答一系列與醫保相關的問題,如醫保政策規定、異地報銷比例、醫保目錄中支付條件的限制、違規場景以及案例等,幫助用戶快速獲取最新、最準確的醫保信息。
在商保方面,“知問”能夠回答保單、理賠、保險條款等問題。王尚前介紹到,“知問”主要服務于惠民保,因為惠民保有很強的地區性差異,很多參保人也不了解惠民保的具體作用,惠民保的運營方很需要有工具可以輔助解釋參保人的問題。
醫保知識問題的測試集中,“知問”回答的準確率達到80%;面對復雜的商保條款,其回答準確率達到86%。對于95%的查詢,“知問”都能在3秒內給出回答。涉及深度計算或復雜條款分析的問題,“知問”也能在5秒內給出回答。
“知問”大模型能滿足不同機構和用戶的需求,可以植入任何前端場景,例如醫保局、醫院等機構的網頁、手機端的APP、公眾號、微信小程序等,可以在一個月內部署上線應用。
垂直領域模型怎么做?抓住“三要素”
從技術角度來看,“知問”的專業表現主要基于三個要素:合適的基座模型、優質的專業數據和先進的訓練方法。
王尚前介紹,“知問”選擇了一些開源大模型作為基座模型,例如Meta公司的LLAMA模型、百川、清華的ChatGLM等。這類模型有很多預制規則,能夠確保問題回答有更好的精確性,“知問”對這些基座模型選型應用,確保最適用于專業垂直領域。在訓練過程中,金仕達衛寧也設置了很多醫保、商保領域的預制規則,以提高回答的效率和準確性。
在此基礎上,“知問”加入專業醫保和商保領域的數據進行訓練,如多年積累的醫藥學知識、全國各地的醫保政策規范、醫保管理規范、法律法規、醫保信息業務編碼和監管規則等,做到能夠應對全國不同城市客戶的需求。在商保領域,與惠民保相關的知識比較簡單;相較而言,醫保的知識較為復雜,這不僅是由于醫保的專業性強,還因為各省、市的醫保政策差異較大。金仕達衛寧積累的醫保相關知識顆粒度可以細化到地級市。
垂直領域的模型,金仕達衛寧傾向于把模型做“小”,做專業化,針對客戶需求做個性化。即以自身的數據積累為基礎,再針對專門的監管機構、各地區的醫保經辦等人員,從需求出發,利用他們提供的有針對性的、非公開的數據進行訓練,例如某一類別的醫保政策,既避免了硬件資源的過度消耗,同時更實現了其模型在這一領域的精細化和精準度,最終確保模型的效果。
大模型的開發都離不開大量優質數據的支持,“知問”的數據主要來源于金仕達衛寧在醫保和商保領域十幾年的積累,有豐富、權威且可靠的語料。這些長期業務中沉淀下來的數據經過了實際驗證和用戶反饋,加之金仕達衛寧參與了國家醫保局的醫保知識庫和規則庫建設,本身有較強的專業性、針對性,基本不需要額外投入大量成本進行標注。
為了保證語料的高質量,金仕達衛寧對知識的獲取、驗證和維護過程進行了嚴格的把控,并采用先進的知識表示、編碼和維護技術,確保語料的權威性和可靠性。在業務中,金仕達衛寧也在不斷進行專業數據的調整和更新,確保了全國范圍內的統一性、通用性和標準性。
金仕達衛寧在數據使用上采取了謹慎的策略,由于其服務領域的高度專注,只選擇與醫保和商保相關的信息來訓練模型。
接下來,金仕達衛寧還準備進一步做一個政策知識庫,通過呈現結果加信源的方式,提供更精準的信息和更好的體驗。
為了提供更準確的回答,“知問”不僅依賴于豐富的知識資源,還采用了前沿先進的訓練技術和專業的業務場景對齊,這里的關鍵技術包括專業知識的預訓練、應用場景的任務指令訓練、全面精準的知識搜索、上下文學習、思維鏈推理等。
以任務指令訓練為例,這是一種讓模型在接收到特定指令后,能夠按照指令進行操作的訓練方式。這類訓練通過設置提綱,確保“知問”能夠理解同一問題的不同組織方式,既包含一般用戶的通俗問法,也包括從業人員的專業問法,從而提高在具體應用場景中的準確度,這也是目前“知問”模型的一大優勢所在。
同時,“知問”非常注重法律合規和用戶數據安全,通過多種措施全力保證用戶數據的安全與隱私。
大模型的未來:垂直領域應用將大顯身手
通用大模型燃起了生成式AI的烈火,而得益于專業性、針對性以及為特定行業創造的價值,垂直領域已經成為接下來大模型應用的新方向。
垂直大模型的一個主要優勢在于增強特定領域應用的能力。通過利用特定領域的專業知識進行訓練,這些模型可以深入研究某一領域的復雜性,成為專業人士不可或缺的工具。例如,在醫療領域,大模型可以幫助診斷罕見疾病,提出個性化治療計劃,并及時了解最新研究和動態。
垂直大模型的另一個優勢是具有定制和適應性的潛力。通過定制訓練數據,并針對特定領域微調模型,可以最大程度上確保模型符合某個領域的獨特要求和術語,從而增強用戶體驗,確保更準確的輸出。此外,微調可以持續改進,并適應不斷變化的行業趨勢,變得更加有效和可靠。
但是,開發垂直模型也有一定的難度。王尚前告訴我們,金仕達衛寧在開發“知問”模型的過程中,主要的難點在于基座模型的選擇和語料設計。
目前,開源基座模型眾多,如何選擇最適合醫保和商保垂直領域的模型,對每種模型效果的評估、具體的評估方法,都帶來了困難。另外,人員成本、機器配置也都帶來了額外困難,例如,比較眾多開源模型中選型耗費的代價非常大。
另一點就是語料設計,一問一答并不能達到預期的訓練效果,需要設計考題考綱、問題變種等模式。在這基礎上,在輸出環節再加入一些限制規則,才能確保模型的效果。
在功能方面,除了“知問”目前切入的專業知識問答領域,王尚前也指出,AIGC還可以提高數據統計的效率,而且金仕達衛寧也會考慮在未來加入核保、核賠等風控應用,滿足客戶的需求。
整體而言,王尚前很看好大模型的發展。和過去的技術不同,大模型在業務流程中的應用使用戶可以通過自然語言與這些新工具交互,不需要再學習專業的技術語言,這也是新一波人工智能技術賦能效率提高的關鍵。而且,我們每天在產生大量數據,有了這些要素的“打磨”,大模型的功能會更加強大。
關于大模型接下來的發展,未來的核心在于客戶需求的競爭,要足夠好用,獲得用戶端的認可。為了滿足客戶的需求,會出現越來越多的垂直領域大模型,當然,這些大模型的功能也會更加專業化、精細化。
大模型應用的關鍵之一在于對數據的掌握,垂直領域的專業大模型更是如此。在這一點上,保觀認為,從金仕達衛寧的“知問”大模型可以看出,掌握數據積累的垂直領域參與者擁有更多機會。
雖然大模型要實現成熟、廣泛的應用,以及摸索出可持續的商業化模式還有待時日,但可以看到,通用大模型的發展解決了很多基本問題,很多企業也已經行動了起來,在借助大模型降本增效的探索之路上持續進步。我們也會持續關注行業的最新動態,挖掘更多優秀經驗,期待與大家有更多交流!
點擊“閱讀原文”,購買保觀最新行業報告
關鍵詞: