機器學習系統是推進工業界落地人工智能應用不可或缺的助力。在過去幾年中,機器學習發展迅速,但其應用需要大量的人工干預,表現在:特征提取、模型選擇、參數調節等方面,而AI技術人員的嚴重短缺導致模型部署困難重重。與此同時,AI落地是將AI服務與場景相結合,一個好的機器學習系統不僅要懂AI,更要懂行業。以金融場景為例,在風控環節中普遍存在信息不對稱、成本高、時效性差、效率低等問題,傳統的風控手段已經難以滿足需求,銀行等金融機構紛紛開始基于機器學習搭建智能風控體系。
為解決AI技術人員短缺以及AI落地困難的問題,百融云創深耕人工智能技術,結合自身的技術優勢與行業經驗優勢,專注金融場景推出了ORCA自動機器學習平臺。ORCA融合算法原理與工程實踐經驗,完成“一站式”自動機器學習,可以提供從數據準備、模型開發訓練、模型評估、模型部署的全流程建模。相對通用的機器學習框架,ORCA提供超過200種算子來解決金融場景復雜數據情況,實現模型推理速度3倍提升,建模到部署周期可縮短50%。
目前,百融云創ORCA自動機器學習平臺已經在公司內部投產于建模平臺,服務于數據分析、精準營銷業務的各個建模環節,承載每日數億級的模型推理服務,幫助金融機構極大提升建模效率。具體來看,此次全新推出的自動機器學習平臺實現了如下幾個產品功能升級:
ORCA_ML: 可解釋&可視化的交互式編程建模產品,支持數據準備、模型開發訓練、模型部署。
ORCA_AML:端到端的AutoML建模產品,支持多目標、遺傳算子、超參調優全流程自動化建模。
ORCA_Serving:快速模型部署框架,實時模型推理性能較通用框架提升3倍。
一、ORCA_ML機器學習框架算法
依據機器學習算法原理,提供封裝良好的處理數據的工具,并且可以搭建出機器學習建模全流程。作為良好的機器學習框架,ORCA_ML具備了可重用、可擴展、可落地三要素,表現在:方法論不會因為數據變更而失效,可以循環往復地嘗試;靈活可自定義設計,滿足定制化建模需求,例如自定義算子;可以構建出可解釋,可交付的模型應用,滿足企業級模型落地需要。同時,ORCA_ML具有如下特點:
領域特定:專注于金融領域常用算法,目前已有200+算子;
性能高:算子經過深度優化,例如毫秒級別的變量分箱;
效率提升:相對于傳統建模,周期縮短50%;
擴展性好:能夠自定義算子;
因此,ORCA_ML著力于成為一個在金融領域,覆蓋風控、營銷、反欺詐全場景的機器學習框架,使其既可以輕易上手,又方便擴展,并且可以快速訓練模型并落地應用。
二、ORCA_AML自動機器學習框架
具備機器學習能力與自動訓練能力,能夠運用機器學習算法完成數據建模,并保證一定的效果,在極少人工干預下仍舊能夠完成模型訓練。同時具有如下特點:
1.低耦合度:可以替換機器學習算子庫,算子超參數空間等;
2.性能顯著: 多目標優化效果顯著,在線上業務上提升10%;
3.簡單易用: 兩行代碼自動訓練模型;
4.擴展性好: 可以自定義交叉驗證方式, 生命周期函數等;
通過分析試用信用卡(類信用卡)、線下消費分期等業務,從KS、AUC和時間方面均體現出ORCA_AML在實際測試中的優勢。其中KS值越大,表示模型能夠將好、壞客戶區分開的程度越大;AUC值越大說明模型準確性越好。具體對比如下:
三、ORCA_Serving機器學習模型部署框架
通過代碼生成技術將復雜的機器學習全流程轉換為可以執行的高級程序語言,在特定場景下獲得了巨大的性能提升。為了與傳統的Sklearn方案對比,百融云創人工智能專家針對模型打分部分進?評測。具體實驗?案如下:
1. 使?同樣的3w樣本在不同情況下建模;
2. 對于同?個模型使?不同的?案導出模型部署?件;
3. 對10條樣本每條進?單條打分預測(模擬線上環境),統計打分耗時,取單條打分平均耗時作為性能評測指標,單位為毫秒;
在建模過程中設定不同樹的棵樹,?較在簡單模型和復雜模型情況下不同?案的打分性能。
在建模過程中選取不同的?模變量數量,?較不同?模變量維度的打分性能。
結果顯示,ORCA相比于傳統的Sklearn,在打分性能上有了顯著的提高,也更易于在線上環境部署。
作為國內領先的獨立AI技術平臺,百融云創自成立以來,在“成為金融行業基石”的愿景推動下,制定了幫助金融機構實現數字化、智能化轉型的戰略。百融云創人工智能實驗室負責人表示,將以此次全新推出的自動機器學習平臺為契機,不斷提高技術研發水平,強化科研成果應用,提升創新服務意識,始終引領金融行業的科技創新方向。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。