SPM 數(shù)據(jù)挖掘預測分析軟件是由美國 Salford Systems 公司開發(fā)的以**的機器 學習算法為**的預測分析工具。
1. SPM 數(shù)據(jù)挖掘預測分析軟件的主要模塊說明:
CART(分類和回歸樹)是一基于斯坦福大學和加州大學伯克利分校的統(tǒng) 計學家 Leo Breiman、Jerome Friedman、Richard Olshen 和 Charles Stone 開發(fā)的原 CART 代碼的決策樹軟件。CART 具有高速、精確和容易 使用的特點,并自動對數(shù)據(jù)提供深入的探索研究,產(chǎn)生高度可理解的預測 模型。
TreeNet 是新一代高速,錯誤容忍,并具有**常精確性的預測建模工具。 TreeNet 僅需要較少的數(shù)據(jù)準備工作,巧妙的處理有缺陷的數(shù)據(jù),自動適 應缺失領域,并且進行廣泛的自檢,使得模型應用于新數(shù)據(jù)時的效果也得 到保證。TreeNet 模型經(jīng)常由 500 或更多的小決策樹組成。清晰的圖表概 括了每個關鍵變量對于結(jié)果的影響。
GPS 算法
廣義路徑追蹤 (GPS)算法是對傳統(tǒng)線性回歸的一次性提升。GPS 是利用機器學習的方法建立數(shù)百,甚至上千個候選線性模型,然后自動選 擇出其中較優(yōu)的模型。模型效果會比傳統(tǒng)線性回歸提升很多。這個算法在 其它任何主流的數(shù)據(jù)挖掘產(chǎn)品中都沒有提供
Data Binning(變量快速自動化分組)
變量離散化工作對于數(shù)據(jù)挖掘項目成功至關重要,而這個過程通常需要 許多手動處理工作,因此非常耗費時間。智能變量分組能夠高度自動化的 對變量進行智能化的分組,大幅度減少手動工作,提升建模效率和模型性 能。
Quick Impute(變量缺失值自動化填補)
變量的缺失值填補工作一直以來需要大量的手動工作。本功能模塊能夠 利用自動化對變量的缺失值進行快速填補,使得缺失值處理輕而易舉,瞬間即可完成之前需要大量手動介入的缺失值填補工作。此模塊包含兩種缺 失值自動化填補方式,**種方式是經(jīng)典的均值、中位數(shù)、眾數(shù)的填補方 式,另外一種較為智能的方式是利用預測模型對缺失值進行個性化的填補。
Logistic Regression(邏輯回歸)
提供經(jīng)典的邏輯回歸算法,可以與 TreeNet 結(jié)合使用,快速建立高精度的 邏輯回歸模型。
Regression(線性回歸)
經(jīng)典的較小二乘線性回歸模型。結(jié)合自動化功能,可迅速進行單一變量 的線性相關性測。結(jié)合 TreeNet 模型,可快速開發(fā)精確的回歸模型。
2. SPM8 的優(yōu)勢和特點:
1. 高精度。雖然已有開源和其它的商業(yè)軟件根據(jù) Jerome H. Friedman 的論文實現(xiàn)了 GBM 算法,但在算法實現(xiàn)細節(jié)上會與 Friedman 的版本存 在差異,因此在精度上也會有所差異。TN(TreeNet)是一由 GBM 發(fā) 明人源代碼開發(fā)而成,歷經(jīng) Salford Systems 十幾年來的不斷迭代優(yōu)化, 使用者*對 GBM 內(nèi)部算法有深入了解,就能通過簡單操作獲得高精度 的模型。在開源軟件中,使用者要對算法細節(jié)有非常深入的了解,不斷對 GBM 進行調(diào)試才可能獲得接近 TN 模型的精度。而在 SAS EM 中實現(xiàn)的 GBM 無論在運行速度和精度上都與 TN 存在差距。根據(jù)中國建設銀行數(shù)據(jù) 分析中心較近的測試結(jié)果,在 KDD2009 比賽公開數(shù)據(jù)集上,如果對所有 15000 個變量進行建模,SAS EM 的 GBM 會出現(xiàn)崩潰死機的情況,而且將 TN 篩選后的 100 多個變量在 SAS 內(nèi)運行后得到的模型 AUC 僅為 0.62, 而在 TN 中可到達 0.9 左右。
2. 高緯度特征快速篩選。SPM 中的 TreeNet 是目前較快的 GBM 算法。 非常適合高緯度快速變量篩選。同時 SPM 中的 GPS 是目前較快速的正則 化回歸算法,支持廣譜正則化路徑搜索策略(包含 Ridge, Lasso 以及 Compact),可作為快速衍生特征篩選的重要工具。
3. 友好的用戶界面,提供強大的自動化建模。SPM 用戶界面設計簡潔明 了,操作簡單,*比較強的專業(yè)背景就可以輕松使用。SPM 中的 AUTOMATE 自動化建模技術可輕松完成兩大**功能:自動化模型優(yōu)化 以及機器學習模型的置信度檢驗。
4. 熱點追蹤。非常適合于信用風險和反欺詐場景。通過 CART 調(diào)整 PRIOR 設置來進行熱點追蹤,大范圍搜索各種可能的規(guī)則集,快速識別關注人群 的特征,對傳統(tǒng)邏輯回歸模型可產(chǎn)生有效補充。
5. 新穎的聚類和異常點分析。CART 巧妙利用監(jiān)督學習算法進行無監(jiān)督 學習。CART 可給出了解釋性很強的規(guī)則形式的聚類;利用 CART 中的 AUTOMATE UNSUPERVISED 夠找到樣本中的異常點,可被用于反欺詐等 場景。
6. 快速邏輯回歸模型開發(fā)。SPM 提供兩種快速邏輯回歸模型開發(fā)方式, 大幅度降低手動工作。**種方法是首先通過 TreeNet 進行變量篩選,然 后利用 Spline 對原始變量進行快速變形,然后再將變形過后的衍生變量 放入邏輯回歸就能得到捕捉非線性信號的邏輯回歸模型,通常這樣的模型 比利用手動分組得到的邏輯回歸模型較加精確。*二種方法是利用 Data Binning 將變量快速進行自動化分組,然后將分組后的數(shù)據(jù)集直接導入 GPS,即可得到特征篩選后的邏輯回歸模型,可作為邏輯回歸模型開發(fā)的 基準參考模型。
3. SPM 給客戶帶來的**
較低的使用門檻
幫助企業(yè)應對大數(shù)據(jù)人力資源問題。熟練掌握 R、Python、SAS 建模編程能力的大數(shù)據(jù)分析人員國應匱乏,人才成本水漲船高!SPM 高度自動化、智能化的使用方式大幅度降低了建模人 員的門檻!*編程,*深厚的建模理論基礎和經(jīng)驗,經(jīng)過較 短時間的訓練就能建立*級的模型!
較高的大數(shù)據(jù)分析效率
面對越來越龐大的數(shù)據(jù)量,以及日益復雜的數(shù)據(jù)分析任務,建模 人員希望能夠有高度自動化的分析技術來幫助他們從繁瑣低效 的手動工作中解放出來
SPM 建模工具的內(nèi)核算法非常巧妙,能夠顯著減少建模人員在 數(shù)據(jù)預處理方面的工作量(數(shù)據(jù)預處理在建模時會占用分析人員 幾乎 80%以上的時間)
高效快速的分析技術將使得組織具有較快的應變能力
建模人員能夠在相同時間內(nèi)完成更多高質(zhì)量的建模任務,節(jié)約人 力成本,并且把更多精力花在商業(yè)問題的理解和定義、新數(shù)據(jù)源 的獲取、構建衍生新特征以及設計策略等較加有**的創(chuàng)意性工作上
較精確的模型
識別更多高風險客戶,尋找到更多具有的客戶
較加精準的進行客戶關系維護(比如較加準確的預測即將流失的 客戶)
SPM 的較佳模型通常比*使用經(jīng)典統(tǒng)計技術建立的模型性能 高 5%到 15%。只要有可能,高性能的模型顯然較加有吸引 力!SPM 建立的較佳機器學習模型通常能夠接近給定數(shù)據(jù)的極限 預測精度,因此可作為 benchmark,對別的模型進行性能對比評測!
北京天演融智軟件有限公司(科學軟件網(wǎng))是SPM軟件在中國的授權經(jīng)銷商,為中國的軟件用戶提供優(yōu)質(zhì)的軟件銷售和培訓服務。
詞條
詞條說明
Aptech了解到因為COVID-19的影響,目前大部分人需要長時間在家工作。為了幫助GAUSS用戶繼續(xù)工作,Aptech提供了免費的GAUSS 20臨時許可證。也就是說GAUSS用戶可申請免費臨時遠程使用許可了。?誰可以申請?擁有GAUSS軟件或有權使用機構版的所有人。?持續(xù)多長時間?我們正在密切觀察情況變化。在接下來的14天里,我們將提供60天的臨時許可。?如何獲
PRSIM數(shù)據(jù)格式轉(zhuǎn)換軟件介紹
使用PSCAD仿真大型電力系統(tǒng)的情況產(chǎn)生了將第三方軟件數(shù)據(jù)導入PSCAD的需求。因此我們開發(fā)了PRSIM(Power System Importer),一個簡單易用的工具,花較少的時間和精力,將標準網(wǎng)絡數(shù)據(jù)導入PSCAD中。?通過自定義實現(xiàn)靈活性PRSIM嚴重依賴PSCAD的開放式架構理念,PRSIM界面使**用戶能夠靈活地設計適合他們需求的自定義模型庫。PSCAD的V4.6和V5主庫中
快速準確地創(chuàng)建醫(yī)療保健經(jīng)濟模型,這樣你可以做出良好的醫(yī)療決策,TreeAge Pro包含了所有需要的模型。TreeAge Pro分為Healthcare和Business/Law版本。TreeAge Pro HealthcareTreeAge Pro for Business/LawHealth EconomistsAttorneysPhysiciansBusiness AnalystsPharm
Hydro GeoAnalyst(HGA)環(huán)境數(shù)據(jù)管理學習
本次在線課程旨在向您介紹如何使用 Hydro GeoAnalyst 進行數(shù)據(jù)管理。 參與者將了解數(shù)據(jù)管理和關系數(shù)據(jù)庫的基礎知識,以及如何有效地管理從收集到分析和報告的數(shù)據(jù)。?該課程結(jié)合了互動在線講座、與我們經(jīng)驗豐富的講師的討論,以及通過一系列密集的練習來接觸 Hydro GeoAnalyst,這將有助于您理解本軟件。在本課程中,您將收到一整套課程筆記,包括講座和練習、Hydro GeoA
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
電 話:
手 機: 18610814366
微 信: 18610814366
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com
公司名: 北京天演融智軟件有限公司
聯(lián)系人: 張經(jīng)理
手 機: 18610814366
電 話:
地 址: 北京海淀海淀上地東路35號院1號樓3層1-312318、1-312-319
郵 編:
網(wǎng) 址: turntech88.b2b168.com