除了降價,阿裡雲把本年度第一波重要釋出放在了「人工智慧」上

ADVERTISEMENT

阿裡雲的腳步已經越邁越遠了。

作者 | 龜途慢慢

昨天,阿裡本年度第一次重量級的大會——雲棲大會·深圳峰會——在深圳舉行,會上,除了阿裡雲總裁胡曉明直接對「馬化騰和他的團隊」表示了不滿之外,更值得注意的恐怕還是阿裡雲在會上釋出的幾款新產品、新戰略和新技術。

在雲端計算市場本身,阿裡雲宣佈新開服的華北 3 資料中心降價 20%,以及 CDN 大陸地區的產品組合降價 35%,並且還釋出了包括高效能計算 ECS 產品、新的資料中心,以及新的儲存產品等多款新產品。除此之外,ET 醫療大腦、ET 工業大腦,以及新的機器學習平臺 PAI2.0 都是阿裡雲在人工智慧方面的新舉措。從中,我們也可以看出阿裡雲除了繼續鞏固自己在國內雲端計算市場上的優勢地位之外,在新技術的開發與應用上也逐漸開始發力了。

阿裡雲總裁胡曉明 ET 醫療大腦與 ET 工業大腦

首先,全場最引人關注的莫過於 ET 醫療大腦項目了。因為幾乎所有人都承認,醫療市場將會在未來爆發出極大的潛力,因此有很多大公司都在佈局這個領域,比如國內的百度以及國外的 IBM 等公司。而阿裡雲通過釋出 ET 醫療大腦,也宣佈正式進入醫療 AI 領域。

阿裡雲方面表示,經過一年多的研究訓練,人工智慧 ET 已具備多項醫療能力,可在患者虛擬助理、醫學影像、精準醫療、藥效挖掘、新葯研發、健康管理等領域承擔醫生助手的角色。而它的背後則是阿裡投入了大量資源,採用深度學習技術,通過海量的資料作為示例來訓練機器完成特定任務。通俗地說,就是讓計算機通過學習病例資料來提升醫術。由於可以 24 小時不睡覺,同時處理成千上萬項任務,ET 的學習進步速度大大超過人類。

阿裡雲人工智慧科學家閔萬裡說:「在多個病症的測試中我們意識機器不僅能夠完成任務,而且在某些方面做的和人類醫生一樣好。ET 完全有資格成為醫生的助理。」

除了能大幅提升醫生的工作效率外,ET 醫療大腦還嘗試從根本上戰勝癌症。通過和華大基因合作,ET 對大量肺腺癌病例的 DNA 序列進行分析,尋找致病的關鍵基因突變。

ADVERTISEMENT

「我們將 ET 醫療大腦設定為一個開放的人工智慧系統。除了阿裡雲的人工智慧科學家投入到研發當中,我們更希望能吸收外部精良的演算法與醫學經驗,這樣 ET 才能更快地成長為一名高階醫師。」閔萬裡說。

同時,阿裡雲還宣佈聯合英特爾、LinkDoc 啟動天池醫療 AI 系列賽,第一季對早期肺癌診斷髮起挑戰。

此外,阿裡雲也在雲棲大會深圳峰會上正式釋出了 ET 工業大腦,讓工業生產線上龐大的鋼鐵軀體擁有智慧大腦。阿裡雲總裁胡曉明表示,我們希望利用人工智慧技術發揮「中國智造 1%」的威力。中國製造業如果提升 1% 的良品率,意味著一年可以增加上萬億的利潤。

在這個部分,阿裡雲舉了蘇州能源巨頭協鑫光伏的例子。這家廠商將標準化車間所有埠的資料傳入工業大腦,隨後通過人工智慧演算法,對所有關聯參數進行深度學習計算,分析出與良品率最相關的 60 個關鍵參數,並搭建參數曲線,在生產過程中實時監測和控製變數。

據胡曉明表示,目前,通過 ET 工業大腦的幫助,協鑫光伏的生產良品率已經提升 1 個百分點,每年可節省上億元的生產成本。

閔萬裡透露,目前 ET 工業大腦已經在流程製造的資料化控製、生產線的升級換代、工藝改良、裝置故障預測等方面開展工作。ET 的目標是成為一個不斷吸收專業知識的「大腦」,可以指揮各種類型的工業軀體。「我們希望用 21 世紀的機器智慧,幫助人類更好地指揮 20 世紀的機器」。

新的機器學習平臺 PAI2.0而另一個重要的人工智慧領域的新釋出就是機器學習平臺 PAI2.0。相比 1.0 版本,PAI 2.0 有多項重大更新,除增加了 100 餘種演算法外,更重要的是對主流深度學習框架 TensorFlow、Caffe 和 MXNet 的全面相容。

此次 PAI2.0 的重大升級主要包括以下方面:

1、全面擁抱開源

ADVERTISEMENT

PAI2.0 程式設計介面完全相容深度學習框架:Tensorflow、Caffe 以及 MXNet,使用者隻需要將自己本地編寫的程式碼檔案上傳至雲端就可以執行。

Tensorflow、Caffe 和 MXNet 是目前全球主流的深度學習開源框架。Tensorflow 開源演算法和模型最豐富;Caffe 是經典的圖形領域框架,使用簡單;MXNet 分散式效能優異。

對於底層計算資源,PAI2.0 提供了強大的雲端異構計算資源,包含 CPU、GPU、FPGA。在 GPU 方面,PAI2.0 可以靈活實現多卡排程。

藉助這些框架以及強大的計算資源,使用者能非常方便地就可以將計算任務下發到對應的分散式計算機群上,實現深度學習模型訓練與預測。

2、更豐富的演算法庫

PAI2.0 提供 100 餘種演算法元件,涵蓋了分類、迴歸、聚類等常用場景,還針對主流的演算法應用場景,提供了偏向業務的演算法,包含文字分析、關係分析、推薦 3 種類別。

「演算法全部脫胎於阿裡巴巴集團內部的業務實踐,所有演算法都經歷過 PB 級資料和複雜業務場景的錘鍊,具備成熟穩定的特點」,阿裡雲首席科學家周靖人說。

3、支援更大規模的資料訓練

PAI 2.0 新增了參數伺服器(Parameter Server)架構的演算法。不僅能進行資料並行,同時還可將模型分片,把大的模型分為多個子集,每個參數伺服器隻存一個子集,全部的參數伺服器聚合在一起拚湊成一個完整的模型。

其創新點還在於失敗重試的功能。在分散式系統上,成百上千個節點協同工作時,經常會出現一個或幾個節點掛掉的情況,如果沒有失敗重試機製,任務就會有一定的機率失敗,需要重新提交任務到叢集排程。PS 演算法支援千億特徵、萬億模型和萬億樣本直至 PB 級的資料訓練,適合於電商、廣告等資料規模巨大的推薦場景。

ADVERTISEMENT

阿裡雲首席科學家周靖人說,在過去的一年時間裡我們協助客戶落地了多項重大的人工智慧應用。但人工智慧要想真正成為成為普惠科技,需要一款更加通用的生產工具。PAI2.0 正是為此而生。

人工智慧綜合了多門學科的技術,對人才要求極其高,除了懂統計學中各種複雜的機器學習演算法,還要懂實現邏輯以及分散式架構理論。PAI 可以大幅的降低人工智慧的門檻以及開發成本。

從操作介面來看,PAI 沒有繁瑣的公式和複雜的程式碼邏輯,使用者看到的是各種分門別類被封裝好的演算法元件。每一個實驗步驟都提供視覺化的監控頁面。在深度學習黑箱透明化方面,PAI 也同時整合了各種視覺化工具。

PAI 的基礎設施和計算框架建立在阿裡雲飛天計算平臺之上,通過雲的模式大幅降低了計算成本,支援 MR、SQL、MPI、PS、GRAPH 等多種分散式計算框架,對於底層的 CPU 和 GPU 計算機群可以靈活呼叫。

兩年時間裡,PAI 在阿裡巴巴內部已經被廣泛使用。以淘寶搜尋為例,搜尋結果會基於商品和使用者的特徵進行排序。通過使用參數伺服器,淘寶可以把百億個特徵的模型,分散到數十個乃至於上百個參數伺服器上,打破了規模的瓶頸。

在阿裡雲的客戶當中,廣東省氣象局對 PAI 的使用最具代表性。他們使用 PAI 對臨近預報 (0-3 小時內) 的降雨量進行建模預測。通過拖拽操作就完成了資料清洗、特徵工程,非線性機器學習演算法訓練以及結果評估的工作。

PAI 還被應用在各種前沿科技領域。華大基因聯合阿裡雲科學家,正使用 PAI 對肺腺癌患者基因進行分析,試圖尋找到導致肺腺癌病發的關鍵基因突變。

本文由極客公園原創

轉載聯絡 [email protected]

科技

» 極客公園

ADVERTISEMENT