雷鳴對話王俊:人工智能與基因技術能否打開醫療的“大黑盒子”?

ADVERTISEMENT

北京大學“人工智能前沿與產業趨勢”第六講由碳雲智能創始人兼CEO、原華大基因CEO王俊老師親臨現場,與北大人工智能創新中心主任、百度七劍客之一、酷我音樂創始人雷鳴老師就生命科學相關問題展開了宣講和討論。本文為您帶來王俊與雷鳴的精彩對話。

編輯整理|Xtecher

網址|www.xtecher.com

微信公眾號ID|Xtecher

雷鳴:我也是聽得全神貫注,在座的我想大部分都是計算機、數學,比較偏計算學科的,對於這種生命科學的東西,包括我也真的是小白來上課,學到了太多太多的東西。剛才我覺得講的特別精彩,說實話也是我第一次去這麼深入的理解生命本身的複雜性,以及我們說從穿透這種表面去看生命一些根本的東西,包括基因蛋白,包括很多生命的基礎特征。我剛才感覺的話,王俊講這些東西,包括基因、蛋白,我有一個理解,以前我們的醫療,更多是檢驗性的。比如說有這個病,中醫會通過各種嚐試來治療。現在感覺有了基因技術、蛋白檢測等這一系列東西之後,覺得在因果中間加了一層數字的特征描述,使得我們可以更精準的去了解這個事情。比如我做了這個事情影響了這些因素,所以這些因素會導致這個病可能就不得了。我們感覺相當於結滿了生命的體系,而不是以前感覺一個大黑盒子,就像神農嚐百草,“亂試”的感覺,我不知道理解的是不是對。

王俊:我其實覺得人工智能系統可能未來還是個黑盒子,或者是一個黑白相間的盒子,有一些已有的知識可以幫助你做很多決策,然後它會同時也是個黑盒子,因為它是個學習系統,本身也確實它要嚐百草,才能知道結果。所以其實我倒這個事情的關鍵不在這兒,現在很多生命科學學習過程,它沒有真正理論化,生命科學有三個階段,第一個階段叫“觀測科學”。生命科學很長一段時間是觀察科學,通過不斷觀察,提出一些理論。

後來從觀察科學到做實驗,創立各種假說,再利用實驗去驗證。再往下一步我認為一定是理論充實,我們開始用計算機,用數學來描述生物學。那個時候的預測將會特別準確。比如說我當時做七個神經元的神經網絡去模擬瓢蟲吃蚜蟲這個過程,我其實不知道它最後進化出來什麼意思,但它弄出來那個博士之後,我再去研究的時候發現,它其中有三個神經元進化成了記憶神經元。它記住了前一步和前兩步準備吃的蚜蟲,我吃著了,所以我就決定我下一步接著轉圈,我沒吃到我就接著隨機走。所以像這種東西是我通過它最後形成的那個,再反過去再學習他的生物學,再找到它的解釋。所以就更精確。我覺得未來可能會有這樣的一種研究方式,就是它不是我的一個come from nowhere 的理論,可能現在是一種數據導向。數據導向的意思是說我也不知道哪個基因跟糖尿病有關係。我能做的一件事情就是把一千個糖尿病人的基因測了,再測試一千個正常人。然後我比較,看到底哪個基因不一樣,對吧?這是數據導向。我認為未來的生命科學再往前走,可能是人工智能的模型導向。就是說數據導向已經不夠了,數據會在不斷的訓練模型,科學家會去研究那個模型為什麼會這樣。

雷鳴:我們今天講的是一個生命科學,包括跟AI之間的關係,現在我們最近就是講的AI,AI為什麼最近特別火,特別爆發,包括阿法狗,一般我們歸結為海量數據,對吧,比如說動輒幾十萬,幾百萬的運算能力,GPO把人定型等等,再加上這個深度神經網絡算法,當然這個算法並不是最近才出來的,而是最近才被海量數據給激活的。剛才其實我們在分析這個事情的時候聊到很多的東西,第一個你講到在以色列八百人的實驗課題,控製血糖,還包括您講到了您這幾個創始人一起做實驗,基本上是幾個人。這個跟我們現在理解的人工智能,因為有一點點的不同,也就是這一波,我們感到人工智能更多的是海量數據,而今天講的感覺就是數據量並不是海量,當然也不是完全單個。就這兩者之間我們開放地探討一下,為什麼說少量的數據也能學到非常顯著的一些東西。

王俊:這取決於問題不同,比如說對單界面的研究隻需要一個家系就行了。什麼叫家系呢,就是一個family哪個遺傳並怎麼過來的家系,幾個人他的基因我就可以把單基因發掘出來。但是對身高、智商這樣的東西,可能要上百萬人。也就是說你研究問題的情況不一樣,它需要的數據點和維度是不一樣的,這是第一個。第二個你看不同信息量的時候不一樣,比如說我看基因,人跟人之間的基因差異是千分之一,這個差異已經很小了。

雷鳴:對,非常小。

王俊:所以呢你需要很大的樣本量才能找到真正的有符合生物學意義的差異。很多時候能查到微生物的差異就沒那麼小,比如說我的里邊有一千種微生物,你的體內有一千種微生物,這個差異就非常大了。所以我們去發現腸道維生素跟糖尿病之間的關係, 400人就可以了。所以你看它這種層面不同數據的時候它又不一樣,你把它全部綜合起來它要多少數據點夠,取決於算法本身和取決於研究的問題的複雜性本身。有的可能就是容易,像我七天不吃飯我對幾個人,因為非常短的一個時間之內非常劇烈的一個變化,所以我的身體狀況,我體內的那種酶上和下是非常劇烈的,你想想七天沒有吃飯了,體內是一個非常大的變化。你只有幾個人都是這樣變的,可能不需要那麼多人,但是你要研究細一點就不同了。如果我想做一個能用的學習系統,我認為需要一百萬人,就是如果我們有一百萬人的完整的數據,可能我們能做出一個能用的人工智能模型。

雷鳴:我覺得這個你講得特別好,我把它翻譯成計算語言再理解的這個問題。比如說像剛才血糖也好,其實現在我們很多的生物醫學的研究,我們叫“顯著性相關”,剛才提到了糖尿病能控製到90%。現在其實感覺上在生命醫學里邊,很多它背後的這種嚴格的治病邏輯這些東西,還搞得不是太清楚。所以其實我們這麼理解,比如人臉識別,因為這個人臉識別是個高度複雜的,就是我們人在把自己培養到三四十歲的時候我們才到剛才說的一個比較正常的水平。其實需要海量的數據,因為它的複雜度很高。假如說我們做一個視頻叫男女識別,這個時候可能需要的數據量就不需要很多了了。我的理解剛才講了,我們在生命科學里邊,很多的事情,剛才像糖尿病控製這個事情,因為以前我們並沒有針對很多人花很多的精力去非常深入地研究,我們剛才講的起點上的話呢它並不是說有很多你做了很久了,我們要去超越它,而是說把這個事情從一定的程度上先找到顯著性,先用一個簡單模型。其實剛才講數據量對應的叫複雜模型,我們說阿法狗下棋,這個是個高度複雜的,因為它從前往後要走一百多步,這樣就需要很多參數,因而需要海量數據。剛才我們理解到比如像單基因,它可能最後就是要確定的一個參數,所以這樣的話它的數據量可能就不需要那麼大,因而這個顯著性只要找準了,就很快能把它找出來,當然你要是找的數據是錯的,那可能也找不出來了。所以我覺得理解生命科學的話,相對來說我覺得很多對於它追根溯源的研究其實還在早期階段,很多的顯著相關性,包括這些控製的話,因此我們可能是一個過程,我們從局部一些對人類特別重要的解決問題開始做起,其實數據量並不是特別大,慢慢地走向,剛才像王俊講的,一百萬人甚至是幾百萬人,我們把那個人的綜合的複雜系統給它再建立起來。

王俊:其實生命是一個極其複雜的系統,之所以沒有那麼多數據的一個核心原因也是因為每項技術都很貴,如果那個時候做一個人的基因一億美金,你怎麼可能有一百萬人的數據,不可能的。我剛才講就一千美金你也不可能,一千美金一百萬的數據十億美金,是非常大的一個東西,可能十美金的時候那是一個挺合適的。所以很多的跟這個還不太一樣,我們拍照片,那些數據基本沒有什麼成本。

雷鳴:以前膠片的時候還挺貴的。

王俊:現在很多可以做,我們現在收集生命數據,程序複雜、價格昂貴,而且後續對數據的很多分析也是一件非常複雜的事,你拿到可用的都很難,你還得判斷很多的東西。所以對我們來講也想摘一點容易的桃子,所以你會去define一些容易的question,那我不需要那麼多太大的樣本量,我能夠先做點東西能夠有用,所以很多時候是處於狀態下的存在。

雷鳴:這個事情使我想起了一個是剛才咱們提到基因測序的成本立刻腦子里一想就是說關於我們提到的摩爾定律,就說所謂的計算成本大概是以每兩年,同成本的計算能力每1.5到兩年翻一翻,其實也就是說同計算能力的成本每一到兩年會跌一半。咱們那個基因測序的成本下降每年在過去的話,大概每年能降多少?

王俊:這個他們的說法叫超摩爾定律,這是兩年超過十倍。但是現在已經開始放緩了,降得非常快,但是現在在做這件事情的時候,已經發現其他的成本,就是測序這件事情,測序本身的成本已經隻占到總成本的20%。

雷鳴:那其他的成本一般指的是什麼呢?

王俊:前面的數理成本,你從血液拿出來就要的。最後到什麼地步呢,很多無創從唾液里邊采DNA,我那個唾液十美金,你可能那個測試比如說我最後就可以搞得很便宜,我幾十美金我就可以測一個人的基金,運費多少錢,計算機處理要多少錢,人工要多少錢。

雷鳴:我聽起來這個事情有一個很有意思的想法,干脆既然這麼便宜就在我們說的7-11超市的出口處就放一個基因測序序列。

王俊:一定會有的。

雷鳴:2C產品。

王俊:現在美國已經開始在做這個事情,我們現在也在找渠道,而且我們現在做基因檢測全都免費,就是所有人都不需要錢。

雷鳴:大家能給你報個名嗎?所以我覺得剛才講到這個事情是我想到說,其實咱們說這次的人工智能的爆發的話,剛才講的因為各種摩爾定律,我們叫計算能力的摩爾定律加上數據增長,數據增長基本上也是全球的數據,大概以每年50%的速度在複利增長,所以的話在這個增長過程中它將達到一個臨界點,這個臨界點的出現是一個量變到質變的工程。所以我們覺得根據剛才咱們分析生命科學,會不會也會有一個點在未來不遠的時間會導致生命科學相關的數據出現爆發,進而引爆生命科學?

王俊:我自己個人覺得雖然我做這個行業,我自己沒有那麼樂觀,從人類基因的計劃開始,在九十年代末的時候開始做,到今天2017年,基因檢測這件事才真正成為一門生意,就它才真正開始逐步推廣。而只是在幾個方向上推廣,比如說醫院里邊才開始推廣開對孕婦的檢測,腫瘤檢測都沒有推廣開。我自己去做了20年的打算,我未來20年會做這件事,我希望我能夠在5年之內有一兩個應用能夠走向老百姓,但這個過程它一定不是眨眼間就做成的事,它可能比任何我們知道的一些下圍棋,語音識別,圖像識別這樣的項目都要複雜和長遠。它還涉及到很多的問題,比如隱私問題,倫理問題,監管問題,等各種各樣的東西,因為你畢竟在做的是一個醫療項目,說實話你語音識別聽錯一句話沒事兒,你現在做的事是數據生命健康的東西,你搞錯了一個,人家沒癌症的你給搞成癌症了,這個事情是很大的事,所以它很多的要求不是那麼簡單的。

雷鳴:我覺得其實還好,因為我對醫療也了解一些,醫療基本上誤診率都是很高的,最好的醫院基本上也有20%。

王俊:應該這麼講,人犯錯可以,機器犯錯不行。無人駕駛汽車是典型的案例,人去開車出錯或許沒事兒,如果一個無人駕駛汽車出去開車出車禍,那是個大事。

雷鳴:這塊我們大體上有一個這種感覺,它這塊還沒有具體量化,你覺得以人的話,因為人這個變化尤其跟生命相關,它非常謹慎。所以基本上我們感覺的話叫量級定律,比如說剛才說的這個自動駕駛,如果它跟人相比,就是百萬英里它出事兒跟人一樣的概率,這個自動駕駛肯定是不讓開的。但如果說它能降低到人類的十分之一的時候,基本上這個時候大家就會慢慢地接受,就跟那個複印機一樣,其實它都會失勢的。

王俊:再有一點跟自動駕駛有很多相像之處,自動駕駛本身有一個長尾效應,所謂長尾效應的意思就是你可以把99%的情況都可以預測到,但是就是那個1%複雜,而且就那個1%千奇百怪,你也不知道什麼東西出問題。在生命科學里面有一個最出名的話,叫在生物學里面唯一不例外的就是永遠有例外。因為生命科學本身我們就是一個例外,我們當年那個猴子變人的時候,當然不是所有的猴子突然間站起來變成人了,而就是那一隻猴子站起來變成人了,然後我們就是成人了。所以人本身就是一個試錯產物,因為它本身就是個例外,所以它的所有生命科學里面幾乎沒有一樣東西是沒有例外的,因為進化的基礎,就在於是生命演化的基礎就在於不斷試錯,容錯,進化,演化的過程,所以它一定有例外。所以你說我做一個模型百分百的能夠怎麼著,你很難聽到,包括在醫學里邊就診斷說我可以有一個東西百分百的診斷,這個話幾乎沒有人說的,因為說了肯定是錯的。

ADVERTISEMENT

雷鳴:這肯定的,因為我們都有經驗,我也經曆很多朋友的,他們得了病之後在北京各大名醫院,然後看一圈之後發現各個醫生的觀點還不一樣,所以最後很痛苦,當然這個呢我們說很多的東西都值得再進一步的研究和探討。回到剛才講到這種所謂風險的東西,因為我們看到因為基因的技術現在進展得很快,我們可以去編輯甚至生成基因。那這里邊的話我們明確看到第一就是轉基因食品這個事情,就是對於我們吃的這些的話,我們做一些基因基礎如何讓它高產,抗病毒,甚至說增加營養這一塊。這一塊的話其實有很對立的兩派觀點,一派可能就覺得說我們就不能吃轉基因的,一派說轉基因在一定的嚴格測試還是可以接受的。這塊我不知道您大概會怎麼看這個事情?

王俊:轉基因是一種基因技術,首先它是基因技術,就跟基因編輯,合成生物學是一樣的,轉基因是把一段外源基因轉到這個物種里邊去,基因編輯是把一個基因的成分改掉,合作生物學是重新合成一個東西,這個從本質上來講都是基因技術。所以對於一個基因技術去反對有點沒有意義,就是對於一種技術去反對是沒有意義。但事實上大家說轉基因的時候不是在說技術,在說轉是什麼東西。你想象一下如果轉基因水稻轉的是另外一個基因的,另外一個水稻的基因就不存在安全性問題。但是你想象一下如果把一個SARS病毒的基因轉到水稻里,那不管怎麼說你們都不會吃,心理都挺別扭的。你比如說那個時候的所謂轉基因抗蟲棉,那是個什麼東西呢?那是蘇雲金杆菌里邊的一個毒蛋白轉到了棉花里邊,棉花有了這個蛋白之後它就抗蟲,因為蟲子吃這個蛋白就會死掉,對蟲子來講是一個神經毒素。那它接下來的問題是它對蟲子有毒,那對人有害沒有?

科學家來驗證一個東西對人是不是比較安全,我們做的事情只有幾個,第一呢做細胞學實驗,看它是不是有問題,把人的細胞放到那兒。第二做老鼠實驗,再不行做猴子實驗,你最不可能就是做人的實驗,你不可能說我把一群人分在這兒做我們的轉基因,這群人都別轉基因了,然後看看你這兒有什麼變化,這個事情它不好做,也不能做。

即使做了也沒有用,為什麼呢,因為公眾對這件事情的認知不是說你這邊轉基因弄完了,明天看你有什麼反應,就完了,不是。那是得50年以後,這50年你要是誰得癌症,這個東西是不是你當時是轉基因的問題。可能這個也不夠,因為如果我生個孩子,這個孩子未來得癌症證明有沒有關係。所以就出現了標準不統一的問題,就是科學家去評價一個東西是不是安全,老百姓認知它是不是安全,這個有個差。有個差之後政府就出來了,政府會說那它必須有標準,什麼叫安全什麼叫不安全,你政府有製定一條標準,一種做法就是說我全面不做轉基因了,我也不想弄點麻煩,夾在兩頭中間我不做了就完了,歐洲很多國家也不做了,俄羅斯也不做了。OK,你要是覺得你能夠解決糧食問題,飲食問題都沒問題,歐洲不做可以不做,美國是沒辦法不做的,因為它那麼多農民,包括除草劑什麼的,它沒有那麼多人工去天天除草,不可能的,很多的必須做。做了政府就會出一道規則出來,FTA就有一套規則,你有規則我就簡單了,就跟吃藥一樣,有的藥是吃死人的,各種副作用的,但是你EFDA有一個標準出來,我得按照這個標準,我過了這個標準就是政府可以上市。

我自己個人認為有一件事情很重要,這個是每個人可以自己選擇,比如說政府定了一個標準,假設在美國,中國也一樣,這個食品通過的這個標準,在超市里邊賣。我覺得不應該是現在這樣標一個非轉基因食品,而是你到底哪個是,哪個不是,你可以自己選擇。這是你自己的選擇,你用戶或者是每一個老百姓有知情權,你可以有你自己做決策的權利,我可以選擇我信科學家的方式,我可以信政府的公信力,我也可以選擇。有的人說我不想吃別的,我就想弄點有機食品,別的地方的雞我都不想吃,因為抗生素太多了,豬的身上抗生素太多了,水稻現在含鉻的東西太多了,你看中國有多少水是沒有重金屬汙染的,吃到稻米里邊是什麼樣的。中國現在吃的雞,豬,牛,有多少是抗生素,這種抗生素會怎麼樣,它會有這種東西,然後你自己選擇。

雷鳴:行,那我們的對話部分就到這里,下面我們還有一個開放的觀眾提問環節,包括網上直播,微信群的觀眾們。第一個問題我跟你讀一下,作為我們的天才男神,你是如何做到這些成就,這個成就指的是說別人發一些,沒事兒就高興蹦到天上,你說哎呀已經不想出了,幾十還是幾百的這個。問題是說你是怎麼做出這麼多有價值的論文,又同時不耽誤其他的工作生活呢?

王俊:我剛才想吹個牛,說完了以後很開心,我跟雷老師是差不多,我比他大一屆,你看我比他顯得年輕。

雷鳴:因為我沒研究生命科學,你看他天天的研究什麼,當然曬傷的臉六天還是五天。

王俊:我就是想說這個問題,我們天天研究這個玩意兒的,還不把自己可以這個多做一點,那個多弄一點,保持一個狀態。雷老師不一樣,天天對著計算機,很枯燥。

雷鳴:以後我得多向你學習。還沒有回答問題呢,作為男神你是怎麼平衡的,你不能光攻擊我。

王俊:其實也沒有,其實誰都年輕過,在年輕的時候都拚命過,每天工作多少個小時不睡覺,我覺得每個人都有,在座的各位肯定都一樣。等你歲數大了,管的人多了,權也多了,錢也多了,那你就可以用資源。你就不一定要像雷老師十個學生,一個學生給他賣命,每個學生只能出一篇文章,有一百個學生你就可能一百篇文章,你看他能動用多大的資源來做多少事,雷老師動用的資源頭髮少一點。開玩笑歸開玩笑,我認為生命科學這個領域,我剛才講的這個領域它是一個大科學,所謂大科學的意思就是它會有很多人一起在一個平台上做很多事。所以它具備很多規模化的特征,所以它實際上做的東西是很不一樣的,當你掌握了一個技術之後,我剛才講了,可能發表的東西都是通量化的東西。

雷鳴:流水化工作。

王俊:你不能講流水線。但它很多的東西確實具備某種技術突破以後研究對象不同所帶來的福利。

雷鳴:說法換了一下。

王俊:你研究基因和糖尿病的關係,研究基因和高血壓的關係,研究基因和腫瘤的關係,腫瘤里邊又分了很多癌症,肺癌,這顯而易見。不僅僅是基因測序這個行當,很多的行當都是一樣,你能看到你有一個技術突破之後,但這個東西它是一波一波的,你過完這一波,該做的做完了,就這麼多癌症,下來之後你可以找新的技術方法手段,再把一個東西推到一個新的層次和高度,你只能是做這樣的事情。最難的實際上是理論性的東西,比如說進化論,進化論出來所有的人到現在都在談進化論是怎麼回事。就是像這樣的東西就不是說我發多少篇論文,其實根本就不算是。你會想到你能不能有可能有一些理論性的這些東西,而這些東西本身能夠帶來更深遠的一些影響,就不僅僅是在技術突破所帶來的很多科學發現,很多時候能夠有一些新的指導科學發展進程的一些理論,我覺得這種東西,我個人對這個東西是最感興趣的。

實際上我那個時候自己在做腸道微生物和各種疾病關係的時候,我就會覺得那樣的發現就很重要,就是你能做到腸道維生素本身跟糖尿病有什麼大關係,以前不知道,現在知道了,這個問題是挺好的東西。這個概念是通的,所以你就會覺得這是一個挺好的東西,這就比你用同樣的測序技術,測完基因,再測植物,再測熊貓要好一點,你會覺得這個是一個更加有意義的東西。

雷鳴:其實你講得也特別好,我最近講深度學習也是到這兒弄一下,到那兒弄一下,反正這個技術突破之後它的各個應用場景上確實也能發出一些不錯的論文,但是相對技術本身的突破它可能是最根本性的。

下面有一個同學問了,現在你這邊的研究方向是基因,我們叫digital life研究基金,包括實際的東西影響數字化的生活。現在看到另外一個方向,現在最近也挺火的,包括Google等等的也有很大的投入做智慧醫療。這兩個方向將來它會有一種什麼樣的方法,它們會交彙在一起嗎,還是說它們兩個會競爭的往前走,怎麼去影響人類的生命或者是健康這一塊?

王俊:你是指我現在做的這個東西和IBMWatson的區別,還是指IBM Watson和Google之間的區別?

雷鳴:問得好,那邊大體上那條思路是基於經驗主義,基於大數據里邊分析挖掘基因診斷的關鍵特征什麼的,像IBM Watson它可能看了小孩的病例,十分鍾說這個就是某個什麼病,就趕快治就行了。它那邊更多病不是說所謂更深層次的理解人的這種,像你做的這種東西,理解未知的世界。而更多更像是說把這個大量的經驗給它集成起來,進而能夠創造出一個比老醫生還老醫生的醫生出來。大概就是這兩套路我們想知道可能在未來的演進過程中,它們會怎麼去互相做。

王俊:雷老師已經回答得很好,基本上就是這個意思,IBMWatson用到的數據一般是醫院的大數據,醫院里邊的病曆數據。一般來說從結果去manage結果隻會是診斷,會做得更好一點。因為它其實都是結果,都是醫院各種各樣的檢測結果,結果做結果,就是診斷的做得更好。但是對於生命更本源的一些東西的理解,很多不是現在有醫療的那些大數據,更多的是從原因的角度來做的。比如說糖尿病,在醫院里邊你去能拿到糖尿病的更多是檢測,用藥,診斷的這些數據,但是我們現在做得更多的基因,腸道微生物,飲食,運動,這些數據它能夠更好地從源頭管控糖尿病,最好是不讓他進醫院,不要產生IBM Watson用的數據。最好是能作為這樣,實在不行進去了,也得用占有基因,蛋白和各種各樣的,從它的成因出發來尋找更好的解決方案。所以我認為它是更根本的一個東西,或者說它的解決和這個數據模型的搭建能夠讓人更好地去管理它的數據成品,而不僅僅是診斷它的疾病,這是一個很關鍵的東西。

雷鳴:我覺得這點的話王俊其實說得我覺得比我問問題的時候清晰得多了。現在總結一下,其實現在我們看到的所謂的智能醫療,智能醫療它做得再好,把所有的小醫生都變成老醫生,然後都變成專家,這個當然有好的地方。我們其實現在的基層醫療它的水平其實不高的,尤其是第三世界國家不高,智能醫療能讓他們都變成全世界最優秀的醫療生水平。但是最優秀的醫生他還有解決不了問題,他還有不理解的事情,那這個事情的話王俊正在研究。他其實研究的話是一些我們還未知的領域,一些背後的邏輯這些。

王俊:但我自己其實覺得,甚至包括疾病狀態,我自己覺得就IBM Watson,包括我們現在做的一套系統都是屬於西醫,有些過於碎片化,中醫里邊有兩個東西很值得做的,第一是系統化,第二是個性化,中醫是非常系統地去觀測一個人,也是非常個性化地去做這個。我覺得就從疾病診斷來講,我認為現在比如說對糖尿病還是IBM Watson給你現在的數據做一個更好,可能也不足夠,你應該從它的個體的基因,各種各樣的所有大數據基礎之上,可能能夠出來一個更好的,即使是診斷都是更好的。因為它是更系統化的去描述這個人的數字生命狀態,這比用一個單一的診斷指標去判斷一個疾病一定也好很多,隻不過以前沒有這樣的數據。

雷鳴:這個完全認同,這個事情我們回過來再講的話,其實這跟我們說工業革命之後的分工,不斷細化有關係,其實現在醫生的話,過去我們中醫基本上就一個人什麼病都看,現在西醫他越來越專業化,導致在專業方向上進展非常快,進而喪失了一個人能有全科的診斷能力了。就是說所謂的真正專家就在一塊鑽得很深,包括我們的學校也是一樣的,過去還有所謂的大哲學家,我們回去看達芬奇這種人,牛頓這種人,基本上很多家都在他身上背著,但現在的話我們很難看到我們基本上跨領域的專家了。剛才講我們人類其實也是有極限的,我們的知識,包括我們學習能力的話,一旦伸進去之後,如果說把很多深度的東西全部都這個人學,他學不會,就一萬個小時以內,想成一個專家花一萬個小時,一萬個小時就一個專家,不可能成為多項專家最後再整合起來。或許我覺得這是人類的極限,將來的話有你這個東西的話,數字化之後,你的運算能力沒有極限,會導致的話,包括我們對智慧醫療,剛才講,它如果往後走的話,很有可能。因為智力沒有極限的話,會導致說它重新會把多個分開的科室重新再綜合起來,然後去做診斷的時候。前一段就是通過演的這個底模去判斷糖尿病幾期,這個好像就是一個有點跨一點科學的東西。

王俊:我自己其實覺得這種人類極限的說法我不是很認可的,因為你現在的人工智能做的就是讓人類上另外一個集成化。因為你很多的這些,以前你花很多的功夫去做的,你現在不一定會花很多的功夫去做,也沒有必要花很多的功夫去做。你可以讓他們幫你去做,以前還要看看地圖很費勁,現在不用,GPS直接幫你規劃了。所以我覺得這個歸到另外一個階段,但假設哪一天我們做出來的人工智能超越了人本身的智能,我自己認為人類應該非常驕傲。因為人類就像猴子變成人一樣,猴子是不知道人是什麼樣的,我覺得如果有一天真做出來了,人類應該非常驕傲,因為人類是第一個主動地創造出比自己的智慧更高一級物種的物種,這是很偉大的一件事。

雷鳴:這個所謂的我們叫強人工智能之爭,這個在學術界也是有一些探討,大部分人認為全人類在可見的短期不大會發生,最後可能我們院長洪小文博士,可能在最後,應該是倒數第二次調一下課,可能會談到這方面的東西,我待會兒會跟他做一個交流。我們再說一個問題,有本書叫《未來簡史》,提到人工智能和人機之間有某種配合。但恰巧的話,我想就是今天應該是,刷屏的ElonMusk又做了一個很神奇的事情,然後把後面腦子和機械之間要做的對接。就是你對這種進展,剛才我們講純粹從人的本體去講,我們人通過科學,我們可以更健康,更長壽,更聰明。但現在的話對於這種應,我們更往前,更科幻感的,比如說人和機器的某種意義的一體化,而這種一體化簡直都進入到生物層面的一體化,這個方面你有一些什麼樣的想法和觀點?

王俊:我現在做的這套learning system,其實做的就是打穿這個矽碳兩界,因為如果我們是碳基因,那個是矽基因,我們身體這個疲勞是一個精準計算的機器,從我們這麼想而已,我今天喝完這瓶水身體什麼反應,這是很精準的反映,它不是一個隨機過程。我今天喝完水,我此時此刻身體就是這樣反映,它不可能是一個隨機的一個東西。而這樣的東西隨著它越來越深入地了解,而且很多的不管是納米技術,還是生物技術,各種各樣的發展。這個疲勞是可以換的,這個疲勞所有的東西都是可以換的。唯一沒有搞明白的就是意識的形成和意識產生的基礎和它用什麼樣的方式能夠去替代,因為涉及到很多我們這個領域經常講的問題了,記憶的上傳,意識的上傳,很多這種問題。碳雲未來20年不研究這個事,碳雲未來年會研究它疲勞的事,就是這個身體本身,血糖怎麼弄的,血壓怎麼回事,心髒怎麼運作,很多是做這種疲勞本身。但我們會開始涉及很多認知疾病,比如說老年癡呆,帕金森,自閉症,很多這些東西它是有很強的物質基礎,就我們知道它這里邊。比如說自閉症的東西,我們曾經做過一點點的研究,自閉症很有意思,我們每一代生孩子,這個孩子跟我們有60到100個基因突變,你每一代除了父母一家以外還有跟你有60到100個基因突變。我們以前認為這個基因就會在基因組成隨機分布,因為我有31字母,這60個字母肯定是隨機組合。最後發現所有這些數據其實是有集團分布的趨勢的,你去看這些集團分布的地方,都是大腦發育基因。再有一個信息就所有的像我們生孩子的年齡,也就是說你歲數越大,孩子的得自閉症的風險就越高。

雷鳴:OK,沒有說晚生就越聰明的。

王俊:但有時候自閉和聰明其實也說不清楚,所以很多這種東西它是有很多的數據基礎。所以通過對這些東西的研究,很可能會構築未來研究腦科學意識層面東西的一個更有意思的一些基礎,我覺得未來20年還是儲備期,20年以後在這個事情上我認為會像今年開始我們講digital life一樣,在20年以後的那個時候我們會講digial mind,計算機能不能像人一樣思考?在那個時候會有比較突破性的進展。

雷鳴:現在包括國家,歐洲會有大腦對話,中國政府現在也是花了很多錢在嚐試去理解大腦,我覺得對大腦的理解可能也會加速。這插播一個挺有意思的,我在數年前當時很感興趣腦科學,大家覺得腦科學應該在哪個系?生物系,是吧,心理系。在心理系,我以為在生物系,生物系早早發現他的DNA解剖,然後就找醫學,醫學天天研究腦子生各種病,都不是我想要的,最後發現在心理系。因為現在的心理系的話,我覺得有點從社會科學向自然科學的轉變,就是這種從歸納領域變成真正研究的科學領域在做。那我覺得時間原因,特別感謝王俊老師。

ADVERTISEMENT

王俊:我再多說一句,碳雲現在在招人。

雷鳴:對,一定的,歡迎大家踴躍報名,實習什麼都行。

王俊:實行留下來工作,做研究干什麼,是很好的機會,你們可以在網上查得到十大創新的公司,前九個都是騰訊,阿里這些的,還有就是碳雲太耘,所以這是個很酷的公司,如果你們對這個東西感興趣,會很好的,會很有意義在做一件不一樣的事,全世界沒有人做過,挺好。

雷鳴:行,我們以熱烈的掌聲感謝王俊老師的分享。

━━━━━

封面來源:網絡  排版:陳光  校對:伍小仙

━━━━━

Xtecher官網平台現開通認證作者,

有發稿意向的個人或媒體,可聯系微信:jueshao121

(添加好友請注明公司、職位、事由)

點擊 | 關鍵詞 | 查看對應內容

Xtecher 精品文章

 人 物 

人工智能

快樂智慧 雷鳴 | 出門問問 李誌飛

達闥科技 黃曉慶(上下) | Rokid 黃伽衛

馭勢科技 吳甘沙 | 格靈深瞳 趙勇 

地平線 方懿 | 彩雲天氣 袁行遠

車和家 李想丨51獵頭 劉維

Face Think 楊鬆帆|中科視拓 山世光

深鑒科技 汪玉|越疆科技 劉培超

Kneron Inc 劉峻誠|MINIEYE 劉國清

地平線 黃暢|三角獸 亓超

極限元 馬驥|NXROBO 林天麟

靈喵 韓龍|雲腦科技 張本宇

創來科技 陳茂|輕客智能 龐琳勇

虛擬現實

諾亦騰 戴若犁 | 大朋VR 陳朝陽

ADVERTISEMENT

Ximmerse 賀傑 | Pico 周宏偉

焰火工坊 婁池 | HTCVR 汪叢青 

七鑫易維 彭凡|影創科技 孫立

所思科技 羅子雄|淩宇智控 張道寧

Dexmo 穀逍馳

大數據

中網數據 孫遠根 | 昆侖數據 陸薇

永洪科技 何春濤 | 華農天時 溫晗秋子

GrowingIO 張溪夢 | ThinkingData 呂承通

神策數據 桑文鋒 | 海雲數據 馮一村

佳格數據 張弓 | 普林科技 王儲

Datatist 宋碧蓮 | 職品彙 龔才春

星環科技 孫元浩 | 人才易 葛昊

航空航天

零壹空間 舒暢 |天儀研究院 楊峰

大健康

人本健康 陳恂 |Haplox 許明炎

奇雲諾德 羅奇斌|基準醫療 範建兵

Fintech

數庫科技 劉彥|Ping++ 金亦冶

abc Fintech 楊永智|奇點機智 宋嘉偉

芥末金融 彭晨| 藍海智投 劉震

海鯨金融 丁華昆|資易通 盛潔儷

其他科技創業者

科幻作家 郝景芳 |Vinci 宋斯純

禾賽科技 李一帆| 諸葛io 孔淼

奧圖科技 葉晨光| 瀚諾半導體 張誠

51獵頭 劉維|騰展科技 魏鬆祥

墨刀 張元一 |Phresh Amit

品類 唐十三|布比 蔣海

Plug and Play Saeed Amidim

集智俱樂部 張江|NVIDIA 黃仁勳

 特 寫 

人工智能

禾賽科技,加入無人車大戰

如果太太說“今晚請使用機器人吧”

奇點汽車強勢啟動智能駕駛布局

透視Rokid:兩度斬獲CES大獎背後

語音助手“小不點”可行嗎?

人工智能:付不起的工資,搶不到的人巨頭之爭,無人駕駛尖峰對決

唇亡齒寒,人工智能一場艱難“拔河”

2016中國最具投資價值人工智能項目Top 100 

直播鑒黃:堵塞出口還是守護高貴

國內智能駕駛Top20

無人駕駛若干問題

渡鴉科技被百度收購的過程

創業群像

“買買買”狂潮下物流巨鏈的前生今世

品類定律:1年成為1億美元公司的背後

華強北困局:離席的人,守望的人

區塊鏈創業者們:黎明之前的那一刻

不開源的區塊鏈都是“耍流氓”

華人對衝基金鼎新資本

ADVERTISEMENT