腦控加人工智慧自動譜曲 耳機這麼玩有沒有落地的可能

ADVERTISEMENT

「 日本一支研究團隊開發了一種機器學習裝置,其為一種人工智慧耳機,能夠跟蹤聽眾的情感狀態,創造出為聽眾量身定製的音樂,從而改善聽眾的情緒,激發新的情緒。」

人工智慧耳機?如今人工智慧已經成為最熱的創業方向之一,因此對於有人想將人工智慧和耳機結合在一起並不感到意外,不過第一反應是用人工智慧為使用者提供語音歌曲搜尋等服務,而日本的這支研究團隊則打破了雷鋒網()編輯對目前人工智慧耳機的認知。「 跟蹤聽眾的情感狀態」、「 量身定製音樂」這兩點從目前的技術水平來說都是很難達到的。

從後面的介紹得知,他們是利用腦電波來跟蹤聽眾的情感狀態,耳機上裝有感測器,感測器能夠檢測腦電波,並識別腦電圖。而量身定製音樂則是通過人工智慧完成,首先,AI系統能夠收集使用者大腦的音樂資料,建立個性化音樂的“情感音樂模型”;在開始譜寫音樂之前,AI系統學習使用者的腦電波,並能識別腦電波與各種音樂之間的關係;最後,AI系統合成為使用者貼身打造的定製音樂,來刺激使用者的精神狀態。簡單來說就是,通過監測你聽不同音樂的腦電波反應,比如高興還是沮喪,人工智慧為你打造能讓你輕鬆愉悅的音樂。而這裡就涉及到兩種技術,腦電波控製以及人工智慧譜曲。

腦電波控製

腦電波控製,即利用腦電電極片收集腦電訊號形成腦電波,並通過相應演算法“翻譯”出當中含義,最終實現識別和控製。早在19世紀50年代,學術界就開始了腦電波的研究,如今腦電波的技術已在醫療領域運用了超過二十年,用來治療癲癇等腦部疾病的病人,在2004年巴西世界盃上下肢截癱者諾平託正是依靠意念控製機械外骨骼踢出第一球的,而在民用行業這幾年也開始有一些應用。然而,大腦的情緒狀態非常複雜,之前就有很多研究指出,與特定情緒相關的腦電波似乎會隨著時間的推移而改變。因此,還沒有人找到一種能夠利用腦電波清晰可靠地識別情緒狀態的方法。

目前,民用的腦電波控製裝置只是粗略地將收集到的原始腦電訊號資料分離出四種波段,分別為α(阿爾法)、β(貝塔)、θ(西塔)、δ(德兒塔),而它們分別對應人腦的不同狀態,包括疲勞、興奮、沮喪等程度。

ADVERTISEMENT

業界採用了三種腦電波收集方式:(腦電極)植入式、半植入式以及非植入式。前面兩者需要把電極內建頭骨之下,與大腦皮層接觸。最後一種是將電極與頭皮接觸。相應地,前兩者的精度高幹擾少,而最後一種訊號弱、幹擾多等。目前emotiv、EEGSmart、BrainLink等國內外企業的產品都是頭戴式裝置,即第三種方式。也正因為如此,這類產品目前都難以有較大的市場,目前都集中在心理健康領域。

人工智慧譜曲

上面這首曲子是Experiments in Musical Intelligence (音樂智慧實驗,EMI)研發的人工智慧音樂作曲系統創作的一個模仿巴赫風格的讚美詩作品。EMI由美國加州大學聖克魯斯分校的音樂教授兼作曲家大衛·科普(David Cope)開發,它譜寫的巴赫風格作品在1987年被首次演出,驚豔四座。兩年後聖克魯斯巴洛克藝術節上EMI創作的模仿巴赫風格作品與巴赫原創作品同臺演繹,直到科普告訴觀眾哪首曲子是巴赫的原創,大多數人都無法給出正確的答案。

EMI創作的原理為分解與重組,即從一名作曲家的作品中識別出不同類型的重現結構,然後以新的排列來複用這些結構,依此產生一份“同樣風格下的”新作品。你可以想象 EMI 在學習了貝多芬的九首交響曲後,自行譜出《貝多芬第十交響曲》的情景。

EMI雖然不是最早的人工智慧音樂作曲系統(最早的演算法作曲(Algorithmic Composition)甚至可追溯到1957年化學家和音樂家Lejaren Hiller用演算法生成了絃樂四重奏伊利亞組曲),不過很長時間內被稱為最先進的人工智慧音樂作曲系統。如今,在人工智慧大熱之際,不少大公司的實驗室都在研究人工智慧譜曲。其中,索尼巴黎電腦科學實驗室研究人員蓋坦·哈傑裡斯(Gaetan Hadjeres)與弗朗索瓦·帕切特(Francois Pachet)開發的名為“DeepBach”(深度巴赫)的神經網路在經過對巴赫音樂學習訓練後可以譜寫出與巴赫風格高度相近的曲目;去年6月,Google的Magenta項目通過神經學習網路創作出了自己的第一首歌曲——一首時長90秒的鋼琴曲(不過,這首鋼琴曲背景內的打鼓聲和管絃樂編曲並不是由這一演算法生成的,而是後期新增的);百度深度學習實驗室則發明瞭一種基於輸入圖片生成曲譜的自動化系統,即輸入一張圖片,系統會自動生成一段符合該圖片內容和意境,且符合韻律和節拍的曲譜。

ADVERTISEMENT

百度深度學習實驗室看圖作曲實驗成果

由此可見似乎人工智慧作曲並非一件難以完成的事情,但雷鋒網發現這個方向的創業項目並不多。目前為止國內雷鋒網瞭解到的有“聽畫”和“創悅”,都是隨機創作音樂的。「 聽畫」與百度的看圖作曲差不多,使用者在聽畫 App 上傳一張照片,人工智慧技術為每張照片配上屬於它的原創音樂。該項目在2014年由班磚科技開始研發,是一款將圖片+音樂融合到一起的移動社交應用。不過,雷鋒網在搜尋該項目的相關資料時發現,關於該項目的最新訊息停留在2016年6月的一篇報道,而其官方微博最後一條微博釋出停留在2016年4月,另外該項目APP最後更新時間也是在這個時候,而其官網則已經處於無法開啟的狀態。不過,據IT桔子的融資情況顯示,該公司在2016年5月完成1200萬Pre-A輪融資。因此,對於該項目的最新進展還無法得知。「 創悅」是根據使用者隨口的哼唱片段進行再創作,目的是輔助使用者原創工作,降低音樂創作門檻以及提高創作效率。利用使用者給出的風格或者關鍵詞或片段是目前國內外人工智慧作曲創業的主要方向。

很多人對於人工智慧譜曲存在質疑的地方在於,人工智慧難以作出帶有情感的作品。雷鋒網諮詢了多位人工智慧方向的創業者和投資人,大部分人都表示並不看好這類的創業項目,有投資人表示以前有過,但到現在還沒有做起來的,不過,作為人工智慧方向的創業公司,狗尾草科技創始人邱楠則向雷鋒網表示目前公司也在這方面的準備,由於精力有限目前只是做了些古典鋼琴曲,大概年底會有新的東西出來。

目前來說,腦控裝置與人工智慧譜曲這兩個方向在產業界都屬於發展初期階段,而將兩者結合則更是將落地的可能減小到更低。就雷鋒網的瞭解,在國內和這個項目比較類似的有EEGSmart 的腦電波頭戴智慧裝置Umind,根據介紹,Umind根據使用者喜好、狀態、選定的場景進行人工智慧學習,結合雲端大資料分析,自動推動使用者最喜愛的、最適合當下場景的樂曲。隻不過,就像前面提到的,目前民用的腦電波控製裝置只能粗略地將人類情緒分類,並不能非常準確地捕捉人類情緒,另外,使用者的喜好是建立在大量的資料分析上的,目前即使是各大音樂服務商在這一方面也並不能做到很完善。當然,不用人工智慧譜曲已經減少很多難題了。

雷鋒網旗下欄目「 新智造」專注於智慧時代的創新與創造,同時我們也關注這些創新能否在產業得到落地,關於腦電波控製裝置以及人工智慧譜曲未來的發展,「 新智造」也將持續關注。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知

ADVERTISEMENT
ADVERTISEMENT