a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 消費電子 > 業界動態 > 讓機器“看圖譜曲” 百度意欲何為?

讓機器“看圖譜曲” 百度意欲何為?

作者: 時間:2016-07-22 來源:今日頭條 收藏
編者按:“看圖譜曲”技術也許尚未成熟,但卻可以落地于不同領域——只要涉及“情緒渲染”,譬如廣告,社交軟件,PR營銷,甚至最近火熱的AR等等。

  許多年之前,在一次講座中,人工智能先驅侯世達為臺下音樂專業的師生播放了兩首作品:一首來自肖邦,一首來自創作的“偽肖邦”,并讓他們判斷哪首是真肖邦,他們受過專業音樂訓練,但多數人選擇了后者。

本文引用地址:http://www.j9360.com/article/201607/294389.htm

  這算是圖靈測試在音樂領域的鏡像。直覺上看,音樂與計算分列認知體系的兩極,前者關乎感性甚至靈性,后者則被多數人歸為“死理性派”,窺不見半點美感,但必須承認,倘若打穿知識邊界,在更本質的意義上,音樂與計算共享同一套底層邏輯:某種抽象事物的形式組合——我個人聽到過關于音樂最好的定義來自數學家萊布尼茨:音樂是人類精神通過無意識計算獲得的愉悅。

  正因如此,人類一直試圖讓擁有“譜寫”音樂的能力——最早的算法作曲(Algorithmic Composition)甚至可追溯到1957年化學家和音樂家Lejaren Hiller用算法生成了弦樂四重奏伊利亞組曲。如今幾十年過去,在大數據“喂養”下,學習技術的發展讓機器譜曲這件事愈加成熟,且與其他技術的嫁接也讓機器譜曲邁向應用層面。

  最近一個例子來自深度學習實驗室,他們發明了一種基于輸入圖片生成曲譜的自動化系統:輸入一張圖片,系統會自動生成一段符合該圖片內容和意境,且符合韻律和節拍的曲譜——換句話說,試圖用機器視角理解一張圖片,然后創作一段音樂。

  技術也正在落地。7月19日晚,聯手尤倫斯當代藝術中心(UCCA)舉辦了一場主題為“AI科技與藝術之夜”的跨界活動。活動現場,人工智能根據藝術家勞森伯格“四分之一英里”畫作中的兩個部分,分別生成了與畫作元素相對應的鋼琴曲。在隨后播放的視頻中,百度還展示了人工智能根據梵高的《星夜》和徐悲鴻的《奔馬圖》創作的曲子。這是百度首次嘗試將人工智能技術與藝術創作相結合。



 那么問題來了,探究這樣一個看起來頗具藝術氣質的技術,百度意欲何為?

  機器“看圖譜曲”

  拆解來看,讓機器“看圖譜曲”的技術實現分兩部分:第一是訓練過程,用海量數據對機器進行飼養(如你所知,近些年來,大規模計算能力,各種復雜模型和算法的誕生,讓深度學習的訓練數據不斷增長),輸入數據是帶有語義標簽的圖片庫,曲譜和對應歌詞的曲庫,輸出是語義標簽提取模型和曲譜生成模型;第二部分是測試過程,當機器智慧覓得規律,輸入一張圖片,則可輸出一曲音樂。

  先說訓練。訓練的第一階段即是利用圖片庫訓練學習,得到語義標簽提取模型,訓練圖片則由人工標注關鍵詞,包含兩種類型:第一,圖片中出現的物體,譬如高山,大海,天空等;第二,圖片色調和意境,譬如灰暗的,晴朗的,憤怒的,壓抑的等。訓練的第二階段是學習得到曲譜生成模型,具體則通過局部曲譜聚類(對所有曲庫中每半個小節作為一個曲譜單元,將所有相似曲譜聚集到同一個聚類上),統計語義標簽與曲譜單元相關性,統計局部曲譜單元聚類的相鄰概率等步驟實現。

  再說測試。這一過程同樣包含兩個階段,第一階段是給定一張圖片,根據語義標簽提取模型判斷其是否可提取得到該語義標簽;第二個階段則是曲譜生成——總之可以看出,作為一項復合型技術,讓機器“看圖譜曲”的實現路徑委實不易。

  不是替代,是合作

  當然,即便如此——即便機器譜寫的曲目聲音悅耳,由于“藝術”長久以來的某種蠱惑性(其實藝術形式的演進從來都與技術進步息息相關),也一定會有人覺得,這種聲音不是“人工”而是“合成”的,從而構建鄙視鏈。但如前所述,作為一門課題,探尋音樂與數學的關系一直存在,不少作曲家都對二者的結合進行過大膽實驗。


上一頁 1 2 下一頁

關鍵詞: 百度 機器

評論


相關推薦

技術專區

關閉