1972年,當一個孤獨的程序員對著電腦敲下第一句“hello world”開始,人類與人工智能的溝通與對話,便從未停止。如今,機器不僅可以聽懂我們的話語,能夠回答“劉德華的老婆的爸爸是誰”這樣典型的邏輯推理問題,還能實時地把文字翻譯成語言,并且能夠根據(jù)上下文語義挑選正確的同音字,實現(xiàn)自動糾錯。
機器譜寫出的音樂同樣性感,最奇妙的是,它還能理解畫作的感情,藍色代表憂郁,紅色代表熱情,畫作中的蒙娜麗莎看似微笑,卻有些傷感,搭配的音樂或許也會有淡淡的憂傷。
能搞定“熊孩子”的兒童陪伴機器人不僅要有耐心,還得有超高智商,這樣才能夠讓家人在戶外瘋狂狩獵“寵物小精靈”時,告訴它什么才是真正的“黑科技”。
一個更加性感的時代已經(jīng)來臨,“黑科技”,歡迎你來到地球。
故事1
口袋妖怪萌寵大于智能
AR和LBS證明了自己的應用價值
最近一段時間,一款名為《口袋妖怪GO》(Pokemon Go)的游戲讓全球玩家陷入了一種瘋狂。游戲中的探索真實世界和抓寵的功能讓紐約時代廣場前聚集大量玩家。因為使用了目前最流行的AR(增強現(xiàn)實)和LBS(地理定位)技術,《口袋妖怪GO》也被冠以“黑科技”游戲。
《口袋妖怪GO》的黑科技到底有多酷炫?或許,會賣萌才是最關鍵的因素。西山居世游運營總監(jiān)趙強對北京晨報記者表示,Pokemon Go所使用的AR+LBS技術已經(jīng)出現(xiàn)了幾十年,這款游戲之所以火爆,并非采用了很多高深莫測的“黑科技”,最主要的原因,還是其開發(fā)公司任天堂20年來對口袋妖怪這一IP的持續(xù)培養(yǎng),讓它在全世界范圍內(nèi)具有廣泛的用戶基礎。
當然,AR和LBS技術也的確為這一游戲IP起到錦上添花的作用。趙強表示,AR技術被稱為增強現(xiàn)實,是一種可以實時地計算攝影機影像的位置及角度,并將虛擬圖像、視頻和3D模型與現(xiàn)實世界疊加在一起進行交互的計算機技術,“這種技術早在1990年就被提出,1998年開始由Sportvision公司用于實況橄欖球直播。”
而LBS和游戲的結(jié)合更加不是新鮮事,自上世紀90年代該技術出現(xiàn)后,2000年的《尋寶游戲》可以讓玩家通過真實GPS坐標尋找秘密寶藏。2004年,《I Love Bees》通過將玩家派送到各個GPS坐標的玩法同樣采用了該技術。
“《Pokemon Go》讓AR與LBS技術突然火起來,不是因為它是什么黑科技,而是此前受到的關注太少?,F(xiàn)在它們終于證明了自己的應用價值。”
故事2
360機器人陪伴孩子
大白離我們只有899元的距離
“大白”正在走進我們的生活,它離我們只有899元的距離。
上周,360兒童機器人巴迪正式推出。在人工智能“黑科技”的快速推進下,曾經(jīng)科幻電影里的機器人場景正飛入尋常百姓家。
別看它外表呆萌可愛,這是個會思考的兒童陪伴機器人。360智能家庭總裁鄧邱偉介紹了里面的黑科技:采用語音控制技術,精準的語義分析讓其能夠快速準確理解孩子的意圖;獨有的K故事功能,即使父母不在身邊,孩子也能通過巴迪機器人聽到爸爸媽媽講的故事。此外,父母還可以通過360兒童機器人與孩子視頻通話,也能隨時監(jiān)控家中場景,當孩子在機器人前停留時,機器人會自動抓拍小視頻,保留孩子的精彩瞬間。
鄧邱偉說,人工智能是其中最核心的技術。聽上去簡單的對話,背后有豐富的數(shù)據(jù)支持和語音喚醒、語音識別、語意理解的支持。360還聯(lián)合國內(nèi)知名兒童內(nèi)容廠商,為兒童機器人量身定制了海量優(yōu)質(zhì)的兒童早教資源。“把我們所擁有的資源全部整合起來。”
“我們想讓人們真正把它用起來,至于未來的盈利模式有很大的想象空間。”在鄧邱偉的設想中,巴迪就是一個可愛的大白,很體貼、很溫馨,能夠解決小朋友的問題。
故事3
百度AI能識圖作曲
“科技和藝術的跨界很性感”
欣賞徐悲鴻的《奔馬圖》時搭配激情澎湃的音樂,品味梵高的《星夜》時是舒緩又寂靜的音符。如今,機器已經(jīng)可以學會理解畫作的情緒,并譜寫出適宜的音符。日前,百度在“AI科技與藝術之夜”活動上展現(xiàn)了人工智能譜曲,并將多位藝術大師的畫作用音樂的形式表現(xiàn),實現(xiàn)了視覺呈現(xiàn)向聽覺表達的轉(zhuǎn)化。
百度此次展示的人工智能看圖譜曲技術,是通過其全球最大規(guī)模的神經(jīng)網(wǎng)絡和深度學習算法由機器自主學習實現(xiàn)。百度神經(jīng)網(wǎng)絡在“看到”圖像后,首先對圖像進行分析解讀,為圖像打上若干具象化的標簽。例如提取圖片中出現(xiàn)的高山、天空、寵物等物體,以及色調(diào)想要表達的意境。然后通過搜索挖掘相關的音樂信息,對音樂拆分重組,再合成與圖片內(nèi)容相匹配的音樂旋律,最終拼接成完整的曲子。
“科技和藝術的跨界很性感。百度一直嘗試用技術解決各種問題,人工智能識圖作曲技術,實現(xiàn)了所閱即所樂。”百度項目負責人對北京晨報記者表示。目前,全球范圍內(nèi)能夠?qū)崿F(xiàn)人工智能自動譜曲的僅有百度和谷歌,而百度嘗試將圖像所體現(xiàn)的情感“移情”轉(zhuǎn)變?yōu)閹в新曇粜畔⒌募夹g則更為復雜。
人工智能識圖作曲并不是一項停留在實驗室中的作品。百度項目負責人告訴北京晨報記者,通過這種方式可以讓神經(jīng)網(wǎng)絡更好地理解人的意圖,更好地為人類服務。例如對于視障人士來說,這項技術可以幫助他們更好地理解眼前的作品。對于一些特殊人群,這項技術或許也可以應用于心理疾病等輔助治療等方面。
多年以來,百度給外界的印象一直都是高科技公司。但近年來包括無人車、張國榮語音合成、尼泊爾古跡修復、度秘等貼近生活的技術展示,讓外界對這家科技公司的印象有所轉(zhuǎn)變,因此其中不少技術也被網(wǎng)友稱為“黑科技”。
故事4
搜狗突破語音識別最后3%
“語音識別是有大腦的”
在日前召開的極客公園創(chuàng)新者峰會上,搜狗展示了最新的語音識別技術,現(xiàn)場將搜狗公司CEO王小川的現(xiàn)場發(fā)言實時翻譯成滾動字幕,準確率高達97%以上。此外,王小川還現(xiàn)場演示了最新推出的語音修改功能,能夠聽懂自然語言糾錯信息并進行修改,例如“弓長張改成立早章”,“女字旁的她”等復雜口令。“這項技術解決了語音識別準確率最后3%的差距。”王小川表示。
搜狗語音交互技術中心負責人王硯峰告訴北京晨報記者,支撐這些技術背后的,一方面是語音識別本身的能力,另一方面,就是強大的語義理解能力。“市場上的語音識別功能只有耳朵沒有大腦,只能聽到有什么樣的字,卻聽不懂其中的意思。”
王硯峰表示,搜狗語音識別有“大腦”,這個“大腦”就是語義理解引擎,將語音識別和對內(nèi)容的理解綁定在一起,做到真正理解用戶的語義。機器對“弓長張”與“立早章”的理解,背后是搜狗龐大的漢字知識庫加海量用戶文字表達數(shù)據(jù),以及搜狗的深度學習技術在海量用戶數(shù)據(jù)上的信息挖掘能力。
王硯峰認為,交互技術的發(fā)展和更智能的搜索體驗將會是引領未來的“黑科技”,也是搜狗一直努力的方向。