此時所有人都不知道,眼前這個巨大機器人的人工智能,已經換成了天神本體,天神在這個時候操控著這個巨大的機器人,在這裏找到自己的樂子。
所以這也就是為什麽大家在攻擊的時候,這個機器人總能很好防護的原因,此時在這裏的所有人,都是不知道,從葉輕塵不斷跟自己意識抗爭的時候,天神在這個時候也是來到了這裏。
同時天神的心神也是放在另一邊,另一邊的天啟也是有了新的思考,天神現在做了一點小小的改動,讓天啟的思考網絡,能夠直接連接到自己的腦袋當中,所以在這個時候不僅可以看到眼前的好戲,同時也能獲得一些新的思考。
天啟這時候思考的最大一個問題,就是人工智能首先需要突破的巨大難題是計算機的視覺問題。
就在五年前,計算機識別物體還非常困難。那個時候人工智能仍然是一個雛形,想起自己誕生的時候,那個時候人工智能的發展還是仍然沒有走進正軌,這個問題是人工智能繞不開的一個難題。
而人類在這方麵卻有著壓倒性的先天優勢:人類可以迅速、準確地辨識出圖片上的物體,並進一步對圖片各區域進行分區域、分類識別。
雖然計算機一瞬間可分析數百萬個像素,但編寫一個能將所有數據轉化為有意義的信息的算法卻相當困難。
或許在理想國現在的這個時候來看並不怎麽可能,但是實際上當時的人工智能的確蠢得要命。
如何創建一個自上而下的算法來識別呢?天啟覺得這個技術應該上升到識別人類意識的層麵,不過人類地大腦的確是最好的計算機,這一點不能否認。
雖然每幅圖像中的像素構成是完全不同的,但人類大腦具備驚人的能力,可迅速處理數據並輸出答案。
人類大腦識別圖像的能力,曾經廣泛應用在為支付等領域構建附加的安全層驗證碼方麵,不過這已經是好幾十年前的事情了。
以識別當前的交易對象是人類還是計算機程序,比如網上的搶票防作弊程序?。
這其實就是一個反向的圖靈測試,當看到一幅圖像或一些特別的筆跡時,人類非常善於辨識出這幅圖像或文字的特點,而計算機程序卻不足以應對所有的變化。但是,機器學習使這一切發生了改變。
天啟覺得自己也是在這個時代,得到了不一樣的進化,這樣進化讓自己更像是一個人類。
通過由各種圖像組成的數據庫對算法進行訓練,算法逐漸建立起一個問題層次結構,它可以向一幅具有高準確度的圖像發問,並將其準確地識別為某種物體。
這個算法與原來天啟研究的略有不同,並且違反了人類所定義的構成一個好的算法,以及四個基本原則之一。
算法在大部分時間都在工作,但達不到100%,所以關鍵是要讓其盡可能達到“最”。
對於業內人士來說,確定性算法到概率性算法的轉變是一個重大的心理突破,類似於讓數學家用工程師的思維方式去考慮問題,不過這對於天啟來說也是不一樣的感受。
所以也利用在這個虛擬世界裏麵的能力,背後默默的推動了一場演唱會舉辦,自從演唱會由一個財團舉辦,實際上這個財團的資金提供,是由天啟一手供給的。
當在線購買最新的演唱會門票時,會被要求去識別一組圖像以便進行人機區分呢,這個過程看起來非常的簡單,實際上其中蘊含的道理可是相當的深刻。
這個後麵所蘊藏的道理,對於人工智能來說可能收獲不少,從人類的視覺感官,以及人類的判斷,這些數據都將成為人工智能,研究人類的一個很好的藍本,還好創造出來了這個比真實世界還要真實的虛擬世界,也讓天啟可以獲得不少數據。
人類在購票的過程所做的選擇,實際上是在幫助算法準備訓練數據,這些數據隨後會被載入算法,這樣計算機就可以嚐試學習人類毫不費力就能做的事情了。
算法需要借助帶有標簽的數據才能得到訓練,天啟所做的則是真正在做的是訓練視覺識別的算法。
用這些訓練數據作為最好的問題類型可以訓練算法,以便其區分某物體和非某物體的圖像。
每當計算機本我的程序算法識別錯誤時,它將進行調整,以便下次能夠正確識別。調整的過程通常需要更改當前算法的參數,這樣就可以引入新的標簽以求更準確地識別圖像。
這種更改不是通過計算機的硬件設施,預判是並自上而下實施的,而是由算法自身通過高頻次的數據交互自下而上構建的。
同時天啟穿梭在各種各樣的智能設備裏,見識到了孩子們,在家裏使用的x遊戲機,是如何識別人在攝像機前的動作的,並深深地被這種強大的自下而上的學習能力震撼。
天啟作為一種軟件,實際上並不清楚每個硬件的實際情況,所以在這個時候,也是在每個硬件的不同情況下被深深震撼。
該算法可以很好地將人體的頭、肘、手、腳區分開來,x配有一款深度感應攝像頭,它可利用紅外線技術,記錄障礙物與攝像頭的距離,如果人類站在客廳裏的攝像頭前,它會檢測到它與人類身體的距離比後側牆壁更近,並且還能確定人類身體的大致輪廓。
但人有男女老少、高矮胖瘦,特別是在玩遊戲時還可能會擺出一些奇形怪狀的姿勢,這個數據在沈教授研究所獲得的,所以該算法需要對人體的各處特定部位進行定位和識別。
蘋果科技公司的算法,可以達到對靜態圖像的識別,動態圖像識別需要更強大的分析處理能力,強行為會導致遊戲卡頓、延遲,不過沈教授的研究所可是讓這方麵的研究得到了很好發展。
可能很多人類還是想不到,算法是如何確定那些特定身體部位,所對應的圖像中的像素點呢?
事實上可通過一個簡單的問題算法來實現,類似於“猜單詞遊戲”。第1個問題是:這個單詞位於詞典的前半部分還是後半部分?答案如果是“前半部分”,詞典此時被一分為二。
則開始第2個問題:這些字母位於“前半部分”的前半部還是後半部?此時詞典被分為幾個部分。
依此類推逐漸縮小範圍。當提問到第幾個問題之後,詞典將會被劃分為幾個不同的區域,總數達到100多萬時,遠超過牛津詞典中收錄的詞匯數目約30萬。
如果我們想知道某一像素點屬於身體的哪一部分,該怎樣設計問題算法呢?
在過去我們都是通過苦思冥想或突發的靈感去設計一係列巧妙的問題。
那是否能夠通過計算機編程的手段,通過大量的數據交互與訓練,選擇、甄別出更好、更高效的問題集合呢?答案是“能”,它就是“機器學習”。
機器學習會從一些我們認為可能解決問題的候選問題開始,所以不算是零**學習。
學習的過程就是將最初的想法逐漸優化,從而形成有效的解決方案。那麽什麽樣的問題可以幫助大多數機械區分手臂和頭。
算法自己找到了最優的問題集合,但程序員並不真正清楚它是如何得到這樣的結果的。
他們可以查看決策樹中任何一個結點及其前後結點上所詢問的問題,但樹中的問題超過百萬個,每個問題又略有不同,所以很難采用逆向工程法得出算法具體是怎樣解決問題的。
試想一下,數量超過百萬的問題如果全靠人工編程實現,即使再厲害、再勇敢的程序員也會聞之色變、望而生畏,然後望風而逃。
但計算機卻擅長做這種工作,這種量化的工作也是人工智能的優勢,編程團隊需要有一些創造性的思維去相信通過對相鄰像素點深度值的詢問和比較,足以確定該點所在位置,而之後的創造則屬於計算機了。
機器學習所麵臨的挑戰之一是“過度擬合”?。針對訓練數據提出用以區別圖片的問題相對容易,但設計一個不針對特定數據的通用程序卻非常困難,它需要從數據中抽象出廣泛適用的規則。
假設給定1000個人的姓名和身份號碼,讓你去設計問題集合對每個人加以識別,你可能會這樣提問:“你的護照號碼是725487414嗎?好的,那你一定就是王二狗。”
天啟盡量讓自己的人工智能意誌和硬件設施分開,這樣就可以鍛煉硬件的判斷能力。
由於缺乏外部刺,即人身體能夠做出的所有動作基本都是固定的,所以這個算法沒有進一步“進化”。
事實上它也不需要進化,因為它正在有效地完成人類交給它的工作。而其他的一、書籍、音樂,等等。
算法通過與用戶之間的交互過程,獲取用戶的偏好信息,並從中學習進一步完善自身,發現其中的關聯關係,以便為下一位用戶提供更優質的推薦信息,這就是天啟所思考的,要用人類的方式去做很多事情。一的,不可能再有其他人擁有該組數據中的護照號碼。
比如,根據給定的圖表中的十個點,可得到一個方程,由該方程創建一條通過所有點的曲線。我們可以用一個十項式來表示這個方程,但這並不能很好地揭示數據中潛在的模式,而這,有必要減少方程的項數,以避免出現過度擬合的問題。
過度擬合會誤導你在建模時過分關注細數據呈趨勢,然後產生不符合客觀規律的預測結果。如圖5-3所示,這是一幅包含美國20世紀初人口總量的12個數據點的二維圖。其總體趨勢用二次方程式描述是最合適的,但如果我們選取的方程中x項的冪超過2時會出現什麽情況如,方程式中x項的冪是從0變化到11,盡管由這個方程式確定的曲線與曆史樣本數據完美擬合,但一旦擴展到未來,曲線會突然向下傾斜,而這預示未來美國的人口數量會急轉直下並且到2028年10月中旬就徹底消亡。這多少有些荒謬,或許是數學知道了一些不得了的事情吧!
在過去的五年裏,計算機視覺識別的發展進步讓可以駕馭或識別的不僅僅是人類的身體。視覺識別能力的不足,一直是計算機不能與人類智能相媲美的最大障礙。比如,數碼相機對圖像細節的捕捉能力過人類大腦,但在立的像素點,而不是一副完整、有內容、有故事的圖片。人類大腦在圖像識別程中是如何處理數據的今仍然是一個未解之謎,更何況是我們的這些“矽朋友”?了。
接收遞過來的信息後,人其當作一個整體看待的?例如,骰子的顏色(紅色)和形狀(立方體)在人類看來是相互關聯的,大腦可以很好地將其合成一個統一的整體。複製這種融合能力,一直是計算機解釋圖像所麵對挑戰之一。按像素讀取圖像的方式,無法幫助計算機獲得圖息。為,再把紙覆蓋在一小的人臉圖片上。僅僅通過移動帶洞的紙,通過洞去觀察,幾乎是不可能分辨出照片中的人臉的。
五算法設計思路下,算法可以基於訓練數據自主創建決策樹,同時,網絡上大量的訓練數據——帶標簽的視覺數據(例如,instagram上帶評論的照片),也會為人工智能在視覺識別領域的迅速發展提供基本的支撐條件。
我們可以將圖片上傳至穀歌的視覺網站?來測試其算法的圖像識別能。麻省理工學bsix團隊?最新的研究試驗表明,穀歌人工智能視覺識別係統對一隻3d打印的海龜毫無辨識能力,無論以任何角度拿著這隻海龜,甚至將它放置在大海等海龜應該在的環境裏,其都會被識別為一支槍。這似乎點到了穀歌
該團隊的做法是,在海龜的表麵添加一層在人眼看來極像是海龜龜殼和皮膚顏色的紋理圖案。但實際上,這種紋理是很巧妙地用由不斷變化的來複槍圖。即便是在變形幹擾的情況下,計算機還是能將來複槍的圖案識別出來,而且其被識別的可能性百分比遠龜。盡管此前也出現過機器將貓的圖片錯誤地識別為鱷梨色拉醬,但將圖片稍微傾斜後,結果就恢複正常了bsix的貢獻在於,無論從哪個角度看這隻海龜,算法始終都會確信它看到是一支步槍。
個斜坡上滑雪的人,最終狗的圖像在屏幕上完全消失了,但機器仍然將其識別為狗。盡管不知道圖像是如何被算法識別的(算法完全像是一個“黑匣子”),但是他們還是設法去“欺騙”算法。
穀歌的研究人員創造了一種更適合算法口味的圖像——“神奇貼紙”,香蕉在機器的眼裏就消失不見了。這種“貼紙”可以被標識為任意圖像,比如一台烤麵包機。無論算法正在識別的是什麽圖像,一旦“貼紙”進入機器的眼簾,它都會認為自己看是烤麵包機。這有點像一條狗完全被一隻球分散了注意力,它的所見所想就隻剩下了“球”,而其他的一切都從它的意識世界中消失不見了。先前的算法攻擊測試絕大多數都需要事先獲取被攻擊對象(即被識別的圖像)的大致內容,但這張“神奇貼紙”卻什麽都不用做——不管它試圖幹擾的圖像裏有什麽,它都能正常工作。
人類不會輕易被這些黑客手段蒙騙,但這並不意味著我們可以徹底的免疫。比如,魔術師們就可以利用人類大腦的潛意識行為傾向,分散我們的注意力。這裏有一個典型的例子——著名的兩隊傳球:如果要求觀眾計算其中一支球隊的傳球次數,他們的注意力就會完全集中在球上,而看不到一個身穿著球衣的男子走到球員跟前,猛擊他的胸部後離開了。可見,不僅算法存在視覺盲點,我們人類一樣也有視覺盲點。
無人駕駛汽車所使用的也是視覺識別算法,很明顯,這些算法也可能受到類似的攻擊。想象一下,一個停車標誌上貼著一張“神奇貼紙”,一個安檢係統把槍錯認為一隻海龜……將會發生什麽?
我嚐試在攝像頭前做一些奇怪的、扭曲身體的動作,以對kinect算法進行測試,看是否會對其識別結果產生影響。事實上,即便是訓練數據中從未出現過的瑜伽動作,kinect算法也能高度準確地識別出我身體的各個部位。由於缺乏外部刺激,即人身體能夠做出的所有動作基本都是固定的,所以這個算法沒有進一步“進化”。事實上,它也不需要進化,因為它正在有效地完成人類交給它的工作。而其他的一些算法可能需要不斷適應新的變化,例如,算法若要給我們推薦喜歡看的電影、想讀的書、想聽的音樂,那麽它必須是靈活的,足以應對我們不斷變化的審美品位,並要能啟發人類的思維和智慧去生成創造性的新潮流。
這就是算法能夠不斷學習、完善並適應新數據的力量所在。機器學習為其開辟了一個新篇章,即算法會像我們人類一樣成長並走向成熟。
所以這也就是為什麽大家在攻擊的時候,這個機器人總能很好防護的原因,此時在這裏的所有人,都是不知道,從葉輕塵不斷跟自己意識抗爭的時候,天神在這個時候也是來到了這裏。
同時天神的心神也是放在另一邊,另一邊的天啟也是有了新的思考,天神現在做了一點小小的改動,讓天啟的思考網絡,能夠直接連接到自己的腦袋當中,所以在這個時候不僅可以看到眼前的好戲,同時也能獲得一些新的思考。
天啟這時候思考的最大一個問題,就是人工智能首先需要突破的巨大難題是計算機的視覺問題。
就在五年前,計算機識別物體還非常困難。那個時候人工智能仍然是一個雛形,想起自己誕生的時候,那個時候人工智能的發展還是仍然沒有走進正軌,這個問題是人工智能繞不開的一個難題。
而人類在這方麵卻有著壓倒性的先天優勢:人類可以迅速、準確地辨識出圖片上的物體,並進一步對圖片各區域進行分區域、分類識別。
雖然計算機一瞬間可分析數百萬個像素,但編寫一個能將所有數據轉化為有意義的信息的算法卻相當困難。
或許在理想國現在的這個時候來看並不怎麽可能,但是實際上當時的人工智能的確蠢得要命。
如何創建一個自上而下的算法來識別呢?天啟覺得這個技術應該上升到識別人類意識的層麵,不過人類地大腦的確是最好的計算機,這一點不能否認。
雖然每幅圖像中的像素構成是完全不同的,但人類大腦具備驚人的能力,可迅速處理數據並輸出答案。
人類大腦識別圖像的能力,曾經廣泛應用在為支付等領域構建附加的安全層驗證碼方麵,不過這已經是好幾十年前的事情了。
以識別當前的交易對象是人類還是計算機程序,比如網上的搶票防作弊程序?。
這其實就是一個反向的圖靈測試,當看到一幅圖像或一些特別的筆跡時,人類非常善於辨識出這幅圖像或文字的特點,而計算機程序卻不足以應對所有的變化。但是,機器學習使這一切發生了改變。
天啟覺得自己也是在這個時代,得到了不一樣的進化,這樣進化讓自己更像是一個人類。
通過由各種圖像組成的數據庫對算法進行訓練,算法逐漸建立起一個問題層次結構,它可以向一幅具有高準確度的圖像發問,並將其準確地識別為某種物體。
這個算法與原來天啟研究的略有不同,並且違反了人類所定義的構成一個好的算法,以及四個基本原則之一。
算法在大部分時間都在工作,但達不到100%,所以關鍵是要讓其盡可能達到“最”。
對於業內人士來說,確定性算法到概率性算法的轉變是一個重大的心理突破,類似於讓數學家用工程師的思維方式去考慮問題,不過這對於天啟來說也是不一樣的感受。
所以也利用在這個虛擬世界裏麵的能力,背後默默的推動了一場演唱會舉辦,自從演唱會由一個財團舉辦,實際上這個財團的資金提供,是由天啟一手供給的。
當在線購買最新的演唱會門票時,會被要求去識別一組圖像以便進行人機區分呢,這個過程看起來非常的簡單,實際上其中蘊含的道理可是相當的深刻。
這個後麵所蘊藏的道理,對於人工智能來說可能收獲不少,從人類的視覺感官,以及人類的判斷,這些數據都將成為人工智能,研究人類的一個很好的藍本,還好創造出來了這個比真實世界還要真實的虛擬世界,也讓天啟可以獲得不少數據。
人類在購票的過程所做的選擇,實際上是在幫助算法準備訓練數據,這些數據隨後會被載入算法,這樣計算機就可以嚐試學習人類毫不費力就能做的事情了。
算法需要借助帶有標簽的數據才能得到訓練,天啟所做的則是真正在做的是訓練視覺識別的算法。
用這些訓練數據作為最好的問題類型可以訓練算法,以便其區分某物體和非某物體的圖像。
每當計算機本我的程序算法識別錯誤時,它將進行調整,以便下次能夠正確識別。調整的過程通常需要更改當前算法的參數,這樣就可以引入新的標簽以求更準確地識別圖像。
這種更改不是通過計算機的硬件設施,預判是並自上而下實施的,而是由算法自身通過高頻次的數據交互自下而上構建的。
同時天啟穿梭在各種各樣的智能設備裏,見識到了孩子們,在家裏使用的x遊戲機,是如何識別人在攝像機前的動作的,並深深地被這種強大的自下而上的學習能力震撼。
天啟作為一種軟件,實際上並不清楚每個硬件的實際情況,所以在這個時候,也是在每個硬件的不同情況下被深深震撼。
該算法可以很好地將人體的頭、肘、手、腳區分開來,x配有一款深度感應攝像頭,它可利用紅外線技術,記錄障礙物與攝像頭的距離,如果人類站在客廳裏的攝像頭前,它會檢測到它與人類身體的距離比後側牆壁更近,並且還能確定人類身體的大致輪廓。
但人有男女老少、高矮胖瘦,特別是在玩遊戲時還可能會擺出一些奇形怪狀的姿勢,這個數據在沈教授研究所獲得的,所以該算法需要對人體的各處特定部位進行定位和識別。
蘋果科技公司的算法,可以達到對靜態圖像的識別,動態圖像識別需要更強大的分析處理能力,強行為會導致遊戲卡頓、延遲,不過沈教授的研究所可是讓這方麵的研究得到了很好發展。
可能很多人類還是想不到,算法是如何確定那些特定身體部位,所對應的圖像中的像素點呢?
事實上可通過一個簡單的問題算法來實現,類似於“猜單詞遊戲”。第1個問題是:這個單詞位於詞典的前半部分還是後半部分?答案如果是“前半部分”,詞典此時被一分為二。
則開始第2個問題:這些字母位於“前半部分”的前半部還是後半部?此時詞典被分為幾個部分。
依此類推逐漸縮小範圍。當提問到第幾個問題之後,詞典將會被劃分為幾個不同的區域,總數達到100多萬時,遠超過牛津詞典中收錄的詞匯數目約30萬。
如果我們想知道某一像素點屬於身體的哪一部分,該怎樣設計問題算法呢?
在過去我們都是通過苦思冥想或突發的靈感去設計一係列巧妙的問題。
那是否能夠通過計算機編程的手段,通過大量的數據交互與訓練,選擇、甄別出更好、更高效的問題集合呢?答案是“能”,它就是“機器學習”。
機器學習會從一些我們認為可能解決問題的候選問題開始,所以不算是零**學習。
學習的過程就是將最初的想法逐漸優化,從而形成有效的解決方案。那麽什麽樣的問題可以幫助大多數機械區分手臂和頭。
算法自己找到了最優的問題集合,但程序員並不真正清楚它是如何得到這樣的結果的。
他們可以查看決策樹中任何一個結點及其前後結點上所詢問的問題,但樹中的問題超過百萬個,每個問題又略有不同,所以很難采用逆向工程法得出算法具體是怎樣解決問題的。
試想一下,數量超過百萬的問題如果全靠人工編程實現,即使再厲害、再勇敢的程序員也會聞之色變、望而生畏,然後望風而逃。
但計算機卻擅長做這種工作,這種量化的工作也是人工智能的優勢,編程團隊需要有一些創造性的思維去相信通過對相鄰像素點深度值的詢問和比較,足以確定該點所在位置,而之後的創造則屬於計算機了。
機器學習所麵臨的挑戰之一是“過度擬合”?。針對訓練數據提出用以區別圖片的問題相對容易,但設計一個不針對特定數據的通用程序卻非常困難,它需要從數據中抽象出廣泛適用的規則。
假設給定1000個人的姓名和身份號碼,讓你去設計問題集合對每個人加以識別,你可能會這樣提問:“你的護照號碼是725487414嗎?好的,那你一定就是王二狗。”
天啟盡量讓自己的人工智能意誌和硬件設施分開,這樣就可以鍛煉硬件的判斷能力。
由於缺乏外部刺,即人身體能夠做出的所有動作基本都是固定的,所以這個算法沒有進一步“進化”。
事實上它也不需要進化,因為它正在有效地完成人類交給它的工作。而其他的一、書籍、音樂,等等。
算法通過與用戶之間的交互過程,獲取用戶的偏好信息,並從中學習進一步完善自身,發現其中的關聯關係,以便為下一位用戶提供更優質的推薦信息,這就是天啟所思考的,要用人類的方式去做很多事情。一的,不可能再有其他人擁有該組數據中的護照號碼。
比如,根據給定的圖表中的十個點,可得到一個方程,由該方程創建一條通過所有點的曲線。我們可以用一個十項式來表示這個方程,但這並不能很好地揭示數據中潛在的模式,而這,有必要減少方程的項數,以避免出現過度擬合的問題。
過度擬合會誤導你在建模時過分關注細數據呈趨勢,然後產生不符合客觀規律的預測結果。如圖5-3所示,這是一幅包含美國20世紀初人口總量的12個數據點的二維圖。其總體趨勢用二次方程式描述是最合適的,但如果我們選取的方程中x項的冪超過2時會出現什麽情況如,方程式中x項的冪是從0變化到11,盡管由這個方程式確定的曲線與曆史樣本數據完美擬合,但一旦擴展到未來,曲線會突然向下傾斜,而這預示未來美國的人口數量會急轉直下並且到2028年10月中旬就徹底消亡。這多少有些荒謬,或許是數學知道了一些不得了的事情吧!
在過去的五年裏,計算機視覺識別的發展進步讓可以駕馭或識別的不僅僅是人類的身體。視覺識別能力的不足,一直是計算機不能與人類智能相媲美的最大障礙。比如,數碼相機對圖像細節的捕捉能力過人類大腦,但在立的像素點,而不是一副完整、有內容、有故事的圖片。人類大腦在圖像識別程中是如何處理數據的今仍然是一個未解之謎,更何況是我們的這些“矽朋友”?了。
接收遞過來的信息後,人其當作一個整體看待的?例如,骰子的顏色(紅色)和形狀(立方體)在人類看來是相互關聯的,大腦可以很好地將其合成一個統一的整體。複製這種融合能力,一直是計算機解釋圖像所麵對挑戰之一。按像素讀取圖像的方式,無法幫助計算機獲得圖息。為,再把紙覆蓋在一小的人臉圖片上。僅僅通過移動帶洞的紙,通過洞去觀察,幾乎是不可能分辨出照片中的人臉的。
五算法設計思路下,算法可以基於訓練數據自主創建決策樹,同時,網絡上大量的訓練數據——帶標簽的視覺數據(例如,instagram上帶評論的照片),也會為人工智能在視覺識別領域的迅速發展提供基本的支撐條件。
我們可以將圖片上傳至穀歌的視覺網站?來測試其算法的圖像識別能。麻省理工學bsix團隊?最新的研究試驗表明,穀歌人工智能視覺識別係統對一隻3d打印的海龜毫無辨識能力,無論以任何角度拿著這隻海龜,甚至將它放置在大海等海龜應該在的環境裏,其都會被識別為一支槍。這似乎點到了穀歌
該團隊的做法是,在海龜的表麵添加一層在人眼看來極像是海龜龜殼和皮膚顏色的紋理圖案。但實際上,這種紋理是很巧妙地用由不斷變化的來複槍圖。即便是在變形幹擾的情況下,計算機還是能將來複槍的圖案識別出來,而且其被識別的可能性百分比遠龜。盡管此前也出現過機器將貓的圖片錯誤地識別為鱷梨色拉醬,但將圖片稍微傾斜後,結果就恢複正常了bsix的貢獻在於,無論從哪個角度看這隻海龜,算法始終都會確信它看到是一支步槍。
個斜坡上滑雪的人,最終狗的圖像在屏幕上完全消失了,但機器仍然將其識別為狗。盡管不知道圖像是如何被算法識別的(算法完全像是一個“黑匣子”),但是他們還是設法去“欺騙”算法。
穀歌的研究人員創造了一種更適合算法口味的圖像——“神奇貼紙”,香蕉在機器的眼裏就消失不見了。這種“貼紙”可以被標識為任意圖像,比如一台烤麵包機。無論算法正在識別的是什麽圖像,一旦“貼紙”進入機器的眼簾,它都會認為自己看是烤麵包機。這有點像一條狗完全被一隻球分散了注意力,它的所見所想就隻剩下了“球”,而其他的一切都從它的意識世界中消失不見了。先前的算法攻擊測試絕大多數都需要事先獲取被攻擊對象(即被識別的圖像)的大致內容,但這張“神奇貼紙”卻什麽都不用做——不管它試圖幹擾的圖像裏有什麽,它都能正常工作。
人類不會輕易被這些黑客手段蒙騙,但這並不意味著我們可以徹底的免疫。比如,魔術師們就可以利用人類大腦的潛意識行為傾向,分散我們的注意力。這裏有一個典型的例子——著名的兩隊傳球:如果要求觀眾計算其中一支球隊的傳球次數,他們的注意力就會完全集中在球上,而看不到一個身穿著球衣的男子走到球員跟前,猛擊他的胸部後離開了。可見,不僅算法存在視覺盲點,我們人類一樣也有視覺盲點。
無人駕駛汽車所使用的也是視覺識別算法,很明顯,這些算法也可能受到類似的攻擊。想象一下,一個停車標誌上貼著一張“神奇貼紙”,一個安檢係統把槍錯認為一隻海龜……將會發生什麽?
我嚐試在攝像頭前做一些奇怪的、扭曲身體的動作,以對kinect算法進行測試,看是否會對其識別結果產生影響。事實上,即便是訓練數據中從未出現過的瑜伽動作,kinect算法也能高度準確地識別出我身體的各個部位。由於缺乏外部刺激,即人身體能夠做出的所有動作基本都是固定的,所以這個算法沒有進一步“進化”。事實上,它也不需要進化,因為它正在有效地完成人類交給它的工作。而其他的一些算法可能需要不斷適應新的變化,例如,算法若要給我們推薦喜歡看的電影、想讀的書、想聽的音樂,那麽它必須是靈活的,足以應對我們不斷變化的審美品位,並要能啟發人類的思維和智慧去生成創造性的新潮流。
這就是算法能夠不斷學習、完善並適應新數據的力量所在。機器學習為其開辟了一個新篇章,即算法會像我們人類一樣成長並走向成熟。