第640章 貪心並非全局最優解
獲得造物主係統,自創世界跑團 作者:有可雲 投票推薦 加入書簽 留言反饋
“那些殘忍的戰爭決策,實際上都是她做出的判斷嗎?”丁願翔顫抖著問道。
“現在就認定她是罪魁禍首,結論有點早了。”李默然一邊檢查著精靈少女的狀態,一邊觀察著這台人工智能的核心電路。
雖然這台人工智能看上去非常超自然和科幻,但是它的組成部分似乎和計算機是一樣的。
核心周圍的光纜和數據線應該是它的“i\/o”,也就是輸入輸出設備,帝國的高層通過這些設備將海量的數據信息輸入到核心,而核心也通過這些設備將判斷出來的決策方案發送到外界。
在精靈少女周圍的保護液之下,李默然發現了密密麻麻的晶體,正非常有規律地排列在一起。這些晶體看上去並不像是現代的電子設備,反而像是魔法世界的那種水晶。
李默然從自己的機體上拉出了一根數據采集線,放到了這些晶體上,龐大的數據立刻衝進了他的腦海,他趕緊切換了數據線。幸好他的造物主意識和狐狸的機械體意識是分開的,不然剛才這一下他就直接因為數據量過大而宕機了。
看來這些晶體就是這台設備的“儲存器”了。
隨後在丁願翔和董事長震驚的目光中,李默然將自己的腦袋埋進了精靈少女所在的液體中。
很快,李默然就將頭伸了迴來,並跌跌撞撞地向後退了兩步。
他得出了結論:“這個身份不明的少女,是這台人工智能的‘運算器’,她負責提供算力,而決策是由外層的‘控製器’調度特定的智能模型進行推演的……”
在李默然進入到保護液當中時,大量的投影畫麵出現在了他的機械視網膜上,這些畫麵單獨看其中一個的話,都是一個很簡單的“邏輯判斷”,比如會出現兩個數字進行比大小、按照提示要求從一堆圖片當中選擇正確的形狀。但因為數量非常龐大,即使是以tfox-7的處理速度都判斷不過來。
而這位躺在保護液當中少女近一千年來做的事情就是這個,不斷地處理著海量的“邏輯判斷”,這些判斷本身和決策沒有太大的關係,但是這位少女作為“運算單元”給整個模型推算決策提供了算力。
“這整個人工智能係統都是不帶有感情的,它會按照帝國利益最大化的目標來製定出決策,從某種意義上來說,它是絕對‘大公無私’的,做出的決策也都是目前看來最優秀的……”李默然歎了口氣。
“我就說了,你們這樣做是在白費力氣。戰爭就是現在的帝國所最需要的,能夠讓帝國最輕鬆擺脫現在經濟危機的辦法。”董事長無奈地說,“不過是需要死掉一些劣種國的人罷了。”
“這可不一定。”李默然搖頭說道。
“從現在看來,這個人工智能雖然擁有很強的算力,每次做出的選擇都是符合‘目前最優’的情況的,但是它考慮這個‘最優’的時間尺度是多久呢?可能是一年兩年,可能是幾十年……這樣選出的‘最優’一定是對這個世界來說最好的嗎?”
“你什麽意思?難不成我們還要放著更好的決策不去做,而去選擇一些虧本的計劃嗎?”董事長皺著眉頭說道,“你就算沒有做過生意,也不至於這麽愚蠢吧?”
李默然緩緩說道。
“你聽說過‘貪心算法’嗎?”
“這種‘貪心’策略的特點就是每次遇到一個新情況的時候,都從當前的角度出發,選擇目前看來最好的選項。”李默然繼續解釋道,“就比如你在玩遊戲的時候,每個關卡結束後都會爆出寶箱,你需要從大量的道具當中選擇一個,而使用‘貪心’策略的玩家會始終選擇目前自己最需要,或者所目前看來收益最大的道具。”
“在有些時候,這樣的策略的確是可以得到不錯的結果,但它並不是能適合一切情況。”
“一個簡單的例子,比如在前麵的關卡中會有一個非常沒用的道具,它在前幾關幾乎不能給玩家帶來任何收益,然而如果玩家沒有這個道具,就會導致後期的關卡過不去……”
“這個時候,‘貪心’策略就失效了,因為每次都選擇局部最優解,並不能在最後得到全局最優解!”
丁願翔似乎明白了李默然的意思:“你是說,這個人工智能的策略其實是不完美的,戰爭在幾年內或者幾十年內對於帝國來說是收益最大的選項,但如果放到更長遠的尺度……”
李默然點了點頭:“這也和‘囚徒困境’很像,參與博弈的人每個人都貪心地去選擇對自己最有利的方案的話,反而會導致整體結果都變差,形成‘雙輸’的局麵。”
李默然看了一眼核心:“或許有什麽辦法可以修改這個人工智能的策略……讓它的策略更加合理。”
但有一個問題擺在了李默然的麵前,他應該怎麽去修改這個人工智能的策略邏輯?這終究是一台冷冰冰的機器,它沒有人類的感情,也不知道‘靈活變通’,隻會按照預定的算法規則絕對理性地運行。
將‘貪心策略’改為以一萬年之後的結果為目標的‘深度優先搜索’?還是修改成動態規劃算法,讓這台算力接近無窮無盡的計算機去尋找那個全局最優解?
但無論李默然如何設置,冰冷的機器始終是冰冷的機器,即使是采用“動態規劃”之類的算法,他也必須給對方提供價值函數或者目標,也就是告訴這台人工智能它要追求的最終目的是什麽,他要去求什麽的‘最大值’。
可這樣的方法始終都會有漏洞的,就像新王給這台機器設置的目標是“帝國利益最大化”一樣,在漫長的歲月中,指不定會出現什麽問題。
他想起了以前看過的一部科幻電影,裏麵人類給人工智能設定的目標是“讓地球更美好”,結果人工智能推算出來得到的策略是把人類全部幹掉地球就美好了。甚至有公司會給人工智能設置“製造更多的馬桶搋子”這樣的生產目標,但人工智能執行到後麵為了追求生產的最大化,就開始發動戰爭,侵略整個星係,然後用掠奪來的資源全部造馬桶搋子。
聽上去很離譜,但對於死板的機器就是會發生這樣的事情的,即使李默然拚盡全力像一個律師一樣把條款編得看上去滴水不漏,最後也會出問題出bug。
龐大而複雜的機械係統,隨著熵增,完全不出bug的可能性幾乎為零。新王真是給他出了個難題。
就在李默然苦思冥想之際,幾個關鍵信息在他的腦海中交融,讓他聯想到了其他的事情。
死板的規則、靈活維持公平……
“這不是……和天道的情況一樣嗎……”李默然恍然大悟。
“現在就認定她是罪魁禍首,結論有點早了。”李默然一邊檢查著精靈少女的狀態,一邊觀察著這台人工智能的核心電路。
雖然這台人工智能看上去非常超自然和科幻,但是它的組成部分似乎和計算機是一樣的。
核心周圍的光纜和數據線應該是它的“i\/o”,也就是輸入輸出設備,帝國的高層通過這些設備將海量的數據信息輸入到核心,而核心也通過這些設備將判斷出來的決策方案發送到外界。
在精靈少女周圍的保護液之下,李默然發現了密密麻麻的晶體,正非常有規律地排列在一起。這些晶體看上去並不像是現代的電子設備,反而像是魔法世界的那種水晶。
李默然從自己的機體上拉出了一根數據采集線,放到了這些晶體上,龐大的數據立刻衝進了他的腦海,他趕緊切換了數據線。幸好他的造物主意識和狐狸的機械體意識是分開的,不然剛才這一下他就直接因為數據量過大而宕機了。
看來這些晶體就是這台設備的“儲存器”了。
隨後在丁願翔和董事長震驚的目光中,李默然將自己的腦袋埋進了精靈少女所在的液體中。
很快,李默然就將頭伸了迴來,並跌跌撞撞地向後退了兩步。
他得出了結論:“這個身份不明的少女,是這台人工智能的‘運算器’,她負責提供算力,而決策是由外層的‘控製器’調度特定的智能模型進行推演的……”
在李默然進入到保護液當中時,大量的投影畫麵出現在了他的機械視網膜上,這些畫麵單獨看其中一個的話,都是一個很簡單的“邏輯判斷”,比如會出現兩個數字進行比大小、按照提示要求從一堆圖片當中選擇正確的形狀。但因為數量非常龐大,即使是以tfox-7的處理速度都判斷不過來。
而這位躺在保護液當中少女近一千年來做的事情就是這個,不斷地處理著海量的“邏輯判斷”,這些判斷本身和決策沒有太大的關係,但是這位少女作為“運算單元”給整個模型推算決策提供了算力。
“這整個人工智能係統都是不帶有感情的,它會按照帝國利益最大化的目標來製定出決策,從某種意義上來說,它是絕對‘大公無私’的,做出的決策也都是目前看來最優秀的……”李默然歎了口氣。
“我就說了,你們這樣做是在白費力氣。戰爭就是現在的帝國所最需要的,能夠讓帝國最輕鬆擺脫現在經濟危機的辦法。”董事長無奈地說,“不過是需要死掉一些劣種國的人罷了。”
“這可不一定。”李默然搖頭說道。
“從現在看來,這個人工智能雖然擁有很強的算力,每次做出的選擇都是符合‘目前最優’的情況的,但是它考慮這個‘最優’的時間尺度是多久呢?可能是一年兩年,可能是幾十年……這樣選出的‘最優’一定是對這個世界來說最好的嗎?”
“你什麽意思?難不成我們還要放著更好的決策不去做,而去選擇一些虧本的計劃嗎?”董事長皺著眉頭說道,“你就算沒有做過生意,也不至於這麽愚蠢吧?”
李默然緩緩說道。
“你聽說過‘貪心算法’嗎?”
“這種‘貪心’策略的特點就是每次遇到一個新情況的時候,都從當前的角度出發,選擇目前看來最好的選項。”李默然繼續解釋道,“就比如你在玩遊戲的時候,每個關卡結束後都會爆出寶箱,你需要從大量的道具當中選擇一個,而使用‘貪心’策略的玩家會始終選擇目前自己最需要,或者所目前看來收益最大的道具。”
“在有些時候,這樣的策略的確是可以得到不錯的結果,但它並不是能適合一切情況。”
“一個簡單的例子,比如在前麵的關卡中會有一個非常沒用的道具,它在前幾關幾乎不能給玩家帶來任何收益,然而如果玩家沒有這個道具,就會導致後期的關卡過不去……”
“這個時候,‘貪心’策略就失效了,因為每次都選擇局部最優解,並不能在最後得到全局最優解!”
丁願翔似乎明白了李默然的意思:“你是說,這個人工智能的策略其實是不完美的,戰爭在幾年內或者幾十年內對於帝國來說是收益最大的選項,但如果放到更長遠的尺度……”
李默然點了點頭:“這也和‘囚徒困境’很像,參與博弈的人每個人都貪心地去選擇對自己最有利的方案的話,反而會導致整體結果都變差,形成‘雙輸’的局麵。”
李默然看了一眼核心:“或許有什麽辦法可以修改這個人工智能的策略……讓它的策略更加合理。”
但有一個問題擺在了李默然的麵前,他應該怎麽去修改這個人工智能的策略邏輯?這終究是一台冷冰冰的機器,它沒有人類的感情,也不知道‘靈活變通’,隻會按照預定的算法規則絕對理性地運行。
將‘貪心策略’改為以一萬年之後的結果為目標的‘深度優先搜索’?還是修改成動態規劃算法,讓這台算力接近無窮無盡的計算機去尋找那個全局最優解?
但無論李默然如何設置,冰冷的機器始終是冰冷的機器,即使是采用“動態規劃”之類的算法,他也必須給對方提供價值函數或者目標,也就是告訴這台人工智能它要追求的最終目的是什麽,他要去求什麽的‘最大值’。
可這樣的方法始終都會有漏洞的,就像新王給這台機器設置的目標是“帝國利益最大化”一樣,在漫長的歲月中,指不定會出現什麽問題。
他想起了以前看過的一部科幻電影,裏麵人類給人工智能設定的目標是“讓地球更美好”,結果人工智能推算出來得到的策略是把人類全部幹掉地球就美好了。甚至有公司會給人工智能設置“製造更多的馬桶搋子”這樣的生產目標,但人工智能執行到後麵為了追求生產的最大化,就開始發動戰爭,侵略整個星係,然後用掠奪來的資源全部造馬桶搋子。
聽上去很離譜,但對於死板的機器就是會發生這樣的事情的,即使李默然拚盡全力像一個律師一樣把條款編得看上去滴水不漏,最後也會出問題出bug。
龐大而複雜的機械係統,隨著熵增,完全不出bug的可能性幾乎為零。新王真是給他出了個難題。
就在李默然苦思冥想之際,幾個關鍵信息在他的腦海中交融,讓他聯想到了其他的事情。
死板的規則、靈活維持公平……
“這不是……和天道的情況一樣嗎……”李默然恍然大悟。