第79章 超級內核芯片的誕生 女媧的前身細說
星係霸主之仙雲星係戰記 作者:幕後黑手 投票推薦 加入書簽 留言反饋
普通pc處理數據采用的是單行線,也就是一串數據隻用一條線路處理,這樣的處理方式叫做串行數據處理,這樣的方式一次隻能處理一串數據,效率低下。
後麵隨著電腦的發展,計算機科學家提出了並行數據處理的方法,也就是一個數據可以同時分為多個部分單獨處理,但始終沒法大規模實現,因為有的數據處理是不可分割的。
就拿一部電影來說,分為視頻信道和音頻信道,而兩者是時間同步的,要想播放一部電影就必須把音頻信道夾雜在視頻信道裏一起播放,而不是分開播放,否則會造成聲音和畫麵不同步。
後來多核cpu的出現一定程度上解決了這個問題,可以音頻和視頻信道分開處理,同時序播放,但音頻和視頻還是要各占一個數據處理通道,本質還是離不開串行數據處理方式。
有沒有更進一步的解決辦法呢,答案是有!有兩種辦法!
要麽是為每個程序專門設計一個cpu,這個一聽就不靠譜,大眾化、通用的pc要為了某一個app或者軟件專門設計製造一個硬件?!得多大的麵子啊!
先不說全世界有多少軟件種類,工作量有多大,就光說程序,一旦升級之後,舊的硬件也就得跟著更新,誰家電腦是白菜價也不能天天換cpu吧!(提一嘴——量子計算機就是因為這個原因無法普及——每個運算過程都需要專門設計運算單元)
另一個辦法,是把一整串數據按時序分割成更小的數據包,讓更細小但是更專業的處理單元分別處理,然後匯總處理結果,排列調整時序,最終得出處理結果。
這個方法靠譜點,而且已經大規模應用,具體參考gpu結構。
女媧的原始結構中,有一部分就采用的第二類方法,不過更複雜。
雷權在軍隊待過不少時間,所以對自己所用的設備有一個通用要求——可靠!
如果兩個係統一個強大但是不可靠,一個可靠但不強大,雷權寧可選擇後者。
雷權深入研究了人腦的基本結構單元——神經元,然後發現這是一種機製非常複雜但是也超級高效率的結構。
人類大腦光是功能分區就有幾十個,每個功能分區負責處理的信號還不一樣,但基本模式一樣。
玩過we(魔獸編輯器)的都知道,其內置語言jass是一種非常優秀的語言結構,簡潔、高效、發揮空間極大、可拓展性極強,但語法非常簡單。
他們把很複雜的動作總結為“事件-條件-動作”這三個步驟,事件是指一件事發生的起始動作,條件相當於對這件事的處理依據,動作就是處理結果。
舉個例子,人被針紮了一下,紮的很深,然後跳了起來。
這個過程中,被針紮是“事件”,針刺激到痛覺神經就是“條件”,跳起來就是“動作”。
人腦對外界信息的反應也是這麽一個過程,不過要額外加上一個“目標”。
整個流程就變為:目標-條件-動作,這樣一來,人的行為就由被動處理周邊信息做出反應,到主動出擊完成自己的目標的一個過程。
簡單來說就是人類跟電腦的最大區別就是這個由被動變主動的區別。
舉個例子,老王想要按摩,這是他的目標,於是他會為了這個目標開始有計劃的攢私房錢,然後找個老婆不在家的時間,然後找個隱秘的小巷子,一頭鑽進了一家外麵啥都看不見的按摩店。
這個過程中,“按摩”是目標,足夠的私房錢、合適的時間、合適的地點是“條件”,一頭紮進按摩店是“動作”。
這個流程一看就很順暢,符合人類邏輯和行為習慣。
基於這個過程,雷權簡化了他所認識的大腦結構,提取其核心部分形成了一個數學模型,然後進行了物理建模,生產出來了一個小型的神經元網絡計算機,也是女媧的雛形。
雷權將數據分配了8個大類並分別製造了專門的類神經網絡計算機,這八個大類主要包括:聲、光、電、熱、磁、核、力、化。
聲、熱、磁、力類數據的神經網絡計算機最好實現,隻需要傳感器和簡單神經網絡計算機就可以處理,它們會把這幾類信號按照特定要求進行細分和處理。
比如聲音信號會按照頻段、振幅等,在神經網絡裏瞬間分解為1024個級別,足夠的細分可以讓音頻被分解成很多接近標準化的分段。
這樣一來,所有音頻信號經過第一層“神經網絡”一個“分段-標準化”的過程處理後,就可以近似簡化形成一係列編號,到了二級神經網絡裏所需的數據處理量就會大大減少,占用的存儲空間也會變得極少。
就拿標準鋼琴來舉例子,88個音符,每個都是一小段不同的音頻,但這些音頻對應每個琴鍵又是相對固定的,一個琴鍵一個音,那麽我們就可以隻在一級神經網絡裏存儲88個音頻,這些音頻到了二級神經網絡裏就會變成88個數字編碼,而一些著名的鋼琴曲,其樂譜對應的數字是基本按順序固定的,那麽在三級神經網絡裏他們又會被簡化為一些標準組合,這些標準組合嘛,也是可以用一組特定編號代表簡化的。
這樣一來,幾乎人類所有的現有鋼琴曲,經過3級神經網絡計算壓縮之後,就會形成“樂譜”,樂譜所占用數據空間連幾十m都不到,以此類推,可能整個人類創作的音樂,經過處理之後,所占用的存儲空間連幾個g都不到。
而這個過程反向運行一下,我們就可以根據樂譜對應的編號的鋼琴音符來演奏出相應鋼琴曲,如果我們還有其他樂器的音符庫,那麽我們就能聽到吉他版的《time back》了!
延展一下,所有語言文字,也是一樣的處理方式,經過標準化處理,然後編號,然後經過神經網絡處理、存儲,現有的所有書籍所占的數據量也就不到10t。
這就是女媧一個足球大小的體積,卻能攜帶浩如煙海的資料的核心秘密。
現代ai功能之所以強大,在於存在世界各地服務器上的海量數據支撐和互相聯通的網絡提供的高速交互。
人腦內正常工作的神經元在10億級別,但一般隻用了3-6億左右,而現在主流cpu內集成的單元器件也已經達到了10億級別,二者數量上差不多的。
但電腦運算速度雖然快,但在並行處理多事務的性能上卻被人腦完虐。
況且人類大腦其實是處於封印狀態的,受限於物理結構和化學物質的運行效率,他有一個運行速度上限,就像cpu的鍾頻一樣決定著一個芯片的運算速度。
女媧的原型機就是基於雷權對大腦的結構研究得來的科技成果。
後麵隨著電腦的發展,計算機科學家提出了並行數據處理的方法,也就是一個數據可以同時分為多個部分單獨處理,但始終沒法大規模實現,因為有的數據處理是不可分割的。
就拿一部電影來說,分為視頻信道和音頻信道,而兩者是時間同步的,要想播放一部電影就必須把音頻信道夾雜在視頻信道裏一起播放,而不是分開播放,否則會造成聲音和畫麵不同步。
後來多核cpu的出現一定程度上解決了這個問題,可以音頻和視頻信道分開處理,同時序播放,但音頻和視頻還是要各占一個數據處理通道,本質還是離不開串行數據處理方式。
有沒有更進一步的解決辦法呢,答案是有!有兩種辦法!
要麽是為每個程序專門設計一個cpu,這個一聽就不靠譜,大眾化、通用的pc要為了某一個app或者軟件專門設計製造一個硬件?!得多大的麵子啊!
先不說全世界有多少軟件種類,工作量有多大,就光說程序,一旦升級之後,舊的硬件也就得跟著更新,誰家電腦是白菜價也不能天天換cpu吧!(提一嘴——量子計算機就是因為這個原因無法普及——每個運算過程都需要專門設計運算單元)
另一個辦法,是把一整串數據按時序分割成更小的數據包,讓更細小但是更專業的處理單元分別處理,然後匯總處理結果,排列調整時序,最終得出處理結果。
這個方法靠譜點,而且已經大規模應用,具體參考gpu結構。
女媧的原始結構中,有一部分就采用的第二類方法,不過更複雜。
雷權在軍隊待過不少時間,所以對自己所用的設備有一個通用要求——可靠!
如果兩個係統一個強大但是不可靠,一個可靠但不強大,雷權寧可選擇後者。
雷權深入研究了人腦的基本結構單元——神經元,然後發現這是一種機製非常複雜但是也超級高效率的結構。
人類大腦光是功能分區就有幾十個,每個功能分區負責處理的信號還不一樣,但基本模式一樣。
玩過we(魔獸編輯器)的都知道,其內置語言jass是一種非常優秀的語言結構,簡潔、高效、發揮空間極大、可拓展性極強,但語法非常簡單。
他們把很複雜的動作總結為“事件-條件-動作”這三個步驟,事件是指一件事發生的起始動作,條件相當於對這件事的處理依據,動作就是處理結果。
舉個例子,人被針紮了一下,紮的很深,然後跳了起來。
這個過程中,被針紮是“事件”,針刺激到痛覺神經就是“條件”,跳起來就是“動作”。
人腦對外界信息的反應也是這麽一個過程,不過要額外加上一個“目標”。
整個流程就變為:目標-條件-動作,這樣一來,人的行為就由被動處理周邊信息做出反應,到主動出擊完成自己的目標的一個過程。
簡單來說就是人類跟電腦的最大區別就是這個由被動變主動的區別。
舉個例子,老王想要按摩,這是他的目標,於是他會為了這個目標開始有計劃的攢私房錢,然後找個老婆不在家的時間,然後找個隱秘的小巷子,一頭鑽進了一家外麵啥都看不見的按摩店。
這個過程中,“按摩”是目標,足夠的私房錢、合適的時間、合適的地點是“條件”,一頭紮進按摩店是“動作”。
這個流程一看就很順暢,符合人類邏輯和行為習慣。
基於這個過程,雷權簡化了他所認識的大腦結構,提取其核心部分形成了一個數學模型,然後進行了物理建模,生產出來了一個小型的神經元網絡計算機,也是女媧的雛形。
雷權將數據分配了8個大類並分別製造了專門的類神經網絡計算機,這八個大類主要包括:聲、光、電、熱、磁、核、力、化。
聲、熱、磁、力類數據的神經網絡計算機最好實現,隻需要傳感器和簡單神經網絡計算機就可以處理,它們會把這幾類信號按照特定要求進行細分和處理。
比如聲音信號會按照頻段、振幅等,在神經網絡裏瞬間分解為1024個級別,足夠的細分可以讓音頻被分解成很多接近標準化的分段。
這樣一來,所有音頻信號經過第一層“神經網絡”一個“分段-標準化”的過程處理後,就可以近似簡化形成一係列編號,到了二級神經網絡裏所需的數據處理量就會大大減少,占用的存儲空間也會變得極少。
就拿標準鋼琴來舉例子,88個音符,每個都是一小段不同的音頻,但這些音頻對應每個琴鍵又是相對固定的,一個琴鍵一個音,那麽我們就可以隻在一級神經網絡裏存儲88個音頻,這些音頻到了二級神經網絡裏就會變成88個數字編碼,而一些著名的鋼琴曲,其樂譜對應的數字是基本按順序固定的,那麽在三級神經網絡裏他們又會被簡化為一些標準組合,這些標準組合嘛,也是可以用一組特定編號代表簡化的。
這樣一來,幾乎人類所有的現有鋼琴曲,經過3級神經網絡計算壓縮之後,就會形成“樂譜”,樂譜所占用數據空間連幾十m都不到,以此類推,可能整個人類創作的音樂,經過處理之後,所占用的存儲空間連幾個g都不到。
而這個過程反向運行一下,我們就可以根據樂譜對應的編號的鋼琴音符來演奏出相應鋼琴曲,如果我們還有其他樂器的音符庫,那麽我們就能聽到吉他版的《time back》了!
延展一下,所有語言文字,也是一樣的處理方式,經過標準化處理,然後編號,然後經過神經網絡處理、存儲,現有的所有書籍所占的數據量也就不到10t。
這就是女媧一個足球大小的體積,卻能攜帶浩如煙海的資料的核心秘密。
現代ai功能之所以強大,在於存在世界各地服務器上的海量數據支撐和互相聯通的網絡提供的高速交互。
人腦內正常工作的神經元在10億級別,但一般隻用了3-6億左右,而現在主流cpu內集成的單元器件也已經達到了10億級別,二者數量上差不多的。
但電腦運算速度雖然快,但在並行處理多事務的性能上卻被人腦完虐。
況且人類大腦其實是處於封印狀態的,受限於物理結構和化學物質的運行效率,他有一個運行速度上限,就像cpu的鍾頻一樣決定著一個芯片的運算速度。
女媧的原型機就是基於雷權對大腦的結構研究得來的科技成果。