2009-07-28

網路世界的第一站

 資料來源(奇蹟文庫)
LHC會導致物理學革命,是否也會導致互聯網革命?

我們已經知道大型強子對撞機將成為人類歷史上最大也是最貴的物理實驗。相對論性的高能粒子將以前所未及的能量——質心能量最高將達到1.4*1013電子伏特——相互碰撞,並產生大量的粒子——其中可能會包括未知的新粒子——它們將被粒子探測器探測到並被記錄下相應的運動軌跡。這個歷史性的實驗需要配套相應的海量數據收集和存儲的能力,這會革新現有的數據處理方式。大型強子對撞機上每五秒鐘就會產生相當於一張 DVD 光盤容量的數據,也就是相當於每秒產生 1G 的數據量。我們可以做一個簡單的對比以說明這到底是怎樣的一個概念:一台普通的家用電腦,在網絡連接都正常的情況下,下載數據的速度一般可以達到每秒鐘兩兆;也就是說大型強子對撞機產生數據的速率是家用電腦正常下載速率的五百倍。正因為如此大型強子對撞機的工程師們才開發了一種新的數據處理方法,將幾百萬GB的數據分佈式地保存於全世界的合作單位。

 


在1990年的時候,歐洲核子中心(CERN: European Organization for Nuclear Research)就曾經革新過我們的生活方式。在此前一年,歐洲核子中心的一位科學家 Tim Berners-Lee 提出了一項電子信息管理方案,在這個方案裡他提出了一種稱為超文本的技術,它可以使得信息在互聯網上的傳播變得更為便捷。不久,他和另一位合作者——歐洲核子中心的系統工程師 Robert Cailliau——一起搭建了一個信息網絡,來幫助歐洲核子中心的科學家們通過個人電腦更好地合作和分享信息,而不再需要將信息存儲在棘手的存儲設備上來傳播,超文本使得使用者可以通過網頁上的超連接搜索和分享文本。Berners-Lee 接著順勢開發了相應的瀏覽編輯器,從而迅速地使得大量的用戶能夠使用這種新的通訊方式。到了1990年5月,歐洲核子中心的科學家們給這種新的網絡技術命名為萬維網(World Wide Web)。實際上,歐洲核子中心建成了世界上第一個網站http://info.cern.ch/,該網站的早期頁面可以通過這個鏈接看到。


因此歐洲核子中心對於通過互聯網管理數據並不是外行,但這個嶄新的大型強子對撞機還是給科學家們帶來了挑戰。佐治亞理工學院(Georgia Institute of Technology)的高性能計算執行主管 David Bader 強調,互聯網目前允許的帶寬是一個巨大的瓶頸,這使得人們迫切地需要開發新的數據共享技術。雖然歐洲核子中心已經決定這些數據將通過網絡提供給全世界的科學家合作研究,但是這些數據會很快使得互聯網薄弱的帶寬不負重荷。


這就是設計大型強子對撞機計算網格(Computing Grid)的原因。網格將處理節點上的大量數據包,其中第零層節點(Tier 0)就位於瑞士附近的歐洲核子中心。第零層節點是一個擁有一百萬個高性能CPU的並行電腦網絡,它被用來實時存儲和處理大型強子對撞機上噴湧而出的大量原始數據。需要注意,並不是所有的粒子碰撞過程都會被探測裝置記錄下來,只有很小的一部分能夠被捕獲,即使如此產生的數據量還是很大。


第零層節點將這些原始數據通過十條帶寬為10G每秒的光纖分發到下一層的節點——分佈於北美、亞洲和歐洲的十個第一層級節點(Tier 1)。這使得歐洲核子中心的合作者可以分析大型強子對撞機上探測器獲得的數據,比如美國紐約布魯克海文國家實驗室(BNL: Brookhaven National Laboratory)的相對論重離子對撞機(RHIC: Relativistic Heavy Ion Collider)合作組可以比較ALIC探測器上獲得的數據和他們自己在相對論重離子對撞機上獲得的數據。


在第一層級節點上,數據將被打包並分發到140個分佈在世界各地的大學、實驗室和私人公司的下一層級節點上。這時候科學家們就可以獲取這些數據包,從而將這些二進制的代碼轉換成關於粒子能量和徑跡的有用信息。


這個層級系統非常好而且可以獨立工作,但是如果沒有高效的軟件——稱為中間件(Middleware)——它還不能發揮效用。當用戶獲取數據的時候,這些數據可能以不同的格式分佈在不同的節點上。一個稱為 Globus 的開源中間件平台將負責蒐集這些數據的信息並提供給用戶,對用戶而言這些數據就像在自己的電腦裡一樣可以隨意調用。


正是這個層級系統、高速網絡聯接和靈巧軟件的結合將會超越大型強子對撞機項目,影響並更為直接地變革我們使用網絡的方式,它將使得我們可以通過網絡隨意地獲得我們需要的東西,網絡對用戶而言變得更加透明了。這是一個非常值得期待的場景。

沒有留言: