2009-05-31

新搜索「計算」工具

前幾個星期在週記中提到的 Wolfram Alpha,我想沒幾個人去使用吧。基於是 Mathematica 的使用者,又有朋友是其大力的推行者,所以順便推推嘍。究竟 Wolfram Alpha 到底是什麼?開啟它的網頁,你一定會認為「只是個搜索器…」,一使用,結果更遭,什麼都搜不到… 哈哈哈,心裡即刻冒出 X 的字眼。這就翻譯一篇國外科技新聞的內容,介紹一下 Wolfram Alpha 吧!(閱讀起來若有不順,敬請見諒嘍…)


假設以光速出發到土星,需要多久的時間呢?

利用週一登場的線上計算機知識引擎 Wolfram Alpha,不需要一秒的時間,答案是 75 分鐘。

網頁使用者對該服務遞出自訂的問題,Wolfram Alpha 會即刻試著找出答案。一位 35 歲健康女性,在未來十年內,罹患心藏病的機率有多大?1/167。Washington D.C. 在兩百週年當年,1976 年溫度是?平均華氏 74 度。

Google 與 Wikipedia 兩個著名線上參考工具,遇到類似的問題時,會對大量的網頁資料來進行搜尋,期望獲得問題的解答。

但 Wolfram Alpha 確非如此運作。Stephen Wolfram:「我們並不使用一般大眾在網頁上所寫的資料」,他是此項計畫的創作者。「我們嘗試使用實際的人類知識資產去計算出精確答案。」

為了完成這項工作,Wolfram 以及他的 human curators 團隊在他們的系統建立大量的數學方程式。數千資料的來源,有如科學期刊、百科全書、官方博物館以及任何能取得可信資料的公司,是他們建立了約 10 TB 大小的資料庫。

10 TB 的資料庫是多大呢?問 Wolfram Alpha 吧,他會告訴你「大約是國會圖書館文本類資料的一半」以及更多的訊息。

添加更多的資料及增強計算能力將是無止境的過程,Wolfram說到「我們主要所要做的,是針對每個領域的專家」

而是否所有精確知識將會轉換到廣告費用仍然在觀察之中。部份分析師懷疑該網站的潛力將同 Google 般被大量的一般線上使用者而耗盡。

Douglas Clinton 表示「大多數的搜索利潤來自於進行商業相關類型搜索的人」。於投資公司的 Piper Jaffray 分析師「你不會去問 Wolfram Alpha 計算機『哪一種數位相機最好?』這樣的問題,因為這種問題的答案並不是一種算式可得。」

如同許多興奮地進入知識搜尋市場的新手,Wolfram Alpha 並沒有脫離與 Google 的比較,以及思索能獲得龐大的搜索市場中多少的佔有率。但是他們的任務聲明確切的闡述這兩種服務是全然不同的。

Google 是極希望「整理全世界的訊息,並使這些訊息能夠普遍的被接受及使用」換句話說,Wolfram Alpha 則是重於「是否每件事物都可被計算出來」這是崇高的理想,卻尚未達到。

Wolfram Alpha 能夠演釋出丙酮溶劑的分子結構,可以列出美國許多城市最近的地震資料,也可以告訴你坦尚尼亞的通貨膨脹率。然而,它還是會失算,例如你問它「現在幾點?」

Wolfram 自己指出「讓引擎夠聰明,並非僅僅對它填入更多的資料。有時甚至答案都可能已在資料庫中,但軟體卻無法輕易瞭解問題問的是什麼。」

例如,問「California 現在幾點?」這就可以得到正確的答案!因此,整個設計過程有一半的努力奮鬥是在教導程式去瞭解人類的語言,使它理解被要求去做什麼。

目前大致能夠看得出,Wolfram Alpha 是新穎、聰明這類搜索引擎的領導者。它使用被稱之為語意科技(semantic technology),這是一種讓計算機能夠擷取概念以及簡單的學習,可視為下個網路服務的產物。

這意味著它是人工智慧嗎?紐約 Rensselaer Polytechnic 研究所計算機科學教授 James Hendler的 答案是 「並不全然。計算機逐漸在大量的資料庫中能夠具有模式的認知,這表示其具備某種強大的學習能力。但依舊無法完美的像人一般,指出非常普遍、或具有直覺性、或複雜的事物。」


Stephen Wolfram 特殊的符號工具(類似量物的 operator),開發出了有別於眾多計算軟體的 Mathematica。它的說明手冊厚厚一本,若將它純粹以「字典」視之,則無法窺見 Wolfram 的深刻用意與寓意。第一次懂得要體悟 Mathematica,是大師兄問我「你對 Mathematica 有什麼看法?」才曉得「它有不同的『看法』!?」

一直致力於 Mathematica 的寶三說「用 Mathematica 證實時間的單向性」、「Mathematica 可以找出人類還未知的知識」,我沒看過 Stephen Wolfram 介紹 Mathematica 的那本書,但是我還持同樣的想法「它能夠徹底符合邏輯的來推演出某種人類尚未得到的證明,但是推論出來的東西還是必須有相當的鑑別率的人,才看過濾出來。過濾的時間可能不亞於人的直接推演。」

Wolfram 從 Mathematica 再開發出 Wolfram Alpha,很類知識的推演,雖然目前推演的過程與資料是在既有的知識中打轉,但可預期的,這是朝向「無中生有」開場,未來這部搜索引擎可能具有預測的能力吧!不過再說回來,要達到自我有預測能力,一種無非是龐大的超級計算機,另一種則是人工智慧。當然超級計算機絕對不會是值得努力的終極目標,而數年前即已興起的人工智慧當時受挫於理解人類語言的問題,如今依舊是個必須征服的山峰。建立汗牛充棟的資料庫已確定是條死胡同,語言學如何拆解、分析人類帶情感性的語言結構絕對影響著人工智慧的開發,使它像孩童一般從呀呀學語到最後懂得話中有話的深刻意義,這才是智慧的學習。

Wolfram Alpha 好不好用?會不會用(中文發問它看不懂…)?試試看吧!將它當作工程計算機,也是可以喔!

沒有留言: