WWW
全球資訊系統之介紹及其展望
作者:
吳毅成
前言
人類在閱覽一些文件或媒體時,常常有個夢想:希望祇需要拿一隻筆、滑鼠、或使用一
個能指示位置的東西,在此文件中某個有趣的特殊名詞、作者、組織、相關工作輕輕地一按
,無論此資料被置放於何處,都可很快速地取出相關的參考資料,並將之呈現於眼前來。同
時我們也希望此參考資料可以是更加活潑生動的聲音、影像、動畫等多媒體資訊,而不再受
限於傳統的文字或圖片文件。簡而言之,我們希望能將各式各樣資訊的擷取動作,操控於指
掌間。
然而這已漸漸地不再是個夢想!藉助於電腦與電腦網路的快速發展,一個叫做 WWW(
World-Wide Web )全球資訊系統正逐步在實現這個理想。這套資訊系統可讓全世界的電子
文件包括任何個人獨自所提供的各種多媒體資料,藉由網路自然地整合起來,讀者可透過此
系統擷取許多線上的資訊。
例如,當閱讀本文時,讀者可能對 WWW 的原始文獻感到興趣,或想了解本文作者的學
歷背景或學術研究方向。若讀者是從〞資訊與教育〞雜誌──傳統的資訊媒體──閱讀本文
,則無法實現前述的理想,必須走到圖書館查閱。若讀者是從 WWW 資訊系統讀本文章,則
只需要在〞 WWW
”文字上,用滑鼠按一下即可擷取 WWW
的原始文獻。若在〞吳毅成〞處按
一下,則可擷取有關〞吳毅成〞的最新個人資料。
為了讓讀者對 WWW 有更深入的了解,本文將更進一步地探討 WWW 的一些相關問題,例
如 WWW 的抽象資訊模式、所使用的網路系統、通訊協定模式、及 WWW 的未來展望。
WWW 的資訊模式
電腦提供人類兩種有用的資訊擷取方法:第一種是由 V. Bush 在 1954 年所提出的超
文字( hypertext)方法,這個方法藉由超文字連結並擷取相關的文件,這仿效人類思維中
常會由文字思考到與此文字相關連的事物或資訊。第二種是文字搜尋方法,這個方法藉由搜
尋某文字來找出相關連於此文字的文章。在 WWW 資訊模式中同時提供這兩類資訊擷取方法
。
超文字幾乎與一般的文字( text )相同,可被存取,搜尋及編輯。但超文字有一個最
大的不同點,那就是超文字與另一文件有連結關係,就好像被貼了一鏈結( link )將之連
到另一文件。我們稱此鏈結為〞超鏈結〞。若在此超文字上按了一下,系統將會把超鏈結所
指的另一文件取出。超文字的英文字 hypertext 中的 hyper 有超越、跳躍的意思,這意味
著可從一文件藉由超文字跳躍到另一個文件,不必再受傳統依序閱讀文件的束縛。
現在讓我們來看一下圖一的例子,在此圖中有文件 A 到 G,文件 A 是此系統的啟始文
件( home page ),在此文件中〞吳毅成〞是一個超文字,讀者可藉由此超文字,讀到文
件 B。(註:超文字系統通常會把超文字塗上另一顏色或加底線以示區別。)接著,再由文
件 B 中的〞學術研究〞超文字讀取到文件 C,由文件 C 中的〞WWW〞超文字讀取到文件 D
。在超文字系統中,我們可藉由不同路徑來擷取同一份文件。例如,在圖一的文件 A 中,
我們可藉由文件 A 中的〞吳毅成〞超文字、文件 B 中的〞蘇瑞元〞超文字,讀取到文件 E
;我們亦可藉由文件 A 中的〞實驗室研究人員〞超文字、文件 F 中的〞蘇瑞元〞超文字,
讀取到文件 E。
另外,我們也可藉由文字搜尋的方式,找到所需的文件。例如,在圖一的文件 A 中,
查詢姓〞 蘇〞的人員,這時可藉由查出的結果(在文件 G )找到文件 E。
WWW 資訊系統實際上更進一步地把超文字擴充到超媒體。基本上,超媒體系統就是把超
文字系統中對文字的處理延伸到對多媒體的處理。我們可由兩方來了解超媒體:
超媒體的例子很多,例如:
WWW 與 Internet
WWW 與其它超媒體系統最大的不同點是其超鏈結不受限於只能連結到單一電腦或有限數
量電腦系統的檔案,它可連結到 Internet 下的各個角落!那它是怎樣的一個網路呢?
Internet 是一個連通全世界許多區域性網路的網路。實際上,Internet 這英文字本身
字面的意思就是〞網路的網路〞。依大約的估算,目
前已有數千萬個使用者,遍佈全球至少 50 個國家。因為使用群的龐大,所以 Internet 可
說是溝通全世界資訊的最重要網路之一。
因為 WWW 的超鍵結是透過無遠弗屆的 Internet 來連結資訊,所以 WWW 一個極為重要
的特性就是把整個 Internet 上的可讀資訊,當作 WWW 的〞資訊庫〞。基本上,每個人、
每個單位可自已提供超媒體資訊,並置於 WWW 下,目前 Internet 上已有許多許多有價值
的資訊。用戶( Client )則可藉由 WWW 資訊系統透過 Internet,瀏覽這些超媒體資訊。
WWW 簡史
在 1989年3月,歐洲高能物理研究群(
簡稱為 CERN )的 Tim Berners-Lee 首先提出
WWW 資訊系統。當初的目的是希望能藉由這樣的一個超媒體系統把散在歐洲各國的物理研
究單位之研究成果,透過 Internet 整合起來。使研究人員可藉由這樣的一套系統迅速地交
換研究心得。
數月後,美國高速計算應用中心( 簡稱為 NCSA )開始發展一個叫做 Mosaic 的 WWW
人機介面。其目的是希望從這樣的計劃,發掘新的研究領域及商業價值。這套人機介面一直
到 1993 年初,才正式公開給外界使用。
在短短的一年左右時間, WWW
的使用率以極驚人的速度成果,由 Hughes 的資料顯示
Mosaic
NCSA 發展出來的 Mosaic 是目前最受歡迎的 WWW 瀏覽工具。一個重要的原因是,它可
以支援各式各樣的系統,例如,大部份的 Unix 系統、SGIs、PCs、Macs 等。此外它亦具有
下列許多功能:
主僕分散式擷取模式( Client-Server Model)
WWW 的資訊擷取動作是架構在 Internet 的主僕分散式結構下。在 WWW 的伺服器(
Server )端,資訊提供者把有用的資訊置於伺服器中,供 WWW 用戶讀取。在 WWW 的用戶
( client )端,提供人機界面( 例如 Mosaic )讓用戶藉由超文字的超鏈結擷取伺服器
的文件。
首先,我們先來研究 WWW 的超鏈結。其超鏈結是用所謂的
URL ( Universal
Resource Locator )格式。此格式是由下列三項組成的:(1)通訊協定,(2)伺服器
在 Internet 上的地址,及此機器的埠( port )號(這通常是 80),(3)在伺服器中
的檔名。例如,在圖四中〞 吳毅成〞上超鏈結的 URL 如下:
http://www.csie.nctu.edu.tw:80/~icwu/chindex.html
這表示〞 吳毅成〞上的超鏈結所對應的文件是在 www.csie.nctu.edu.tw 伺服器中(用第
80埠)的 /~icwu/chindex.html 檔中。我們可用 WWW 的標準超文字傳輸協定( Hypertext
Transmission Protocol )來取得此檔案。若一超鏈結是要連到其它的資訊系統,例如
gopher、ftp等,我們只須把 http 改為 gopher 或 ftp 即可。
接著,我們要來探討
HTTP 通訊協定。在圖四的文件中,若讀者在〞 吳毅成〞處按一
下,用戶端程式由超鏈結的 URL 查知其將用 HTTP 協定,因此開始與
www.csie.nctu.edu.tw 伺服器用 HTTP 協定擷取文件。首先用戶端送〞GET
/~icwu/chindex.html" HTTP 命令給伺服器,然後此伺服器接受此命令後讀取
/~icwu/chindex.html 檔,並傳回給用戶端程式。當用戶端讀到此檔後,就將此檔
以多媒體形態呈現出來。
WWW 上所使用的檔都是遵循一個叫做
HTML( HyperText Markup Language )的超媒體
語言,通常 HTML 檔案的檔名以〞.html”結尾。此語言非常接近已廣為使用的 SGML(
Standard Generalized Marked Language )語言。 請參見一個 HTML 的例子。目前的
HTML 的最新版叫 HTML+,它增加了許多新功能,例如,提供交談式填表功能、數學符號的
表示、表格( Table )的表示。
WWW 的現階段發展
目前仍然有許多相關於 WWW 的研究技術或計劃正在發展中,例如:
結語
WWW 全球資訊系統極重要的特色是把整個 Internet 的資料當作 WWW 的〞 資訊庫〞,
並且可讓讀者藉由超媒體的方式容易地瀏覽資訊。對資訊提供者言,只要把自己的資訊掛在
WWW 系統上就可容易地讓他人讀取,這甚至可成為一很好的宣傳方式。對資訊的讀者言,在
這工商業競爭激烈的環境下,誰能迅速擷取有用資訊,往往就是贏家。再加上 Internet 上
就有取之不盡,用之不竭的資訊,我們相信 WWW 會很快地從學術界走入工商業界,甚至到
一般的民間。
圖一的文件 A
http://dist1.csie.nctu.edu.tw/Lab.html
圖一的文件 B
http://www.csie.nctu.edu.tw/~icwu/chindex.html
參考文獻
圖一: WWW 資訊模式的一個例子
圖二: Mosaic 顯示資訊的一個例子
圖三: Mosaic 可以讀取 gopher 資訊系統的資料
圖四: HTTP 通訊協定