WWW 全球資訊系統之介紹及其展望
作者: 吳毅成

  • 前言
  • WWW 的資訊模式
  • WWW 與 Internet
  • WWW 簡史
  • Mosaic
  • 主僕分散式擷取模式
  • WWW 的現階段發展
  • 結語
  • 參考文獻

  • 前言

      人類在閱覽一些文件或媒體時,常常有個夢想:希望祇需要拿一隻筆、滑鼠、或使用一 個能指示位置的東西,在此文件中某個有趣的特殊名詞、作者、組織、相關工作輕輕地一按 ,無論此資料被置放於何處,都可很快速地取出相關的參考資料,並將之呈現於眼前來。同 時我們也希望此參考資料可以是更加活潑生動的聲音、影像、動畫等多媒體資訊,而不再受 限於傳統的文字或圖片文件。簡而言之,我們希望能將各式各樣資訊的擷取動作,操控於指 掌間。

      然而這已漸漸地不再是個夢想!藉助於電腦與電腦網路的快速發展,一個叫做 WWW( World-Wide Web )全球資訊系統正逐步在實現這個理想。這套資訊系統可讓全世界的電子 文件包括任何個人獨自所提供的各種多媒體資料,藉由網路自然地整合起來,讀者可透過此 系統擷取許多線上的資訊。

      例如,當閱讀本文時,讀者可能對 WWW 的原始文獻感到興趣,或想了解本文作者的學 歷背景或學術研究方向。若讀者是從〞資訊與教育〞雜誌──傳統的資訊媒體──閱讀本文 ,則無法實現前述的理想,必須走到圖書館查閱。若讀者是從 WWW 資訊系統讀本文章,則 只需要在〞 WWW ”文字上,用滑鼠按一下即可擷取 WWW 的原始文獻。若在〞吳毅成〞處按 一下,則可擷取有關〞吳毅成〞的最新個人資料。

      為了讓讀者對 WWW 有更深入的了解,本文將更進一步地探討 WWW 的一些相關問題,例 如 WWW 的抽象資訊模式、所使用的網路系統、通訊協定模式、及 WWW 的未來展望。


    WWW 的資訊模式

      電腦提供人類兩種有用的資訊擷取方法:第一種是由 V. Bush 在 1954 年所提出的超 文字( hypertext)方法,這個方法藉由超文字連結並擷取相關的文件,這仿效人類思維中 常會由文字思考到與此文字相關連的事物或資訊。第二種是文字搜尋方法,這個方法藉由搜 尋某文字來找出相關連於此文字的文章。在 WWW 資訊模式中同時提供這兩類資訊擷取方法 。

      超文字幾乎與一般的文字( text )相同,可被存取,搜尋及編輯。但超文字有一個最 大的不同點,那就是超文字與另一文件有連結關係,就好像被貼了一鏈結( link )將之連 到另一文件。我們稱此鏈結為〞超鏈結〞。若在此超文字上按了一下,系統將會把超鏈結所 指的另一文件取出。超文字的英文字 hypertext 中的 hyper 有超越、跳躍的意思,這意味 著可從一文件藉由超文字跳躍到另一個文件,不必再受傳統依序閱讀文件的束縛。

      現在讓我們來看一下圖一的例子,在此圖中有文件 A 到 G,文件 A 是此系統的啟始文 件( home page ),在此文件中〞吳毅成〞是一個超文字,讀者可藉由此超文字,讀到文 件 B。(註:超文字系統通常會把超文字塗上另一顏色或加底線以示區別。)接著,再由文 件 B 中的〞學術研究〞超文字讀取到文件 C,由文件 C 中的〞WWW〞超文字讀取到文件 D 。在超文字系統中,我們可藉由不同路徑來擷取同一份文件。例如,在圖一的文件 A 中, 我們可藉由文件 A 中的〞吳毅成〞超文字、文件 B 中的〞蘇瑞元〞超文字,讀取到文件 E ;我們亦可藉由文件 A 中的〞實驗室研究人員〞超文字、文件 F 中的〞蘇瑞元〞超文字, 讀取到文件 E。

      另外,我們也可藉由文字搜尋的方式,找到所需的文件。例如,在圖一的文件 A 中, 查詢姓〞 蘇〞的人員,這時可藉由查出的結果(在文件 G )找到文件 E。

      WWW 資訊系統實際上更進一步地把超文字擴充到超媒體。基本上,超媒體系統就是把超 文字系統中對文字的處理延伸到對多媒體的處理。我們可由兩方來了解超媒體:

  • 由超鏈結所連到的資訊,不限於文字資訊,它可以是各式各樣的多媒體資訊,例如聲音 、圖片、影像、動畫等。

  • 超鏈結不只可被貼於文字上,亦可被貼於圖片上。

  • 超媒體的例子很多,例如:

  • 當閱讀一段英文文章時,若想聽聽美語系人的發音,可選取此段,來聆聽英文發音。這 將大大地幫助了非英語系國家的人學習英文會話的效果。

  • 當看到一個公司或學校的平面圖時,若想了解某一辦公室情形,可在此室的位置按一下 ,這就可讀到相關於此室的資訊,例如,在此辦公人員的資料。

  • 當閱讀某篇描述彈性振動的文章時,可藉由某超文字來讀取一個能顯示彈簧振動的動態 影片。觀看這樣的影片可加深對彈簧物理特性的了解。

  • 當讀到某個新產品時,可藉由超文字來讀取一個有關此產品的影片。例如此影片可不斷 地旋轉此產品,使顧客能仔細地從各角度觀察此產品。


  • WWW 與 Internet

      WWW 與其它超媒體系統最大的不同點是其超鏈結不受限於只能連結到單一電腦或有限數 量電腦系統的檔案,它可連結到 Internet 下的各個角落!那它是怎樣的一個網路呢?

      Internet 是一個連通全世界許多區域性網路的網路。實際上,Internet 這英文字本身 字面的意思就是〞網路的網路〞。依大約的估算,目 前已有數千萬個使用者,遍佈全球至少 50 個國家。因為使用群的龐大,所以 Internet 可 說是溝通全世界資訊的最重要網路之一。

      因為 WWW 的超鍵結是透過無遠弗屆的 Internet 來連結資訊,所以 WWW 一個極為重要 的特性就是把整個 Internet 上的可讀資訊,當作 WWW 的〞資訊庫〞。基本上,每個人、 每個單位可自已提供超媒體資訊,並置於 WWW 下,目前 Internet 上已有許多許多有價值 的資訊。用戶( Client )則可藉由 WWW 資訊系統透過 Internet,瀏覽這些超媒體資訊。


    WWW 簡史

      在 1989年3月,歐洲高能物理研究群( 簡稱為 CERN )Tim Berners-Lee 首先提出 WWW 資訊系統。當初的目的是希望能藉由這樣的一個超媒體系統把散在歐洲各國的物理研 究單位之研究成果,透過 Internet 整合起來。使研究人員可藉由這樣的一套系統迅速地交 換研究心得。

      數月後,美國高速計算應用中心( 簡稱為 NCSA )開始發展一個叫做 MosaicWWW 人機介面。其目的是希望從這樣的計劃,發掘新的研究領域及商業價值。這套人機介面一直 到 1993 年初,才正式公開給外界使用。

      在短短的一年左右時間, WWW 的使用率以極驚人的速度成果,由 Hughes 的資料顯示

  • 從 1993 年的 1月到 12月,用 WWW 管道傳送的字元量增加 187倍。在 1993年1月, WWW 的字元傳送量僅是 Internet 的第 127位,在 1994年 3、4 月間,其字元傳送量 已躍居 Internet 的第 11位
  • 在 1993年 6月,約有 100 多個 WWW 伺服器,然而 1994年 5月左右,已高達 4500 伺 服器,目前臺灣已有 10台左右的 WWW 伺服器。
  • 在 1994年 5月,約有數十萬個 WWW 讀者 。

  • Mosaic

      NCSA 發展出來的 Mosaic 是目前最受歡迎的 WWW 瀏覽工具。一個重要的原因是,它可 以支援各式各樣的系統,例如,大部份的 Unix 系統、SGIs、PCs、Macs 等。此外它亦具有 下列許多功能:
  • 能顯示超文字及超媒體文件(見圖二)
  • 提供多種語言(見圖二)
  • 提供多種字型(見圖二)
  • 提供聲音功能(見圖二)
  • 提供圖片功能(見圖二)
  • 可讀取 Internet 上其它資訊系統的資料。例如 gopher (見圖三)、ftp、nntp等 資訊系統。
  • 提供交談式的資料查詢。
  • 提供下註解功能。
  • 自設熱門資訊的選取清單( hotlist )。使用者可依自己的興趣把常讀取的資訊之 位置,放在此清單,以便於下次讀取。當下次讀時,可直接從此清單取出,而不需 經過許多超鏈結來讀取。

  • 主僕分散式擷取模式( Client-Server Model)

      WWW 的資訊擷取動作是架構在 Internet 的主僕分散式結構下。在 WWW 的伺服器( Server )端,資訊提供者把有用的資訊置於伺服器中,供 WWW 用戶讀取。在 WWW 的用戶 ( client )端,提供人機界面( 例如 Mosaic )讓用戶藉由超文字的超鏈結擷取伺服器 的文件。

      首先,我們先來研究 WWW 的超鏈結。其超鏈結是用所謂的 URL ( Universal Resource Locator )格式。此格式是由下列三項組成的:(1)通訊協定,(2)伺服器 在 Internet 上的地址,及此機器的埠( port )號(這通常是 80),(3)在伺服器中 的檔名。例如,在圖四中〞 吳毅成〞上超鏈結的 URL 如下:

      http://www.csie.nctu.edu.tw:80/~icwu/chindex.html

    這表示〞 吳毅成〞上的超鏈結所對應的文件是在 www.csie.nctu.edu.tw 伺服器中(用第 80埠)的 /~icwu/chindex.html 檔中。我們可用 WWW 的標準超文字傳輸協定( Hypertext Transmission Protocol )來取得此檔案。若一超鏈結是要連到其它的資訊系統,例如 gopher、ftp等,我們只須把 http 改為 gopher 或 ftp 即可。

      接著,我們要來探討 HTTP 通訊協定。在圖四的文件中,若讀者在〞 吳毅成〞處按一 下,用戶端程式由超鏈結的 URL 查知其將用 HTTP 協定,因此開始與 www.csie.nctu.edu.tw 伺服器用 HTTP 協定擷取文件。首先用戶端送〞GET /~icwu/chindex.html" HTTP 命令給伺服器,然後此伺服器接受此命令後讀取 /~icwu/chindex.html 檔,並傳回給用戶端程式。當用戶端讀到此檔後,就將此檔 以多媒體形態呈現出來。

      WWW 上所使用的檔都是遵循一個叫做 HTML( HyperText Markup Language )的超媒體 語言,通常 HTML 檔案的檔名以〞.html”結尾。此語言非常接近已廣為使用的 SGML( Standard Generalized Marked Language )語言。 請參見一個 HTML 的例子。目前的 HTML 的最新版叫 HTML+,它增加了許多新功能,例如,提供交談式填表功能、數學符號的 表示、表格( Table )的表示。


    WWW 的現階段發展

      目前仍然有許多相關於 WWW 的研究技術或計劃正在發展中,例如:
  • 資訊的保護:目前 WWW 上的所有資訊,均可被他人讀取,然而有些資訊可能只能給 部分使用者閱讀,例如一公司的內部文件,只能給公司的內部人員閱讀。
  • 付費資訊與使用權分等級:有些具有商業用途的資訊,必須付費才可讀取,或依使用 權等級來決定可讀取資訊的量或類別。
  • Cache 功能的提供:通常在瀏覽超媒體資訊時,常會反覆讀取資訊,若能將讀過的資 訊存起來,可減少遠距離的讀取次數,這可使效率大為提高。
  • 電腦輔助教學:基本想法是把教科書置於 WWW 上,讓學習者自由閱覽。若學習者有 任何疑問可透過一些伺服器,向伺服器上的助教請教。目前一個叫做 GNA( Globalwide Network Academy )計劃正在做這方面的嚐試。

  • 結語

      WWW 全球資訊系統極重要的特色是把整個 Internet 的資料當作 WWW 的〞 資訊庫〞, 並且可讓讀者藉由超媒體的方式容易地瀏覽資訊。對資訊提供者言,只要把自己的資訊掛在 WWW 系統上就可容易地讓他人讀取,這甚至可成為一很好的宣傳方式。對資訊的讀者言,在 這工商業競爭激烈的環境下,誰能迅速擷取有用資訊,往往就是贏家。再加上 Internet 上 就有取之不盡,用之不竭的資訊,我們相信 WWW 會很快地從學術界走入工商業界,甚至到 一般的民間。

    圖一的文件 A http://dist1.csie.nctu.edu.tw/Lab.html 圖一的文件 B http://www.csie.nctu.edu.tw/~icwu/chindex.html


    參考文獻

  • Bush, V. (1945): As We May Think. The Atlantic Monthly.
  • Berners-Lee, et. al. (1992): World-Wide Web: The Information Universe. in Electronic Networking: Research, Applications and Policy, pp52-58
  • Krol (1992): The Whole INTERNET User's Guide and Catalog. Sebastopol CA, O'Reilly Associates.
  • 圖一: WWW 資訊模式的一個例子 圖二: Mosaic 顯示資訊的一個例子 圖三: Mosaic 可以讀取 gopher 資訊系統的資料 圖四: HTTP 通訊協定