國立中央大學圖書館通訊 第二十七期 87年12月           專題報導

                                 連文雄

壹、背景說明

隨著網際網路的快速成長,與全球資訊網(WWW, World Wide Web)的風行, 在台灣學術網路(TANet)上,已經有愈來愈多的學校與圖書館,將各項圖書資訊服 務、教學、研究成果、招生、行政服務等各項資訊,透過WWW來做為整合與管 理應用的服務"窗口"。根據[教育部電算中心,1998]的統計,87年7月份TANet 到INTERNET的網路服務流量共1,421,067,678 KBytes,其中WWW的使用率為 56.93%,,可見WWW的使用與服務已漸居網際網路的主要地位。因此,如何妥善管 理代表學校資訊服務"窗口" -─ WWW 網站的問題,也愈來愈為重要。

然而任何需要管理的事物,都必須要有一套衡量品質的標準,才能作為後續 改進的評估方向與指標。因此, [Buchanan and Lukaszewski 1997]提出了網站管理 生命週期(Web Site Life Cycle) 的觀念,將WWW資訊服務的管理工作,分為 1.定 義需求 (Define Need)、2.規劃分析 (Planning and analysis)、3.製造開發(Production and Development)、 4.施行推廣 (Implementation and Promotion)、5.評估演進(Measurement and Evolution) 五個階段,並強調五個階段都必須縝密規劃與執行,才能促使網站 品質與服務水準不斷的提升與演進。

在過去網際網路與台灣學術網路的相關研究中,有 關WWW的技術、應用、內容設計等課題,均引起廣泛的 討論,並獲致相當的成果。而有關網站服務的使用衡量 與行為分析方面的課題,則相對地還有許多未知的問題 需要研究探討,面對未來越多越多的WWW資訊服務與使 用者,甚至一些電子商務(E-Commerce)應用與服務的來 臨,及早發展相關的網站衡量策略,以了解使用者與網 站的行為模式,對於提升資訊服務的品質與經營成效, 將具有重大的意義與影響。

貳、問題探討

2.1使用衡量的層次與類型:

[Buchanan and Lukaszewski 1997]將WWW 網站的使用衡量(Usage Measurement) 分為如圖1.中的四種類型,其意義與關係分述如下。

圖1.使用衡量的階層圖

(1). Raw Measure:原始資料分析,直接由server上記錄檔所獲取的資料,如
訪客的Domain,每個網頁(Webpage)被瀏覽的次數等。

(2). Consolidated Measure:加強合併分析,由原始資料中,經分析統計所產生
的指標。

(3). Approximated Measure:概略分析,由於量化資料無法獲得,而所採用的
一些非量化或質的衡量指標。

(4). Impact Measure:衝擊影響分析,由上述量化與質化的指標,綜合分析所
得,通常代表一個網站的整體使用狀況與品質的指標。

2.2 使用衡量的單位

網站管理人員最想知道的就是到底有多少人來訪? 但是由於訪客是透過電腦來 瀏覽,也沒有密碼來管制,因此訪客人數通常只能用一些基本的原始計量單位來加 以估計,[Sheets 1998]提出為了要分析相關的資料,至少必須了解以下幾個重要而 又容易令人混淆的單位:

(1). Hits: 每向WWW server要求下載一個物件,即稱為一個hit。例如有一個
網頁包括了一個html檔、3個圖檔、一個聲音檔。當當瀏覽此網頁時,
會被算為5個hits。

(2). Accesses: 每瀏覽每一個網頁稱為一個Access。一個訪客可能瀏覽至少一
個以上的網頁。

(3). Sessions: 一個電腦與伺服器由連線到離線的服務活動。

(4). Host: 一部向WWW server要求資料的電腦,通常是一部PC或工作站。

通常一個訪客至少會瀏覽一個網頁,也就是一個Access,但是一個Host並不 能代表一個訪客。以一個Session來作為訪客的估計單位,雖然比較接近,但由於 WWW的使用是採取所謂stateless的方式,亦即WWW server將user所要求的資料 傳給browser後,就不再保持連線,所以也很難以把一個連線到離線的狀態,視為 是一個訪客。目前較為人接受的估計方式是,如果某一部機器在WWW server上瀏 覽資料後,經過一段相當時間(如網路統計軟體WebTrend的預設值是半小時)[4], 沒有繼續要求瀏覽資料,就算是一個訪客。問題是這一段所謂的"相當時間"到底是 多久才合理,是否需要以實驗、模擬、或資料回溯追蹤的方式,來找出一個更具體 合理的估計時間,還有待繼續深入研究與探討[5]。

2.3 衡量方法的選擇:

網站衡量的方法與工具有相當多不同的選擇,這些方法各有其利弊,通常資 料蒐集的的範圍越大,需要的功能越深入,所需要投入的人力與預算也越多。網站 管理人員必須視網站的目標、規模、性質而有所取捨。一般商業性的行銷網站,如 Amazon書店,線上購物等服務,對於訪客的使用狀況與行為模式,常需要大量而 嚴密的資料統計分析。目前大學雖然沒有商業的服務,但隨著經費自主政策的逐漸 落實、與重大計畫如遠距教學、數位圖書館等網路服務的的發展,未來勢必也需要 更有效精確的衡量策略,來分析使用的狀況與行為,例如,那些遠距課程最受歡迎? 學生瀏覽了課程中那些網頁? 那些網路資料庫或電子期刊利用率最高? 這些對未來 的開課方向與電子期刊的續訂策略,均有相當的影響與價值。

一般網站的衡量方式大致可歸納為下列幾類,分述如下:

(1).安裝計數器:在網站首頁或特定網頁上安裝一計數器(counter),可以快
速知道網頁被瀏覽的總數。

(2).外包專業廠商:由一些專業廠商來安裝其特定的軟體,並分析網站的使
用狀況與流量。

(3).分析記錄檔:直接由網站中的記錄檔(log file)中,擷取分析可用的資料。

(4).非量化的方法:例如訪客的e-mail回函,問卷調查,使用者訪談等方
式,也可以收集到一些質方面的資料。

參、實例分析-中大圖書館網站的使用衡量

3.1 WWW 網站系統架構與組織

中央大學圖書館網站上現提供Webpac、期刊目次、光碟檢索、視聽資料、虛擬圖 書館、線上考古題、網路教材、訊息通告等功能。在系統架構上,為了確保系統的 長期穩定運作,網站的架構與使用的統計軟體如下:

表1. 網站的系統架構

系統架構規格版本
主機平臺IBM RS6000 570 Server
O.S. AIX 4.2
WWW Server軟體Apache V1.2b6
記錄檔統計軟體 1. AccessWatch V1.33[7]
2. WWWCount V2.4
3. Web TrendsV2.0
4. Wusage 6.0[8]

透過這些記錄檔的分析,可以讓我們了解使用者使用圖書館資源的狀態、頻率、與 模式,對於規劃未來使用者需求與資源分配,均有重要的意義與價值。

有關中大圖書館網站使用者分析的統計資料,可至本館全球資訊網 (http://www.lib.ncu.edu.tw/)中,在 【本站使用統計分析】下查詢。

肆、未來方向

WWW的使用量與提供的資料服務越多,就越有衡量的需要與價值,透過記錄檔的統 計分析,可以讓網站管理與資料提供人員,更加了解網路使用者的行為模式、與網 站的服務成效,然而除了定量的資料分析仍有待繼續發展之外,另外還有許多質的 定性方面的研究也需要去探討,為了解台灣學術網路上的使用行為與需求,提升國 內網際網路服務的品質與水準,在使用衡量的研究領域裡,還有相當多的問題,需 要大家共同來思考與研究。

【參考文獻】

  1. [教育部電算中心,1998] 教育部電算中心, 教育部電算中心簡訊,1998年7月.

  2. [Buchanan and Lukaszewski 1997] Robert W. Buchanan, Jr., And Charles Lukaszewski, Measuring the Impact of Your Web Site,Wiley Computer Publishing,1997.

  3. [Sheets 1998] Scott Sheets. "Understanding WWW Statistics",Managing Office Technology,January-February 1998,p18.

  4. webtrend安裝與使用說明, http://www.webtrends.com.tw

  5. Internet快訊, http://www.stic.gov.tw,Vol. 3, No.32 ,Aug 11, 1998.

  6. accesswatch, http://accesswatch.com

  7. wusage installation, http://www.boutell.com/wusage

87.11.30 資策會周中理先生及叡揚資訊公司蘇守謙先生到館演講『認識ISO 9000』