跳到主要內容區塊
banner

歷次消息

       
字級
    分享
  • QRCode
NBINet資料庫將轉換為Unicode相關說明
  • 2008-06-12
NBINet資料庫將轉換為Unicode相關說明
97.6.6

一、字碼運用現況
近年來圖書資訊單位進行書目資料交換的機會越來越頻繁,資料格式互通性也相對重要。內碼是重要的書目資料格式之一,臺灣圖書館界長久處於多種中文內碼(CCCII、Big5、Unicode)並行的情況下,目前面臨的主要問題包括:
(一)CCCII、Big5對外國語文字符的編碼相當欠缺且不一致,無法因應圖書館外國語文資料處理所需;
(二)中文字數居多且普遍使用的CCCII,目前並無專責單位統籌維護,因此,即便同是使用CCCII內碼,也可能因廠商系統編碼不同,而產生同字不同碼的問題;
(三)分別以CCCII、Big5、Unicode內碼建檔的書目資料,必須經由內碼轉換程式才能進行交換;
(四)由於不同類型內碼無法一對一完整轉換,往往須耗費人力時間修改轉換後的資料。
基於上述情形,涵蓋多國字符且由國際間各地區代表協力維護的Unicode,應可解決目前大多數的字碼問題。

二、字碼轉換籌備
為了讓龐大的NBINet聯合目錄資料採用符合國際趨勢的Unicode,並推動臺灣地區圖書館界共同採用一致的國際標準,國家圖書館書目資訊中心(以下簡稱「書目中心」)自2004年開始,召集圖書館組成「Unicode工作小組」,並積極集會討論解決字碼相關問題,為聯合目錄及各圖書館目錄資料的字碼轉換進行準備,目前完成的事項如下:
一、CCCII(Big5)轉換Unicode對照表;
二、Unicode轉換CCCII(Big5)對照表;
三、Unicode轉換CCCII之多碼對一字對應表--由Unicode轉為CCCII時,若遇CCCII多碼對一字的情形,建議選擇對應的CCCII字碼。
上述對照表皆可於「Unicode工作小組」網站(http://unicode.ncl.edu.tw)取得。
除轉換所需的字碼對照表編製以外,由於許多圖書館長期以來經由各種途徑,轉錄聯合目錄的書目資料,資料格式改變勢必會影響圖書館作業流程,書目中心過去一年間在各種合作館會議場合,也預先說明字碼轉換計畫,以便圖書館儘早因應。

三、字碼轉換時程
書目中心已完成字碼轉換先期作業,包括:準備字碼轉換測試所需的書目紀錄,以及與系統廠商進行轉換測試及對照表調整。至於目前預訂之字碼轉換時程如下:
(一)97年6月:提供諮詢專線(02-23822374)及網頁答客問;
(二)97年7月:正式進行聯合目錄資料轉換。資料庫進行轉換及索引重整約須3日,為加速轉換處理作業,並避免查詢結果出現異常狀況,擬於轉換期間暫停資料查詢及下載服務。實際轉換作業日期將提前於網頁公布。

四、轉換的影響
NBINet聯合目錄資料字碼一旦轉換為Unicode,從系統提供的任一介面轉出資料之內碼皆為Unicode,對合作館及一般民眾使用資料的影響如下:
(一)合作館
1、使用GUICat連結NBINet的合作館--合作編目專用的GUICat介面將停止使用,合作館的自動化系統若具備Z39.50查詢功能,請經由該項功能連線至NBINet查詢並下載所需書目紀錄;無該項功能之合作館,請經由NBINet WebOPAC (Unicode介面)查詢並選擇轉出所需之機讀格式書目紀錄,再透過本館提供之字碼轉換程式(http://cmarcxml.ncl.edu.tw/page/meeting.asp?pagetitle=工作成果&strtype=2)轉換為所需的內碼。
2、使用WebOPAC或Telnet連結NBINet的合作館—NBINet的Big5 WebOPAC停用,請改由NBINet的Unicode WebOPAC查詢並轉出MARC格式書目紀錄,再透過本館提供之字碼轉換程式(http://cmarcxml.ncl.edu.tw/page/meeting.asp?pagetitle=工作成果&strtype=2)轉換為所需的內碼。

(二)一般使用者
1、一般民眾--NBINet的Big5 WebOPAC介面停用,改以Unicode WebOPAC提供查詢及轉出所需格式之書目資料。
2、一般轉錄MARC資料使用者-- NBINet的Big5介面WebOPAC停用,請改由NBINet的Unicode WebOPAC查詢並轉出MARC格式書目紀錄,再透過本館提供之字碼轉換程式(http://cmarcxml.ncl.edu.tw/page/meeting.asp?pagetitle=工作成果&strtype=2)轉換為所需的內碼。

最後更新時間:2009-02-26