本期期數:第三十三期
發行日期:2012 / 2



 
       列表
             最新消息
             中心記事
             學術活動
             專題報導
            

訂閱電子報

      

 

 

 

 

 

 

 

 

 

 

中心記事

2011數位典藏與數位人文國際研討會活動報導

2011年第三屆「數位典藏與數位人文國際研討會」,於2011年12月1日至2日,假國立臺灣大學法學院霖澤館國際會議廳舉行。從2009年開始,由國立臺灣大學數位典藏研究發展中心主辦的「數位典藏與數位人文國際研討會」,迄今已邁入了第三年,本研討會每年匯聚數位人文最前沿的研究成果,期能透過定期且常態化的方式,藉由廣泛而深入的討論,帶動數位人文研究的成熟。在過去的會議中,經由主題演講或論文發表,我們都看到各式新資料被數位典藏,各種新的方法被開發應用,各種新的觀點逐潮蘊釀生成,這些新資料、新方法、新觀點,皆證明了數位人文令人期待的前景。

本次會議也不例外,在兩天的會議裡,總共進行二場主題演講與五場論文發表。國立臺灣大學羅清華副校長的致詞以目前最流行的雲端技術為例子,不論在其預設和發展的前景上,內容才是決定性的關鍵;是以,從日據時代即被視為東南亞學術重鎮的臺灣大學,以其擁有豐富的人文資源,極具發展數位人文的優勢,透過數位技術充分地利用和開發,使這些人文資源價值被真正彰顯,這些數位人文的資料將是雲端科技發展的「甘霖」。其後的主題演講,由美國哈佛大學東亞語言與文明學系講座教授暨地理研究中心主任包弼德教授(Peter K. Bol)以〈Historical Research in a Digital Environment〉為題發表演說,由曾任中研院史語所所長,現為長庚大學專任講座教授黃寬重教授擔任主持人。包教授為歷史學出身,其對宋代士人和理學的研究早已成為該領域的扛鼎之作,近幾年更積極投身數位人文的領域,主持諸如中國歷代人物傳記資料庫等大型計畫;本次演講將由其橫跨兩個領域的經驗出發,發表對數位環境下歷史學研究的看法。包教授認為應該要跳脫「工具開發」(Tool Building)和「內容蒐集」(Content Creation)的二分法,而是要開發能夠支持內容蒐集的系統, 從這個角度出發,包教授參與、主導了諸如「中國歷史地理信息系統」(China Historical Geographic Information System)、WorldMap和「中國歷代人物傳記資料庫」(China Biographical Database)等三個系統的開發。包教授詳盡介紹了這三個資料庫的功能和理念,以及在研究上所能帶來的幫助。CHGIS和WorldMap讓使用者可以由空間的角度重新去思考文字資料,在地圖圖像的輔助下,使研究者可以直觀地去感受史料的地域分佈。CBDB則透過廣收歷代人物相關的傳記資料,建立起一龐大的資料庫系統,輔以數位技術,除傳統人名生平的查詢功能外,進而開展出「聚集傳記學」(Prosopography)和「社會網絡」(Social Network Analysis)的分析。以上,皆顯示出一個依照資料性質所開發的系統,在研究上的潛力。

第一天的第一場論文發表,主題為「地理資訊系統與視覺化」,由國立臺灣大學地理與環境資源學系蔡博文教授主持,共有三篇論文,其中兩篇是由日本京都立命館大學團隊所進行的研究,分別是〈京都大比例尺地圖(京都市明細圖Kyoto‐shi meisai‐zu)數位化〉和〈數位典藏應用的社會效益與永續經營──以阪神大地震資料3D 視覺化為例〉,前者探討京都大比例尺地圖(京都市明細圖Kyoto-shi meisai-zu)及其數位化計畫的過程。這些地圖涵蓋了1927 年至1951 年間繪製的291 份地圖,這些地圖的繪製目的是消防安全之用,因此包含了詳細的建物資訊。立命館大學歷史地理資訊系統(HGIS)研究群,特別針對此批地圖執行數位化計畫,期能藉此重建1920 至1950 年代京都的都市景觀,並對地圖所呈現之資料進行分析。其成果將令使用者可以十分便利地將京都市明細圖與現代的京都市容作比較,看出京都市景觀於數十年間所產生的巨大變化,例如,京都傳統木造建築京町屋已被西式洋房取代,御池通、堀川通與五条通等主要道路的拓寬。這些例子說明了京都市明細圖的數位化,對觀察京都市歷史發展的助益。後者則以1997年日本官方所公佈的阪神大地震資料庫為對象,進行視覺化平台的實驗,以期作為日後其他地震災害資料數位化呈現的參考,並進一步提出針對文化遺產與社會機構等,在進行數位典藏過程中,永續經營的可行性,並提升其社會面的應用價值。該團隊利用KACHINA CUBE(KC)網路平台,在立體空間中儲存、模擬與顯示資料,結合2D 地圖與時間縱軸,將阪神大震一個個時間片段繪製在3D 空間內,讓使用者可以以直觀的方式對每一個時間點作進一步的分析。第三篇論文則是高雄大學西洋語文學系助理教授奧利華報告其團隊的研究成果:〈運用地理信息系統工具於文化研究時之規格要求及挑戰──以墓地為例〉。該文嘗試利用簡易的地理信息系統(GIS)工具,如便宜的衛星定位接收器和PostGIS及Mapserver之類的免費應用軟體,對南臺灣的墓地進行測量和分析。他們努力克服目前市面上現有的GIS工具在精密度及準確度上有所限制,藉由採用其他測量工具或數據的方式,修正已獲得的GIS資料,令其符合研究所要求的精準度。也唯有經由空間的呈現,才能夠將墓碑上的文字資料具象化,令研究者去發掘其中各種議題,進行詮釋。在該場次中,諸如精準的定位、時間因素的加入、3D的呈現等等,充分顯示了GIS在技術上的突破,當技術門檻不再是限制之後,如果應用於實質研究,賦與更多人文或現實價值,使其具有更普遍的意義,將成為開發者們的下一個考驗。

第二場論文發表「資料庫建置與運用」,則由中央研究院歷史語言研究所邱澎生教授主持,計有三篇論文發表。第一篇由中研院民族所邱斯嘉教授所率領的團隊進行報告,題目為〈太平洋史前Lapita陶器線上數位資料庫的建立與運用〉。邱教授長期關注史前Lapita文化的擴散,該文化和臺灣及東南亞所屬的南島語系有著密切的關連。該團隊以六年的時間建立了太平洋史前Lapita 陶器線上數位資料庫,該資料庫可以供世界各國的研究人員互相比較各地之Lapita 陶器收藏,以統計方法來互相對照、比較遺址之間的研究工具。該團隊更以GIS的方式,呈現Lapita陶器紋飾在各島群的分布狀況為例,這樣的應用,將更有助於人們理解Lapita文化的遷移和擴張。該資料庫已成為研究Lapita文化的重要參照,日後將吸引更多國外考古研究人員與臺灣考古學界合作,進一步促成及推動跨國與跨領域的太平洋史前Lapita 陶器研究。第二篇則由林明燦發表〈清代「後壠城堡」的地理空間分析──從疊圖分析到圖籍解構〉,因為工作的地緣關係,對後壠一帶的歷史發展產生了興趣,而試圖將古地圖結合簡易的GIS工具,進行疊圖觀察,經由這樣的方式,可以對後壠一地有更明確的空間想像,將有助於歷史研究者在分析當地歷史事件時,更多輔助的想像。第三篇〈18世紀中國常民的身高分佈、營養、與福利──初步分析報告〉則是由國立自然科學博物館、美國明尼蘇達大學歷史學系、英國諾丁漢大學當代中國研究學院等三單位跨國組成的研究團隊所發表,他們利用清代《內閣刑科題本‧婚姻姦情類》中所記載關於被害人的背景及生理資料,特別是身高的部分進行統計,記錄並分析1,800個案例,結果顯示18 世紀中國常民身高呈現來回震盪,在許多區域有少幅增加的情況下,北方男子的身高卻逐漸遞減,下降幅度超過10 公分,進而推測其原因可能與18 世紀中國的營養與福利並沒有整體的提升,中國北方更常陷入飢荒有關,回應了近幾年著重環境因素的新歷史視角。這三篇精彩的研究引起很大迴響,透過三人的研究,可以看到數位的呈現和統計技術,對近年來學界的熱門焦點,諸如物質文化、地域社會和環境史的研究,所能帶來的幫助,透過兩者的結合揭櫫了新議題與新發現的可能。

第三場論文發表「文本處理與分析」,由國立政治大學資訊科學系暨圖書館劉吉軒教授主持,共有四篇論文。王昱鈞等所發表的〈漢語方言語音資料庫自動擴增補完方法〉乃是試圖以數位技術去處理歷史語言學的問題,將部分由田野所收集的方言語音資料庫,以機器學習方法模型,利用既有的方言語音內容以及從中古漢語韻書中找出於各方言中語音對應,自動擴增補全資料庫中缺少的漢字發音資訊,並以漢字語音的音韻特徵來增加準確率。藉由這套方法不僅能擴增漢語方言資料庫內容,其預測結果還能協助研究者發現具研究價值的語音現象,發展更多研究議題。周亞民教授的〈明治時期異體字研究知識庫的建立與其運用〉旨在解決中日漢字資料庫缺乏日本異體字知識的問題,透過文本比較的方式建立明治時期異體字知識庫,日後將陸續完成江戶、昭和與當代等各個時期的異體字資料庫校對和整合,從歷史的角度呈現日本漢字的使用變化。〈結合漢典古籍虛詞常見字與統計量化分析進行漢譯佛典譯者風格辨別〉一文則出自法鼓佛教學院的研究團隊,該團隊長期關注佛學的數位人文研究,該文以數位的技術去處理早期漢譯佛經中翻譯混亂、錯誤的問題,以數位化資料及統計量化方法進行資料的比對分析,採用常見的古代中文的虛詞作為風格特徵之評斷指標,並搭配多變量統計分析手法中的主元素分析法,進行譯者之風格分析。其實驗結果,證明該方法能成功區分譯者的風格,協助研究者進行翻譯的判斷。劉昭麟教授報告的〈自然語言處理技術於中文史學文獻分析之初步應用〉,則是金觀濤和劉青峰兩位教授,在政大主導的研究團隊系列成果之一。該研究利用PAT Tree 技術分析了西元1905 到1911 年間的《清末籌備立憲檔案史料》中關於華工的相關史料所獲得的初步成果。其結論認為自然語言處理技術固然不能完全取代史學研究者從事史學研究,但該技術有足夠的潛力為史學研究者提供初步分析的服務,讓史學研究者可以比較有效率的方式處理大量的語料,並且把珍貴的研究時間用於知識層次的分析工作。在該場討論中除針對專業層面進行討論,諸如漢語的界定為何?如何去進一步預測缺漏的音韻特徵?又或者建議從群體辨別的視角全面的考量佛經文體,以及將虛詞再行細分可以提供準確度外;項潔教授和劉昭麟教授亦針對數位技術和人文研究者之間的關係進行精彩的討論。兩人最後皆贊成數位技術的研究者永遠不要試圖去取代或挑戰人文研究者,兩者的關係不是對立或競賽,數位技術的開發應從輔助的角度出發,與人文學者一同合作,攜手並進,才是數位人文正確的發展方式。

12月2日,原定的主題演講講者英國倫敦國王學院Sheila Anderson教授因病臨時無法出席,改由國立臺灣大學數位典藏研究發展中心項潔教授進行演講,日本京都立命館大學教授暨日本文化與藝術數位人文研究中心計畫主持人稻葉光行教授主持。在該篇演講中,項教授指出檔案的數位化已經成為時代的趨勢,但卻也面對質疑的聲音。其中最大的不安,在於原本紙本檔案保存的脈絡,是否會在數位化過程中遭到破壞?為了回應這樣的質問,項教授回顧了傳統檔案學的保存原則,即依機構、依時間、依事件的整理,其目的便在於保存所謂檔案的既有脈絡。但這樣的原則本身便隱藏著矛盾,如依事件的整理本身就會打破檔案依機構和時間所產生的原生脈絡,編纂者的後見主觀和選擇必然會影響檔案。更何況從研究的角度,人文研究本身便是要從史料既有脈絡中,重新找出新的解釋脈絡的過程。是以,紙本檔案的脈絡本身便是具變動可能的。進入數位化時代後,檔案的儲存不同於紙本,資料的性質在類型上更多「元」,資料的來源往往也更為多「源」;此外,數位化檔案由文字轉化為位元後,檔案的呈現亦更將原子化。然而,這並不表示檔案數位化將破壞原本脈絡,恰恰相反,數位化後檔案的原子化特性,反而較紙本更具調整和變動的可能,產生紙本檔案所無法想像的多元脈絡。要實現這樣的可能,必需建立起一個功能強大的系統,這才是檔案數位化的關鍵,數位檔案無法離開系統而單獨存在,系統的好壞將決定檔案的可用度。檔案檢索系統應儘量提供文件的各種脈絡及觀察脈絡的環境。是以,系統的建構不應再只是檔案數位化過程中的附屬物,而是依據檔案特性所設計的重要環節。項教授以臺大數位典藏中心的研究成果為例,說明一個好的系統所能提供的各種脈絡可能,分別為:(一)檔案原始的脈絡;(二)重組原始脈絡的多元組合;(三)鳥瞰型的脈絡;(四)子文件集之縱觀的脈絡;(五)文件間統計型的脈絡;(六)文件間隱藏的新脈絡。總結上述,經由檔案的數位化,檔案單一脈絡的限制被打破,檔案整理與檔案研究之間的矛盾隨之減輕;而透過檔案檢索系統的設計,檔案的豐富且多重的脈絡可被發現、被呈現、被觀察。因此,檔案檢索系統是未來在思考檔案數位化時不可式缺的關鍵方法。

緊接著的「圓桌論壇」由項潔教授主持,與談人包括了包弼德教授、稻葉光行教授、中央研究院院士及近代史研究所特聘研究員陳永發教授,以「數位人文在研究上的機會與挑戰」為題進行近一個半小時的討論。由陳永發教授首先引言,他介紹近史所在其率領下,以中研院所藏1895年至1930年間共250萬字的《譚延闓日記》為底本所架設開發的「筆墨譚心——延闓日記網站」。該網站企圖以採貼近生活經驗的方式,希望能從一個比較符合現代年輕人喜愛的角度,用生動活潑的方式,體現清末民初傳統士人如何面對時代轉型的挑戰,讓原本只屬於專家學者專業領域,一般人既不了解,也沒興趣去知曉的歷史資料,變成為大家都可以輕易理解、享受的知識來源。是以,在建置過程中面對的挑戰主要有二,其一辨識字詞,將難辨的日記筆跡正確數位化;其二結合歷史學與資訊學的專長,創造便於瀏覽、勾起使用者興趣之網站,使歷史的縱深有著資訊科技的新生命,為數位典藏的加值應用提供範例。包弼德教授則由自己長期教授相關學門的經驗立論,他指出近年其研究團隊一直在思考在數位環境該如何進行研究,基於這樣的關注,他提出了幾個基本的問題,和大家分享。第一是如何在數位資料質和量皆增加的情況下,保有操作的簡易。其二則是如何維持數位資源的持續發展,諸如誰來維護、使用者付費的規則建立。其三則是計畫的不同屬性,有些計畫是有限的,有些計畫則是不斷擴充,前者比較易於保存,後者則因過於龐大,如何維持便成為一大難題。其四則是在數位時代,個人式的資料數位化收藏變得更加容易與常見,但這種「一次性」、專屬個人的資料卻無法受到正規圖書館的承認,更遑論支持,如何取得資料開放的正當性,便考驗著既有的機構思維。最後,則是教學的問題,即如何教導一般人文學子數位的技術,或者更具體的,該教授他們哪些數位技術;在包教授看來,在數位資訊量爆炸的今日,教導學生數位技術是正當且必要的。最後發言的稻葉光行教授,則簡介了近年來關於日本藝術和文化的研究機構及研究成果,從機構成立的趨勢上看,近幾年日本學界對數位人文研究的重視,從1980年來正逐年增加;在具體內容上,則主要分為數位典藏、數位研究平台的建立以及教育的推廣,如何能順利達到這三項目標便成為日本學界最大的挑戰。稻葉教授緊接著展示出一系列的研究成果,顯示日本數位人文研究者在這三方面所做的努力。最後開放現場的討論,主要集中在幾個方面,一個是制度面上,不管是以公立或私人機構之力,去推動、維持數位人文的進行。其次則是數位人文的教育問題,該如何推動在既有教育體制和預算中,加入數位的課程,為數位人文建立堅實的基礎。第三則是在昨日論文發表中,已約略觸及的,數位技術端的開發者和人文專業研究者之間的關係,彼此的合作是議場中的共識,但具體的合作方式,以及在這合作過程的背後所涉及的方法論的理論層次問題,則有待學界繼續深入的探討。

第四場論文發表的主題為「資料庫與知識」,由國立臺灣大學圖書資訊學系陳光華教授主持。第一篇是由國立政治大學劉吉軒教授所率領的團隊發表〈以文本分析呈現臺灣海外史料政治思想輪廓〉,該文應用數位資訊重新整理戒嚴時期海外民主刊物,除了保存這些逐漸流失、不易取得的資料,為臺灣民主發展的過程留下見證外,更進一步對其內容進行文字探勘的工作,一為人工關鍵詞與全文自動斷詞篩選詞語的比較,通常人工關鍵詞以單篇內容為範圍、呈現人事時地物等面向的核心資訊,而全文自動斷詞篩選詞語則以文字符號組成單元的計算方式,以詞語出現次數與使用重複性的比較為基礎,挑選出代表性詞語,探討二者間的差異及其意涵。二為社會網路模型的應用,以社會網路模型建構史料中人物、事件、理念之互動情形,透過社會網路的視覺化工具,觀察個別人物、事件、理念的角色及彼此的關聯,提供一種新型態的解讀與分析結果。其結果乃是透過數位人文的研究方法,呈現出海外臺灣人民部分的政治思想輪廓。第二篇亦為金觀濤、劉青峰兩位教授所領導的團隊所發表〈「共現」詞頻分析及其運用─以「華人」觀念起源為例〉,該文將《清季外交史料》(1875-1911 年)中,對於「華工事件」進行歷時性描述,形構出當時官方對於「華工事件」的認知轉移過程,再從事件中諸多「關鍵詞」內涵的歷時性變化中,觀察「華人觀念」是如何隨著「華工事件」認知焦點的轉移而逐漸形成之脈絡。本研究應用了該團隊所研發之「共現詞頻分析法」為數位輔助程式,透過此程式,可令研究者在龐大的研究文本中,切割出眾多的待選詞,再由研究者確定重要關鍵詞後,進一步將關鍵詞兩兩配對成共現詞組,觀察各共現詞組的共現頻度及歷時性分布。研究者便可由高共現頻度之共現詞組中,架構出以事件為核心之重要關鍵詞叢,進而觀察事件與觀念之間的互動過程。該場次最後由清華大學博士生梁世佑發表了〈網路數位時代中的證據杜撰與知識整理〉,文章的調性和其他論文略顯不同,作者引用了許多時下熱門的新聞事件,對數位化時代的網路資料提出質疑,認為或出於有意或出於無心,網路上的資料時有瑕疵或造假的情形,他歸結出各種出問題的原因,指出數位典藏不應只是單純的增加成果的數量,而更應該形成一套可受規範和公評的整理規定。會後的提問時間,人際網絡和事件判斷成為現場討論的焦點,從研究難易上看,人際網絡以資訊技術無論在處理或呈現上都遠勝於人力,如何進一步給予呈現成果研究上的實質意義,可能才是接下來的課題。至於事件判斷,則是數位人文未來在發展上大哉問,看法兩極,但無論如何,加入時間軸作為歷時性的觀察都是個值得借鏡與深思的重要突破。

最後一場論文發表,第一篇論文是〈史料新形式及其分析─以日本的數位圖書館與數位檔案館所藏亞洲歷史資料為例〉,放映了許多影音資料,介紹了東洋文庫數位圖書館(digital library)與數據庫(database)的情況,希望藉由和臺灣之間的互動和交流,在分享經驗之外,探討建立國際性數位圖書館或檔案館的可能。接下來兩篇論文,則是由國立臺灣大學項潔教授所領導的研究團隊,分別是陳品諺的〈《清實錄》之文本分析與時間標記初探〉和歐仲翔的〈開放式歷史地理資訊系統──日治時期臺灣主題式地理分佈圖繪製系統之開發與應用〉,分別由彭維謙、張嘉文兩位同學,也是共同研究者負責發表。在第一篇論文中,試圖以《清實錄》這部貫穿清朝的中央政事紀錄為對象,結合資訊技術,建立一套以研究為出發的《清實錄》資料庫系統,以期能為清史的相關研究,帶來更多的幫助。該文詳細介紹了資料庫建置前文本的處理過程,以及如何以成熟的「臺灣歷史數位圖書館」(THDL)作為資料庫的底本,並進行操作的實例;希望透過《清實錄》這種巨型文件的數位化處理,彰顯資訊技術對人文研究所能帶來的協助,以及數位人文在發展和應用上的可能。〈開放式歷史地理資訊系統〉一文,則逆向思考提出了「簡單即是多」的概念,指出地理資訊系統(geographic information system)於歷史研究已越來越受到學界所重,但受限於技術、設備與人力等條件,往往只有少數機構與學者有能力結合兩者。Web GIS的出現,雖讓使用者得以透過網路瀏覽軟體,獲得地圖等地理資訊,可是對大部分研究者而言,仍難以主動地將自身的資料與地理資訊系統結合。該研究目的即在打造一個可供使用者自行上傳研究資料、繪製主題地圖的歷史地理資訊系統,透過簡易的操作方式,讓更多人文學者有應用地理資訊系統的機會。換句話說,建立一個只需要會使用Excel這樣的基礎軟體,即能讓自己的資料於GIS系統上顯示,從技術開發的角度,這或許是種功能的刪減,然而從使用者的角度出發,卻或許是重要的協助和突破;跳脫技術人員的思維,改由研究者的角度去思考,可能是發展數位人文最重要的思考參照之一。最後一篇論文〈公民數位典藏平台之使用者研究〉,便將關注焦點放在數位典藏的使用者身上。該文乃是由李峻德和曾馨瑩兩人透過對公民數位典藏平台,對該平台的使用者模式進行研究,希望發掘目前設計的潛在問題,提供建設性的改善方針,提高使用者的接受度,進一步加強公民數典平台推廣草根性思維以及多元價值理念的潛力。

連續兩日的2011年第三屆「數位典藏與數位人文國際研討會」便在第五場論文發表會結束後告一段落,誠如項潔教授於最後閉幕致辭中所言,能連續三年舉辦這樣的研討會,並不是一件容易的事,項老師除了感謝行政人員的辛勞外,也指出這正顯示了數位人文這樣一個新興的學術領域,正不斷地向前拓展與邁進,每年都有新的研究成果與觀點產生,能有這樣一個機會,聚集各地的研究團隊齊聚一堂,彼此交流,他相信對整體研究環境的成熟是有莫大幫助的。因此,他期待來年還能再次與世界各地的研究者,於2012年的「數位典藏與數位人文國際研討會」再度相逢,並帶來更多的、更新穎的成果一同分享。

 

 


臺灣大學數位典藏研究發展中心 版權所有 (C) All Rights Reserved. 台北市大安區106羅斯福路四段一號臺灣大學 TEL: 02-33669847