本期期數:第二十五期
發行日期:2010 / 12



 
       列表
             最新消息
             中心記事
             學術活動
             國際瞭望
             專題報導

訂閱電子報

      

 

 

 

 

 

 

 

 

 

 

2010數位典藏與數位人文國際研討會活動報導(99/11/29~30)

本研討會在項潔主任的主持下揭開序幕,項主任以近日《紐約時報》關於數位人文的報導為例,說明數位人文已經受到世人所矚目和重視,他認為數位人文的未來發展,必將是重要的歷史事件。本次研討會所發表的主題演講或論文皆反應了這股新的趨勢,不只是處理技術面的問題,更重要的是要如何回應關於技術和人文研究有機結合的挑戰。陳泰然副校長在開幕致詞時,首先細數了這幾年來台大從數位典藏的早期開發階段到目前應用推廣階段的發展與努力,而本研討會將提供所有致力於數位典藏與數位人文研究的專家學者,進行開發端和應用端的對話與交流。此外,他也以地主的身份歡迎現場的來賓,希望他們能多利用會議的空檔,在台大校園走走,一起分享台大這幾年的進步。

在第一場的主題演講「數位化:當代史學與社會結合的一大契機」中,國史館館長林滿紅教授指出,歷史文獻的數位化很可能是填補歷史學與社會嚴重脫節的契機。在她看來台灣歷史學的發展之所以和社會脫節,可分為兩個層面,一是史學本身的因素,對古史的重視多於近代史,近代史研究則偏描述而非解釋;總體而言,忽略了現在與過去間的對話。二是社會本身的問題,一種否定傳統知識的心理傾向。這樣的困境非一朝一夕所能解決,數位化正提供一個可能的窗口,其所提供的親近和便利,使得社會大眾能更加接近歷史學的成果。林館長以近年國史館所推出的各式展覽,諸如「百年回眸──臺北賓館的故事」、「總統府一樓展覽:從總督府到總統府」、「永續經國──蔣故總統經國先生百年誕辰紀念特展」、「國史館總統副總統文物館」等短期或常設展覽為例,說明數位化於其中所扮演的關鍵角色。此外,在國史館所推出的「爭鋒──蔣中正的革命風雲」、「驟變1949──關鍵年代的陳誠」、「深耕──蔣經國的台灣行旅」、「存亡關頭──1949年的中華民國」及「異人的足跡系列紀錄片」等記錄片中,皆大量仰賴著數位化的資料。我們可以說,藉由數位化的功能為橋樑,歷史學和社會之間的鴻溝正逐步被彌平著。

接下來則是第一場的成果發表,主題為「臺灣大學數位典藏與自動推論實驗室成果發表」,由吳密察教授擔任主持人,分別由涂豐恩報告〈當資訊科技碰到史料:臺灣歷史數位圖書館中的未解問題〉、歐仲翔報告〈GIS與臺灣契約文書的空間分析〉、陳品諺報告〈臺灣契約文書交易關係的自動重建〉。涂豐恩首先提到關於數位人文的兩種態度,即對數位科技和人文研究的結合持悲觀和樂觀的兩種心態,並分析了兩種態度學者各自的想法。他認為或許在兩極端間有另一條路線,跳脫數位科技可以幫研究者解決什麼問題的框架,轉而去思考數位科技可以幫助人文學者發現什麼問題。他以THDL為例,指出透過各式的工具和功能,挖掘出大量且重要的研究課題,有待學者正視。歐仲翔和陳品諺的報告,則具體展示了這種新的取向,在歐仲翔的發表中,他以GIS的技術,利用1904年所繪的臺灣堡圖,重建了臺灣契約文書中的相關地理位置分佈圖,從中可以看出許多有意義的現象,諸如台灣南北開發早晚對地權歸屬的影響、以及河流流域和土地開發間的關係等等,可供進一步思考的議題。陳品諺的發表中,提供了對THDL中龐大的契書資料加以整理的自動化方法,重建出古地契之間上下手契、原契與契尾、鬮分契多份、契書內容相同四種關係;並開發土地移轉圖的工具介面,以及以人物為中心的土地關係圖。兩篇文章都揭示了數位科技在處理史料、開發新課題的無窮可能。

下午的議程首先則是由金觀濤和劉青峰兩位教授進行主題演講「數位人文研究的理論基礎」,由黃俊傑教授主持。金教授的〈數位人文研究的理論基礎〉一文,旨在替業已勃興的數位人文研究在理論層面提供堅實的基礎。他指出人文知識和自然科學、社會科學的知識不同,並無客觀性的原則,而是基於他人經驗在研究者心中的可重演性。因此數位分析在人文研究中所扮演的角色也不同於其在自然、社會科學中的應用,不是針對數據統計(事實分析),而是在處理歷史文獻和各式各樣的文本;又因為文本直接涉及了人文研究的核心,所以數位科技在人文研究的重要性勢必將遠大於它在自然、社會科學中的比重。為了適應各類人文研究的需求,不同的研究皆需要有適合、能與之對應的電腦數據庫的建立;金教授認為在這樣的條件下,隨著IT技術對文本深度挖掘技術的開展,將會出現一門稱之為數位人文學的新學科。金教授回顧了由R. G. Collingwood到Reinhart Koselleck,一直到中國當代觀念形成之研究,勾勒出數位人文學在觀念史研究中的起源、發展過程,以及數據庫統計之分析、文本深度挖掘和數位分析技術在人文研究中所扮演的意義。金教授在最後總結道,數位方法和人文研究的結合,猶如科學假說與實驗配合,將形成人文研究中長程的二階(second order)反思視野。劉青峰教授則回顧了她和金觀濤教授一路探索人文研究中數據庫方法、建立「中國近現代思想史專業資料庫」並進行實作研究的過程,她強調利用資料庫,使以關鍵詞為中心的觀念史研究變成可能;但也必需透過和人文學者不斷的互動,數據庫才能做出相對應的研究。無論是關鍵詞的選擇或統計圖的繪製,都可以在學者和數據庫不斷互動的作用下,發揮出更大的潛力。劉教授認為在人文研究者為準、數據資料庫為輔的交互作用,數位人文未來將有可能發展成一個令人所重視的新學科。

主題演講結束後,本次的研究會分成兩個場地進行。首先是第二場的成果發表「中國近現代思想及文學史專業數據庫研究群成果發表」,由邱彭生教授主持,分別由姚育松發表了〈從「改造」一詞的使用看共產主義在中國的發生背景〉、邱偉雲發表〈關鍵詞叢與文本意義挖掘的嚐試:以《清季外交史料》為例〉、詹筌亦、王乃昕的〈「主義」的數位人文研究〉,三篇皆是使用「中國近現代思想史專業數據庫(1830-1930)」的成果。姚文以「改造」一詞為關鍵字,發現在1895-1921間該詞的使用和政治理念相關,背後有一「如何改造」的預設。此外,該文亦指出1919-1921間社會主義爭論和1895-1911年間立憲和革命派的爭端相一致,焦點都在「改造主體」是否具有道德意志,,並都以改造自己作為起點,進而完成大我的改造這反映了儒家傳統,提供了後來共產黨成功的條件。邱文則以「中國」為關鍵詞,試圖開發出一套可搭配程式,處理《清季外交史料》的「中國」一詞,進行觀念類型的提取並加以統計,形成特定的樣本,在小範圍史料中進行檢驗和調整。最後,再以近現代「中國」認同下「主觀」觀念模型發展趨勢圖,與當前相關研究成果對話。詹、王兩人的文章,則使用「主義」作為關鍵詞,從宏觀的視角析理該詞在中國的興起。先由資料庫中檢索出5萬多筆含有「主義」的紀錄,再透過數位分析加以處理,經由專門的統計程序,對該詞進行總體描述,歸結約1680種不同的「主義」,並指出1903年作為該詞出現最高峰的時代意義和特殊性。


同時進行的第一場論文發表「數位人文:資料庫建置」中,共計有羅小珊〈中國古代繪畫數據庫建設構想〉、謝澤業〈圖像資訊數位化協助聚落保存可能性初探:以中興新村藍晒圖為例〉、趙建雄〈數位典藏中的中文地名處理〉等三篇論文。羅小珊因故無法出席,在該文中介紹了中國古代繪畫數據庫目在建構過程的種種構想與挑戰,希望能建立起一個整合畫論、圖像等檢索功能的資料庫,以利學界。在謝澤業的文章中,則結合了藍晒圖數位化和GPS科技,進行文化資產的數位保存工作,令傳統的有形文化資產能經由數位應用和數位加值,被充分的再利用。跳脫過往只搜集文獻和圖像的侷限,本研究試圖由對圖像資訊的強化,替數位和人文聚落的保存間覓得更多的可能。趙建雄則從漢字規範的角度,以數位典藏中的中文地名處理為例,說明在數化位中文資料日漸普及和成長的情況下,勢必得面對的問題,即基於中文自身的特性,導致不同時期的個人電腦對中文處理的能力與方式皆不相同,以及各種字集和編碼的使用,凡此都影響著數位檢索的處理能力,成為日後學界所必須共同解決的難題。

第二場的論文發表「數位人文:歷史學研究」則由李文良教授主持,計四篇論文,分別是陳志豪〈歷史資料庫的應用與省思:十九世紀熟番「社域」問題的檢討〉、陳詩沛、項潔、何浩洋、杜協昌〈《明清臺灣行政檔案》引用關係之重構〉、林政佑〈從日治時期財產權的建立到清治時期古契書分類的反省〉、李朝凱〈家族史的新視野:以清代彰化縣戴潮春家族興起為例〉。陳志豪的文章,在肯定THDL資料庫的重要價值和便利性的同時,亦指出歷史資料庫的應用,不僅僅只是「量」的增加,而是以量為基礎,使研究者能在研究的「質」上加以提升,重新審視自己的研究取徑,開展新的方向與可能。該文即以自身熟番研究為例,透過資料庫的量化分析後可能的優勢與盲點。陳詩沛所報告的文章,先簡明介紹了明清兩代行政檔案的定義與特色,龐大的數量與零散的整理,造成使用者很大的不便,故其試圖以資訊科技對「引文」進行分析,重建其引用關係,並繪製成圖表,希望能為相關研究提供可清楚、便利的理解方式。林政佑的文章則利用資料庫,討論日治時期關於贌耕權的財產權論爭,並重新檢視當前對清治時期古契書的分類方式;希望能以資料庫為基礎,建立一開放的意見溝通平台,讓對古契書的分類能在集合眾人之力的情況下更加完備。李朝凱的研究則使用THDL對戴潮春及其祖父戴神保進行研究,描繪出戴潮春家族的興起過程和發展策略,藉以指出戴潮春事件之所以能和官方那麼長時間對峙,有其龐大的社會基礎。

同時段於另一會場進行的第三場論文發表「數位人文:文學與文化研究」則共計發表四篇論文,林淑慧〈文化想像與邊陲敘事:THDL於清治前期采風詩文研究的應用〉、蘇冠銘等〈大眾媒體內容作為資訊文獻之分析:以《台客練習曲》再現之鄉村意象為例〉、林俊宏等〈生命敘說全文資料庫關鍵詞分析之初探〉、葉衽榤〈運用「《臺灣日日新報》資料庫」與「臺灣漢詩數位典藏資料庫」考察台灣的迷信概念與信仰文化〉。在林淑慧的文章中藉由大量對資料庫進行采風詩文的搜尋,試圖分析臺灣納入清廷版圖後,游宦或流寓文人對臺灣這塊邊陲之地的文化想像和寫作策略,藉以呈現出文人觀看臺灣的視角,以及空間移動經驗的文化脈絡。在〈大眾媒體內容作為資訊文獻之分析〉一文中,則以《台客練習曲》節目為對象,以語料庫語言學為工具分析其字幕稿,探討其中再現出何種的鄉村意象,以此為例,說明相對於傳統的內容分析,以資訊科技作為研究的輔助,除在效率上有所提升,並能對大眾媒體的再現內容進行全新的解構,挖掘出更多文本所蘊藏的意義。〈生命敘說全文資料庫關鍵詞分析之初探〉一文則介紹了「生命敘說學術全文資料庫」的初步研究成果,結合人工作業和文件分析軟體,進行關鍵詞表分析,由目前所得可知二字詞關鍵詞為數最多,「自己」則為頻率出現最多的詞彙。該關鍵詞表除可作為後續系統建構之用外,同時可以有效說明關鍵和文本之間的關聯何在,提高檢索時的準確性。葉衽榤的文章則透過對《臺灣日日新報》資料庫與臺灣漢詩數位典藏資料庫兩大資料庫的使用,蒐集和迷信、信仰相關的史料,考察位於傳統與現代過渡之間的日治時期,傳統文人和新式報刊是如何看待迷信和信仰的議題,從分析的結果可以見得傳統習俗的延續性,許多信仰和迷信即使經歷了現代化視角的批評和革新,仍頑強在社會中持續作用著。

第二天的主題演講「數位人文中科技、資訊與使用之整合:一種用來探索這個令人讚嘆的世界、歷史與文化之數位新模式」,陳劉欽智教授作為一個長期在數位領域深耕的研究者,以The World Heritage Memory Net為例,提供一個更廣泛的全球性發展模式,即經由多媒體和多語化系統的整合,建造不斷擴充的知識庫,透過互動的呈現,使知識能夠打破地理或族群的界限進行傳播。The World Heritage Memory Net是應用對尖端科技的整合,將聯合國教科文組織世界遺產中心(WHC)於151個國家中所的911個世界遺產置於網上,只要透過點擊即可觀賞實景,並可藉由地理資訊、時間軸及圖片進行檢索,並提供相關的訊息或資源。其中圖像檢索的部分陳教授認為特別重要,因為過去資料庫的檢索系統通常還是需要填寫標題、位置、關鍵字等訊息欄位,但使用者往往缺乏這些資訊,圖像檢索(CBIR)在隨著視覺化工具不斷開發,過往隱藏在各種複雜資訊結構下的世界遺產,將更輕易的呈現在使用者面前。


接下來所進行的專題論壇「亞太地區之數位人文研究」中,則分別由Anna Gerber、項潔、稻葉光行、王曉光四位來自不同地方的教授,針對各自國家的數位人文資料庫進行概要的介紹。Anna Gerber教授介紹了由昆士蘭大學的eResearch實室與澳洲文學研究社群合作的Aust-e-Lit計畫,該計畫為對澳洲文學相關的史料進行整合與註解的服務,並與AustLit(澳洲文學資源入口網頁)進行整合,以非營利的模式,集合了十二所澳洲大學和澳州國家圖書館,提供了澳洲文學作品相關的書目資料,同時也提供與澳洲文學創作、出版有關的個人或團體傳記方面的資料,並提供強大的檢索與開放註解的功能。項潔教授則介紹了從「臺灣歷史數位圖書館」(Taiwan History Digital Library)系統中所設計出來的多種分析工具,首先是「參考工具」,包括中西曆轉換對照查詢、清代文官官職表、蘇州碼轉換器。其次則是四種「檢索分析工具」,包括前後綴詞查詢系統、總督府抄錄契書地區分析、總督府抄錄契書地理資訊,以及文件年代分佈與事件標註器。最後則是四種「關係探勘工具」,包括土地移轉查詢系統、臺灣相關明清檔案引用關係、契約文書買賣角色分析與淡新檔案分析圖。這十一種工具全部是免費對外開放使用,希望在查找、觀察與比較史料上,節省研究者的時間,未來亦將會繼續依照使用者的反應,開發更多貼近使用者的工具。稻葉光行教授則概述了立命館大學日本藝術與文化數位人文研究中心 (DH-JAC)的研究成果,DH-JAC因其在文化中心京都的地利之便,利用各項尖端的數位技術將京都一所保留的日本傳統或現代的物質、非物質的文化遺產,同時並與日本國內外各大學、博物館進行橫向的聯繫,希望能通過數位科技的整合,打造出具組織和規模的學術社群,以此開發出數位人文領域新的研究可能。王曉光教授則介紹了數位人文目前在中國大陸的發展情況,他指出數位人文在中國還是十分新鮮的概念,儘管中國大陸的人文學界的相關機構和研究者早已開始利用資料庫和網路技術進行人文研究和交流,但仍處於基礎的階段,真是創新研究方法並不多見,依舊不脫既有的研究範式,橫向交流的社團也尚未產生。近年來,中央官方單位開始注意到數位人文的重要性,相關領域也越來越受到來自官方的重視與贊助。目前武漢大學正在籌設處擬的數位人文研究中心,用以進行跨學科的數位人文專案,並嘗試人文研究在範式上的更新與升級。

下午所進行的第四場論文發表「數位人文:地理資訊GIS應用」,則由賴進貴教授主持,共計三篇論文發表。河角龍典報告的〈以GIS為基礎的日本京都平安京之地景視覺化與可視性分析〉,運用了3D-GIS和3D-CG科技,重建平安京的地貌,並利用3D地景視覺化系統模擬眺望四周山區,開發出了「虛擬平安京」的3D地景視覺化系統。這樣一套系統,可以提供考古學或地理學等人文研究領域新的可能。在目前的基礎上,未來再整個大量的考古資料與歷史文獻,建置一個平安京專屬的GIS資料庫。日本立命館大學團隊的〈從虛擬京都中的「京‧町家」看都市景觀的變遷〉則介紹了「虛擬京都」系統,該系統採用4D-GIS,最在原本的3D建築物和地形模型的基礎上再加入時間軸,最初設計的動機源自於協助京都市政府對傳統建築進行保護的計畫,投過各單位的協助投入大量人力以及PDA行動地理資訊系統進行田野調查,收集大量資料,使「虛擬京都」得以運行,使任何人都能輕易使用,並描繪出京都城市景觀的變化。由楊森豪所進行報告的〈繪圖註說:《淡新檔案》之地圖繪製與地圖使用〉則討論了《淡新檔案》中的地圖史料,透過對這近兩百張地圖的分析,可以跳脫過去討論官方繪圖的既有論述,從中發現無論官方或民間,過去的人們是使用何種視角去理解生活的空間;並且地圖是具有實際的生活用途,不同的官員出於不同的治理需求繪製地圖,民間也會以繪製地圖的方式,來爭取自身在訴訟過程中的權益。 本次會議最後一場論文發表「數位人文:技術與模式開發」,由劉吉軒教授主持,共計四篇論文。首先是謝育平的〈同位詞夾子:主題式分類詞庫萃取演算法〉,該文介紹了「同位詞夾子」這套半自動主題式詞庫萃取演算法,其運作主要理由人工來保證精準率,利用機器來補足召回率,以達到極高的準確率與儘量高的召回率。透過在THDL和古典小說中萃取成功的實例,可知該工具已具有相當高的成熟度。王昱鈞和蔡宗翰則介紹其所開發的「歷史佛典文獻外來語借詞對辨識系統」,以佛經為對象,透過一系列複雜的程序,比對其中的同源詞(cognate)和外來語借詞(loanword),對研究語源及跨地域的文化交流,將會具有十分重要的貢獻,從而發挖出更多的研究議題。來自日本的立命館團隊所發表的〈電玩數位典藏:電玩研究之e化研究平台〉則提出了電玩e化研究平台的全新構想,用以整合電玩書目資料與使用者創作內容(UGC),為日本電玩業相關軟硬體研究打造多功能平台,建立屬於電玩研究的數位典藏。Kihwang Lee和Jae-yun Lee兩位教授,則利用數位的方式將江原大學所整理的「朝鮮晚期食譜手稿」進行量化的整理,透過矩陣型和網絡式的呈現與分析,從中發現許多現代化前韓國料理的有趣議題,值得研究者進一步挖掘。本次研討會也在本場發表後告一段落,在最後項潔主任感謝所有的發表人與參與者,以及現場所有的工作人員,並開始期待明年大會來到,讓數位人文這塊全新的領域可以不斷的發展,深耕、挖掘出更多的可能。

臺灣大學數位典藏研究發展中心 版權所有 (C) All Rights Reserved. 台北市大安區106羅斯福路四段一號臺灣大學 TEL: 02-33669847