今天請到交大的柯皓仁老師和我們談談有關語意網絡與知識本體的議題。
##ReadMore##
所謂的語意網路,就是在網路上的資料可以讓機器看得懂,並做解析與應用的動作,換句話說,也就是讓網路「變聰明」,可以讓機器、電腦自動理解描述的資訊。要實做如此的架構,除了重要的Metadata需要定義清楚,使得電腦知道要抓什麼之外,另外重要的就是要將資源與資源間的關係定義清楚。老師提到了幾個實做語意網路的方法,包括使用XML、RDF、RDFS等等。
現今有許多將資源整合的網站,如Findbooks與Metacat等,都是程式設計師寫一個小的程式,去各個網站抓所需要的資訊回來,比方說在一個網頁的HTML中有"作者:",程式就可以自動把後面的文字擷取,當作是此文件的作者名,但以網路書店來說,博客來、金石堂、三民書局等等、網頁呈現商品的方式不同,HTML格式也不盡相同,除了程式設計師要對不同的網頁寫不同的擷取資料程式,在網頁改版以後也很有可能要重新檢視是否需要修正原本的程式,那這樣的情形,就是可以透過建立標準化的語意網絡改善。
ontology(知識本體)老師提供的定義則是"An ontology models the vocaabulary and meaning of domains of interests in a computer-usable form."。知識本體的形成,可以讓我們有架構的認識一個完整的概念,之前學的索引典、FRBR等,都是可以將知識本體呈現出來的方式,而我們在自己動手做資料庫之時,一開始架構整個資料庫在定義ER model的動作,也是同時在建置這個資料庫的知識本體。
聽完這個禮拜的演說,又讓我想起我之前忘了什麼時候有的感概,就是當我們真正的學習到電腦的時候,對他了解越多,就越會知道他的笨。使用端用得漂漂亮亮順順利利,都會是程式設計師在後面一步一腳印慢慢設計出來的,讓這「笨電腦」學會的。電腦能不能自己建立出好的標籤?建立出來的很方便但我們放心嗎?這也是我們人腦要到電腦時代的過度期吧。
我覺得每個禮拜在圖書資訊學研究碰到不同的老師,除了對我們分享他們所熟知的領域以外,還是可以藉由不同的老師了解他們在領域研究上的不同面向,不只增長我們的學業知識,更灌溉我們的人生知識。雖然不像其他同學一樣有上數位出版上過老師的課,但也經由之前的聘請專任教師演講發表中與這堂課,了解到老師對於圖書資訊領域的熱忱,這也是我們可以學習的地方,今天謝謝柯老師的演講。
沒有留言:
張貼留言