2008年10月31日 星期五

圖書資訊學研究 1027 資訊計量

這次的上課,是請到政治大學的蔡明月教授來跟我們講解有關資訊計量的主題。##ReadMore##

回想在大學上課時,資訊計量是我們比較沒有提的部份,記得以前看到這個詞是在大一上圖書資訊學導論的時候看到的吧 囧,後來或許在提起某些議題時會談到,但是也沒有深入講解,所以大四準備研究所做全盤複習的時候,對於書目計量學的三大定律:Bradford's Law、Lotka's Law以及Zipf's Law還找其他文獻來做了一番研究,研究所考題中有一題說談圖資界有什麼理論我就寫這定律= =  也不知道這樣回答對不對,也因此對於蔡明月老師的名諱不陌生,這次請到資訊計量學的權威來跟我們講解,真的是莫大的榮幸。

在課堂之前老師請我們先預習了資訊計量學的背景,讓我們回顧整個資訊計量學的發展脈絡。文中可以知道資訊計量學是由我們圖書館的書目計量學為所有的根基發展出來的,(看到這裡會有種莫名的開心),而這個概念後來被廣泛的發展與應用,結合了科學成為科學計量學,結合資訊叫資訊計量學,最後要了解網路的型態發展了網路計量學,未來還是會有對很多領域的發展空間,也會有在原本領域加深加廣的研究,(如在圖資領域不只對於書目計量,也有對期刊做分析,)所以在這門學科我們更是要打好基礎。

聽完蔡老師的演說,除了在預習時就對資訊計量學有了一個較完整架構的認識之外,這堂課我還有下列三個收穫:
  1. 學科的歷史發展脈絡重視:其實在接觸每個學科的發展時,老師都會講解這個學科的發展背景。在我原本的學習態度是,我們對於學科的學習只要知道它是從哪裡來,現在可以怎麼用,未來可以怎麼發展就好了,但是蔡老師的教學卻讓我強烈的感受到了解一個學科是如何誕生是相當重要的。每個學科的發展,都會是經由許多「大師」從不同角度對他的詮釋而慢慢形成一個較全面性架構的,了解越多背景,其實也可以幫助我們從更多不同的面向去理解這門學科、知識。學科的形成並非一蹴可幾,更不是能夠以我們的理解,用三言兩語就可以解釋的,了解越多,我們就可以知道越全面的輪廓。
  2. 進行計量研究的研究者特質:細心。不論是在選定主題範圍做通盤的暸解以開始進行研究或是做研究結果的分析,研究者都要有清楚的邏輯以及細心的思考才能達成。遇到了一詞多義或是同樣縮寫的名稱,若是電腦沒有進行訓練的動作,對於相同的詞彙是不會有所區分的,但這對於研究結果卻是有很大的影響,研究者的細心特質在這邊就成了非常重要的關鍵。
  3. 評鑑的效度:現今的多所大學都拿學校教授在國際學術期刊上的投稿作為評鑑的依據,但是對於所選用的期刊,其實是有很大的爭議性的。每種期刊所收錄的文章數不一,這也意味著能夠被收錄的困難度不同;如果不同層次的期刊卻被作為相同的評鑑標準,那就不符合效度的原則,但這卻是國內多所大學所忽視的!而且引文索引資料庫中的資料原為了提供學術界了解各個學科的發展情形,用來作為大學的評比其實也是與本意所不符合的,政策的訂定人實在需要檢討,而這也是我們在做研究時的一個選擇效度的警惕。

蔡老師的講解相當詳細,而內容準備的也非常豐富,礙於時間的關係不能和我們分享她的所有資料,實在是有些可惜。也建議下次在演講的時候可以幫講者準備小型麥克風,可以讓台下的學生聽得更清楚。

2008年10月27日 星期一

社科研究法 Week6 也該漸漸要聽懂了

行動面

這個禮拜一樣就從上個禮拜作業的檢視開始,上個禮拜老師讓我們回去做了命題與假設的練習,老師以同學做的命題與假設為例,告訴我們在進行時有哪些面向必須注意。

命題是一個陳述句,可以是是(true)、否(false)的描述,由兩個或以上的概念(concepts)及其間的關係(relationship)所組成。假設是為了驗證命題是否正確,所以假設是可被測試、測量的。##ReadMore##

Ø 進行命題與假設應該注意的事項:

   1.注意概念的範圍不要太大,太擴散,可具體一點

   2.一個命題中的概念最好不要超過三項,並注意概念間的邏輯順序

   3.注意命題與假設間的一致性

   4.假設為命題的可驗證版本

   5.假設要把可能性的概念放入

在課堂過程中,我和信一有了我們兩個的men’s talk的悄悄話(),我們在想,以教授的文章來說,什麼會是教授想要表達的命題與假設?那是不是她文章標題所說的,是「文化與人們的資訊行為間存在著關係」?那如果是這樣的命題就跟上述五點的第一點就不符合了,因為「文化」的概念是否太廣泛?教授的回答和我所想的差不多,教授的命題並不一定等同於她的文章標題,文化這個概念的確太大,不適合做為命題,所以此篇研究的命題可以是(或許是)「台灣原住民的文化與原住民們的資訊行為存在著關係」。

另外Foster教授也叫我們不要太過於對此篇文章盲從,他拿這篇文章給我們閱讀,是為了要讓我們了解我們如何閱讀與評鑑文獻,並不是說我們寫文章就要像她這樣寫,而是希望在討論過程中,讓我們培養寫作與閱讀的敏感度。

Ø Focus of theory

1. 實質理論(substantive):對什麼樣的領域作研究,可將理論應用在該領域。如我們對高中生的行為做了相關研究,可以將此研究推論到其他高中生。

2. 正式理論(formal theory):一研究的理論可以被其他的場域所使用。

Ø Forms of theoretical explanation

1. casual - 解釋成因,如「在資訊尋求的過程中感到挫折是因為對資訊的不確定性所造成」

2. structural - 以結構來解釋

3. interpretative - 詮釋性解釋,如葉教授解釋原住民在生活中如何獲得資料

Ø range of theorizing

1. empirical generalization:實徵研究的階段,對實徵資料的呈現做推論,如「在晚上十點的時候會有很多人同時使用skype」是研究者對於研究統計資料所做出來的推論

2. theoretical framework:由假定、概念、關係構成,再加上假設,使其可以被驗證,成為理論的架構

3. middle-range theory:介於empiricaltheoretical 的中間


認知面

其實在一開始對於命題與假設是不了解的,雖然經過上個禮拜的講解,但真的面對一篇文章要我去列出其中的命題與假設,我還是顯得相當笨拙與抓不到方向,透過課堂上的舉例講解或許我可以再修改我的上週作業,從葉教授的文章中重新列出一個新的命題與假設,不過不知道這樣是否符合:

命題:原住民對疾病的態度與他們的祭司有很大的關係
假設:原住民的祭司在原住民對疾病的態度上具有很大的影響力


在自我預習的時候,讀到理論解釋的時候,一直有一個瓶頸,讓我怎麼看這段文字都看不懂,結構性解釋到底是什麼?課本裡詮釋性解釋是又在寫什麼火星文?後來我想給它這樣的解釋,不知道正不正確。有問就有答,當我們在解釋的時候,可能是因為幾種情況:這件事為什麼會發生?怎麼發生的?比如說一個震驚社會的洗錢案件,可以給他這樣的解釋:某人一夜致富,不想要以後享受不到,所以他透過洗錢來保有自己的身價(因果);人都有貪心的心理,當動了不好的念頭,守不住心中那道防線,慾望便會潰堤,加上「權力使人腐化,絕對的權力帶來絕對的腐化」,且天時地利人和的狀態下,這事情就會發生(結構);某人家境貧苦,從他成長的過程中,逐漸取得越來越高的財富,一旦他意識到他會失去財富,他會開始洗錢(詮釋)。


感受面

我的英文聽力能力一直以來應該都只有在中等程度,完全不好,但我想不至於太壞,但能不能聽懂就取決於是否完全專注在課堂上的聽講了。經過三個禮拜,已經較能適應Foster教授的教法和表達方式,現在對整個課堂的專注力已經延長到大概三分之二了吧,不過還是有很大的進步空間。



2008年10月19日 星期日

社科研究法 Week 5 理論與研究


行動面

在課堂的一開始,是驗收上個禮拜的學習成果,我們將自己對葉教授所評文獻分數交出,Foster教授再將我們分組,教授應該有將兩兩評分差異很大的讓他們在一起討論,因為尤敏和我之前打的分數就差滿多的,所以原本意見不一致的兩人就可以激盪出許多不一樣的火花。最後我們達成的共識是葉教授的標題、大綱、討論、結論等的面向都寫得不錯,(其實是我們看不出什麼缺點啦   囧),方法和文獻回顧的地方分數稍低,因為我們原本想的是文獻就完全依照一篇文獻會不會太過缺乏?引用文獻都是幾十年前的文章,會不會沒有新穎性和代表性?取樣方法是否沒有交代清楚,為何兩個部落的取樣數以及待的時間不一致?(但是後來好像都不是影響文獻評估的重點,整個失敗= =)
##ReadMore##
但是瞎貓碰上死耗子,在文獻回顧和方法是Foster教授認為此篇文獻較不足的部份,包括如文獻分析可以再多包含一些實徵研究方面可供驗證的文獻,而不僅是列出較抽象概念的理論;方法方面則是少舉了測量工具有些可惜,葉教授如果將當時進行訪談的題目或者是紀錄附上會使此篇文獻更加完整。至於我們提到取樣的問題則是可以在研究中補充說明研究限制,但那不夠成整篇文獻好壞的致命傷。


學習面

這次的客堂上了有關於理論的概念。理論是由假定、概念與他們間的關係等元素所構成。理論和意識型態有其接近的地方,如他們都能表達系統的概念與想法,但在教授的一開始即表明了理論與意識形態是不一樣的,最大的不同點就是在於理論是可以被檢驗,而意識型態是不能被檢驗的,比如說某某宗教宣揚每個人做了壞事會下地獄,這可以是一套系統性的說法,但是它無法被檢驗驗證,所以它是意識形態而非理論。

理論的第一要素是假定。我們假設,每個人的知識架構都是可以透過內在的自我成長而形成,個體的知識是靠吸收資訊、理解資訊爾後建構而來。理論的形成則是由不同、多於兩個的概念組合而成,是表示概念與概念間的關係。概念的構成包含兩個元素,一個是文字或符號,另外一個是它被賦予的意義。概念可以是具體的,也可以是抽象的,但也並不一定表示那個概念就是具體或抽象,像高度是具體的概念,資訊是較抽象的概念,不過如果是表示一個人「品味」的高度那是抽象的,如果我們說書籍就是資訊,那這個資訊的概念就是具體的,所以我們在研究時要給我們所研究的概念一個實質的定義才行。

概念可以是單一一個簡單的面向,也可以是複雜由多個面向所組合而成的。課堂上舉了Kuhlthau的ISP model做範例,它可以是簡單的概念,說明資訊行為是由initiation、selection、exploration、formulation、collection、presentation與assessment的過程構成,但我們也可以分別由行動、思考與感受面來架構資訊行為。


感受面

我還滿喜歡今天的討論的,它讓我們與不同觀點的同學互相激盪各自的想法,進而產生兩人新的共識,這讓我了解其他人的感受,經由討論後再聽到Foster教授的解答也較有踏實感與學習心得。在聽課的方面,有比上次進入狀況一點,我在想或許也是因為今天有開放討論而不是就完全四小時聽講的關係吧,只是還是相當依賴美美老師在Foster教授講課一個段落之後的小整理,可以讓我驗證我的想法與教授講課的內容,希望對課程的掌握度能夠再好一點。



2008年10月17日 星期五

圖書資訊學研究 Week 5 資訊政策

政策告訴我們什麼該做,什麼不該做。把「政策」二字前面標了「資訊」的主題成為的資訊政策,我們又可以如何來定義它?其實資訊政策就在我們每個人的身邊,我們可以以有關個人資訊行為所會引起的問題來定義,也可以放大到公共政策上來說;梅森(Marilyn Mason)曾經給資訊政策下了一個定義:「資訊政策係相關於資訊之創造、製作、收集、管理、傳播、檢索與利用之一系列法律與政策。最重要者在於其對於個人在社會中之表現,與其在社會中面臨政治、經濟與社會問題所作之抉擇,具有深遠之影響。」##ReadMore##


資訊政策的制訂在歷史的演進上處處可見,西元前三世紀在埃及所建的亞歷山大圖書館,或者是我們東方歷史上有名的焚書坑儒,都是當時代下所規範的資訊政策,至於整個資訊政策的議題,則是從1960年代開始興盛。

談到資訊政策要如何制定規劃,其實每個國家都有著不一樣的標準,訂定資訊政策並非制式的,而是依各國的政治背景、風俗名情而有不同的制定方針。就像美國向來對於隱私權是相當重視的,但是卻在遭逢911恐怖攻擊之後通過「愛國法案」,該法案對於資訊安全造成某種影響,因為它更新了監聽等相關法律,以便跟上例如行動電話、語音信箱及電子郵件等等不斷變動的科技。資訊安全和個人隱私哪方面重要?對於美國的案例來說,我們很難去下評論,但是我想在正常發展的社會之下,個人所應該擁有的隱私部份,是非常重要的。
圖書館是一個資訊服務的單位,我們提供使用者對於資訊的取用與管理、保存。圖書館制定資訊政策如館藏發展政策等提供圖書館的發展方向,但在圖書館制定資訊政策的同時,也有一個議題在悄悄的發酵,也就是圖書館對於圖書的審查制度。

圖書館對於採訪時的選書是否應該帶有審查意見?還是依照我們是個資訊收藏機構而必須要儘可能的將書籍納入館藏?美國圖書館協會曾經在1939年發表「圖書館權利宣言」提供給所有圖書館作為服務政策的準則,宣言中表達圖書館員應具中立的立場,尊重讀者接觸、表達及選擇資訊的自由,無論讀者或是作者,不管其宗教、種族、年齡、社會或政治觀點等,都該受到平等待遇,有公平使用的權利。因此,未成年讀者的資訊取用權也不應受到其本身年齡的限制,應一視同仁、公平對待。

不過其實是不是圖書館員不帶有審查制度就是好的?圖書館可以收藏有關炸彈製作的書嗎?圖書館可以收藏有關自殺的書嗎?18禁的書呢?可以收藏可以供借閱嗎?其實這都是審查制度會存在的原因。我們要怎麼樣看待審查制度,其實是很值得討論的。儘管審查制度的出現是有關於種族、政治或是宗教的理由禁止某些人看某些書,但是隨著時代的演進,就算社會上是少了很多的歧視或是單一文化的影響,我們也可以說審查制度的出現是為了保護、防止某些行為發生。在我看來,圖書館還是依照本身的資訊政策,館藏方向做為選書以及作為與讀者互動的依據即可。

小蝶老師說,希望同學能夠加強自己的英文實力,能在教授的演說中,聽懂七成以上,我想班上是有同學有這樣的實力的,這真的很讓我羨慕  囧,對於資訊政策的議題只能在教授上課時把以前所學習過的拿出來對照才能免強跟的上進度,以後如果遇到不熟悉的題目,還是要再多加預習才行。

2008年10月13日 星期一

社科研究法 Week 4 文獻探討

如果接觸到一個新的議題,我們該如何去分析它?它的作用是什麼?它從哪來?可以用在哪裡?何時需要用它?

這次Foster教授用why, where以及what來與我們分享何謂文獻探討,與如何評斷好的文獻標題與不好的標題,以及如何評量一個文獻探討的好壞。
##ReadMore##
什麼是文獻探討?知識是會累積的,透過別人的知識分享,我們可以更加的了解與擴充這塊知識領域。透過文獻探討,我們可以了解並整合所要研究知識領域的概念並做摘要記錄,從中學習其他研究者對這塊知識的貢獻,包括好的與不好的,同時把我們的研究與所研究的知識領域做連結,而這樣也可以讓讀者知道作者對於這個領域是了解的,從而讓讀者對作者與此篇文章建立信心,
  • self-study review
  • context review
  • integrative review
  • methodological review
  • theoretical review
  • historical review
六種類型的文獻回顧在預習時就已經有了大概的印象,不過在教授講解的時候,其實我一直搞不太懂context review(脈絡回顧)與integrative review(整合回顧)的差別,經過反覆聽教授的講解與再度細看講義及課本,我對於這兩種文獻探討的類型是這樣解釋的:脈絡回顧是將自己的研究連結到知識領域本體,對大的知識領域作簡述,如葉乃靜教授的Introduction部分;而整合回顧則是在這個知識領域中對其他學者的意見(不管是同意或不同意)做整合,在寫作的時候通常可以與脈絡分析放在一起,也可以單一做一章來寫作。(這樣講起來好像又很簡單,是我原本想得太複雜還是純粹我聽力太爛= =?)

在進行文獻探討的時候,通常會是大量的閱讀並篩選合適自己研究主題的文章,因此文章的標題訂定及摘要的寫作是十分重要的,通常研究者透過標題及摘要即會訂出此文章與自己的研究的相關程度是高相關,普通相關或低相關。

文獻探討分幾個區塊:
  • introduction section - 將問題聚焦,建立問題,架構研究概念
  • literature review section - 文獻探討
  • methods section  - 指出資料來源、如何蒐集,變項如何被測量,樣本的取得等
  • findings section - 描述性的,由簡入繁,指出其中新思想及其發現
  • discussion section - 探討
  • conclusion/summary - 結論,與問題和所發現的再做一次簡單的回顧及連結
如何找到文獻資料?圖資有哪些文獻來源?
  1. 國家圖書館館刊
  2. 資訊傳播與圖書館學
  3. 圖書資訊學研究
  4. 國立中央圖書館台灣分館館刊
  5. 國立台灣大學圖書資訊學刊
  6. 大學圖書館
  7. 圖書與資訊學刊
  8. 教育資料與圖書館學
  9. 圖書館學與資訊科學
  10. 圖書館學刊
  11. 全國博碩士論文
  12. EBSCOhost
  13. Proquest
  14. 中國圖書資訊學文獻摘要
  15. 中華民國期刊論文索引
最近一次的文獻檢索
是在大學的時候幫正在唸研究所的學長進行論文時,(題目為「我國大學生的網路相簿使用與社會資本之關連性研究」),解決他的資訊焦慮。第一步我先了解此題目研究背景以及對此領域有個大概的認識,再請學長分享所使用過的關鍵字與曾經使用過的資料庫。
我們總共經過三次的主要面談,第一次是了解內容,第二次我將關鍵字做多元的組合找到了一些學長之前沒有找到過的資料,並請他篩選出他要的方向,最後我再從中進行更進階的檢索,並找到一些學長在進行研究中可以使用的文獻。

心得
或許大家都有這樣的感受,但是英文能力不好的我,是真的聽得很吃力。課程前半段的是課本中有預習到的部份,所以在進度上還免強跟得上,但是在第二堂課時是上教授準備的教材,加上時間緣故,教授講課的速度有加快,我就更加跟不上教授的節奏了。或許下次的上課也還是磨合期,我們還必須要再適應教授上課的節奏,不然只怕要把課程的時間再度拉長,才能讓大家更進入上課的狀況。

2008年10月9日 星期四

圖書資訊學研究 Week4 專題演講

我想,這次穆教授的演講內容,跟卜老師在第一次介紹整個圖資環境時所拋給我們的問題,我們可以做連結,且得到答案:google和圖資的領域這麼樣的相似,圖資有沒有可能被google取代掉?而穆教授告訴我們,我們可以做得比google更好。

##ReadMore##
在大學時讀過有關知識管理的議題,也知道這是我們可以發展的領域,說得冠冕堂皇,我們可以組織知識阿blabla似乎很行,但是當有一天我真正的在想,知識管理到底跟檔案管理有什麼不一樣,有了知識管理系統的公司和有檔案管理系統的公司,差別會在哪裡?我們所自以為的知識管理,是否不過就是普通的檔案管理?

其實知識,就是由資料化為資訊而最後得到的。經由穆教授的說明,我想知識管理是建構在完善的檔案管理上面,除了將公司內部的檔案格式、文本標準做一個統一性的規範,另外還要加上各個員工的「知識分享」,讓檔案、資料不僅僅是原本的檔案資料,而是可以對其他人而言有意義的資訊、知識。

奇異這樣的大公司卻在內部的檔案管理就出現了很大的問題,更不用談知識管理!如此大而悠久的公司在資料控管這方面的落後是我不敢相信的,經過穆教授這麼一說,我想或許還有很多其他的大公司也是面臨相同情況的吧。一個公司在檔案管理系統上面如果沒有良好的基礎,隨著運作的日子增長、資料量倍增,只會使內部的流通越來越不容易,絕對不能變成「始發之時,終日可愈;三日,越旬可愈;今疾且成,非三月不能瘳」。穆教授也提到,大企業不像小公司,系統說換就換;大規模的公司就像一艘大船在海上航行,並不是說掉頭就掉頭的!

聽完這次穆教授的演講,我有的另外一個體會是,縱然我們擁有無窮的知識、做系統的能力或工作能力多強,如果不懂得推銷自己,機會還是不會掌握在我們手中的。就拿奇異這麼個大公司來說,如何呈現我們所有的,讓他們知道我們可以做得很好,我想行銷能力也是推銷圖資領域的關鍵。或許很多領域的企業對於圖資的人能做什麼還不了解,就像詩絨所說的,圖資人在工作領域有著不可取代性,但是如何讓企業知道圖資的長處,是我們該加油的。

最後,其實有個小問題想要在課堂上問,知識管理重要的是內部知識的分享與交流,那麼可以使知識管理系統運作流暢的重要元素,就是公司的人都要熟知此知識管理系統的功能以及發文的注意事項,這部份該如何做規範?另外,關於穆教授提到的問題,在建造知識管理系統時,是資料重要,還是架構、檢索重要,亦或是使用者用得上手重要?每個系統設計者在設計上或許都會有不同的觀點在,若有那樣的資源,齊頭並進是更好,但我想使用者還是決定一切,畢竟這是要工公司「每位」使用者使用的系統,如果使用者的同質性、資訊素養能力高,能夠接受較功能齊全且進階的使用介面(設計得太過陽春簡單或許會少掉一些功能),那可以以架構為設計重點,這是我的想法,也歡迎大家討論。

2008年10月4日 星期六

圖書資訊學研究 Week3 專題演講

我承認,當出現了一連串的英文而後面附有中文解釋的時候,我習慣先看中文,而這個中文解釋如果讓我對這個主題完全提不起興趣的話,我就更不會的深入去看這個標題甚至文章要傳達給我的訊息。Bibliographic Latent Semantic Indexing: No Blames On Users(書目隱性語義索引:使用者無錯)是我第一次看到的此次演講題目,我當時看不懂那一連串英文的專有名詞,對於「使用者無錯」這個名詞更是覺得拗口而對於這個題目沒有很大的興趣。
##ReadMore##
穆教授在演講的開始,提起了他小時候對於圖書館的感覺。當他走進圖書館,矮矮的個子抬頭看坐在櫃檯上高高在上的阿姨,只覺得是走進了當舖!不了解書的擺架,不懂圖書分類的法則,不會使用卡片目錄,走進圖書館有如霧裡看花,這是誰的問題?是館員該抱怨使用者太笨了找不到書,我們明明就照著我們認為最好的分類方法將人類的知識分類了,怎麼還會找不到這麼簡單的排架;還是使用者會碎碎念,圖書館怎麼會這麼爛,不是收藏很多書嗎,怎麼我想看的一本也找不到?

或許也有人會說,這都是過去的情形了,現在電腦科技發達,大部分的人都懂得使用電腦去查詢想要的書,查出來的書還會告訴你在哪個樓層可以找到等等,這些問題在實體圖書館有稍微減少;那麼,在這麼個資訊發達的時代,我們有了這麼好的工具使用,當使用者利用電腦網路來搜尋資料,是總是輕鬆的找到想要的,還是總是找不到,還是一找又了太多了?這又是誰的錯?

穆教授提到,經統計,使用者在進行資訊搜尋行為的時候,是很少使用到進階搜尋的功能的,就算有,往往也是錯誤的使用,然後再找到錯誤的答案,而會使用布林邏輯來檢索的使用者更是佔了很少的比例。自從網路發達之後,各網站、網頁如雨後春筍般的出現,而這些網站的出現不就是要提供使用者來瀏覽?那使用者在這麼浩瀚的網路世界中能夠準確的找到他所要看的網站嗎?

我們再將問題拉回圖書館。圖書館五律中提到,每本書是有他的讀者,每個讀者也有他的書,這我們唸圖資的都知道,而他們要怎麼才能夠被順利的找到彼此,這就是我們圖資所要做的。但是一本書經過館員的分類編目、上架,之後能不能被使用者找到?這打了一個很大的問號,館員常常會以圖資人的心態覺得分類編目很簡單,進行了我們自以為簡單的分類編目後,卻跟使用者間出現了很大的鴻溝,我們的語言跟他們的語言常常是不相同的!我們要怪館員太死腦筋,要怪使用者太笨?還是要怪圖書館網頁太爛?

而穆教授希望能以書目隱性索引來作為改善讀者和圖書館的「溝通橋樑」。圖書館視每一筆資料都是單獨的一個文件,但是事實並非如此,文件和文件間會存在著連結關係。舉例來說,某筆中文資料和英文資料在查詢時是完全不搭嘎的,但是他們卻因為是同個作者所寫的,而存在在彼此間的聯結關係,如果我們能找出文件和文件之間的「隱藏連結」,將可以使這些文件更容易的被找到,而這也就是隱性語意索引的基本概念。

穆教授以隱性語意索引研究書目的狀況而成書目隱性索引,而所要進行的第一步驟,就是找出該文件的重要特徵,成為區別該文件的索引。以電視節目「全民最大黨」來看,每個演員都辦的唯妙唯肖,不僅穿著一樣、髮型特色一樣,有的連說話語調語氣都很類似,但是民眾知道他們不是政治人物本人,原因就在每個人都還是有足以區分自我特色的因素在,在隱性語意索引中,其中就有以singular value docomposition(SVD)的方法,以矩陣來找出每筆文件當中的關鍵字。

透過LSI的數學計算,我們最後可以得知每個文件關鍵字的分布情況並予以權重計算,找出一個讓使用者更容易查詢想要資料的規則,穆教授已著手將LSI與書目結合,成為Bibliographic Latent Semantic Indexing(B-LSI),但是尚有許多問題有待克服。誠如曾元顯老師所說,以隱性語意索引來看,我們可以把常出現的關鍵字抓出來,但是這也意味著我們放棄了很多因為特性不夠顯著的關鍵字,這些關鍵字出現的次數可能較少,但並不意味著他們的重要性不高,但卻會因為LSI出現的「長尾理論」而被淘汰,這是還有待加強的地方。

這次的演講讓我感觸很深的,一個是穆教授在一開始提到的,網頁的價值,不完全在有多少人連結,我們應該依照他的特性,他的使用族群而給予不同的權重,要怎麼給予權重?卜老師的解釋是依照權威性。兩個文獻來比較,20個一般大學生說A比較好,但是另外5個教授說B比較重要,那麼哪方面的意見比較重要?當然是教授的意見較具權威性,而我們可以依照不同「身分」的網頁(如依照PageRank的排名),成為計算網頁權重的元素之一。

另外一個是,是要說我們不了解使用者的資訊尋求行為,還是該說使用者的資訊尋求行為很難讓我們了解?當使用者在搜尋鍵入「高清電視」,他有可能是想要了解他的規格,可能是要知道他的價錢,也有可能是要知道他的製造廠商等等,這是使用者與我們的代溝。使用者常常會不了解該如何表達他們所想要的意思,但是並不是我們不去了解他們的意思,是訴諸於文字更甚至是查詢語言的想法,可能連使用者自己都不明白,所以我們提供了如LSI的技術、如(PageRank)的排名告訴使用者你輸入的詞彙其他人大家較多看的是怎麼樣的網頁,我們為使用者進行了改革,但是我認為是相對的,使用者應該也要從網路的使用中,逐漸的成熟自我的資訊素養,這樣網路世界才有更成長與演化的空間。No Blames On Users,但是我希望並不是使用者等著吃糖果就好了,如果當時山頂洞人要吃什麼就出現什麼,那人類也不會進化,網路世界應該是要互相學習而成長的。

最後,關於B-LSI是正在起步的技術,還有許多尚待克服的問題,像我原本在結束想問的,如果真要用矩陣來表示這麼大維度的文件加所有的單字單詞,我想是需要相當大的空間才能存入以作分析的,目前穆教授取樣的樣本還不是很大,但是未來還有很多成長的空間吧我想。

社科研究法 Week 3

另外的分類概念

在上個禮拜,我們學到面對大量詞彙時,應該有的概念 -- 整理、分類。在面對分類的時候,我們可以依科學哲學、研究方法、理論現象等來做分類了解,但老師說班上有一位同學提出了不一樣的看法,將所有的知識分成你所的,與所不懂的。歐買尬,這真是完全搔到我的癢處,這的確就是我所想的「第一步驟」,常常在想說那麼多的辭彙我怎麼知道要分哪一類,而我應該更先要做的是先把懂的和不懂的挑出來,she got it!老師接下來也提到,我們的知道與不知道分類,只是我們自己在做的「個人層次」的分類,科學界是要找的是一致性的通用分類,我想也跟上個禮拜做出了呼應,因為科學是放諸四海皆準的,common sense不能作為科學的分類。##ReadMore##

偽科學的解釋

偽科學是不被主流接受的科學。我覺得這麼一句話給了上個禮拜解釋的偽科學一個更貼切的解釋,不管它是所謂的「未來科學」,甚至是「主流科學」也一樣,那是前人所一步一部堆積出來的研究成果,但典範不是沒有轉移的可能,我們所要秉持著的,就是應該對任何事情保持科學懷疑的態度,不冒昧相信,也不隨便肯定。

研究方法四重點

老師由解釋上個禮拜有同學不懂的名詞「過度概化」談起,說明研究方法有四個基本要素:測量、樣本、信度、效度。

  • 測量:分成以數字測量與分類的概念。以數字測量的前提是我們必須先準備好測量的工具和標準,要用對的工具量測對的對象;比如說量身高我們用公分作單位而不用公斤,嬰兒的體重表示用公克而一般人的體重表示用公斤等,若測量工具無法反映測量物件的特質,我們會說這個研究的內部效度有問題。比較數字測量與分類的概念,老師舉了一個例子。假設今天要做老師的評鑑,我們可能會有兩種情況,第一是使用如李克特量表,將對老師的印象以五等地區分,這麼一來我們可以用數字的轉換統計來評量這個老師的教學狀況;另外一方面我們也可以請全班的同學寫下對老師的五個評語,若有十位同學作評鑑,我們可以得到五十個名詞,此時我們可以根據這些名詞,以分類的概念再來看學生們對老師的教學做出了什麼樣的評價。
  • 樣本:樣本的使用錯誤即會造成同學提到不懂名詞過度概化的概念。過度概化的發生代表了外度效度產生錯誤,研究者是以小群體樣本的結果推論到大群體,而造成過度概化的錯誤。舉例來說,如果研究現在要做一個全國國中生資訊素養狀況的討論,而對中部四縣市的學生作取樣,想要以此推論母群體(全國國中學生)的資訊素養狀況,研究者在此研究中忽略了城鄉差距等的因素,這樣的推論很有可能造成過度概化,甚至錯誤的結果。
  • 信度:經由同學的報告,指出信度為一致性的概念。
  • 效度:效度為真實、正確性。在這邊我想到一個之前大學上課時老師舉的一個例子,高信度低效度,高效度低信度的狀況是如何發生的?以老師出題,學生作答為例,若老師出了一份考卷,學生很多都考得很好,表示這是一個具有高信度與高效度的考卷;如果在對答案的時候,老師不小心將正確答案"B"念成"D"讓學生改錯了,也就是出現學生都一樣寫了B(高信度)但是批改出來是錯的(低效度),出現高信度低效度的情形;最後就是如果老師出了一份題目但同學上課都不聽,答案亂寫,呈現的就是高效度低信度的情形了。

實徵研究、實證研究、實地研究
  • 實徵研究:在第一堂上課的時候,老師就提到了實徵研究室進行研究方法的最重要步驟,必須進入場域蒐集資料。在這次上課報告的第二章中,提到了資料蒐集技術有分質化的與量化的,量化包含實驗、調查、內容分析及既有資料等;質化的資料蒐集技術則有實地研究與比較歷史等。以上都為實徵研究的方法。
  • 實地研究:由以上可知實地研究為實徵研究中的一種,它是屬於質化的蒐集資料的方法,是對一群人,進行一段持續且長時間的個案研究。
  • 實證研究:為了證明假設所進行的量化研究行為。實證研究中通常會具有兩個變項,比如說研究者想研究是否真的男生的理化會比女生好兒去做的証明研究就是實證研究。
心得

二到八章都是進行研究須具備的基本概念,其中六七八三章是有關研究方法的討論,這個禮拜我們以分組的形式,秋風掃落葉般的把這幾個章節概括的重點抓出來,這當中有些是老師一再重複提的,有些是更深入的講解,也有些是之前就或多或少聽過的概念。研究法真的是一門馬虎不得且紮實的工夫,它牽涉到很廣的範圍,但又因為是「科學的方法」而匯於一宗,實在是令人不敢大意的學問。這次最大的收穫,也是藉由這樣的小組討論,將這麼一個好幾十頁的章節「以我們的角度」去蕪存菁,不但要馬上壓縮我們的腦袋擠出空間把這些概念放進來,還要瞬間消化和同組同學達到共識,實在是太刺激了!只是發現真的從大四下開始就沒有再做分組報告很有差,整個融會貫通和報告時語言表達能力都下降許多,明明小組有充分準備在我口中都結結巴巴冗字一堆,別的小組就可以說得很流利,真的要趕快把感覺抓回來!