2009年4月28日 星期二

EndNote 與 QUOSA 全文下載之比較

自從發現EndNote全文下載有遺漏,且知SCOPUS中有QUOSA全文下載功能後, 心裡一直有個想法, 想看看兩者之間的差異性。

上星期五(4/24)試著在SCOPUS中查找了Facebook的相關文獻。 其中,各學科領域中的文獻都有。為了符合QUOSA一次最多只能下載50篇全文的限制,我將查詢結果限制於Social Science 領域,且文獻類型以Journal Article與Trade Publication為主,共查得49筆書目,並將這49筆書目匯至EndNote中。



其後,同時以SCOPUS中的QUOSA全文下載功能與EndNote中的Find Fulltext功能來下載全文。(註:我在使用這兩個的全文下載功能時,還不是很順利呢!第一次QUOSA下載到一半,給我無緣無故當掉,猜想給可能是同時也用EndNote在下載全文吧,把EndNote抓全文的功能取消後,QUOSA才順利抓完全文;而用EndNote下載全文時,第一次更離奇,一筆也沒下載到,是尖峰時刻嗎? 星期一再做一次後,才順利下載到全文)

兩者查到全文的筆數情況如下圖,EndNote抓到13筆全文,而QUOSA則抓到17筆全文,兩者皆為PDF檔,其中兩者共同抓到的全文有7篇,EndNote獨有抓到全文的有6篇,QUOSA有10篇。這引發我的好奇心,到底是何因造成兩者抓到全文篇數不一致呢? 是因為全文的來源不同所造成的嗎?(即全文是從電子期刊出版社網站中抓取,還是索摘資料庫廠商的Server中抓取?) 全文檔案的類型有影響嗎? (即是PDF檔,還是HTML檔?)



為此,我在EndNote中加註了幾項欄位來分析,包括標示全文的來源與全文檔案類型,參見下圖。



其後,我將EndNote與QUOSA無法下載到全文的書目一筆筆查找是否有全文可下載,以及它們的檔案類型是PDF檔還是HTML檔。結果竟然發現人工一筆筆下載全文竟可高達43篇(其中PDF檔37篇,HTML檔6篇)。就算單純以出版社為全文來源、檔案類型為PDF檔來看,人工下載到29篇,也遠比EndNote的13篇、QUOSA的17篇來得多。(分析表參見如下圖)



從上述小小的分析來看,我自己歸納出可能抓取全文的條件如下:(因為廠商好像也沒明說技術面到底是怎麼抓取全文的)

1. 全文的檔案類型需為PDF檔。許多Born in Internet的電子期刊,若全文為HTML格式,恐怕都無法以EndNote或QUOSA下載到全文。例如這次書目中查詢時所看到的D-Lib Magazine。

2. 全文的來源必需是從出版社網站中取得。這一點後來一想也是合理的,主要是因為索摘資料庫Server中的全文常會有變動,一方面是全文年份embargo的問題,一方面索摘資料庫廠商每年的收錄期刊title數也會因為合約的變動而有變化。(這也應證了我在EndNote X2.02 全文下載功能仍有遺珠之憾! 一文中看到EBSCOhost的Case,三筆有全文者,一筆為PDF檔,一筆為HTML檔,存在EBSCOhost Server中;一筆為連結到外部出版社的全文,結果是這筆連到外部出版社的全文,EndNote有下載到全文。)

比較讓我不解的是:同樣為出版社網站且檔案為PDF格式的全文,竟然有那麼高的比例未下載到全文。且EndNote與QUOSA抓到全文的篇數也不同?這是技術層面的問題嗎? QUOSA有下載全文篇數的限制(50篇),EndNote Find Fulltext功能的下載篇數限制呢? 至今未得到回應。

(4/30補充說明一下: EndNote廠商告知Find Fulltext功能是利用數位物件識別號(Digital Object Identifier,簡稱DOI)來抓取全文的,想要更瞭解DOI的介紹,可參考Wikepedia中的說明。故一些小型出版社若未向註冊代理機購如CrossRef等申請DOI,那就會抓不到全文了。 有機會再找時間將兩者未抓到的全文,Check一下看是否無DOI。)

從這次小小的研究中,似乎無法解答兩者未能全面下載到全文的疑問,但至少告訴自己,對於未查到全文的部份,真的要double check啊!

此外,在這此查找過程中,同時發現SCOPUS中也收錄不少通訊類的雜誌,如Library Hi Tech News、EContent、Online等,此類雜誌多屬為trade publication。SCOPUS相較於同樣為引文資料庫的WOS而言,兩者對於期刊收錄原則,到底要重視的是質,還是量,恐怕又有一番爭論吧!