2008年11月6日 星期四

如何利用表格式的Data並以Tab Delimited的方式匯入EndNote中?(以臺灣日日新報YUMANI版資料庫為例)

相信大家會發現很多中文資料庫,幾乎都沒有直接匯入EndNote的功能,原因可能因為資料庫開發的時間早。碰到這一類資料庫時,若要儲存書目至EndNote中,除了自行複製貼上外,唯一的方法就是自行撰寫Filter。但是撰寫Filter需要花一點時間,如果我們觀察資料庫的書目結構是一種表格式的清單時(csv檔亦可),或許我們只要稍微修改一下data檔,就可以利用EndNote現成的Filter(即Tab Delimited)來匯入資料檔。(可參見EndNote手冊中的Creating a Tab-Delimited Format)

以臺灣日日新報YUMANI版資料庫為例,它的檢索結果可以輸出成csv檔,就可以轉成tab格式的文字檔再匯入EndNote中,其做法如下:

1. 以Excel開啟輸出結果csv檔。(因為Excel可以剖析資料,讓Data有規律的排列整齊,或進一步利用涵數將資料再整理,例如年代1896-07-25,可再分為1896與7/25。)

2. 在Excel中第一列加入所需的Reference Type (例如:*Newspaper Article)與第二列中的欄位名稱。欄位名稱需對應至EndNote中該Reference Type所使用的Field Name,以YUMANI資料而言,除了原有的欄位:日期(Issue Date)、年號(匯到Notes項)、刊別(Frequency)、頁次(Pages)、作者(Reporter)、標題(Title)、關鍵字(Keywords)外,我又加了兩個欄位:報別(Newspaper)與資料庫名(Name of Database)。



Ps. 此種情況是因為Data 同屬於某一種Reference Type;若Data分屬多種Reference Type時,需在Data的最前一欄,加入各種Reference Type。例如:



3. 另存成文字檔。(需留意編碼,以臺灣日日新報YUMANI版資料庫而言,因Data中有日文字,所以要存成Unicode的文字檔;另值得留心的是Excel 2003中的Unicode並未告知是UTF-8或UTF-16…)

4. 以Word或筆記本開啟該文字檔,檢查該文字檔是否有規律的以Tab鍵排列Data,並再另存為UTF-8文字檔。(這是我測了很多次,發現在EndNote中用UTF-8字碼才能順利匯入)

5. 開啟EndNote,選擇File中的Import。

6. 選擇Import Data File,Import Option選擇Tab Delimited,Text Translation選擇 Unicode (UTF-8)後即可匯入。



要比較留意的是,有時無法匯入的原因,常常是第一列Reference Type後有空格,亦或是字碼對應的問題,需要耐心的試一試喔!

----------------------------------------------------------------------------
附記: 茲將EndNote X2手冊中對於Tab-Delimited方式匯入的其它考量記載如下,供大家參考.

· ANSI, ASCII, or UTF-8 formatted text files can be imported. This means that, typically, no font styles or text styles can be preserved during import.

· All field names and reference type names in the file must be identical to those in EndNote. See the List of Reference Types for a listing of all of the reference types and field names. If you have custom reference types, you may check them by choosing Preferences from the Edit menu, selecting Reference Types, and clicking the Modify Reference Types button.

· Multiple author names should be separated by semicolons (;) or by two forward slashes (//).

· Fields cannot contain tabs or paragraph marks. Let the lines of data "wrap" to the next line.

· Leading and trailing spaces are removed during importing.

· No upper/lower case conversion is made during importing.

· A reserved field name called "Unused" may be used for data that you do not want imported into EndNote.