Citeseerx:免費論文搜尋網

CiteSeerX是CiteSeer的換代產品。1997年,CiteSeer引文搜尋引擎由美國普林斯頓大學NEC研究院研製開發。CiteSeer引文搜尋引擎是利用自動引文標引系統(ACI)建立的第一個學術論文數字圖書館。

研發人員不斷對CiteSeer執行中暴露的問題和使用者的反饋建議進行分析,並由NationalScienceFoundation和MicrosoftResearch資助,為該搜尋引擎重新設計了系統結構和資料模型(即CiteSeerX),於2007年投入執行。

CiteSeerX採用機器自動識別技術蒐集網上以Postscrip和PDF檔案格式存在的學術論文,然後依照引文索引方法標引和連結每一篇文章。CiteSeerX的宗旨就在於有效地組織網上文獻,多角度促進學術文獻的傳播與反饋。

至今,CiteSeerX儲存的文獻全文達138萬多篇,引文2674萬多條,內容主要涉及計算機和資訊科學領域,主題包括智慧代理、人工智慧、硬體、軟體工程、資料壓縮、人機互動、作業系統、資料庫、資訊檢索、網路技術、機器學習等。

CiteSeerX與CiteSeer一樣,也公開在網上提供完全免費的服務,實現全天24h實時更新。

CiteSeerX的常用功能包括:

1、檢索相關學術文獻,瀏覽並下載PS或PDF格式的論文全文;

2、檢視某一具體文獻的“引用”與“被引”資訊,同時還能獲得文獻、作者與出版單位最新的引用排行;

3、檢視某一文獻的相關文獻,並應用特殊演算法計算文獻相關度;④圖表顯示某一主題文獻(或某一作者、機構所發表文獻)的時間分佈。可依此推測學科熱點和發展趨勢,避免重複勞動。

 

CiteSeerX檢索方法:

檢索介面:

?

啟動IE瀏覽器,在位址列輸入http://citeSeerx.ist.psu.edu/cis,然後回車,即可開啟CiteSeerX檢索介面。?

CiteSeerX的檢索介面簡潔清晰,預設為文獻檢索介面。如果要搜尋某一特定作者的學術論文,選擇“Authours”標籤進入作者檢索介面。

若選擇“IncludeCitations”可選項,則搜尋範圍不但包括CiteSeerX的學術文獻全文資料庫,還包括資料庫中每篇論文的參考文獻。因此未選擇“IncludeCitations”項的檢出結果均能下載全文,而選擇“IncludeCitations”項的檢出結果不一定有全文。

CiteSeerX的檢索首頁只有一個檢索框,預設為對篇名、作者、摘要、文字內容進行檢索。CiteSeerX還支援高階檢索,點選“AdvancedSearch”進入高階檢索介面,可以看到CiteSeerX支援以下檢索欄位的“並”運算:篇名、作者、作者單位、期刊或會議錄名稱、出版年、文摘、關鍵詞、文字內容以及使用者為論文定義的標籤(Tag)。當然也可以在首頁的單一檢索框自行構造組合檢索式,如Author:(jkleinberg)ANDvenue:(journaloftheacm)。

檢索規則及技巧:

CiteSeerX作為獲取計算機專業領域學術論文的高效搜尋引擎,其查詢遵循以下操作規則:

1、CiteSeerX支援布林邏輯運算。邏輯組合查詢的語法有邏輯(and)或(or)、無邏輯非(not)。邏輯算符不區分大小寫。如:要查詢Kleinberg或bollacker的論文則在檢索框中錄入“Kleinbergorbollacker”。需要注意的是:邏輯或只在檢索首頁的單一檢索框適用,高階檢索介面的各組合檢索框之間為邏輯與關係。

2、CiteSeerX支援鄰近詞運算匹配,鄰近距離預設為一個單詞。多個關鍵詞之間有空格的作為片語或鄰近詞運算匹配。如輸入“Virtualcomputer”,可檢出包含“Virtualcomputer”或“Computervirtual”的文獻。

3、CiteSeerX不支援片語的精確匹配,這樣處理對查出同一作者姓名的不同拼寫有利。例如J.R.Quinlan和Quinlan,J.R.的拼法,若用精確匹配只能檢出一個,若用親近匹配則兩個都能檢出;再如,要檢索“JonKleinberg”的文章,如果檢索詞為全名“JonKleinberg”,則不能得到所有該作者的論文,只有那些名字“Jon”未經縮寫的作者的文章能夠被檢出。在作者檢索中,只用姓或者名字縮寫加姓進行檢索,會得到比較好的效果。例如用檢索詞“J.Kleinberg”,CiteSeerX的作者索引將擴充套件該檢索式得到“JonKleinberg”和“JonMKleinberg”的文章。

4、CiteSeerX查詢時,詞幹法有效,而萬用字元語法是無效的。如錄入關鍵詞“Programme”,可檢出“Programme”、“Programming”、“Programmed”和“Programms”文獻。

5、CiteSeerX支援位置算符,書寫格式為w/n,n=詞間相連數值。如輸入virtualw/3computer,表示2個詞中間允許出現3個或3個以內的單詞或符號。

6、利用CiteSeerX查詢時,遵循檢索詞大小寫無差別原則,如輸入檢索詞“bollacker”、“Bollacker”,或“bolLackEr”,將返回同樣的檢索結果。

7、在CiteSeerX中檢索完整字句,需用雙引號,如“3Dcomputervision”。

8、若輸入檢索式後,CiteSeerX搜尋結果為零,無論何種原因,系統會自動給出檢索建議和幾種新檢索式的連結供檢索者選擇。

9、在高階檢索介面還可以對檢索範圍和檢索結果排序規則做出規定。比如可對文獻發表時間、文獻引文的最小數目等做出限定,這樣發表時間超出範圍或引文數少於規定數目的文章將不被檢出。排序規則包括被引次數、相關性和標引日期。

檢索示例:

例如,查詢近兩年來國外發表的有關計算機視覺(ComputerVision)方面的科技文獻。為提高查準率可將檢索關鍵詞“Computervision”限制在摘要(Abstract)欄位,並將出版時間範圍限制在2007to2009。

具體操作如下:

若採用普通檢索,可在CiteSeerX主頁檢索介面Documents檢索框中直接鍵入Abstract:(computervision)ANDyear:(2007TO2009),再點選Search按鈕。

若採用高階檢索,可在CiteSeerX主頁檢索介面直接點選“AdvancedSeach”標籤,進入高階檢索介面,然後分別在Abstract和PublicationYear:RangeFrom()to()檢索框中輸入“computervision”及2007和2009,再點選“Search”按鈕。

獲得查詢結果後,可根據需要點選選中文獻標題連結,進入論文概況介面,再點選“View/Download”即可瀏覽或下載全文。

CiteSeerX被譽為是全球最大的科學文獻免費全文索引搜尋引擎。筆者曾就某一計算機學科方面的檢索課題做過對比研究,根據使用者的具體查新要求,在Inspec和EiCompendex文摘型資料庫查到12篇相關適用文摘,多為會議文獻。為獲取全文,筆者利用CiteSeerX反檢,結果查到其中的11篇,並均成功下載到全文。可見,CiteSeerX的確稱得上是廣大科研人員和圖書情報工作者免費獲取電腦科學文獻的搜尋利器,值得推介和收藏!

猜你喜歡

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *