《小學堂》是由臺灣國科會補助,臺大中文、中研院共同開發,是老牌而知名的甲骨文、金文、戰國簡帛文字、小篆資料庫,有大量漢語文字的形音義第一手資料。
所謂「小學」,就是指科學考證漢語文字形音義演變的學問。所以雖稱小學,但實際上博大精深。而且小學堂的搜尋方式很有意思,除了搜尋文字可以找到本站的古文字資料外,還會索引很多外站的文字解釋資料,所以一次就可以找到大量的文字相關資料內容,節省很多時間,是非常棒的索引工具。
「小學堂文字學資料庫」是一個形、音、義綜合的文字學資料庫,可提供使用者根據文字的形、音等屬性先檢索出字頭,再透過字頭連線到個別的形、音、義資料庫或字書索引。
本資料庫收錄的字形涵蓋甲骨文、金文、戰國文字、小篆及楷書,總數超過20萬字;收錄的聲韻資料涵蓋上古、中古、近代及現代,總數超過128萬筆;收錄的字書索引資料則超過35萬筆。
本資料庫主要由漢字古今字資料庫及漢字古今音資料庫組成。漢字古今字資料庫由甲骨文、金文、戰國文字、小篆、異體字表資料庫組成,而漢字古今音資料庫則由上古音、中古音、近代音、官話、晉語、吳語、徽語、贛語、湘語、閩語、粵語、平話、客語、其他土話資料庫組成,各資料庫除可互相連結外,也可獨立使用。
本資料庫也包含了形音以外的資料庫,例如甲骨文合集材料來源表資料庫;也提供了一些語文工具軟體的下載,例如吳守禮臺語注音字型及輸入法,小學堂增益集。
本資料庫是一個整合型的資料庫,期望能以單一查詢介面,透過檢索出的字頭,銜接網際網路上不同的形、音、義資料庫。初期銜接的資料庫包括教育部的異體字字典及重編國語辭典、原行政院主計處電子處理資料中心的「CNS11643中文標準交換碼全字型檔」、中華開放古籍協會的「開放康熙字典」、「數位典藏與數位學習國家型科技計畫」的「國際電腦漢字與異體字知識庫」。