《中國文檔名詞發(fā)展演變史》特色鮮明,系統(tǒng)梳理了從先秦至民國文檔名詞的發(fā)展脈絡,運用計量語言學等方法深入研究,以大量文獻為依據(jù),詳細闡述各時期特點及影響因素,兼具學術性與可讀性,是檔案學、語言學等領域研究的重要參考書籍。
本書是一部具有較高學術價值的專著。本書系統(tǒng)梳理了中國文檔名詞從先秦至民國的發(fā)展脈絡,詳細闡述了各時期文檔名詞的演變歷程,對了解中國文化傳承與發(fā)展意義重大。作者運用計量語言學等方法,通過大量文獻檢索與數(shù)據(jù)分析,深入探究文檔名詞的起源、發(fā)展規(guī)律,以及政治、文化等因素對其的影響,使讀者能清晰把握其發(fā)展軌跡。書中不僅對常見文檔名詞進行解讀,還對一些易混淆或鮮為人知的名詞進行辨析,為檔案學、語言學等領域的研究提供了重要參考。無論是專業(yè)研究者還是對歷史文化感興趣的讀者,都能從本書中獲得對中國文檔名詞及相關歷史文化的深刻認識,是一部不可多得的佳作。
專業(yè)語言的歷史實證研究(代序)
本書是筆者主持的國家社科基金一般項目中國文檔名詞發(fā)展演變史(14BTQ071)的最終成果。
一、研究對象
名詞,是人對特定的客觀事物的符號性表述。這種表述(名稱)是人們在認識世界、理解世界的活動過程中獲得的,其對象是那些具有獨立特征的某一個或存在共性的某一類事物。這個名稱確立后,會在人類認識發(fā)展過程中得到不斷的修正與完善。名詞的產(chǎn)生與發(fā)展,表面上是語言問題,而本質(zhì)上是人類思想認識問題。詞匯,不僅僅是語言,更是一種概念、一種思想。對它們的研究,是構(gòu)建人類思想史、認識史的一個重要方面。
專業(yè)語言,對于一個專業(yè)領域而言具有極其重要的意義。普通人也說文書和檔案,但那只是一種一般意義上的名稱,不是一種專業(yè)的概念認識。他們在說這些名詞時,沒有專業(yè)研究員頭腦中的那些豐富、精確的概念認識。作為概念的專業(yè)名詞,它是建立在通曉專業(yè)歷史和成就的基礎上的。非專業(yè)地使用名詞與專業(yè)地使用概念,是非專業(yè)與真專業(yè)的明顯區(qū)別。
作為專業(yè)的研究者,我們的確要比非專業(yè)人士對專業(yè)名詞了解得更多。但
這就夠了嗎?黑格爾說,人們對自己經(jīng)常掛在嘴邊的名詞往往是最無知的。雖
然作為研究者,我們對本專業(yè)的這些名詞比普通人了解得多一些。但如果認真
推敲起來,說起這些名詞的來源、演化,我們大多知之不詳、知之不確。這種
無知,會使我們的專業(yè)性受到質(zhì)疑,會使我們學科的成熟性受到質(zhì)疑。專業(yè)語
言的成熟,從來都是專業(yè)成熟的顯著標志之一。
關于文檔名詞的研究,是文書術語學、檔案術語學、文書史、檔案史等學科重要的基礎性的組成部分。在古代漢語中,人們對文書和檔案這兩種事物的認知區(qū)分還不是十分清晰,反映為名稱上的區(qū)分也不是很明顯,同一個名詞常常兼具文書和檔案兩方面的含義,它們之間聯(lián)系緊密。歷史時代越早,這種情形就越明顯;诖,本書將兩者作為共同的研究對象,即我們研究的是文檔名詞,而不只是檔案名詞或文書名詞。當然,由于現(xiàn)代社會名詞的專業(yè)化程度大大提高,我們就改為以檔案名詞為主了。
在語言學中,研究某一專業(yè)或行業(yè)語言的部分,被稱為專業(yè)或行業(yè)語言學。在專業(yè)語言學中,語音與語法不是研究的重點,詞匯是它們的主要研究對象。而專業(yè)詞匯又以名詞為主,這是本書以文檔語言中的名詞作為研究對象的主要原因。
名詞是由詞素構(gòu)成的,據(jù)此,我們將具有同一詞素(根詞)的名詞歸為一類,稱為名詞族類,這是一種詞匯聚類研究方法在文檔名詞研究中的應用。具體而言,我們從文檔語言的特殊性出發(fā),在文檔族類特征方面,歸納出以下族類文檔名詞:文族書族案族簿族籍族冊族卷族牘族典族圖族檔族等。這些族類將文檔名詞劃分為組或群,以一個群組為研究對象,即按照文檔名詞整體文檔名詞族類文檔名詞個體的研究路徑展開,可以幫助我們更好地從整體到個體分析文檔名詞的詞義與使用情況。
此外,文檔名詞族類中的很多名詞往往可以分屬兩個不同族類,即構(gòu)成該詞的兩個詞素分屬兩個不同的族類,如案牘案卷文案等,它們既都屬于案族文檔名詞,也分別屬于牘族卷族文族文檔名詞。
在統(tǒng)計時,這些交叉的名詞我們在不同的族類中皆納入統(tǒng)計范疇,不在整體中加以剔除,以保持各族類本身的完整性。但在具體論述時會有所側(cè)重、取舍,盡量避免較多的交叉與重復。
多數(shù)情況下,一個名詞會具有多個義項。而這些義項往往并不都是指代文檔類事物的,也會包含其他事物或概念,而本書中所研討的主要是該名詞的文檔類含義和用法。如文字一詞,《漢語大詞典》中有3個義項、6種含義,在大多數(shù)情況下它是指記錄語言的書寫符號,古漢語中多指單字。比較這6種含義,僅有公文;案卷指奏疏或札子屬于文檔名詞的范疇,即文字一詞僅在這兩種用法中指代文書檔案類事物,因此檢索結(jié)果和統(tǒng)計數(shù)據(jù)均在這兩種用法(文檔含義)的范疇內(nèi)篩選和計算,即一般只統(tǒng)計其文檔含義的部分,以確保數(shù)據(jù)的準確性和可靠性,避免含義混淆、數(shù)據(jù)泛化。
本書的選詞范圍較大,總數(shù)多達200余個。在名詞范圍上達到了前所未有的水平,具有較高的全面性。如文族名詞就包括文、文卷、策文、公文、文典、文字、文告、文憑、文契、文墨、文款、文疏、文牒、文榜、文誥、文翰、文歷、文學、文驗、文解、文稿、文檄、文引、文札、文示、文表、文帖、文券、文狀、文奏、文按、文計、文約、文記、文帳、文移、文符、文獻、文證、書文、文書、文案、文牘、冊文、文冊、典文、圖文、文簿、中古文、架閣文字、架閣文書等51個文檔名詞。
當然,即使達到如此之大的選詞范圍,但在浩瀚的詞匯海洋面前,遺漏仍然是難免的,有待我們繼續(xù)挖掘。
- 主要基于數(shù)據(jù)庫文獻之檢索、分析的較大數(shù)據(jù)量抽樣統(tǒng)計法
本書采用了計量語言學的方法進行歷史語言學的研究。它需要兩個重要前提:第一,歷史上連續(xù)的文獻遺存。對于古代語言,特別是文檔語言(具有明顯的書面語言特點),我們主要從各個時期的書面文獻來考察。如果文獻是斷斷續(xù)續(xù)的,數(shù)量很少,就難以達到較好的效果。在這一點上,我們要感謝我們偉大的祖先,從商代開始,就給我們留下了大量的連續(xù)的文獻資料,不但經(jīng)史子集汗牛充棟,小說、筆記也數(shù)不勝數(shù)。這是本書開展研究的必要條件之一。第二,數(shù)據(jù)庫的建設與運用。我們進行了大數(shù)據(jù)量的統(tǒng)計工作,如果沒有網(wǎng)絡數(shù)據(jù)庫這樣的工具,手工完成是很困難的,甚至說是不可能完成的。
盡管本書的數(shù)據(jù)量很大,但使用的仍是抽樣統(tǒng)計法,即在從全部研究對象(古代文獻)中抽取一部分對象(筆者當時所能查到的全部數(shù)據(jù)庫文獻及部分紙質(zhì)文獻)進行調(diào)查并取得資料的基礎上,運用數(shù)理統(tǒng)計的原理,對整體做出數(shù)量上的估計判斷,從而對認識對象得出大致結(jié)論。抽樣法也叫取樣法,統(tǒng)計學中稱為抽樣推斷法,是統(tǒng)計方法在社會科學領域的應用。這種統(tǒng)計工作,成功與否、效果如何主要取決于研究人員對統(tǒng)計樣本的選擇。本書主要采用整群抽樣法,即古代以《國學寶典數(shù)據(jù)庫》《愛如生中國基本古籍數(shù)據(jù)庫》所收全部古籍文獻等為統(tǒng)計對象,現(xiàn)代則以年鑒數(shù)據(jù)庫為統(tǒng)計對象,對這些群體對象進行調(diào)查統(tǒng)計,以期獲得較佳的結(jié)果數(shù)據(jù)。
本書所進行的檢索統(tǒng)計,樣本主要來源于《國學寶典數(shù)據(jù)庫》、《愛如生中國基本古籍數(shù)據(jù)庫》(2016年年底)和《四庫全書數(shù)據(jù)庫》(2016年)所包含的書籍及一些特殊文獻(如甲骨文匯編、金文匯編等),并參考了讀秀等中文數(shù)據(jù)庫。在古文獻樣本選擇上,我們首先選擇了《國學寶典數(shù)據(jù)庫》,因為它是目前國內(nèi)數(shù)據(jù)量較大、檢索較便利的數(shù)據(jù)庫。但這個數(shù)據(jù)庫有一些缺點,如部分文獻時代歸屬不準確、內(nèi)容有錯誤、部分重要文獻缺失等。所以我們采取了一些補救措施,如:在文獻年代歸屬上,我們都在進行研究后確認或訂正;在內(nèi)容上,我們逐一對照權威紙本或紙本的掃描電子版,并以紙本作為參考文獻注釋的依據(jù);在重要文獻缺失問題上,如甲骨文獻、金文文獻、《清實錄》等,我們就不能單純依賴該數(shù)據(jù)庫了,通過其他數(shù)據(jù)庫(如《愛如生中國基本古籍數(shù)據(jù)庫》、《四庫全書數(shù)據(jù)庫》、讀秀等)和紙本文獻來彌補。
…………