提示:近來機器人較多、網站若有卡頓、請隔10分鐘後再試

一、聲符的類和界

近況喜人

  「聲符的類和界」是古音小鏡的叫法,通常叫諧聲類、諧聲系,因研究困難、材料繁瑣,一直是個冷門學問。冷門到什麼地步呢?國內大學中文系,能講古文字的人可尋,能講諧聲類的人鳳毛麟角。說到學問,諧聲類還沒形成確定的學問,裡頭迷迷糊糊的東西很多,管中窺豹的也不少,連上古音專家也未曾對它的所有問題深思熟慮。不過很幸運,近年來我們能在網絡上看到很多高水平的探討,很多真誠的探索者在思考這些問題,如果您想了解諧聲類,這些帖子值得閱讀:

  1、Msoeg「上古音·從古聲十九紐到四分法」(創新使用切韻51聲類探索上古聲母諧聲類)

  2、布之道「諧聲域述聞」(介紹諧聲類、諧聲域的來龍去脈)

  3、Cyslngsul「古典漢語羊系拾遺」「上古漢語羊系的一些雜談」(探討諧聲類個例「羊系」)

  4、Sliark「諧聲W系中以母、邪母部分的條件分化可能」(諧聲類個例的思考)

  5、水晶狐狸「論上古漢語的L系兼論W系」「論上古漢語SL類聲母的構擬」(諧聲類個例的思考)

  6、百越閒人「瓦鄉話是否可以看作中古漢語後代?」(談及瓦鄉話和L諧聲的關聯)

  7、Poem《聲形析微表》(完備的諧聲分析共享文件,雖不討論諧聲類,是研究諧聲類的優質素材)

  ……(還有很多年輕人在思考這類問題)

  這兩年還出現了三部研究諧聲類的專著:

  1、2022年 布之道《廣韻形聲考》共享電子作品(為廣韻所有聲符確定諧聲域,可追查廣韻全部字,完整、明確、實用性強,內含「上古諧聲分佈表」),這部作品是小站「聲符的類和界」的統計對象。

  2、2022年 李豪《古文字的諧聲系統及相關問題研究》復旦大學博士論文(為古文字、今文字所有聲符擬定16類聲母諧聲系、聲符完備、例字使用舉例性質的代表字)。

  3、2022年 施瑞峰《上古漢語聲母諧聲類型在古文字資料釋讀中的效用》香港中文大學博士論文(主要討論:K組-P組諧聲問題、TS系聲母獨立性、T系/L系的古文字問題、K組-T組諧聲問題),作者的碩士論文《上古聲母諧聲類型及其對古文字釋讀的重要性》2019也是討論諧聲系。

  這三部作品對諧聲類或諧聲類個案進行了系統、深入探索。

二、讓聲符自動聚類、解放眼睛

如何聚類?

  如果「聲符在中古音中的分佈有規律」是真的,如何讓電腦去分類?

  兩個聲符,我們要想出一個方法,把它倆「在中古音中分佈的相似性」變成一個數值,1000個聲符兩兩組合有100萬對數值,對100萬對數值進行聚類,就可以得到聲符的類。

如何量化一對聲符的相似性?

  這樣的方法應該有很多,小站琢磨出一種理解輕鬆、行之有效的:

  假設聲符A分佈在端、知、精,聲符B分佈在精、莊,各轄字100個,見下。

聲符A10字30字60字
聲符B30字70字
移動多少使相等(10-0)÷2=5字(30-0)÷2=15字(60-30)÷2=15字(70-0)÷2=35字

  直觀看,聲符A和聲符B不太一樣,但在精組上有交集,還是有一點點一樣的,那麼它倆的差異如何衡量?我們把轄字看成米,把字數看成斗,需要移動多少斗米使它倆一樣多?這移動量就是它倆的差異。

  通過觀察,它倆的合集有4個倉(端、知、精、莊),分別移動5斗、15斗、15斗、35斗後變得一樣多,總移動70斗,各自有米100斗,佔70%,即這兩個聲符的差異是70%。不同的聲符對,這個數值在0%-100%之間,0%時兩個聲符分佈面貌完全相同,100%時兩個聲符分佈面貌完全不同。

  現實中,聲符轄字不可能正好100,我們等比例縮放成100字計算,也就是用百分比來計算,這樣所有聲符都公平了。

  這樣,我們的量化目標達到了。

  但是,這個方法有個不足,請看知組和精組:兩者雖然都相差30斗米,但前者是有無的區別,後者是數量的區別,我們知道,質的區別重要,量的區別不太重要,現在的計算一視同仁,是不公平的。我們希望質的區別作用大,量的區別作用小,因為諧聲類更看中質的區別,為此改良計算方式:精組是量的區別,我們只取數值的1/3,這樣就變成如下:

聲符A10字30字60字
聲符B30字70字
移動多少使相等(10-0)÷2=5字(30-0)÷2=15字(60-30)÷2÷3=5字(70-0)÷2=35字

  區別是紅色字,在有交集的音類上,我們只取1/3,降低它的權重,5斗米抵15斗,這樣質的區別-量的區別就平衡了。為什麼是1/3?我也算了1/2、1/4、1/5等,對比下來1/3聚類效果最好一些,三個臭皮匠頂個諸葛亮!

  這樣,計算結果是60%,比之前的70%更有價值。改良後的方法,結果值不超過100%,最小是0%,仍然在理想的0%-100%之間。這個數值的性質是差異性,如果要相似性,只需用100%減掉它。

  改良後的方法,同時考慮了定量和定性,是權衡利弊的結果,比單純的定性(只看分佈音類的有無)和單純的定量(對質變的忽視)要合理。

把數據看成一張網

  用上面的方法,我們把1000個聲符(約數、實際是893個)的100萬對組合進行計算,得到100萬個相似性數值(實際是50萬對稱2組)。我們把這1000個聲符想象成一張網,這100萬個數值是網的連線,其中有的連線弱,有的連線強,把強和弱想象成引力,那麼有些聲符會聚合成團,有些聲符會彼此遠離,那些聚合成團的聲符,就是聲符的類(諧聲類),這張網有多少個團,就有多少個諧聲類。

把網變成樹

  在「數據[網]」裡,我們可以看到這張網,網雖好看但不實用,最終我們把它轉成了樹,使用「平均距離法」聚類,這是最基礎、最常用的聚類法。樹的好處是每個聲符的位置是確定的,聲符的類反映為樹枝,類的邊界反映為樹枝之間的距離。有了這顆樹,分析諧聲類就大大方便了。

幫-非組、端-知組合併計算

  聚類計算中,對兩組有把握的聲母進行了合併:幫滂並明-非敷奉微、端透定泥-知徹澄孃,它們在諧聲時代是相同聲母,在切韻前後才合併,合併後聚類效果更好(李豪說,有徹-來清邊音諧聲,端-知不能合,考慮到比例很小且不顯著,抓大放小,仍然合併)。其他聲母,雖有互補,但上古來源多樣,並不單純,不作合併。諧聲類研究包括聲母、韻母,本功能只討論聲母。

關於「廣韻字研究諧聲不堪用」

  這是外行瞎說的。

  如果自己親手探索過一遍諧聲,廣韻字不僅能用,而且「素質」還很高,原因有:

  ①從統計看,廣韻字的聲符表現很上古。什麼叫「聲符表現」?比如簡化字「宪」的聲符表現就不古,聲符可以驗證字的古老程度。

  ②從「定母沾以就不沾端」這條規矩看,廣韻字是很嚴格的,除了幾類特殊的「多」系字外,例外很少(約0.4%),說明廣韻字保持了嚴格的上古聲母「T系-L系」對立,反而《簡帛古書通假字大系》中「T系-L系」有部分混淆(可以在假借繫聯欄目中選擇聲系的T和L進行查看核實)。片面看,廣韻字竟然比秦漢簡帛通假字更古、更優越一些。

  諧聲類研究中,字量越多準確性越高,只用《說文》不用《廣韻》對研究是不利的。(少量例外我們用統計眼光排除掉即可)

局限須知

  ①字越少的聲符越不可信,由於「該出現的位置不一定出現」,造成對類的性質、諧聲類誤判。

  ②該功能只限於形聲字證據,完整的聲符研究還需考慮假借字,兩者相互補充,請到本站的「假借字繫聯」網頁裡尋找證據。

  ③該功能對開合諧聲類的分辨不好,由於諧聲對-w-介音很敏感,所以很多學者的諧聲類分開合,這次用於聚類的38個聲母不區分介音,所以無法分出開合諧聲類。

聲符的類和界·上古音漢字諧聲類別
 
蘇ICP備17001294號 | 0.48MB 0.91MB 0.005s | 材料如有冒犯通知即刪