聲符的類和界·古音小鏡漢字諧聲系列

　　「聲符的類和界」是古音小鏡的叫法，通常叫諧聲類、諧聲系，因研究困難、材料繁瑣，一直是個冷門學問。冷門到什麼地步呢？國內大學中文系，能講古文字的人可尋，能講諧聲類的人鳳毛麟角。說到學問，諧聲類還沒形成確定的學問，裡頭迷迷糊糊的東西很多，管中窺豹的也不少，連上古音專家也未曾對它的所有問題深思熟慮。不過很幸運，近年來我們能在網絡上看到很多高水平的探討，很多真誠的探索者在思考這些問題，如果您想了解諧聲類，這些帖子值得閱讀：

　　1、Msoeg「上古音·從古聲十九紐到四分法」（創新使用切韻51聲類探索上古聲母諧聲類）

　　2、布之道「諧聲域述聞」（介紹諧聲類、諧聲域的來龍去脈）

　　3、Cyslngsul「古典漢語羊系拾遺」、「上古漢語羊系的一些雜談」（探討諧聲類個例「羊系」）

　　4、Sliark「諧聲W系中以母、邪母部分的條件分化可能」（諧聲類個例的思考）

　　5、水晶狐狸「論上古漢語的L系兼論W系」、「論上古漢語SL類聲母的構擬」（諧聲類個例的思考）

　　6、百越閒人「瓦鄉話是否可以看作中古漢語後代？」（談及瓦鄉話和L諧聲的關聯）

　　7、Poem《聲形析微表》（完備的諧聲分析共享文件，雖不討論諧聲類，是研究諧聲類的優質素材）

　　……（還有很多年輕人在思考這類問題）

　　1、2022年布之道《廣韻形聲考》共享電子作品（為廣韻所有聲符確定諧聲域，可追查廣韻全部字，完整、明確、實用性強，內含「上古諧聲分佈表」），這部作品是小站「聲符的類和界」的統計對象。

　　2、2022年李豪《古文字的諧聲系統及相關問題研究》復旦大學博士論文（為古文字、今文字所有聲符擬定16類聲母諧聲系、聲符完備、例字使用舉例性質的代表字）。

　　3、2022年施瑞峰《上古漢語聲母諧聲類型在古文字資料釋讀中的效用》香港中文大學博士論文（主要討論：K組-P組諧聲問題、TS系聲母獨立性、T系/L系的古文字問題、K組-T組諧聲問題），作者的碩士論文《上古聲母諧聲類型及其對古文字釋讀的重要性》2019也是討論諧聲系。

　　這三部作品對諧聲類或諧聲類個案進行了系統、深入探索。

二、讓聲符自動聚類、解放眼睛

● 如何聚類？

　　如果「聲符在中古音中的分佈有規律」是真的，如何讓電腦去分類？

　　兩個聲符，我們要想出一個方法，把它倆「在中古音中分佈的相似性」變成一個數值，1000個聲符兩兩組合有100萬對數值，對100萬對數值進行聚類，就可以得到聲符的類。

● 如何量化一對聲符的相似性？

　　這樣的方法應該有很多，小站琢磨出一種理解輕鬆、行之有效的：

　　假設聲符A分佈在端、知、精，聲符B分佈在精、莊，各轄字100個，見下。

　　直觀看，聲符A和聲符B不太一樣，但在精組上有交集，還是有一點點一樣的，那麼它倆的差異如何衡量？我們把轄字看成米，把字數看成斗，需要移動多少斗米使它倆一樣多？這移動量就是它倆的差異。

　　通過觀察，它倆的合集有4個倉（端、知、精、莊），分別移動5斗、15斗、15斗、35斗後變得一樣多，總移動70斗，各自有米100斗，佔70%，即這兩個聲符的差異是70%。不同的聲符對，這個數值在0%-100%之間，0%時兩個聲符分佈面貌完全相同，100%時兩個聲符分佈面貌完全不同。

　　現實中，聲符轄字不可能正好100，我們等比例縮放成100字計算，也就是用百分比來計算，這樣所有聲符都公平了。

　　但是，這個方法有個不足，請看知組和精組：兩者雖然都相差30斗米，但前者是有無的區別，後者是數量的區別，我們知道，質的區別重要，量的區別不太重要，現在的計算一視同仁，是不公平的。我們希望質的區別作用大，量的區別作用小，因為諧聲類更看中質的區別，為此改良計算方式：精組是量的區別，我們只取數值的1/3，這樣就變成如下：

　　區別是紅色字，在有交集的音類上，我們只取1/3，降低它的權重，5斗米抵15斗，這樣質的區別-量的區別就平衡了。為什麼是1/3？我也算了1/2、1/4、1/5等，對比下來1/3聚類效果最好一些，三個臭皮匠頂個諸葛亮！

　　這樣，計算結果是60%，比之前的70%更有價值。改良後的方法，結果值不超過100%，最小是0%，仍然在理想的0%-100%之間。這個數值的性質是差異性，如果要相似性，只需用100%減掉它。

　　改良後的方法，同時考慮了定量和定性，是權衡利弊的結果，比單純的定性（只看分佈音類的有無）和單純的定量（對質變的忽視）要合理。

● 把數據看成一張網

　　用上面的方法，我們把1000個聲符（約數、實際是893個）的100萬對組合進行計算，得到100萬個相似性數值（實際是50萬對稱2組）。我們把這1000個聲符想象成一張網，這100萬個數值是網的連線，其中有的連線弱，有的連線強，把強和弱想象成引力，那麼有些聲符會聚合成團，有些聲符會彼此遠離，那些聚合成團的聲符，就是聲符的類（諧聲類），這張網有多少個團，就有多少個諧聲類。

● 把網變成樹

　　在「數據[網]」裡，我們可以看到這張網，網雖好看但不實用，最終我們把它轉成了樹，使用「平均距離法」聚類，這是最基礎、最常用的聚類法。樹的好處是每個聲符的位置是確定的，聲符的類反映為樹枝，類的邊界反映為樹枝之間的距離。有了這顆樹，分析諧聲類就大大方便了。

● 幫-非組、端-知組合併計算

　　聚類計算中，對兩組有把握的聲母進行了合併：幫滂並明-非敷奉微、端透定泥-知徹澄孃，它們在諧聲時代是相同聲母，在切韻前後才合併，合併後聚類效果更好（李豪說，有徹-來清邊音諧聲，端-知不能合，考慮到比例很小且不顯著，抓大放小，仍然合併）。其他聲母，雖有互補，但上古來源多樣，並不單純，不作合併。諧聲類研究包括聲母、韻母，本功能只討論聲母。

● 關於「廣韻字研究諧聲不堪用」

　　如果自己親手探索過一遍諧聲，廣韻字不僅能用，而且「素質」還很高，原因有：

　　①從統計看，廣韻字的聲符表現很上古。什麼叫「聲符表現」？比如簡化字「宪」的聲符表現就不古，聲符可以驗證字的古老程度。

　　②從「定母沾以就不沾端」這條規矩看，廣韻字是很嚴格的，除了幾類特殊的「多」系字外，例外很少（約0.4%），說明廣韻字保持了嚴格的上古聲母「T系-L系」對立，反而《簡帛古書通假字大系》中「T系-L系」有部分混淆（可以在假借繫聯欄目中選擇聲系的T和L進行查看核實）。片面看，廣韻字竟然比秦漢簡帛通假字更古、更優越一些。

　　諧聲類研究中，字量越多準確性越高，只用《說文》不用《廣韻》對研究是不利的。（少量例外我們用統計眼光排除掉即可）

● 局限須知

　　①字越少的聲符越不可信，由於「該出現的位置不一定出現」，造成對類的性質、諧聲類誤判。

　　②該功能只限於形聲字證據，完整的聲符研究還需考慮假借字，兩者相互補充，請到本站的「假借字繫聯」網頁裡尋找證據。

　　③該功能對開合諧聲類的分辨不好，由於諧聲對-w-介音很敏感，所以很多學者的諧聲類分開合，這次用於聚類的38個聲母不區分介音，所以無法分出開合諧聲類。

一、聲符的類和界

● 近況喜人