《通用規(guī)范漢字表》問題解答
2009-08-19
《通用規(guī)范漢字表》研制專家工作組
按語:在《通用規(guī)范漢字表》研制過程中,課題組和專家工作組曾就其中的一些重大問題長時間反復(fù)研討,向?qū)W術(shù)界和各領(lǐng)域反復(fù)征求意見,最終形成基本一致的意見?,F(xiàn)將有關(guān)問題的解答刊登于此,以方便大家更好地了解字表。
1.《通用規(guī)范漢字表》制定的意義
我國現(xiàn)代漢字規(guī)范工作醞釀于20世紀(jì)上半葉。新*成立后,在國務(wù)院直接領(lǐng)導(dǎo)下,這一工作開創(chuàng)了全新的局面。20世紀(jì)50年代以來,國務(wù)院語言文字工作主管*和其他有關(guān)*陸續(xù)發(fā)布了多項漢字規(guī)范,初步實現(xiàn)了社會用字標(biāo)準(zhǔn)化,推動了我國教育、文化和科技事業(yè)的發(fā)展。近20年來,隨著*現(xiàn)代化、信息化事業(yè)的快速推進(jìn),我國語言生活發(fā)生了巨大變化。語言文字規(guī)范同社會發(fā)展和人民生活聯(lián)系的廣度和深度是前所未有的。在新時代、新形勢下,過去的規(guī)范已經(jīng)不能完全適應(yīng)現(xiàn)代語言生活的需要,因此,對此前的漢字規(guī)范工作重新審視、制定新的可行性規(guī)范是非常必要的。
制定《通用規(guī)范漢字表》,是為了適應(yīng)*信息化發(fā)展的需要。世紀(jì)之交,我國實施創(chuàng)新型*戰(zhàn)略,信息化成為實現(xiàn)這一目標(biāo)的重要支撐。語言文字規(guī)范化是*信息化的基礎(chǔ),只有有了漢字這種傳播載體的標(biāo)準(zhǔn)化,才能保證信息傳播的速度和信度。
制定《通用規(guī)范漢字表》,是為了適應(yīng)當(dāng)代語言生活的需要??茖W(xué)技術(shù)的發(fā)展,教育水平的提高,使科技術(shù)語用字范圍擴大,并且快速進(jìn)入日常生活。印刷業(yè)告別了“鉛與火的時代”,激光照排成為出版的主要手段。古籍整理、辭書編纂廣泛使用計算機,計算機字庫的缺字和錯字直接影響印刷出版與信息傳播的質(zhì)量和社會效益。在社會生活中,戶籍、郵政、金融、保險等**和服務(wù)行業(yè)的信息存貯和檢索已經(jīng)實行數(shù)字化,姓氏人名、地名中的不規(guī)范字和生僻字影響多個行業(yè)信息系統(tǒng)的建設(shè)和*的社會管理,也給某些相關(guān)人員的日常生活帶來極大的不便。制定適應(yīng)現(xiàn)代語言生活的漢字規(guī)范,已經(jīng)成為關(guān)涉人民生活的大事,成為廣大人民群眾的需求。
制定《通用規(guī)范漢字表》,是為了貫徹*語言文字法的需要。2000年10月頒布的《*人民共和國*通用語言文字法》規(guī)定:“*推廣普通話,推行規(guī)范漢字”,并進(jìn)一步明確了“*機關(guān)以普通話和規(guī)范漢字為公務(wù)用語用字”,“學(xué)校及其他教育機構(gòu)通過漢語文課程教授普通話和規(guī)范漢字。使用的漢語文教材,應(yīng)當(dāng)符合*通用語言文字的規(guī)范和標(biāo)準(zhǔn)”,“公共服務(wù)行業(yè)以規(guī)范漢字為基本的服務(wù)用字”。這一法律的頒行,使?jié)h字規(guī)范進(jìn)入了法律層面,需要為社會一般應(yīng)用提供明確的“規(guī)范漢字”范本。制定字表,對已有的漢字規(guī)范進(jìn)行整合和優(yōu)化,消除不同規(guī)范字表之間相互矛盾之處,集分散的規(guī)范于一體,明確“規(guī)范”的政策指向和法律效力,確定“規(guī)范漢字”這一法律概念在通用層面上的外延,使*通用語言文字法所指稱的“規(guī)范漢字”在一般社會通用層面落到實處,是保證該法順利施行的重大措施。
2.制定《通用規(guī)范漢字表》遵循的原則
《通用規(guī)范漢字表》的制定,遵循了如下四項原則:
(一)注重與原有規(guī)范的銜接,維護漢字系統(tǒng)的基本穩(wěn)定。字表的制定,堅持了漢字簡化的基本方針,同時也遵循了國務(wù)院1986年批轉(zhuǎn)*語委《關(guān)于廢止〈第二次漢字簡化方案(草案)〉和糾正社會用字混亂現(xiàn)象的請示的通知》中所指出的“今后,對漢字的簡化應(yīng)持謹(jǐn)慎態(tài)度,使?jié)h字的形體在一個時期內(nèi)保持相對穩(wěn)定”的原則?!?批異體字整理表》、《簡化字總表》、《印刷通用漢字字形表》、《現(xiàn)代漢語常用字表》、《現(xiàn)代漢語通用字表》等已有的漢字規(guī)范,經(jīng)過數(shù)十年實踐的考驗,很多精神和大量成果值得承襲和吸取。字表繼承了這些規(guī)范的原則和主要內(nèi)容,對其中錯誤、疏漏、相互矛盾及不能滿足當(dāng)今社會需要之處,則在詳細(xì)調(diào)查和認(rèn)真分析的基礎(chǔ)上,充分考慮到歷史形成的全民習(xí)慣和社會的可接受程度,遵照便民利國的原則,進(jìn)行必要的修訂。
?。ǘ﹫猿謱嵤虑笫堑目茖W(xué)精神,遵循漢字構(gòu)造和演變的規(guī)律。字表制定過程中,邀請了我國多位資深的語言文字學(xué)家主持和參與工作,又反復(fù)聽取了很多其他語言文字學(xué)家和相關(guān)領(lǐng)域?qū)I(yè)人員的意見,注意吸收漢字學(xué)與漢字史研究的*成果,采用科學(xué)的統(tǒng)計方法獲取可靠的數(shù)據(jù);同時也廣泛吸取基礎(chǔ)教育、古籍整理、辭書編纂、印刷出版、計算機信息處理等*的實踐經(jīng)驗,遵循漢字構(gòu)造和演變的規(guī)律,充分考慮漢字應(yīng)用的實際,盡可能提高漢字規(guī)范的科學(xué)性與可行性。
?。ㄈV泛聽取各界意見,照顧不同領(lǐng)域漢字應(yīng)用的需要。字表的制定,堅持了群眾路線,通過各種方式聽取廣大人民群眾的意見,尤其是基礎(chǔ)教育和文化普及領(lǐng)域所反映的意見,盡量滿足不同領(lǐng)域、不同文化程度的人群對漢字使用的不同要求。
?。ㄋ模┻m當(dāng)考慮漢字在臺灣、香港、澳門的使用情況和國際化的需求。漢字通行于兩岸四地,而且還跨越國界,傳播到世界各地。字表的制定,正視使用漢字的不同*、地區(qū)簡繁字形并存并用的客觀實際,兼顧漢字使用的現(xiàn)狀及國際化的各種需求,盡量避免擴大不同*或地區(qū)之間漢字使用的差異,以利于相互之間的溝通和交流。
3.《通用規(guī)范漢字表》的性質(zhì)
漢字規(guī)范一直是我國新文化建設(shè)中一項重要的基礎(chǔ)工作。《通用規(guī)范漢字表》是《*通用語言文字法》的配套規(guī)范,是體現(xiàn)*文字政策的重大規(guī)范,將經(jīng)國務(wù)院批準(zhǔn)、由教育部和*語言文字工作委員會發(fā)布。
《通用規(guī)范漢字表》說明第二條指出:“《通用規(guī)范漢字表》是現(xiàn)代記錄漢語的通用規(guī)范字集,體現(xiàn)現(xiàn)代通用漢字的字量、字級和宋體字形的規(guī)范?!边@個定義式的說明可以從以下三個方面來理解:
規(guī)范性是字表的首要特點,也是字表的本質(zhì)屬性。字表給出了確定的字量、字級,實現(xiàn)了字形與用字的標(biāo)準(zhǔn)化。表中規(guī)定了三個等級的字集,各級字集所收的字,字頭都經(jīng)過嚴(yán)格選取,并根據(jù)規(guī)則進(jìn)行了字形整理,完全可以成為我國社會通用領(lǐng)域漢字的正字,在字形上具有*標(biāo)準(zhǔn)的作用。
現(xiàn)代性是字表的第二個特點。字表的分級、收字都是從現(xiàn)代應(yīng)用出發(fā)的,充分考慮到現(xiàn)代語言文字生活的需要,所收的字也主要從現(xiàn)代漢語語料庫中選出?,F(xiàn)代文本中的文言文引文和中*語文教材中的文言文,是當(dāng)今文化傳承和文化學(xué)習(xí)所必需的,而且需要用簡化字印刷,其用字屬于現(xiàn)代用字的范疇,這些字也已納入了字表。
通用性是字表的第三個特點。在現(xiàn)代一般社會用字領(lǐng)域,沒有必要對一些罕用字或生僻字進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過規(guī)范整理的8300字,都是現(xiàn)代社會需要的通用字。字表按通用程度分級:一級字表的通用性*,二級次之,三級字表雖然取自專業(yè)領(lǐng)域,但這些字都與國計民生的信息傳播息息相關(guān),在計算機存儲和閱讀上也有通用性。
4.《通用規(guī)范漢字表》發(fā)布后在有關(guān)領(lǐng)域如何實施
《通用規(guī)范漢字表》的制定,是為了方便群眾和各界更好地使用漢字。各領(lǐng)域在使用時,可根據(jù)其用字特點和實際需求,采取既遵循規(guī)范、又有一定寬松度的實施辦法:
?。?)專業(yè)性的古籍印刷,書法和牌匾等手寫字,可以用繁體字與傳承字。為了社會釋讀的方便,也為了印刷編輯*有據(jù)可依,古籍印刷使用的繁體字也要適時進(jìn)行整理。在沒有制定相關(guān)標(biāo)準(zhǔn)之前,建議采用歷史上曾經(jīng)通行的漢字,即:字形要有歷史上使用過的依據(jù);有多個字形可以采用時,要盡量選取通行度高、易于識別的;不要生造新字或亂改字形。
?。?)基礎(chǔ)教育語文新課標(biāo)規(guī)定,*階段識讀漢字的數(shù)量為3500個。這3500字應(yīng)采用《通用規(guī)范漢字表》的一級字表。但根據(jù)教學(xué)需要,尚需在3500常用字范圍內(nèi)再劃分應(yīng)用子集時,比如*、二、三學(xué)段分別應(yīng)該學(xué)其中的多少字、學(xué)哪些字,教育管理*可按照兒童不同年齡段的認(rèn)知特點,以漢字必要的屬性做參數(shù),經(jīng)過科學(xué)研究,生成適用的應(yīng)用字表。需要強調(diào)的是:《通用規(guī)范漢字表》給出的僅僅是宋體字的規(guī)范字形,而我國*語文課本1-3年級的課文和各年級的生字都是以楷體字印刷的,兩種字體在筆形上略有差異,在楷體字字形沒有新的規(guī)范之前,仍沿用原有楷體字形。
?。?)根據(jù)需要可以使用表外字。所使用的表外字如果有繁體部件,根據(jù)規(guī)定,不得類推簡化。若為了保持系統(tǒng)的一致性而確需類推簡化,例如新化學(xué)元素用字等,可報*語言文字工作主管*審批。
(4)字表發(fā)布后,如有當(dāng)用的姓氏用字尚未收入,可報*語言文字工作主管*,經(jīng)專家審定和相關(guān)*確認(rèn)后,適時補充進(jìn)字表。
?。?)使用漢字的工業(yè)產(chǎn)品,特別是信息產(chǎn)品,要遵守漢字規(guī)范的原則,不應(yīng)違背字表。由于產(chǎn)品更新需要一定的周期,字表公布后,與字表規(guī)定不一致的產(chǎn)品用字的更改,可以有個過渡期,在此期限內(nèi)應(yīng)積極采取措施,以盡快與*規(guī)范切合。
5.《通用規(guī)范漢字表》表內(nèi)字分級的理據(jù)及一、二級字表的字量與收字
作為*規(guī)范,字表將要面對的是全體使用者,全體使用者的文化水平不同,交際范圍不同,行業(yè)需求不同,對漢字的使用要求也必然會有差異。而且,漢字本身的使用頻率存在著很大的差別,通用的程度是不一樣的。因此,字表只有對所收字進(jìn)行合理的分級,才能反映漢字的實際使用狀況,照顧不同人群的需求差異,從而提高字表的實用性。
字表收字8300個,根據(jù)它們的通用程度,劃分為三級,各級字表的收字?jǐn)?shù)量、每個字的標(biāo)準(zhǔn)字形以及某些字的使用范圍,都有明確規(guī)定。一級字表共收3500字,是一般社會領(lǐng)域使用頻度*的常用字集,主要滿足基礎(chǔ)教育和文化普及層面的用字需要。二級字表共收3000字,一般社會領(lǐng)域也會經(jīng)常使用,但其使用頻度明顯低于一級字;一、二級字表一共6500字,主要滿足現(xiàn)代漢語文本印刷出版用字的需要。三級字表共收1800字,是姓氏人名、地名、科技術(shù)語和中*語文教材文言文用字中未進(jìn)入一、二級字表的較通用的字,主要滿足與大眾生活密切相關(guān)的專門領(lǐng)域用字的需要。
常用字是使用頻率*的字,這批字覆蓋了絕大部分通用的語料,人們閱讀和書寫時常常使用它。常用字必須夠用,但也不是越多越好,準(zhǔn)確確定常用字的數(shù)量,并把應(yīng)當(dāng)收入的常用字收入,對漢字信息的傳遞,以及識字教學(xué)、字書編纂等應(yīng)用,都具有重要意義。制定《通用規(guī)范漢字表》,在理論上根據(jù)的是“漢字效用遞減率”這一重要的原理。頻率反映的是漢字的具體使用情況,個體字符的使用頻率不是平均分布的,隨著字頻的下降,漢字使用的覆蓋率呈遞減趨勢。當(dāng)字頻降到一定程度,覆蓋率基本不再上升。因此,掌握以下數(shù)據(jù),就可以大致統(tǒng)計出常用漢字的數(shù)量:(1)從一定通用語料中測查出的漢字使用頻率的降次排列表;(2)每個頻次段落語料中所含的不重復(fù)的漢字?jǐn)?shù)的遞增量;(3)每個頻次段落中覆蓋率的增長數(shù)。
要想得到這些數(shù)據(jù),選取什么樣的語言材料和多少字?jǐn)?shù)的語言材料進(jìn)行統(tǒng)計,直接影響統(tǒng)計結(jié)果的代表性、客觀性和準(zhǔn)確性。制定《通用規(guī)范漢字表》,選定*語委的“現(xiàn)代漢語平衡語料庫”為基礎(chǔ)語料庫。該語料庫按照時代與領(lǐng)域平衡的原則,收錄1919年至2002年的語料9100萬漢字,不重復(fù)漢字8181個。同時,采用北京語言*“現(xiàn)代新聞媒體動態(tài)流通語料庫”(收集2001-2002年15種報刊語料共3.5億漢字)和《通用規(guī)范漢字表》課題組建立的“教育科普綜合語料庫”(收集1951-2003年的中*通用教材及科普讀物語料404萬漢字),作為核查、驗證的輔助語料。同時還參考了*語言資源監(jiān)測與研究中心2005-2008年建立的平面媒體、網(wǎng)絡(luò)媒體、有聲媒體、教育教材等海量語料庫及海內(nèi)外幾十個其他語料庫。利用這些語料庫進(jìn)行統(tǒng)計與分析,得到了《通用規(guī)范漢字表》一、二級字表的分級、字量和收字的基本結(jié)果。
在確定一、二級的字量與收字時,始終以客觀的統(tǒng)計數(shù)據(jù)作為主要判斷依據(jù)。但由于漢字自身和漢字使用都具有很強的人文性,漢字字集的界限并不是截然分明的,而是存在一定數(shù)量的“臨界字”,對于這些“臨界字”,只有進(jìn)行人工的調(diào)整,才能更加科學(xué)地反映漢字使用的實際狀況。在確定一級字表時,作了如下人工干預(yù):(1)補全了10個大寫數(shù)目字、22個干支字、31個?。ㄖ陛犑校┖喎Q用字和一部分常用聯(lián)綿詞的缺字;(2)增加“兒童文學(xué)語料庫”(收1949年后出版的適合基礎(chǔ)教育閱讀的各種體裁兒童文學(xué)語料570萬漢字)的口語高頻字;(3)提出頻次位于3201至3500的300字,向中*教師進(jìn)行問卷調(diào)查,將其中通用度相對小的字與所增加的字置換,并將被置換的字降到二級字表。經(jīng)人工干預(yù)調(diào)整的字量約占3%。在確定二級字表時,主要是對備選字表的字逐一進(jìn)行核查、甄別,排除備選字表中意義離現(xiàn)代較遠(yuǎn)、形體上與其他字有糾葛的字,用三級字表中頻度相對較高的字補足。
此次確定的一級字表的3500字與原《現(xiàn)代漢語常用字表》的3500字比較,有103字的出入,但在不同語料庫中的覆蓋率比原來的常用字高出0.09%~0.22%。一、二級字表的6500字,與原《現(xiàn)代漢語通用字表》的7000字比較,減少了500字,但在不同語料庫中的覆蓋率基本不變。字?jǐn)?shù)減少而覆蓋率保持不變的原因,首先是我國幾十年來漢字規(guī)范工作取得了成效,適用性較差的字被自然淘汰,社會用字相對集中。同時也可看出,《通用規(guī)范漢字表》選字和定量的資料是優(yōu)化的,方法是科學(xué)的,程序是合理的。
6.《通用規(guī)范漢字表》三級字表設(shè)立的原因及其性質(zhì)
《通用規(guī)范漢字表》三級字表的設(shè)立,主要是為了滿足專門領(lǐng)域的用字在通用層面上的需要。由于信息化帶來的用字量擴大,《通用規(guī)范漢字表》如果只局限在基本通用字的范圍,雖然可以滿足日常生活用字的需要,卻無法解決計算機存儲和專門領(lǐng)域的用字問題。因此,有必要補充一些與大眾生活密切相關(guān)的專門領(lǐng)域用字?!锻ㄓ靡?guī)范漢字表》在基本通用字之外,增設(shè)三級字表,適當(dāng)增加姓氏人名用字、地名用字、科技術(shù)語用字以及中*教材文言文用字,以便有效地解決這四個領(lǐng)域中信息處理的缺字問題。
雖然三級字不能在平衡語料庫里依照字頻和覆蓋率收集到,但仍舊屬于通用層面上的用字。這個問題需要從兩個方面解釋:
*,需要全面理解“通用”這個概念?!巴ㄓ谩卑▋蓚€層面:一個是印刷的層面,一個是閱讀的層面。能夠進(jìn)入平衡語料庫的漢字,兼有這兩個方面的通行度。但是也有一些漢字,印刷的頻度并不高,閱讀的頻度卻很高。例如醫(yī)藥名稱、飲食營養(yǎng)學(xué)中的專業(yè)用字,雖然僅僅專業(yè)領(lǐng)域用來打印,但閱讀人群卻可以達(dá)到千家萬戶。再如,基礎(chǔ)教育語文教材的文言用字,也有少部分不屬于社會通用字,但是每年的教材印刷必須使用,歷屆教師、學(xué)生、家長必須面對,閱讀人群幾乎也達(dá)到千家萬戶。這些字也是需要統(tǒng)一字形而進(jìn)入規(guī)范的。
第二,在信息時代,“通用”的概念發(fā)生了實質(zhì)性的變化。除了人的使用外,還必須考慮到計算機的存儲與使用。在漢字主要是手寫的時代,這些特定領(lǐng)域的用字即使不定標(biāo)準(zhǔn)也不會有太大的問題,而在計算機和互聯(lián)網(wǎng)時代,那些在一般語料庫里憑借字頻難以找到的字,在人民的日常生活中卻不失其通用性。以漢字為載體的信息,一部分是在流通領(lǐng)域通行的,還有一部分是儲備領(lǐng)域必需的。例如姓名,除了*人士,一般的姓名在社會通用層面上使用度不會太高;地名,除了大城市、著名景點,一般的地名在社會通用層面上使用度也比較有限,根據(jù)字頻和使用度不能將它們收集到。但是,無所不往的郵政、金融、交通等事業(yè),無人不用的身份證、學(xué)歷證書、醫(yī)療保險、產(chǎn)權(quán)證明等證件,必須儲備可能用到的漢字。如果在信息處理上不對這些字進(jìn)行規(guī)范,也會引起社會信息儲備和使用的混亂。完全依據(jù)使用頻率和語料覆蓋率來確定字表的收字,這些特定領(lǐng)域的用字就難以收集到,所以要從專門領(lǐng)域提供的專用字中收集。專業(yè)領(lǐng)域通用字是對一般社會通用字的必不可少的補充。
7.《通用規(guī)范漢字表》三級字表的收字原則、范圍以及具體來源
在確定《通用規(guī)范漢字表》三級字表的收字時,堅持以下三條原則:(1)從漢字應(yīng)用的具體事實出發(fā),必須字字有來歷,或有文獻(xiàn)出處,或由相關(guān)職能*提供用例和出處;(2)必須音義俱全,人名用字應(yīng)適合于起名;(3)必須保證其通用的性質(zhì),不收用處不大的生僻字。收字范圍具體包括:姓氏人名用字、地名用字、科技術(shù)語用字、中*教材文言文用字。
?。?)姓氏人名用字。*是一個多民族的*,姓氏不但稽留著民族和血緣的傳承關(guān)系,還成為每個公民的稱謂符號,其用字不能隨便更改。字表對當(dāng)用的姓氏用字要盡可能收集齊全,以保證信息傳播的信度。至于名字所用的漢字,現(xiàn)在已經(jīng)相當(dāng)混亂,有些名字的用字甚至在已經(jīng)擴充到7萬余字的計算機國際編碼字符集中都難以找到,致使第二代身份證由于字庫用字不全而無法制作,給一些人的生活帶來極大不便?!锻ㄓ靡?guī)范漢字表》無法改變已有人名用字的混亂狀況和使用上的麻煩,但可以對今后的命名(主要是新生兒起名)和更名提供一些便于使用的字,可以引導(dǎo)人們減少使用生僻字、避免使用錯訛字起名。這就需要盡量將姓氏用字收全,并在已有的人名用字中選擇足夠的、適合于起名的漢字進(jìn)行規(guī)范,以保證個人姓名有效地在社會上流通。
?。?)地名用字。地名用字往往不是在*范圍內(nèi)普遍通行,但對當(dāng)?shù)鼐用駚碚f卻屬于常用字,在省級區(qū)劃范圍內(nèi),鄉(xiāng)以上地名用字是不可缺少的。由于方言的關(guān)系,經(jīng)常會產(chǎn)生各種各樣的“方言字”或自造字,造成用字的混亂。當(dāng)今,戶籍、郵政、金融等行業(yè)的信息貯存和檢索已經(jīng)全面數(shù)字化,地球衛(wèi)星定位系統(tǒng)廣泛應(yīng)用,地名用字的混亂,會給有關(guān)行業(yè)帶來信息阻塞的后果,這是不言自明的。
(3)科技術(shù)語用字。由于科學(xué)技術(shù)的發(fā)展、教育水平的提高和科學(xué)知識的普及,很多科學(xué)技術(shù)的用語快速進(jìn)入人民的日常生活。僅僅拿記錄化學(xué)元素的漢字來說,它們很多要用在藥品名上,當(dāng)藥方不再手寫而用計算機輸錄時,這些字就成為醫(yī)生、藥師、病人、家屬交流的載體。農(nóng)藥、化肥、室內(nèi)裝修材料也有不少是要用它們的學(xué)名來宣傳、普及的。至于化妝品、清潔劑的使用,飲食健康的講解,氣象的采集和預(yù)報等,一旦進(jìn)入科學(xué)普及領(lǐng)域,都會受到普遍關(guān)注。特別是各專業(yè)的教科書的編寫和印刷,更會用到這些字。
(4)中*教材文言文用字。規(guī)范漢字主要是書寫現(xiàn)代漢語文本的,但是,傳統(tǒng)、歷史與現(xiàn)代不是絕緣的,現(xiàn)代文本中會引用文言作品,中*語文教材中也都會收一部分優(yōu)秀的文言作品。前者可以在一般的平衡語料庫中收集到,而為了保證教材印刷的規(guī)范,需要在語文教材中專門收集文言文的用字。
這四個方面,既是信息時代用字的重要領(lǐng)域,又是信息傳播容易缺字的領(lǐng)域。具體收字?jǐn)?shù)量如下:
姓氏人名用字930字,主要來源于1982年18省市抽樣人口普查資料和公安部提供的姓氏用字及部分人名用字,并適當(dāng)補收一些古代姓氏用字和有影響的古代人名用字。
地名用字465字,主要來源于民政部提供的鄉(xiāng)鎮(zhèn)以上地名用字、*測繪局提供的部分村級地名和部分自然實體名稱的用字、常用漢語工具書中標(biāo)明為“地名”的用字。
科技術(shù)語用字276字,主要來源于*科學(xué)技術(shù)名詞審定委員會提供的中醫(yī)藥學(xué)、植物學(xué)、遺傳學(xué)、冶金學(xué)、微生物學(xué)、土壤學(xué)等56個門類的術(shù)語用字,以及*社會科語言研究所提供的天文、氣象、地理、動物、植物、工業(yè)、農(nóng)業(yè)、政治、經(jīng)濟、文化、歷史等33個門類的科學(xué)技術(shù)與人文社會科學(xué)的術(shù)語用字。
中*教材的文言文用字362字,主要從字表研制工作組建立的“中*語文教材文言文語料庫”(收1949-2007年中*語文及普及文言文語料,560萬漢字)中提取。
以上四個方面的用字合并去重后,去除已經(jīng)進(jìn)入一、二級字表的字,再去除疑難字、錯訛字和異體字等,共為1800字。由于三級字是四個方面的用字合并去重后得出的,所以,三級字的屬性并不都是單一的,有些字可能兼有多個領(lǐng)域的不同屬性。
8.《通用規(guī)范漢字表》對異體字問題的處理
嚴(yán)格異體字的定義應(yīng)當(dāng)是:音義全同、記詞職能完全一樣、僅僅字形不同,它們在任何語境下都能互相替代而不影響表達(dá)的意義的一組字??梢钥闯觯瑥墓δ軄砜?,異體字是漢字的冗余,徒增記憶的負(fù)擔(dān),需要加以規(guī)范。1955年12月22日發(fā)布的《*批異體字整理表》的說明中指出:“從實施日起,*出版的報紙、雜志、圖書一律停止使用表中括號內(nèi)的異體字。但翻印古書須用原文原字的,可作例外?!边@個說明明確了異體字屬于“不規(guī)范的字”的范圍,異體字在通用層面上書寫現(xiàn)代漢語文本時,不能使用。但是,在該異體字整理表中確定的“異體字”,有些并不是嚴(yán)格意義上的異體字。把這些字都列入“不規(guī)范的字”的范圍而取消,有時不利于意義的精確表達(dá)。
《通用規(guī)范漢字表》對《*批異體字整理表》進(jìn)行整理時,采用了科學(xué)的原則、穩(wěn)定的原則和求實的原則,形音義并重,對各組字的關(guān)系進(jìn)行了重新認(rèn)定,并規(guī)定今后對這類字,不再采用簡單的“取消”“廢除”而要采取“認(rèn)同”和“辨析”的處理方法。
《*批異體字整理表》在1955年12月發(fā)布后,有些相關(guān)的文件曾對其進(jìn)行過改動,主要是:(1)1956年3月發(fā)布的《修正〈*批異體字整理表〉內(nèi)“阪”“挫”二字的通知》;(2)《簡化字總表》(1986年10月10日重新發(fā)表)和《關(guān)于發(fā)布〈現(xiàn)代漢語通用字表〉的聯(lián)合通知》(1988年3月25日發(fā)布)中重新認(rèn)定了26個字;(3)1993年《關(guān)于“镕”字使用問題的批復(fù)》。上述3個文件總共恢復(fù)了29字,分別是:阪、挫、、、曄、詟、訶、、、刬、鲙、誆、讎、翦、邱、於、澹、骼、彷、菰、溷、徼、熏、黏、桉、愣、暉、凋、镕。此次制定《新訂異體字整理表》時,根據(jù)現(xiàn)有原則對這29個字重新審核,審核后的處理結(jié)果為:“ 、、、刬”4字仍按異體字處理,其余25字收入《通用規(guī)范漢字表》。此外,根據(jù)群眾的意見,《通用規(guī)范漢字表》還將51個異體字恢復(fù)為規(guī)范字,并在各級字表中相應(yīng)的字下增加注釋,說明這些字恢復(fù)為規(guī)范字后的使用范圍:
恢復(fù)到二級字表中共6字,其中只恢復(fù)其部分音項的1字,即“袷”;完全恢復(fù)不再作為異體字的5字,分別是“噘、慄、蹚、皙、瞋”。
恢復(fù)到三級字表中共45字,其中只恢復(fù)其部分音項的5字,分別是氾、、叚、絜、釐;恢復(fù)其部分義項的36字,分別是仝、邨、捍、吒、飏、昇、並、逕、迺、鉅、祕、陞、、椏、貲、、脩、砦、堃、喆、蒐、椀、甦、淼、犇、殽、、甯、缐、劄、、麹、谿、瓌、、龢;完全恢復(fù)不再作為異體字的4字,分別是凓、勠、菉、曏。
9.《通用規(guī)范漢字表》對類推簡化問題的處理
1964年5月,*文字改革委員會根據(jù)當(dāng)年3月文改會、文化部、教育部聯(lián)合發(fā)布的《關(guān)于簡化字的聯(lián)合通知》而編印出版了《簡化字總表》,在《〈簡化字總表〉說明》中有這樣的表述:“本表收錄1956年國務(wù)院公布的《漢字簡化方案》中的全部簡化字。關(guān)于簡化偏旁的應(yīng)用范圍,本表遵照1956年方案中的規(guī)定以及1964年3月7日*文字改革委員會、文化部、教育部《關(guān)于簡化字的聯(lián)合通知》的規(guī)定,用簡化字和簡化偏旁作為偏旁得出來的簡化字,也收錄本表內(nèi)。”“用簡化字和簡化偏旁作為偏旁得出來的簡化字”就是類推簡化,比如“嚴(yán)”“龍”簡化為“嚴(yán)”“龍”,“儼”“壟”可以類推簡化為“儼”“壟”;“車”簡化為“車”,則以“車”為偏旁的“軌、軍、庫、載”可以類推簡化為“軌、軍、庫、載”,等等?!丁春喕挚偙怼嫡f明》還列出了132個可作偏旁用的簡化字和14個簡化偏旁,作為類推簡化的依據(jù)。這132個簡化字和14個不能獨用的偏旁,可以用在當(dāng)時《新華字典》所收8000多個漢字的范圍內(nèi)沒有簡化的字上,這些字形成了《簡化字總表》的第三表,一共收字1753個, 它們都是類推簡化來的簡化字。雖然文件中沒有明確規(guī)定這種類推簡化的范圍,但實際上只應(yīng)用于當(dāng)時最常見的漢語工具書《新華字典》的收字范圍內(nèi),所以被稱作“有限類推”。
實行類推的初衷是為了保持簡化漢字的系統(tǒng),易于識別;總體減少筆畫,書寫方便。這個原則在有限的范圍內(nèi)進(jìn)行,對保持漢字構(gòu)形的體系不能說沒有積極的作用。但是,由于類推簡化沒有明確限制范圍,當(dāng)一系列大中型字詞書相繼問世、大型計算機字庫相繼建立、簡體版的古籍紛紛出版時,類推簡化的范圍便無限擴大,遠(yuǎn)遠(yuǎn)超出了原來的《新華字典》8000個字的范圍,問題也就逐漸顯露:字?jǐn)?shù)大量增多后,產(chǎn)生了一批同形字;有些繁體字類推簡化后,原字的結(jié)構(gòu)被破壞,影響了構(gòu)字的理據(jù),也破壞了字形的美觀;類推出了一大批完全沒有使用過的字形,實際上使?jié)h字的總體系統(tǒng)繁化甚至混亂;有些辭書對貯存領(lǐng)域的漢字不限部位、不限層次、不限功能地?zé)o限類推,在漢字本來數(shù)量繁多的情況下,又人為地造出大量歷史上從來沒有使用過的“人造字”,違背了辭書存儲漢字的歷史真實性原則;造成了一個新的“簡化系統(tǒng)”,拉大了漢字應(yīng)用的古今距離和兩岸距離。
《通用規(guī)范漢字表》對類推簡化采用了尊重現(xiàn)實和嚴(yán)格限制的原則。所謂尊重現(xiàn)實,是對在《現(xiàn)代漢語通用字表》范圍內(nèi)已經(jīng)有限類推的字仍然保留。由于姓氏人名、科技用字和用簡化字印刷的語文課本中的文言文用字多數(shù)也已經(jīng)類推,因此,三級字表也采用有限類推的辦法,實行類推簡化,與一、二級字表保持一致。其具體細(xì)則是:(1)按《簡化字總表》第二表規(guī)定的132字與14個偏旁的范圍類推,不擴大范圍。(2)盡量只在*層次構(gòu)字時類推,以保持原字的結(jié)構(gòu)不受影響。(3)采用以上原則產(chǎn)生難以識別的怪異字或產(chǎn)生同形字時,為保持字與字的區(qū)別,作個別變通處理。不予類推簡化。
《通用規(guī)范漢字表》以外的字,根據(jù)國務(wù)院1986年“今后,對漢字的簡化應(yīng)持謹(jǐn)慎態(tài)度,使?jié)h字的形體在一個時期內(nèi)保持相對穩(wěn)定”的指示精神,不再類推簡化;個別領(lǐng)域確需類推簡化的,需報*語言文字工作主管*批準(zhǔn)。
10.《通用規(guī)范漢字表》對宋體字形調(diào)整的原則與結(jié)果
《通用規(guī)范漢字表》對宋體字的字形進(jìn)行了微調(diào),主要是取得宋體字筆形變異上的一致。其他主用字體(仿宋體、黑體、楷體)與非主用字體,以后再逐步進(jìn)行調(diào)整。
1965年發(fā)布的《印刷通用漢字字形表》,對宋體字的字形進(jìn)行了有規(guī)則的處理,1988年發(fā)布的《現(xiàn)代漢語通用字表》繼承了其字形規(guī)定。但其中還有少部分字,在同樣條件下筆形變異處理不一致。這次制定《通用規(guī)范漢字表》,根據(jù)群眾和專家意見,按照字形處理原則,對所收《印刷通用漢字字形表》的字進(jìn)行了微調(diào),也對新收的字進(jìn)行了統(tǒng)一處理。
字形調(diào)整需要制定一些統(tǒng)一的規(guī)則,這樣,借此次字形調(diào)整,檢驗、總結(jié)和完善過去已經(jīng)建立的規(guī)則,以便在今后擴大字量時仍然有章可循,不再出現(xiàn)新的字形不統(tǒng)一現(xiàn)象。這次字形調(diào)整的總原則是:
?、僮鹬貪h字結(jié)構(gòu):字形調(diào)整雖是筆形層面的問題,但筆形的變異也會影響漢字的結(jié)構(gòu);在規(guī)定筆形變異規(guī)則時,必須尊重漢字結(jié)構(gòu),不因筆形調(diào)整使字的結(jié)構(gòu)模式發(fā)生錯亂或因調(diào)整筆形產(chǎn)生同形字、易混字等。
②考慮宋體風(fēng)格:宋體字來源于雕版印刷字體,經(jīng)過工藝美術(shù)處理,其筆形及筆畫交接有自身的特點,總體風(fēng)格講求平直方正、對稱均衡。新的《通用規(guī)范漢字表》的宋體字字形,應(yīng)盡量符合宋體字的風(fēng)格特點。
?、圩裱y(tǒng)一規(guī)則:調(diào)整字體,必須遵循統(tǒng)一規(guī)則。一切規(guī)則是在條件的控制下確立的,為了減少隨意性,條件相同的字應(yīng)按統(tǒng)一規(guī)則處理,條件有變化時規(guī)則才能變化。印刷字形的美化屬于工藝美術(shù)層面,也應(yīng)考慮規(guī)則的一致性。
?、車?yán)格控制特例:在按規(guī)則處理字形時,會出現(xiàn)一些特殊情況,完全不允許對個別字進(jìn)行特殊處理是很難做到的;但在處理特例時應(yīng)闡明充分的理由,盡量減少規(guī)則之外的特殊處理字形。
在總的原則控制下,宋體字的筆畫變異需要有進(jìn)一步的理性規(guī)定。在這次字形調(diào)整中,制定了橫變提,豎變撇,捺變點,豎彎鉤變豎提,豎鉤、橫折鉤去鉤等五類筆形規(guī)則,這些規(guī)則是從原有字形規(guī)范中總結(jié)出來的,同時用來復(fù)查新的規(guī)范字是否符合這些規(guī)則。經(jīng)過對字形的調(diào)整和美化,進(jìn)一步取得了宋體字筆形的一致,使字形更趨于規(guī)律性、系統(tǒng)性。
《通用規(guī)范漢字表》以筆形變異規(guī)則為標(biāo)準(zhǔn),對所收的8300字全部進(jìn)行了復(fù)查,在統(tǒng)一筆形規(guī)則的前提下,生成了《通用規(guī)范漢字表》的宋體字形表,其中包括對《印刷通用漢字字形表》中與規(guī)則不一致的44個字的字形進(jìn)行了調(diào)整,約占《印刷通用漢字字形表》總字?jǐn)?shù)的0.57%。具體是:
?、佟扒?、瑟、琵、琶”的上左和“徵”的中下部件“王”*一筆橫變提
②“魅”的右部件和“糴、汆、褰、衾”的下部件的末筆捺變點
③“巽(撰、饌、噀同)”的上左部件“巳”的*一筆豎彎鉤變豎提
?、堋坝H(櫬同)、殺(剎、脎、鎩、弒同)、條(滌、絳、鰷同)、茶(搽同)、新(薪同)、雜、寨”下部件“木”的豎鉤變豎
?、荨坝痢钡纳喜考汀捌常ū住⒈锿钡纳献蟛考袡M折鉤變橫折
?、蕖拜辍?、縟、褥、耨、薅”中的部件“”以及“唇、蜃”由半包圍結(jié)構(gòu)改為上下結(jié)構(gòu)
?、摺拜灐钡淖笙虏考败嚒鄙咸砑右欢虣M,與從“”諸字的字形取得一致。