中文输入法






































中文输入法是指为了将汉字输入计算机或手机等電子设备而采用的编码方法,是中文信息处理的重要技术。一般可分類作拼音输入法(如:漢語拼音輸入法、注音輸入法、粵拼輸入法)、字形输入法(如:倉頡、大易、五笔、郑码、表形码),以及混合音、形兩者的音形码输入法。


中文输入法是从1980年代發展起来的,中间为几个阶段:单字输入、词语输入、整句输入。对于中文输入法的要求是以单字输入为基础达到全面覆盖;以词语输入为主干达到快速易用;整句输入还处于发展之中。




目录






  • 1 输入原理


  • 2 历史


  • 3 简体中文键盘输入法


    • 3.1 汉语拼音输入法


    • 3.2 粤语拼音输入法


    • 3.3 汉语注音输入法


    • 3.4 五笔字型输入法


    • 3.5 郑码输入法


    • 3.6 表形码输入法


    • 3.7 二笔输入法


    • 3.8 音形码输入法




  • 4 繁體中文鍵盤輸入法


    • 4.1 注音輸入法


    • 4.2 倉頡輸入法


    • 4.3 老蘇形音中文 輸入法、蘇式倉頡輸入法、庫哥--腦殘輸入法


    • 4.4 行列輸入法


    • 4.5 大易輸入法


    • 4.6 嘸蝦米輸入法


    • 4.7 自然輸入法


    • 4.8 漢音輸入法


    • 4.9 源自香港


      • 4.9.1 形筆輸入法


      • 4.9.2 粵語拼音輸入法


      • 4.9.3 快碼輸入法


      • 4.9.4 九方輸入法


      • 4.9.5 縱橫輸入法


      • 4.9.6 六碼筆畫輸入法


      • 4.9.7 會說普通話的輸入法


      • 4.9.8 安氏漢字電腦編號漢字輸入法




    • 4.10 源自中国大陆


      • 4.10.1 汉语拼音输入法


      • 4.10.2 五笔字型输入法






  • 5 内嵌輸入法


  • 6 其他输入法


    • 6.1 联想输入法


    • 6.2 聲韻輸入法


    • 6.3 手写输入法


    • 6.4 語音輸入法




  • 7 专利与著作权


  • 8 功能及品質


  • 9 參考資料


  • 10 參見


  • 11 外部連結


    • 11.1 中文输入法


    • 11.2 新闻


    • 11.3 線上中文輸入系统


    • 11.4 指南


    • 11.5 应用商店提供的中文输入法







输入原理


从汉字的逻辑构造上看,汉字并不能像英文字母那样被分成少量的元素单位,从而不能进行以文字构造为基本单位的分类归放、处理等。虽然汉字可以分成不同的部首、偏旁等文字基本构件,但是被分成的基本构件数量过多并且基本构件在组成汉字時的位置、方位、朝向都将决定汉字的构成。这大大限制了中文汉字直接以汉字本身的构造进行快速录入速度,根据汉字的构造输入的方法例如有五笔字输入法、倉頡輸入法和嘸蝦米輸入法。


由于中文汉字的构造特性,汉字的字形输入显得繁琐。这也从而衍生出字音输入法等其它转码输入法。


音转码对汉字的读音要求比较准确,而汉字又是语素文字。字音输入法并不能直观的反映汉字的特点,并且汉字重音字、多音字比较多,这客观上对字音输入汉字的方法有一定的障碍。



历史





國立交通大學的一套試驗漢字鍵盤。


由於汉字数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编输入码(檢索出漢字的代碼),用数个键来输入一个汉字。此外,雖然使用特殊鍵盤輸入,可達每分600字以上的速度[1][2][3][4],但由於电脑键盘之普及,普通日常使用仍以电脑键盘為主。


中文输入法的发展过程,是“万码奔腾”的过程,在20年间出现了上千种编码方法。汉字的单字输入分为几类:音码、形码、形音码、音形码、无理码等。注意输入法编码,与汉字内码区分,内码以GB 2312-80、GB18030-2005为基础。


因为使用汉字简繁的不同,汉字计算机软件市场经常被分成两个不同的市场:简体字用户(中国大陆)和繁体字用户(台港澳)。大陆计算机用户一般都会汉语拼音,所以拼音起源的输入法在大陆很普遍。在臺灣,注音輸入法比較流行,但市場上也有很多其他種類的輸入法,如倉頡、行列,香港等粵語地區也流行粵語拼音輸入法。


随着地理环境交流的发展,中文输入法不断扩充字符集(或包含汉字数),以达到繁体字、简体字与生僻字通用的目的。主流形码输入法为了解决字符数扩充导致重码数增加的问题,大都推出了新版字根布局系统(如98五笔、郑码、倉頡輸入法六代等),取码方式及拆字方法没有变化或变化不大。其中字根布局系统为了解决字根过多易产生重码的问题而向字根双编码(如郑码)及用已有字根组合新字根(如仓颉码)两个方向发展;取码方式及拆字方法则希望可以更多取到字形的整体结构而非仅开头部分。



简体中文键盘输入法


简体中文输入法大部分可以分为三类:拼音输入法、形码输入法(如:五笔、郑码、表形码)和音形码输入法(如:二笔、自然码)。智能ABC身兼两种输入法既可以纯拼音输入又可以音形码输入,绝大部分的输入法软件都采用上述的汉字编码方法。见中文输入法列表。



汉语拼音输入法



汉语拼音输入法是利用汉字的读音(汉语拼音)进行输入的一类汉字输入法。拼音输入法有几种输入方案包括全拼和双拼。市场上有许多用拼音作基础的输入软件。绝大多数中文操作系统均附带汉语拼音输入法,如内置于Windows操作系统中的智能ABC(已停止更新)和微软拼音。此外互联网早期时代还有紫光拼音、拼音加加、拼音之星、智能狂拼、黑马神拼等输入法,在之后由中国互联网公司开发的搜狗拼音、QQ拼音、百度输入法等输入法较为流行。


其中用于手机的汉语拼音输入法较常见的有:搜狗手机输入法、QQ输入法、点讯输入法(现为百度手机输入法[5])、讯飞输入法、谷歌拼音输入法、触宝输入法。



粤语拼音输入法



粤语输入法是一种利用粤语拼音打字的输入法。



汉语注音输入法






和注音输入法有关的主要介绍请参见下文「繁體中文鍵盤輸入法」章節,但基于注音输入的原生简体中文输入法只有微软新注音2010/2012Rime输入法



微软新注音2007启用简体中文模式之后允许以台湾当地的读音标准进行简体中文输入(而不是输入正体之后再走整句转简流程);

微软新注音2010/2012则会在启用简体中文模式之后直接启用专门的简体中文语料库、使用中国大陆当时的官方读音用字标准直接进行简体中文输入;

之后的微软新注音无法使用简体中文模式、且台湾微软官方至今也没有提供公开解决方案。

同期其它产自台湾的注音输入法均采用「先敲正体、再行转简」的相容方案。


Rime输入法由河南人佛振编写、内建基于大千键盘布局的原生简体中文注音输入方案(兼具港标繁体中文和台湾正体中文的文字输入模式),

其输入节奏风格采用类似于搜狗拼音输入法的顺序输入方案、也使得大千键盘布局特有的声韵并击的功能无法使用,

但这同时也是Rime注音输入方案的优点,Rime的简码拼字注音输入方案是注音输入法中独有的,在很多情况下输入速度会比传统注音输入法快速。




五笔字型输入法



五笔字型输入法是王永民在1983年8月发明的一种汉字输入法。


汉字编码的方案很多,但基本依据都是汉字的读音和字形两种属性。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型输入法在使用简体中文的地区较广泛,是这些地区最常用的形码输入法。



郑码输入法



郑码输入法是一套字形输入法,其发明人是中国著名文字学家、《英华大词典》主编郑易里教授及其女兒郑珑。鄭碼設計之初便考量繁體、簡體字統一編碼的需要,在使用同一編碼規則情況下,可以輸入10萬以上繁體、簡體漢字。


現今大部份作業系統皆附有鄭碼輸入法。它是简体中文使用地區最常见的形碼輸入法之一。为了解决繁体字与简体字通用的问题,郑码采用字根双编码方式减少字根重码,因采用按特征检索基根和区码方式以及大多采用标准的偏旁部首记忆量增加不大较为易学。



表形码输入法



表形码是由旅居法国的华侨人士陈爱文于80年代发明的中文输入法。



二笔输入法



二笔输入法是陈劲松于1992年发明的汉字输入法,分为音形码和全形码两种,其中音形码得到较广泛使用。


二笔输入法将汉字按字形结构分为独体字和合体字;按码长分为一码字(一级简码)、二码字(含简码和全码)、三码字(含简码和全码)和四码字。输入汉字时,第一码取汉字拼音首字母,从第二码起取笔画,每二笔算一码,最多取四码,不足四码应全取,不能取双笔画时就取单笔画。二笔输入法具有规范、易学、快速的特点,也是目前唯一通过中国教育部评审的可以进入中小学教材的汉字输入法。



音形码输入法


音形码输入法是编码方式以拼音(通常为拼音首字母或双拼)加上汉字笔画(偏旁或字根)辅助的输入法,因易学、智能且接近形码的少重码体验等特点而受到部分用户的欢迎,较好的平衡了拼音输入法重码多、输入效率低,而形码输入法学习较困难的情况。


代表输入法有超强快码、二笔输入法(音形版)、自然码、拼音之星谭码、小鹤音形[6]和智能ABC等。



繁體中文鍵盤輸入法




常見的繁體中文鍵盤,印有注音、倉頡 和大易碼


繁體中文輸入法的歷史可溯及自1976年由朱邦復發明之倉頡輸入法開始。目前繁體中文輸入法主要有:屬於字形輸入法的倉頡輸入法、行列輸入法、大易輸入法、嘸蝦米輸入法、部首輸入法、筆劃輸入法,和屬於拼音輸入法的注音輸入法、粵語拼音輸入法等。





注音輸入法



注音是採用符號或記號來標注文字的發音方式及語調,亦可稱為音標、標音符號或注音符號。標音符號主要有兩類,一類是以拉丁字母為基礎的標音符號如國際音標、漢語拼音、通用拼音,這一類通常稱為拼音;另一類注音符號是由北洋政府教育部於1918年11月23日所公佈,目前盛行於臺灣,名為「國語注音符號第一式」。


注音輸入法則在此基礎下,藉以利用臺灣注音符號和漢語拼音的注音來達到輸入中文的效果,此輸入法易於使用,只需使用者懂得注音和拼音就可以輸入中文,雖然有高選字率的缺點,仍是最常為一般臺灣人使用的中文輸入法。



倉頡輸入法




File:Typing chinese characters with Cangjie gedit383 Ubuntu1310 screencast.ogv播放媒体

在Ubuntu之下,以Gedit利用倉五輸入中文



倉頡輸入法,是由臺灣人朱邦復於1976年所創製的中文輸入法,最初只有繁體中文版本,原名「形意檢字法」,用以解決電腦輸入漢字的問題。1978年由前國防部長蔣緯國將軍重新定名為「倉頡輸入法」。


朱邦復公開倉頡輸入法,不收分文,使電腦漢化得到很大的進展。現今大部份作業系統皆附有倉頡輸入法。它是繁體中文使用地區最常用的形碼輸入法。


在香港及澳門, 倉頡輸入法與速成輸入法是最常用的中文輸入法,在香港的文職招聘廣告中,經常會要求求職者懂得倉頡及(或)速成輸入法。由於香港回歸以前,香港的教育體系並不會教习漢語拼音,因此很多香港人都不懂以普通話發音的漢語拼音輸入漢字,倉頡和速成遂成為香港人最常用的中文輸入法。



老蘇形音中文 輸入法、蘇式倉頡輸入法、庫哥--腦殘輸入法



  • 老蘇形音中文 輸入法:取倉頡頭、尾兩碼及注音第一碼,可以輸入全型中文標點符號。

  • 蘇式倉頡輸入法:包含倉頡輸入法及老蘇形音輸入法,可以輸入全型中文標點符號。

  • 庫哥--腦殘輸入法:包含倉頡輸入法、老蘇形音輸入法,注音輸入法,可以輸入全型中文標點符號及注音符號。



行列輸入法



發明者為臺灣人廖明德,他曾任職發展倚天中文系統的倚天資訊,行列輸入法免費授權給海峽兩岸的中文電腦廠商,附在各系統中,讓使用者可以免費使用。


行列輸入法的設計和其他拆字型輸入法有著很大的不同,像是一種將文字編碼的方法。和早年使用來做為字典索引的四角號碼一樣,行列輸入法也是類似這樣用數字來為中文字編碼。


除了將文字編碼之外功能,行列輸入法還將這個編碼後的數字和鍵盤互相對應,也是這樣的一個對映關係,讓使用者省去背誦字根的力氣。



大易輸入法



發明者為臺灣人王贊傑。



嘸蝦米輸入法



發明者為臺灣人劉重次,以低重碼率、可輸入文字廣泛著稱的字根式輸入法。嘸蝦米以形音義將英文字母與字根結合,所以只要可以輸入英文的鍵盤皆可使用。



自然輸入法



自然輸入法為中央研究院資訊科學研究所特聘研究員許聞廉教授在1990年所發明。



漢音輸入法


漢音輸入法是於1985年由松下電器技術開發公司周峻慧開發,是第一個拼音/注音兼具的智慧型輸入法。由於學習容易及變換率高,推出時曾造成相當震撼。惟當時臺灣市場規模不大,日本松下逐漸縮小開發投資。現已無販售與維護。至今仍有許多死忠的支持者繼續找出在Windows 7、Windows 10中使用漢音的方法。



源自香港



形筆輸入法


將中文字以形象化的字符(形筆字母)來拼砌中文字「見字打字」。



粵語拼音輸入法



利用粵語拼音來輸入漢字。粵語沒有像漢語拼音那樣統一、通行的拼音系統,故輸入法有基於不同拼音方案的系統。



快碼輸入法



快碼輸入法是由香港的九方科技控股有限公司發明的一種中文字形輸入法,其把漢字歸類為可橫向分割字和不可橫向分割字,然後再按照其輸入漢字的法則把漢字編碼。



九方輸入法



九方輸入法同樣是由香港的九方科技控股有限公司發明的一種中文字形輸入法。其特點是只需要使用鍵盤右方的數字鍵位置,即可輸入漢字。該種輸入法僅使用9個字碼拆字,每個字只需輸入3個字碼即可選擇,被認為是一種簡易快捷的輸入法。



縱橫輸入法



縱橫輸入法是由香港人周忠繼於1993年發明的一種中文字形輸入法。其特點是只需要使用鍵盤右方的0-9數字鍵位置,即可輸入漢字。



六碼筆畫輸入法



六碼筆畫輸入法是由香港城市大學電子工程學系副教授布禮文於2007年開發的「筆畫輸入法」加強版,支持Windows、OS X、Android, iOS;「六碼筆畫」(簡稱G6),它除了支援「全碼」筆畫輸入模式,更提供「六碼」輸入模式,其基本理念與「速成輸入法」類似。 G6=diGit-6 即六碼的意思,因為這種輸入模式以漢字的5種基本筆畫類型:橫(一)、豎(丨)、撇(丿)、點(丶) 和 折(フ), 再以「頭三尾三」的選碼規則而編出最長為六碼的漢字碼或詞組碼。


六碼筆畫的主要優點是介面簡潔、易學易用,因為只要懂得漢字筆順及頭三尾三的編碼規則,就能輕鬆輸入中文單字、二字詞、三字詞及多字詞。 六碼鍵盤是經過精心的人機界面設計,無論在柯蒂鍵盤或數字鍵盤都能以最靈活的食指、中指和無名指進行輸入。用戶亦能以 Y/ 鍵作六碼及全碼筆畫輸入的轉換,這樣就可以大大提升六碼筆畫的實用性。



會說普通話的輸入法



會說普通話的輸入法是由香港人李祥於2004年開發的一種打字時,能聽到普通話同步發聲,又能同步顯示帶聲調的漢語拼音的中文輸入法。輸入法幕後程序上的創新達到功能上的突破:實現輸入法用非拼音輸入碼(倉頡、速成、英文等)打詞組時,也能聽到和看到其輕聲、兒化音及變調的效果。既是輸入漢字的工具,又是香港人學習普通話的工具。開源輸入法平台gcin也能提供類似的發音功能。



安氏漢字電腦編號漢字輸入法



安氏漢字電腦編號漢字輸入法是由香港人安子介於1985年發明的中文輸入法。它把漢字分成部首和其餘部分,分別接筆劃規定賦予數​​字,組成編碼。由於採用了六位數字,故無重碼。[7]



源自中国大陆



汉语拼音输入法


中国大陆市场上许多汉语拼音输入法内置了繁体中文输入功能,单击这些输入法状态栏的“简繁切换”按钮或在設定中切換為繁體模式即可以漢語拼音输入繁体字,但不少漢語拼音輸入法經常出現簡繁轉換錯誤[8]



五笔字型输入法


目前,很多五笔字型输入法均可以输入繁体中文。主要分为两种方式:在支持GBK或Unicode字符集的模式中,可以将繁体汉字一样按照五笔的字根进行拆分,如输入「swwi」(木+人+人+末笔为捺杂合型识别码)可打出「來」。另一种方式为打开「繁体输入」开关后,按简体拆分可输出对应的繁体,如在该模式下,输入go(简体「来」的编码)可打出「來」。



内嵌輸入法



  • VimIM —— Vim 中文輸入法


其他输入法


除了上述常见输入法还有些边缘输入法,使用人数不是很多,流行范围较小,但些许功能更加优秀。



联想输入法



聯想輸入法是一種以鍵盤輸入區為數字鍵小鍵盤區的輸入法,曾經主要使用於銀行及特殊工作行業內使用過,但現今很少有發現使用。



聲韻輸入法


聲韻輸入法用滑鼠輸入中文。先點擊聲母,再點擊韻母;或先點擊韻母,再點擊聲母,就出現全部同聲同韻的字以供選擇。聲母韻母均用近音字提示,不必記憶。近音檢字法和粵音檢字法,是聲韻輸入法的代表。參看外部連結。



手写输入法


手写输入法是一种对笔迹进行智能识别以选取汉字的输入法,可以辅助输入一些生僻字。主流的汉语拼音输入法可以通过其官方站点获得手写输入法扩展,也有如“开心逍遥笔”之类独立运行的输入法。



語音輸入法


見語音輸入法



专利与著作权


中文输入法的拆字方法与原则若其符合专利法条件可受到专利权的保护。但是任何人依据同一套拆字方法或原则衍生出的编码表是唯一的、都一模一样,所以此编码表不受著作权法保护。[9][10]



功能及品質




中州韵输入法引擎的Windows发行版——小狼毫输入法的用户界面






商業化、內建與否

通常系統內建的輸入法最方便、最泛用。而需要額外安裝者次之。除下載或攜帶安裝程式的不便以外,有些系統會限制使用者不得安裝軟體。商業化的輸入法除了需要付費,許多地方可能沒有安裝而造成使用不便;更甚有因公司倒閉而使輸入法絕滅,使用者只好重新學習新的輸入法。目前有少量开源输入法,比如中州韵输入法引擎。


易學

通常初學者會考量一個輸入法是否易學,以下是一些影響易學性的變數:



  • 字根數目:通常字根數越多,記憶量便增加

  • 編碼的合理性:編碼較合理,能方便記憶,加快學習速度

  • 口訣:有些編碼雖不甚合理,但附有特殊口訣,而容易記憶

  • 取碼規則的繁複與否


速度


  • 重码率:重碼率越低,免卻選字的疑慮,輸入速度越快

  • 编码长度:編碼越短,輸入時間越低。但另一方面,編碼長度太短,又會增加重碼率。因此好的輸入法須取得平衡。

  • 簡碼:簡碼可大幅增加常用字的輸入速度,但必須額外背誦。因此是否要背簡碼、簡碼是否好背,也是考量要點。


容錯性


  • 有些輸入法可一字多拆,避免一些字型由於主觀認知上的差異而拆不出的困擾

  • 有些輸入法支援模糊輸入,如,如此一來,不會拆字時,便可用模糊的輸入方式拆出


符號輸入

標點符號在中文文章中相當重要,因此標點符號是否容易輸入也至關緊要。
有些輸入法除常用標點符號以外,尚可輸入較少用的符號,如注音、希臘符號、數學符號、等等。


自由性

有些輸入法可自定編碼或自定詞庫,以词定字、以句定词、优化词库,增加靈活性。輸入法的學習、記憶功能亦會影響到輸入速率及體驗,故不少輸入法都有动态字频、动态词频。


字庫大小

一些輸入法只針對常用字編碼,導致生僻字不是無法輸入,就是難以輸入。


人工智慧

无论音碼、形碼、形音碼、音形碼、無理碼输入法在出现重码时期望可以通过人工智慧辅助选字。这方面音碼因为重码较多,比较迫切,因此做得较好;相比下形碼因为重码较少,支持人工智慧选字的形码输入法较少,有較大發展空間。



參考資料





  1. ^ 中华人民共和国全國首屆速錄信息處理大賽,來自上海的專業速錄人員劉鳳鳴以每分鐘打出 648 個漢字的成績打破了第 47 屆國際速聯大會上的國際速錄比賽漢字看打最高紀錄。全國首屆速錄大賽漢字快打速度破國際速錄比賽紀錄


  2. ^ 首届全国速录信息处理大赛现场(组图)


  3. ^ YouTube - 实拍+难以置信的打字速度


  4. ^ YouTube - CCTV-1_朝闻天下 速录师


  5. ^ 百度首次证实收购点讯输入法


  6. ^ 何海峰. 小鹤双拼输入法. [2014-03-31]. 


  7. ^ 安子介式漢字筆形電腦編碼法及其鍵盤專利: CN1003890 B, CN 85101817 A, US 4868913 A


  8. ^ 比如「臉麵」。


  9. ^ 專利期間已屆滿之中文輸入法能以著作權保護字碼表嗎? 互联网档案馆的存檔,存档日期2012-06-24.


  10. ^ 字库侵权,输入法不侵权 Archive.is的存檔,存档日期2013-04-26




參見



  • 中文輸入技術

  • 中文輸入法列表

  • 中文電碼

  • OpenVanilla

  • SCIM

  • gcin

  • 计算机速录



外部連結



中文输入法




  • 玉明軒輸入法[永久失效連結]

  • 速打粵語拼音輸入法

  • 开心逍遥笔



新闻


  • 中文輸入法世界


線上中文輸入系统



  • 網上中文輸入法

  • 近音檢字法


  • 粵音檢字法(繁体中文)


  • 六碼筆畫輸入法 (繁体中文)

  • InputKing


  • Online Chinese IME(简单易用的基于全拼输入法的線上中文输入系统,字词库近6万)

  • 百度在线输入法


  • 在线试用 Google 输入工具(支持在线输入简体中文及繁体中文)

    Google 输入工具(Google Chrome在线输入扩展)



  • Universal Text Input(含中文在线输入功能)

  • 網.蝦米 Hyper Liu , 2008-01-30

  • 網.蝦米 Hyper Liu - 行易有限公司


  • 華語web ime(繁体中文)



指南



  • 如何在英文WINDOWS下输入中文?

  • 基于浏览器的不用安装的中文输入平台


  • 聪明打字 2011[永久失效連結]



应用商店提供的中文输入法


  • Google Play



Popular posts from this blog

Guess what letter conforming each word

Port of Spain

Run scheduled task as local user group (not BUILTIN)