查看: 2693|回复: 10
|
最完整的中文輸入法--倉頡
[复制链接]
|
|
本帖最后由 lunglung 于 13-10-2021 10:28 AM 编辑
前文連結:《中文輸入法的分類》https://cn.cari.com.my/forum.php ... &tid=4296965&extra=)
完整至少要能八全:全漢字(不受字集收字限制)、
全免費(不受軟體商限制--輸入法軟體版本和系統共容性)、
全球備(不受系統和裝置限制,易得)、
全三易(易學易記易用)、
全功能(碼序形辨音義;序=給中文排序有賴字和碼唯一對應)、
全鍵盤(中文鍵盤必有倉頡碼,有助於初學,建立手指記憶後可盲打,就不需按鍵標示字碼,純英文鍵盤也無礙,歸因於一碼一字)、
全中意(操作全程思惟沉浸在中文筆劃、意念、字碼)、
★全沒病(音碼的注音和漢拼,必生四系電腦病:無法盲打盯屏傷目、同音錯字音魔殺形、限用京音忘亡方言、西文漢拼自慚形穢。
全三易:字根規則少,所以,易學(學習)、易記(記憶)、易用(認辨寫打識(=對)+序) = 十優(學習認辨記憶寫打識序)
自西元一九七九臺灣朱邦復發明世界第一部實用上市銷售的中文電腦後,中文輸入不再需另製大鍵盤,而可使用標準鍵盤直接輸入。倉頡眼光遠大,所考慮到的是中文資訊處理的全功能六大需求(字碼、字序、字形、字辨、字音、字義),它不是單純的輸入法,它是倉頡系統的輸入部分,其背後支撐的除倉頡系統,相關支援還有漢字基因工程,使電腦「懂」中文;還有圖文系統可用中文字作命令直接製動畫。
|
|
|
|
|
|
|
|
楼主 |
发表于 20-9-2021 12:42 PM
|
显示全部楼层
|
|
|
|
|
|
|
楼主 |
发表于 20-9-2021 01:03 PM
|
显示全部楼层
|
|
|
|
|
|
|
楼主 |
发表于 20-9-2021 01:08 PM
|
显示全部楼层
本帖最后由 lunglung 于 22-9-2021 09:44 AM 编辑
3. 其他
3)說明空間序(切塊取根皆依此空間順序:左右、上下、外內),符合閱讀視覺習慣,不因個人、地區之筆順習慣而使取碼不同。沒有另設的筆順規則。
3)圖-> 14空間序
4)輸入法整體相關各部
4)圖->15導覽圖
|
|
|
|
|
|
|
|
楼主 |
发表于 20-9-2021 01:11 PM
|
显示全部楼层
本帖最后由 lunglung 于 8-1-2022 09:08 PM 编辑
4. 取碼四格式和字例
通則:
★★★實踐操作口訣:【貫切出左上外區塊取首尾碼】重復;最多切二刀成三塊取五碼。
總結得取碼四格式:
4--【首次三尾】 --(無切,一區塊 整體字 囗)
23-【首尾】 {首次尾} --(一切,二區塊 組合字 吅吕回)
\_字首_/\__整體字身__/
221【首尾】〖首尾〗〔尾〕 \--(二切,三區塊 組合字 字身再切共九結構)
212【首尾】 〖首〗〔首尾〕 / 切出左上外=字首、次字首;
\_字首_/\次字首/\次字身/ 剩下=字身、次字身。
\_字首_/\___組合字身___/
原則4.2:三四面包圍尾碼省略(改取包圍字形)。
*鳥=一區塊;格式4--=取碼[首次三尾] (一區塊無切)
=切塊[鳥]=取根[ノ曰卜~灬]=得碼[竹日卜~火]=按鍵 竹日卜火
*龍=二區塊;格式23-=取碼[首尾][首次尾] (二區塊一切)
=切塊[立月][<龍-立月>]=取根[亠~月][卜コ~匕]=得碼[卜~月][卜尸~心]=按鍵 卜月卜尸心
*轉=三區塊;格式221=取碼[首尾][首尾][尾] (三區塊二切)
=切塊[車][叀][寸]=取根[十~十][十~、][~、]=得碼[十~十][十~戈][~戈]=按鍵 十十十戈戈
*踼=三區塊;格式212=取碼[首尾][首][首尾] (三區塊二切)
=切塊[?][曰][万ノノ]=取根[口~ˊ][曰][丆~ノ]=得碼[口~一][日][一~竹]=按鍵 口一日一竹
*醹=三區塊;格式221=取碼[首尾][首尾][尾] x=尾碼(受三四面包圍)包含省略(改取包圍字形)
=切塊[酉][雨][而]=取根[一~囗x][一~冂x][~冂x]=得碼[一~田x][一~月x][~月x]=按鍵 一田一月月
以上可視作理論性、概念性的解釋。是大腦的知。
以下可視作實踐操作的程序。是手指的行。
另一種解釋方式:
★★★就是,一邊切塊一邊取根,一邊得碼按鍵。
|
|
|
|
|
|
|
|
楼主 |
发表于 20-9-2021 01:15 PM
|
显示全部楼层
本帖最后由 lunglung 于 22-9-2021 09:52 AM 编辑
二、01中文字排序字根表(字碼序、字根序)
圖->01排序字根表
所有其他輸入法都不行,唯倉頡勝任。倉頡輸入法設計,是作爲內碼使用,要求一字唯一碼(零重碼率),所以,能像英文般給中文字排序。下圖將中文字母(字碼)以「類序號第一位數+碼序號第二位數」組成字碼序;若遇同碼(機會低,六代無重碼),再加根序號第三位數得字根序。如此比對數字,比起abc挨屄吸字母更易快速排序。
類序號 :哲理類=1 筆劃類=2
中文字母:日 月 金 木 水 火 土 竹 戈 十 大 中 一 弓
字碼序 :11 12 13 14 15 16 17 21 22 23 24 25 26 27
類序號 :人體類=3 字形類=4 輔助類=5
中文字母:人 口 手 口 尸 廿 山 女 田 卜 難 符
字碼序 : 31 32 33 34 41 42 43 44 45 46 51 52
例:字 = 中 文 字 排 序 根 表
碼 = 中 卜 大 十弓木 手 中 一 尸 戈 弓 戈 弓 木 日 女 手 一 女
字碼序= 26 4624 232714 33252631 22272227 141144 332644
排序 = 26 4624 141144 232714 332644 22272227 33252631
排序字= 中 文 根 字 表 序 排
詳參:https://drive.google.com/open?id ... 0eK80QKSs4kURSVg5Gl 《1普及版華文積木遊戲(橫排).pdf》頁14~15,18,127。
試遍各種輸入法,經驗纍積卅餘年,圖表編撰凡八載,字根規則覽一頁。 |
|
|
|
|
|
|
|
发表于 21-9-2021 01:44 PM
|
显示全部楼层
謝謝分享喔!最近學校開始做中文閱讀報告,不懂中文輸入法的我正開始學倉頡輸入法,這篇文章很詳細~ |
|
|
|
|
|
|
|
楼主 |
发表于 22-9-2021 10:36 AM
|
显示全部楼层
本帖最后由 lunglung 于 23-9-2021 10:55 AM 编辑
試遍各種輸入法,經驗纍積卅餘年,圖表編撰凡八載,字根規則覽一頁。
【貫切出左上外區塊,取首尾碼】重復;最多切二刀成三塊取五碼→
得取碼四格式:4--、23-、221、212。餘規則引申易懂。
字根爲要是門檻,廿六字母分五類,五段朗頌配指按,直接上機是竅門。
音碼破壞文化嚴重,文字能力附音退化:盯屏傷目同音錯字,忘亡方言漢拼形穢。
漢字危機文化垮塌,注音漢拼難辭其咎,挽危急學始祖倉頡,捨棄音觀回歸形觀。
同音錯字氾社會,流毒九十後青年,五旬歲數也受害,皆因音碼在肆虐。
音碼認音不記形,有音是娘隨意選。求快誘因辭輸入,次字待選助忘形。 |
|
|
|
|
|
|
|
楼主 |
发表于 22-9-2021 11:53 AM
|
显示全部楼层
|
|
|
|
|
|
|
楼主 |
发表于 8-12-2021 12:36 AM
|
显示全部楼层
本帖最后由 lunglung 于 31-12-2021 05:03 PM 编辑
這是額外製作,給初學者增強信心。
google雲碟網址:
https://drive.google.com/drive/folders/1r7qdV_9Tq5IHHj21Aiag36BHsTS77DKE
找 《__4開講倉頡.pdf》 附錄 頁46/59
依序,可插入於 #3樓此二圖之間:10通則切塊分類(結構13式),【10-1通則切塊取根點分佈】,11通則切塊取碼四格式(初階操作表--通則)
|
|
|
|
|
|
|
|
楼主 |
发表于 31-12-2021 05:03 PM
|
显示全部楼层
倉頡基本精神
在上面各樓熟悉了倉頡,現回顧整體設計基本精神:
1.字形特徵體現在:1) 通則之「連體區塊定義」(含筆劃相連原則)--操作表左下角,通則對「整體字形/區塊的定義」下1.形和勢 2.筆劃相連原則
2)(區塊內取根)原則--操作表右邊,其目的:1.針對字形特徵,2.提取最多最精煉字形資訊以最短碼表示,3.逼向一字唯一碼。
2.通則切區塊,基本操作便是「二刀貫切法」:「【〖貫〗〔切〕[出] 左、上、外 區塊,取首尾根】重復;最多切二刀成三塊取五碼。」(→得取碼四格式:4--、23-、221、212)。
重點就在「切出」,而且是「貫」(貫穿整個字)的方式將區塊切出去,纔取首尾根。
網上youtube解說的,用「左右、上下、外內、多列、連體」來分。連體是無切。「左右、上下、外內」是因應區塊結構,縱橫圈三方向「貫穿」切第一刀,自然而得。多列(或多塊)是切第二刀出現的三區塊字,切第二刀時仍然有「左右、上下、外內」,二刀就有九種結構。第一刀要爲縱橫圈三方向的切各造一集,而切第二刀時又以多列(多塊)馬虎帶過。有重此失彼之嫌。這都是以區塊概念講述,參考朱邦復先生三代和五代原著手冊,都是使用流程圖來解說,將之簡化即是第#3樓的《09通則切塊取根(是非分叉)》圖,重點就在「貫切出」。祗需把握「貫切出」左上外區塊的「二刀貫切法」,根本不需要多廢唇舌,講區塊結構十三種,或「左右、上下、外內、多列、連體」五分類。
區塊觀念:
區塊,在朱邦復先生原著中沒有這名稱,但有這觀念,是「貫切出」之下衍生的。在以下三種狀況,原著是個別以內容說明,沒有特別稱呼。
1. 取碼區塊:有五種,整體字(五代,含連體字(三代))、字首、整體字身、次字首(組合字身的)、次字身(組合字身的)。是通則,「貫切出」的結果。其中,字首、次字首、次字身,可能由散離的小塊(連體)部件組成。
2. 連體區塊:是通則對「整體字形/區塊的定義」下1.形和勢 2.筆劃相連原則 所指的,即原三代的連體字或連體字形。內無散離小塊部件。
3. 實踐區塊:是通則對「整體字形/區塊的定義」下3.所指的,即附則所指定的複合字/複合字首、難字、特殊字(支架)等指定字27個(五代,33個(三代))。實踐操作上如同連體。
連體區塊和實踐區塊,是包含在取碼區塊內。
偶而打不出字:
極少數字,尤其罕用字,有時打不出。利用萬用替代符「*」來尋找,或查碼網站查到的碼與所想的不同,或不能理解。
1. 目前通行的電腦系統是美國架構的,屏幕字形顯示及印表機列印字形是由字型數據font data所控制。在鍵盤按鍵後,進入電腦依輸入碼(鍵)對應內碼的碼表,轉成內碼在電腦內部處理,並依內碼從指定字型別font type的字型檔font file提取字型數據font data,控制屏幕顯示和印表機列印。
字型檔是由字型軟體商提供,其所依據字辭典文獻、資料,些微的筆劃有誤或與倉頡編碼所依據字形有別。如:倉頡三代制訂時,標準字體的字形未公佈(五代依標準字體編碼,但標準字體收字不是全漢字)。字型軟體商取用日本字模(某些字參考中國文獻所錄俗寫,如戶作戸)或供大陸市場的字型檔因規定必須依大陸簡化字指定之繁體俗寫(民間錯寫)字形,內有俗寫體筆劃(如戶作户、別作别)。它們與倉頡依循字源(小篆、文獻)訂正的習用字形可能有異。
2. 倉頡依據手寫楷書字形,不是依據印刷用的宋體/明體。宋體/明體與手寫楷書,某些字筆劃有異(宋體是參考秦檜書法,少部份保留篆書筆劃,如眞(真)。如「?」下「?」這個宋體的「直」字就打不出的。)如鄭碼就說是參考印刷體字形編碼,又強調依筆順(手寫體)取根打字,殊不理想。其他很多輸入法不明說其編碼所參考的字體。
3. 目前電腦都使用美國制訂的聯碼unicode作內碼,聯碼沒收的字,電腦就無法處理。即使倉頡編了輸入的倉頡碼,也無法使電腦顯示或列印、儲存、傳輸。今日聯碼收漢字七萬五千,對一般人是足夠,不太可能遇到缺字。即使聯碼收有某字,字型檔也要有對應的該字的字型數據,纔可顯示或列印出該字字形。字型軟體商也盡量依公佈字形製作收字完整的字型檔,不過系統所帶的字型檔,便要看系統軟體商(如微軟的視窗系統MS-Windows)的決定和態度。
一般人都使用微電腦(個人電腦、如桌上型desktop、筆電的膝上型laptop,平板的iPad等等)大致都用微軟的系統,網上指出有幾個字編錯碼(但微軟沒有修正)。
http://input.foruto.com/cccls/chinput-cj-FM.html 《Windows倉頡編碼的夜與霧》。在本文所述的字:
噏:字形下方的羽,?內是兩ノ,與手寫楷書?內冫有別。本字典所給碼是倉頡三代,五代指定合爲複合字,合在次字首區塊,=[口][合][羽]=口人口一。
验:所指=弓火人弓心,在Windows8下不見有。而且是簡化字,祗有大陸及使用簡化字者在用。
问:所指=戈尸木竹,在Windows8下已收,但也有正確的碼=中尸口。
叁:所指=戈大一一一,認爲=[厶大]一區塊是錯,厶不是通則下筆劃相連原則指的「與下相連」。=戈大一一,纔正確。
曱:所指=曰丨=日中,在Windows8下已收,或指Windows設=田一中,都不對。應=囗一丨丨=田一中中。
依原則 3.字形特徵 (1)不重複取碼 12)若兩可碼組,不實穿日囗等封閉字形。
囗內不祗筆劃一,而有丅,所以不能取根曰,丨穿過囗必要斷成兩豎。故取=囗一丨丨=田一中中(倉頡五代);所指Windows取=田一中,是倉頡三代碼,五代碼修正。
(華通軟件是香港公司。微軟帶給香港倉頡三代,雖然五代出來,微軟動作蹣跚,牛步化地將五代碼編入三代的內置倉頡作共容。沒有獨立另製五代碼倉頡。)
智慧手機的系統有IOS(蘋果機)或開源的安卓Android(其他品牌),各系統和品牌商家的產品,在內碼收字數和字型檔方面,會有各自考量和決定而異。
4. 倉頡是形碼,依筆劃而打。所見的想打的字形,與三伺機器顯示的有異或沒有,受到以下因素影響(1. 系統收字--裝置內部可處理 2.配合的字型檔收字--裝置可輸出(顯示/列印) 3.輸入法收編的字--裝置可輸入):
1)手寫體、印刷體;
2)筆劃爲美觀而書法變形;(如川的最左豎,有人叫豎撇,其實不是撇,是豎,應取字根丨作字碼中;輝的左部首光之右下角筆劃乚變成?,其實是乚,應取字根乚作字碼山;……。
3)這兩者又受到公佈字集所收字字數影響(今系統都用美國強勢主導的聯碼unicode,掃清了各國地區機構廠商各自制訂的字集差異);
4)字集收字之字形,受到依文獻小篆而訂正的字集所收字形、各國地區(臺港陸日韓越)影響,如大陸簡化字以民間俗體錯寫字形爲準以彰顯勞動人民;
5)輸入法編碼所依字集,其字數及擴收的字。如微軟倉頡本是倉頡第三代,其時收字三萬五千。後微軟(繁體正字版)視窗系統不再用Big5作內碼,改用unicde,因unicode字集所收字數比Big5多,這多出的字是原倉頡第三代未編碼的,微軟自行擴編(內有一切不符規則或跟收字更多的第五代不符);
6)系統商所訂的字型檔收字情況;
6)另裝之字型檔,其字型軟體所收的字。
線上查倉頡碼:
(分辨三代、五代碼:面=一田卜中(三代)/ =一田尸中(五代))
1. 「倉頡之友.馬來西亞」倉頡大字典(五代碼) https://www.chinesecj.com/cjdict/
2. 華通軟件在網上提供的《follow me 倉頡字典》線上查詢版(三代碼):http://input.foruto.com/cccls/cjzd.html
3. 漢典:https://www.zdic.net/ (三代碼)
網上輸入法:
(直接在網上打,再剪貼到編輯軟體--如WORD/筆記本Notepad--去。)
https://www.chinesecj.com/ime/cj5.php (網上倉頡輸入法 第五代倉頡輸入法2022世紀版 (支持九萬漢字))
(註:目前電腦系統,一般人(終端用戶,微電腦系統用戶)使用最多的如MS-Windows來說,是使用聯碼unicode作內碼的。Windows 10 內附的中文字型font目前只能支持到七萬漢字(unicode ExtA-ExtD),故需另外安裝支持九萬漢字(unicode ExtE-ExtG)的字型,若你的電腦已安裝有支持(unicode ExtE-ExtG)的字型,那麽在《倉頡平台2022》軟體設置使用該字型即可讓《倉頡平台2022》軟體顯示九萬漢字。
https://www.chinesecj.com/forum/ ... read&tid=195320
《倉頡平台2022》測試版正式推出 阿勤 發表於 17-6-2021 14:21:04 )
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|