更新时间:2024-05-01 08:27:49作者:佚名
这要从信息熵开始。
无论任何语言,最常用的单词都在 2,000 到 20,000 个左右。 符号字符中的单词由字母组合组成,CJK字符由部首组成。
如果字母数量太少,比如只有两个0和1,那么一个单词就会由很长的重复字母组成。 例如,如果将英文单词转换为ASCII码,则几乎没有可读性。 对于记忆的使用和表达来说非常不方便。
如果字母太多,比如100个,其实也可以。
这涉及到一种语言的设计哲学,是用相对较少、简单的字母组成符号字符,还是用非常大、复杂的字母组成象形文字。
如果把每个汉字看成一个字母,那么单词和字母几乎是同义词,相当于一个单词一个字母。 那么每个字母都有很强的表达能力,但是也很复杂。
符号语言的设计理念是单个字母是简单的,单词是由有限长度的字母组合而成。
汉语的优点是字母的表达能力强,信息量大。 通过两个字母的组合二十六个字母是什么,几乎所有新的科学术语都可以表达意义,甚至达到字面上毫无意义的程度,这对于科普普及很有帮助。 它的缺点就像它的优点一样。 由于每个字母都有很强的含义,组合词带有字母本身的强含义,不利于形成新的抽象词。
英语的优点是字母有限、简单,而且字母没有任何意义,所以很容易组成新单词。 缺点也是它的优点。 由于字母没有意义,很难理解文本二十六个字母是什么,所以英语发展了词根,每个词根都类似于一个中文单词。 信件在一定程度上解决了这个问题。
一般来说,符号书写的灵活性和象征性比汉语更适合现代书写系统。
那为什么是26呢? 根据上面的讨论,两种哲学思想都会走向数字的两端。 汉字希望字母多,英文希望字母少。 少足以显示符号系统的优越性,但同时也不能太少,导致字数很长英语作文,可读性很差。
所以结果可能是 20 到 30 个符号之间的系统是最有效的。 字母既少又简单,但又足够多,使单词不会太长、重复而难以记忆和表达。
另一个原因是20到30个字母的数量也可以与音节的数量很好地一致。
音节数和字母数大致相同的数量级并非巧合。 因为它们都是为表达相同语义而开发的文字和声音系统,所以简单而有效的原则同时在这两个系统中发挥作用。
另外,20到30正是单手10个手指打字最舒适的范围。 这也是一件很有趣的事情。 手指太少,不够灵活有效,表达能力也受到限制。 手指太多效率太低,付出的代价太高。 它很大但是好处太小,就是性价比太低,所以最后10个手指是表现力足够强、效率最高的数字,打字可以覆盖26个字母的范围。
你会发现宏观世界里很多数字恰好能够在一个数量级的范围内相互适应,这是非常有趣的。 它们都是密不可分的。 根本原因之一可以用信息熵来解释。
最后,所有西方符号文本都来自腓尼基符号系统。 该系统是为记录业务中的事件而开发的实用文本。 当然,它的设计理念是用尽可能少的、有效的符号来形成可用的文本。 书写系统。