本文正在参与「金石计划 . 分割6万现金大奖」

原文作者:Tomoko Matsuoka

原文地址:mailmate.jp/blog/half-w…

假如读者填写过日文在线表格,你可能遇到过日文字符输入类型:半角字符(hankaku 、half-width)和全角字符(zenkaku、full-width)。

根据输入字段的不同,这两种日文字符集有必要切换运用。

例如,假设一个在线信用卡表单需求你输入邮递地址,一般输入的是全角字符。在同一网页上,你可能还要有必要用半角字符来输入你的电话号码,如此来回切换。

不只是在日本的外国人觉得切换这两种字符类型很烦人,从网上的大量评论也能够看出,日本人也讨厌在填写在线表单的时候切换全角和半角字符的不便。

那么,为何这个问题一向没得到处理呢?这两种字符类型又从何而来?

半角字符和全角字符的故事

图:Neto Labbo;在在线表单种输入信息,然后提示错误:“请用全角字符输入字母数字。”

什么是全角字符和半角字符?

半角字符和全角字符的故事

上面这张图片展现了全角(上面一行)和半角(下面一行)。尽管它们看起来相似,除了有点变形,但他们归于不同的电子字符集。

Morgan Data System KK是一家支持资料录入和聚合查询数据的公司,该公司的对全角字符(zenkaku)和半角字符(hankaku)进行了解说,现将其翻译并转述如下:

“有时半角字符被称为单字节字符,全角字符被称为双字节字符。(字节是计算机中存储数据的计量单位)。

“单字节(1个字节)为8位二进制数(比特),共有256种组合。但这256个值不足以表明所有日文字母。双字节(两个字节)为16位二进制数,共有65536种组合,这就足以用来表明字符量很大的言语了,比方日语和汉语。

半角字符和全角字符的故事

上图左边是全角字符「ア」,右边是半角字符「ア」。尽管这两个字符的发音是相同的,但从对字符的编码能够看出,它们的电子字符集来历不同。

全角半角诞生记

美国信息交流标准码(ASCII),是第一个标准化的字母和数字编码系统(编码标准),是由Bob Bember在1961年5月创建的。

Bember建议运用一种通用的底层编码来表明字母和数字字符,使计算机之间更方便地通讯。

ASCII运用8个比特位生成256个数字组合(256种模式),这些组合能够表明任何言语中等量的字符。英语只要94个字母、数字、符号等,因此256个组合足以用来表明英语了。

1969年,日本程序员将半角片化名分配到这94个字母数字字符后的空缺位置,其时被称为JIS C 6220。

半角字符和全角字符的故事

第一个日文电子字符集是半角片化名, 美国东部时间1969年, Japan Association of Graphic Arts Technology

片化名是日本的一种表音符号,被以为足以用来发送简略的电报,也能用于其时的公营和私营部门组织的程序傍边。

跟着计算机功能的前进,以及文字处理运用成为现实,人们自但是然需求一套完好的日文电子字符集,其中包含数以千计的日文汉字。

金泽大学Riyuichi Fujimoto先生的讲稿(日文版),里面记录了让日文可机读的演变史。下面是从他的论述中总结出的一些事件及其简略时间线。

1963年,ASCII字符:计算机只能了解英文字母数字。

1969年,ASCII字符+半角片化名(JIS C 6220):计算机能够处理半角片化名字符,但不能展现日文汉字。

1978年,全角字符(JIS C 6226.2):计算机能展现日文汉字,但不同国家和制造商存在不一致的状况。

1991年,Unicode:通过给世界各地的字母一致分配数字来标准化言语字符集,便于计算机都能正确处理不同国家的计算机字符。

现状:仍未一致

目前,有许多编码计划能够跨计算机和程序将日文电子字符集(半角和全角)转换成可读言语。(这篇Stack Overflow帖子解说了字符集和编码计划之间的差异)

使日文具有可读性的编码计划有哪些呢,下面列出了部分最著名的计划:

  • EUC-JP code
  • SHIFT JIS code
  • UTF-8
  • UTF-16
  • UTF-32

但是,到目前为止(译注:作者发布本文的时间是June 14th, 2021),还没有一致的日文电子字符集,因此人们仍在持续运用全角和半角。

现在,当填写在线表单(如)时,半角首要用于填写字母数字的字段,比方电子邮箱、密码和电话号码。

全角用于输入日文字母的字段(如邮递地址等),此时有必要输入全角字母数字。

假如说全角是更新的、更高级的方式,为什么半角字符仍然用于数字和电子邮件地址?

Sphere System Consulting KK给出了回答:在计算机的数据处理才能很低年代,人们的关注点在于让数据尽可能轻量、简略。这便是为什么程序员更倾向半角字符,而不是全角字符,由于全角消耗的数据是半角的两倍。

此外,在某些状况下,比较全角字符,半角片化名多用于物理空间有限的状况,比方银行存折和收据中。

何去何从:问题的处理计划?

舆论普遍以为,日本人也讨厌这种做法,在Idea Box“数字改革创意箱”上还有关于半角字符和全角字符集(1,2)的问题(Idea Box是一个敞开论坛,个人能够直接向日本中央政府提出投诉或改进要求)。

关于日本用户来说,输入URL时双字节字符不易读是一个烦人的问题,所以,他们不得不切换到半角字符输入URL。关于电话号码和电子邮件等,全角号码也有必要转换为半角号码。

关于(在日本的)外国居民来说,在用片化名输入名字的时候,根据在线表单和输入字段的不同,有必要选择半角化名或全角化名。这往往会造成错误,导致用户不能及时完结填写。

日本政府还没有采用并施行一致的电子字符集前,只要依托暂时的处理计划来改进电商网页、网上银行和政府填表的用户体会。

Forrester Research公司的一位高级分析师在2008年的一篇专栏文章提出了一个简单的处理计划,即在搜集数据时将字母数字字符、平化名和片化名自动转换为一套编码。

别的,专门从事软件开发者东西和其他IT处理计划的Grapecity 公司,他们用JavaScript处理所述的问题,并发布了他们的计划。

既然有了处理计划,至于为什么日本政府和企业迟迟没有更新他们的系统,可能是出于这样或那样的原因要节省空间,或者是困于现状。

或许“一向都是这样”,但不是根本原因。

一位为本文提供技术评审的IT经理指出,“办理层常有职位级别的问题,由于办理层(一般是老年人)对所办理的技术空间缺少满足了解,一般也要考虑风险规避的问题。他们靠工作年限晋升,而不是个人才能或办理技能。他们不会去修复那些看似无反常的问题,也可能不会过多考虑部属的前进主意。

我坚信,官僚式的程序会极大阻碍变革。从主意到实现是漫长的,包含了从评论、填表、同意到等待(成果)的进程。也许有些(程序员)曾涉入(这个进程),但在途中仍是被驳回了。其他人肯能单纯地不想阅历走程序的噩梦。”

结语:把握快速切换快捷键

尽管咱们希望前途光明,但这个方法能够处理当务之急。

Windows用户:在线表单中按F10可快速切换全角半角字符。

Mac用户:全角、全角片化名按Control + k。半角、半角化名按Control + ;。按Control + Space 还会给一个言语选项列表,包含半角和全角化名(假如Mac上安装了日语)。

关于Mac用户来说,还有两个小技巧(由Christopher J. Green of J Tech Solutions K.K.共享):

1. 输入化名或全角字符,但要一个英文单词,MacOs只需按“fn”+F10。详见:youtu.be/12XbfouHmaA

2. 输入半角字符但想轻松切换至全角字符,只需按“fn”+F6、F7、F8、F9或F10。详见:youtu.be/nhqqN_3XiuM