注册娱乐账号 登陆娱乐平台 娱乐客户端
信博娱乐国际会所中心,信博娱乐注册欢迎您!图片
信博娱乐国际会所中心,信博娱乐注册欢迎您!
信博娱乐国际会所中心,信博娱乐注册欢迎您!官网

娱乐技巧

ISOorIEC 8859-1_

标题:ISOorIEC 8859-1 ISO / IEC 8859-1:1998,信息技术 - 8位单字节编码图形字符集 - 第1部分:拉丁字母编号1,是ISO / IEC 8859系列基于ASCII的标准字符编码的一部分,版本于1987年出版.ISO 8859-1编码它所称的“拉丁字母编号1”,由拉丁字母中的191个字符组成。这种字符编码方案遍及美洲,西欧,大洋洲和非洲的大部分地区。它也常用于大多数东亚语言的标准罗马化。它是最流行的8信博娱乐 位字符集的基础,包括Windows-1252和Unicode中的第一个字符块。 使用字符集标签ISO-8859-1对Windows-1252文本进行错误标记是非常常见的(在Internet上)。常见的结果是,所有引号和撇号(由文字处理软件中的“智能引语”产生)被非Windows操作系统上的问号或盒子替代,从而使文本难以阅读。大多数现代Web浏览器和电子邮件客户端将媒体类型字符集ISO-8859-1视为Windows-1252以适应这种错误标签。现在这是HTML5规范中的标准行为,它要求公布的ISO-8859-1文档实际上是用Windows-1252编码进行分析的[1]。 截至2018年4月[更新],所有网站中有4.1%声称使用ISO 8859-1(有关这两种编码的声明使用统计信息,请参阅Windows-1252)。[2]但是,这包括实际使用Windows-1252和/或UTF-8的未知页数,尽管使用了字符集标记,但浏览器通常都能识别这两个页面。 ISO-8859-1是补充了ISO / IEC 6429的C0和C1控制代码(参见下面的HTML5例外情况)的IANA首选名称。 IBM将其称为代码页819或CP819。下列其他别名是针对ISO-8859-1注册的:iso-ir-100,csISOLatin1,latin1,l1,IBM819。 Oracle称之为WE8ISO8859P1。[3] 对于除128?159(十六进制80至9F)范围以外的所有代码,Windows-1252代码页与ISO-8859-1一致,其中少量使用的C1控件被替换为附加字符,包括ISO- 8859-15。代码页28591 a.k.a. Windows-28591是实际的ISO-8859-1代码页。[4] 每个字符都被编码为一个八位代码值。这些代码值几乎可用于任何数据交换系统,以下列语言进行通信: ISO-8859-1通常用于某些语言[需要的引证],即使它缺少这些语言使用的字符。在大多数情况下,只有少数字母丢失或很少使用,并且可以使用某种形式的印刷近似替换为ISO-8信博娱乐平台859-1中的字符。下表列出了这些语言。 字母?在法文中只出现很少,从不在文字的开头,只有小写形式。与其大写形式相对应的插槽被来自德语的小写字母?占据,其本身很少以其大写形式使用。 对于上面列出的某些语言,正确的印刷引号缺失,因为只包含??,“”和“”。此外,此方案不提供面向(6或9形)的单引号或双引号。某些字体会将空格重音(0x60)和撇号(0x27)显示为一对匹配的单引号,但这不被视为现代标准的一部分。 ISO 8859-1基于数字设备公司(DEC)在1983年流行的VT220终端中使用的多国字符集。它是在ECMA(欧洲计算机制造商协会)内开发的,并于1985年3月作为ECMA-94发布[ 5]的名字,它仍然有时是已知的。 ECMA-94第二版(1986年6月)[6]也包括ISO 8859-2,ISO 8859-3和ISO 8859-4作为规范的一部分。 原始草案将法文和法文编码为215(0xD7)和247(0xF7)。然而,法国代表既不是语言学家也不是印刷术者,他们错误地指出,这些不是独立的法文字母,而是单纯的连字符(如fi或fl)。根据德国代表团的建议,这些代码点很快就被×和÷填充。然后,对于法语来说情况更糟糕,当时又错误地指出信?是“不是法国的”,导致首都?的缺席。事实上,这封信是用许多法国专有名称发现的,大写字母已用于字典和百科全书。[7]这些缺点后来在ISO / IEC 8859-15:1999以及之前的Windows-1252(1992,Windows 3.1x)中得到了改进。 1985年,Commodore采用ECMA-94作为其新的AmigaOS操作系统。[8]与Amiga 1000一起使用的Seikosha MP-1300AI冲击点阵打印机包含此编码。[需要的引证] 1992年,IANA注册了字符映射ISO_8859-1:1987,更多地以其首选的ISO-8859-1的MIME名称(注意ISO 8859-1的额外连字符)(ISO 8859-1的超集)在互联网上使用。该映射将C0和C1控制字符分配给未分配的代码值,从而通过每个可能的8位值提供256个字符。 ISO-8859-1(根据标准至少)是通过HTTP传递的文档的默认编码,其MIME类型以“text /”开头(但是HTML5规范要求实际分析作为ISO-8859-1公布的文档与Windows-1252编码)[9] [10]它是某些描述性HTTP头的值的默认编码,并定义了HTML 3.2文档中允许使用的字符集(HTML 4.0,但是,基于Unicode)。在没有语言环境或其他信息的情况下,这和Windows-1252通常被认为是Unix和Microsoft Windows上的文本编码,这只是逐渐被Unicode编码(如UTF-8或UTF-16)所取代。 在ECMA-94(1985)的第一版中,两个盒装代码点215(0xD7)和247(0xF7)仍未定义[5]。 传说: 通过替换范围为128到159(十六进制80到9F)范围内很少使用的C1控件,流行的Windows-1252字符集添加了ISO 信博娱乐/ IEC 8859-15提供的所有缺失字符以及一些印刷符号。即使数据实际上是Windows-1252编码,将字符数据与字符集标签ISO-8859-1错误标记也是很常见的。许多Web浏览器和电子邮件客户端将ISO-8859-1控制代码解释为Windows-1252字符,并且该行为后来在HTML5中标准化[11],以适应这种错误标签,并应小心避免产生这些ISO-8859-1标签内容中的字符。 Apple Macintosh计算机在1984年推出了名为Mac Roman或Mac-Roman的字符编码。它旨在适用于西欧的桌面出版。它是ASCII的超集,如ISO-8859-1,它具有ISO-8859-1中的大多数字符,但排列完全不同。后来的版本,在IANA上注册为“Macintosh”,用欧元符号替换了通用货币符号¤。在使用旧版Macintosh浏览器(包括Mac版的Internet Explorer的最新版本)编辑网站上的文本时,ISO 8859-1中的少数可打印字符在此设置中通常是麻烦的来源。但是,MacRoman支持Windows-1252在C1代码范围内的额外字符。 DOS具有代码页850,其具有ISO-8859-1具有的所有可打印字符(尽管布置完全不同)以及来自代码页437的最广泛使用的图形字符。 在1989年[12]和2015年之间,Hewlett-Packard在许多计算器上使用了ISO-8859-1的另一个超集。这种专有字符集有时也简称为“ECMA-94”。[12]