.NET Framework 中的 Unicode

更新:2007 年 11 月

.NET Framework 使用 Unicode UTF-16(Unicode 转换格式,16 位编码形式)来表示字符。在某些情况下,.NET Framework 在内部使用 UTF-8。

“Unicode 标准”是用于字符和文本的通用字符编码方案。它为世界上的书面语言中使用的每一个字符赋予一个唯一的数值(称为码位)和名称。例如,字符“A”由码位“U+0041”和名称“LATIN CAPITAL LETTER A”表示。有 65,000 个以上的字符有值,并且还有再支持多达一百万个字符的余地。有关更多信息,请参见位于 <externalLink><linkText>Unicode home page</linkText><linkUri>https://go.microsoft.com/fwlink/?linkid=37123</linkUri></externalLink>(Unicode 主页)的“Unicode Standard”(Unicode 标准)。

以往,不同区域性的不同语言要求迫使应用程序在内部使用不同的编码方案表示数据。这些不同的编码方案迫使开发人员为操作系统和应用程序创建零碎的基本代码,如用于欧洲语言的单字节版本、用于亚洲语言的双字节版本以及用于中东语言的双向版本。这种零碎的代码库使得难以在不同的区域性之间共享数据,并且对于开发支持多语言用户界面的全球通用应用程序来说尤为困难。

Unicode 数据编码方案简化了开发全球通用应用程序的过程,因为它允许用单个编码方案来表示世界上使用的所有字符。应用程序开发人员不必再跟踪用于产生特定语言字符的编码方案,并且数据可以在世界上的各系统之间共享而不会受到损坏。

请参见

概念

为基类型编码

其他资源

编码和本地化