PDC与最后的恐慌者
恿装纬督一、字符/Character对用户可见的“一个字符”通常是我们在屏幕上看到的一个字母、数字、emoji 或组合字符。比如a、é、???????????二、字符编码标准/字符集字符编码标准定义的是如何将字符映射到唯一编码常见的字符编码标准比如ASCII、Unicode、GBK等2.1 ASCIIASCII7位定义了 128 个字符的唯一编码包括数字0到9、小写字母a到z、大写字母A到Z以及常用标点符号等。2.2 UnicodeUnicode又叫万国码目标是为所有字符定义唯一编码Code Point。为了解决ASCII/GBK不能定义全部字符的问题。比如a - U0061?? - U1F468注意Unicode只负责分配码位Code Point并不决定具体的存储形式。Unicode的前 128 个码点与ASCII相同。2.2.1 Code PointCode Point也叫码位Unicode中为每个字符分配的唯一编码。一个字符可以对应一个或多个Code Point比如aU0061对应 1 个Code Point???????????U1F468 (??) U200D (ZWJ) U1F469 (??) U200D (ZWJ) U1F467 (??) U200D (ZWJ) U1F466 (??)对应 7 个Code PointéU00E9或U0065 U0301备注在Unicode中é实际上有两种表示方式单一字符表示法即直接使用U00E9这个单独的Unicode码位表示é。组合字符表示法使用U0065字母e和U0301重音符号两个Unicode码位来表示一个é字符。为什么会有这两种表示法历史原因Unicode设计时考虑到了不同语言的需求许多语言如法语、西班牙语等使用带有重音符号的字符因此Unicode同时支持这两种表示方式。兼容性一些旧的系统或字体可能只支持分解字符表示法因此Unicode也保留了这种组合字符的方式以提高兼容性。2.2.2 Code UnitCode Unit也叫码元代码单元表示计算机中实际存储Unicode的基本单位取决于编码方式。比如UTF-8 Code Unit是 1 字节8 Bit比如a在UTF-8编码下占 1 个字节表示为0x61。UTF-16 Code Unit是 2 字节16 Bit比如a在UTF-16编码下占 2 个字节表示为0x0061。UTF-32 Code Unit是 4 字节32 Bit比如a在UTF-32编码下占 4 个字节表示为0x00000061。三、字符编码方式字符编码方式决定了字符如何存储、传输和解码常见的编码方式有UTF-8、UTF-16、UTF-32等UTF-8可变长度用 1 到 4 个字节来存储 Unicode 字符为了节省存储资源。UTF-16可变长度用 2 或 4 个字节存储字符。UTF-32固定长度每个字符始终使用 4 字节存储。比如é的Code Point是U0065 U0301当以UTF-32方式编码时每个Code Point未超过4字节所以表示为0x000000650x00000301当以UTF-16方式编码时每个Code Point未超过2字节所以表示为0x00650x0301当以UTF-8方式编码时0x0301值超过了128需要按UTF-8格式拆分为0xCC0x81所以表示为0x650xCC0x81QUTF-8编码为什么是按128做比较按理说1字节0xFF表示的最大值是255A有两个原因一是为了与ASCII兼容ASCII只支持了128个字符编码在UTF-8编码中前128位与ASCII编码相同二是UTF-8编码中会将第一个字节的高位部分用来标识这个字符的编码长度具体为0xxxxxxx表示 1 字节字符ASCII 范围110xxxxx表示 2 字节字符1110xxxx表示 3 字节字符11110xxx表示 4 字节字符在这里插入图片描述

相关新闻

openclaw在window上的安装记录

openclaw在window上的安装记录

安装 此教程可以安装node.js,git和openclaw此教程比较全面,包括安装飞书赋予full权限。在用户目录下,找到.openclaw/openclaw.json文件,修改tools中的值为full。即"tools": { "profile": "full" }…

2026/5/17 10:26:10 阅读更多 →
AI产品经理必备秘籍!30本精选实战宝典,看完助你吊打面试官

AI产品经理必备秘籍!30本精选实战宝典,看完助你吊打面试官

前言: 本文整理了一系列产品经理专业书籍推荐清单,涵盖电商、AI、数据、硬件等领域的产品设计与管理方法论,包括《业务中台产品搭建指南》《人工智能产品经理》《数据中台产品经理》等30本精选书籍。这些书籍从实战角度出发,系统介…

2026/5/17 10:26:07 阅读更多 →
Check Point 156-215.81 認證考試介紹:CCSA 認證詳解、考試內容與備考指南

Check Point 156-215.81 認證考試介紹:CCSA 認證詳解、考試內容與備考指南

在企業網絡安全領域,防火牆與威脅防護設備扮演著至關重要的角色。作為全球知名的網絡安全廠商,Check Point Software Technologies 提供了一整套完整的安全產品與專業認證體系。其中 156-215.81 考試 是獲得 Check Point Certified Security Administrat…

2026/7/4 11:41:40 阅读更多 →

最新新闻

AutoRaise:彻底改变macOS窗口管理的鼠标悬停自动聚焦神器

AutoRaise:彻底改变macOS窗口管理的鼠标悬停自动聚焦神器

AutoRaise:彻底改变macOS窗口管理的鼠标悬停自动聚焦神器 【免费下载链接】AutoRaise AutoRaise (and focus) a window when hovering over it with the mouse 项目地址: https://gitcode.com/gh_mirrors/au/AutoRaise 你是否厌倦了在多个窗口间频繁点击切换…

2026/7/4 14:32:06 阅读更多 →
Lemos零代码构建智能知识图谱

Lemos零代码构建智能知识图谱

Lemos智能图谱知识库与免费且可本地部署的知识库(如部分开源Wiki、笔记软件)的核心区别在于其底层架构从“静态文档库”升级为“AI驱动的动态知识网络”,这带来了在知识组织、处理、应用及协作层面的系统性优势。 对比维度免费/本地部署的传…

2026/7/4 14:32:06 阅读更多 →
LV30条码扫描器与PIC18F86J11微控制器集成方案

LV30条码扫描器与PIC18F86J11微控制器集成方案

1. LV30条码扫描器与PIC18F86J11微控制器的技术背景 LV30是一款工业级线性影像式条码扫描引擎,采用先进的CMOS图像传感器技术,能够以每秒1000次扫描的频率捕获条码图像。与传统的激光扫描器相比,它的核心优势在于能够处理各种特殊介质上的条码…

2026/7/4 14:30:05 阅读更多 →
基于HSV颜色空间的人民币面值自动识别系统开发

基于HSV颜色空间的人民币面值自动识别系统开发

1. 项目概述 人民币面值自动识别系统是一个典型的数字图像处理应用场景。我在实际开发中发现,相比传统OCR技术,基于RGB颜色分量的识别方法在特定场景下具有独特优势。这种方法不依赖复杂的字符识别算法,而是通过分析纸币的主色调特征来实现快…

2026/7/4 14:30:05 阅读更多 →
国产API测试工具横向评测:Apifox、YApi、Eolinker深度对比与选型指南

国产API测试工具横向评测:Apifox、YApi、Eolinker深度对比与选型指南

1. 项目概述:为什么我们需要关注国产API测试工具? 在软件开发领域,API(应用程序编程接口)早已成为系统间通信的基石。无论是微服务架构下的内部调用,还是面向合作伙伴或公众的开放平台,API的质量…

2026/7/4 14:30:05 阅读更多 →
WAM与VLA泛化性对比:六个可测量的工程变量拆解

WAM与VLA泛化性对比:六个可测量的工程变量拆解

1. 这个问题不是“泛化性谁更强”,而是“你在问谁的泛化性” “WAM 泛化性真的比 VLA 更强吗?”——这句话一出来,我就在实验室白板上画了个三层圈:最外层是“WAM”,中间是“VLA”,最里层是“泛化性”。然后…

2026/7/4 14:30:05 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻