-
继续Big编码的扩展隐射及解决方法
关于香港那边的编码相关的东西。在拷贝出来的文本中出现了 \uF6EA 专业的字符, \uF6EA(U+F6EA)属于 Unicode 的私用区(PUA)。PUA 字符经常是从 Big5 / HKSCS / 厂商扩展表映射过来的,也就是说某次把字节按 Big5/HKSCS 等映射到 Unicode 时,映射表把某个 Big5 扩展码位映射成了 U+F6EA,这说明在导出/复制/粘贴的某个环节使用了带扩展的 Big5 映射(或类似厂商映射),而在你当前查看、希望得到简体字的环境里则应当把原始字节用 GBK/GB18030/CP936 解回去
Date: 2025-12-03 View: 1520
-
用AI生成的一段穷举编码转换的java代码
从一个数据库导入数据到另外一个数据库的时候,发现了很多中文都是乱码,为了搞清楚这些乱码的可能编码转换关系,用AI生成了一段检查代码。果然找到了正确的编码转换关系
Date: 2025-12-02 View: 1520
