博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
字符编码总结
阅读量:7049 次
发布时间:2019-06-28

本文共 1049 字,大约阅读时间需要 3 分钟。

字符编码发展: ASCII 255 1个字节 1980 gb2312 1995 GBK1.0 2000 GB18030 Unicode 英文1byte,欧洲2bytes,中文3bytes utf-8可变长,英文单词存的是ASCII码,1byte;中文存的是Unicode,3bytes 不同编码格式之间的相互转换:   转换规则:python2和python3中不同编码格式之间的相互转换都要经过Unicode   转换方法:先decode(’编码格式‘)转成Unicode在encode(’需要传换成的编码格式‘) 注意:python所有的数据类型都是Unicode,-*- coding:utf-8 -*-声明的是文件编码格式
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 # Author:James Tao 4  5 import sys 6  7 print('默认编码格式为',sys.getdefaultencoding())#显示默认编码格式 8  9 s='你好'#s的格式依然是Unicode,所以s.decode不存在10 11 print('s经过gbk编码之后得到',s.encode('gbk'))12 print('s经过utf-8编码之后得到',s.encode('utf-8'))13 print('s经过utf-8编码,再解码成Unicode,再经过gb2312编码之后得到',s.encode('utf-8').decode('utf-8').encode('gb2312'))14 print('s经过gb2312编码之后得到',s.encode('gb2312'))15 16 s_gbk=s.encode('gbk')#gbk编码,python3默认再转成bytes类型17 print('s:',s)18 print('s经过gbk编码之后得到:',s_gbk)19 print('s经过utf-8编码之后得到:',s.encode())20 21 gbk_to_utf8=s_gbk.decode('gbk').encode('utf-8')#先将gbk转成Unicode再转成utf-822 print('将gbk转换成utf-8后的s:',gbk_to_utf8)
 

得到结果:

 

 

转载于:https://www.cnblogs.com/BIT-taozhen/p/9769724.html

你可能感兴趣的文章
控制属性修改时间,控制时间,联合主键
查看>>
android-包签名
查看>>
Android开发和调试必备工具-SDK Tools
查看>>
JSON.parse()和JSON.stringify()
查看>>
Ehcache 使用
查看>>
Supported Values for @SuppressWarnings(转)
查看>>
PowerShell自定义对象
查看>>
安卓模拟器BlueStacks 安装使用教程(图解)
查看>>
Storm ack和fail机制再论
查看>>
android开机动画(bootanimation)
查看>>
【LeetCode】107. Binary Tree Level Order Traversal II (2 solutions)
查看>>
《微软的软件测试之道》读书笔记 之 结构测试技术
查看>>
ASP.NET中Session的个人浅谈
查看>>
数学图形之Kuen Surface
查看>>
发RTX通知
查看>>
读《C# 和 Java 的比较》有感
查看>>
魅族的“火爆”预定表示“呵呵呵”-不要怪我拆穿
查看>>
ESXi 5.5 解决 cannot edit the settings of virtual machines of version 10
查看>>
【BZOJ】3399: [Usaco2009 Mar]Sand Castle城堡(贪心)
查看>>
深入理解Java:注解(Annotation)自定义注解入门
查看>>