python编码问题无法复现_Python编码问题详解
1. 基本概念
字符集(Character set)
解释:文字和符合的总称
常见字符集:
Unicode字符集
ASCII字符集(Unicode子集)
GB2312字符集
编码方法(Encoding)
解释:将字符对应到字节的方法,部分字符集和编码方法名称一样。
常见编码方法:
UTF-8:可对Unicode字符进行编码
GB2312
ASCII
编码(Encode)
解释:将字符集中字符按照一定规则转换成字节
解码(Decode)
解释:与编码相反,将字节转换为字符集中的字符
字符集与编码方法的关系
每个字符集都有对应的编码方法
一种字符集可能有多种编码方法
不同的编码方法得到的字节不同,占用存储空间也不一样
例如Unicode字符可以使用UTF-8/ASCII/GBK等方法编码
Unicode字符集包含世界上大部分字符,很多其他字符集有的字符它都有,是他们的超集
大部分字符集可以理解为Unicode的子集
实际上,除了Unicode之外所谓的字符集主要是对Unicode部分字符编码而已(定义编码方式)
一种编码不必支持Unicode的所有字符(通常把它能支持的那部分称为它的字符集)
2. 关于编码的错误和解决方法
在开发过程中,我们所接触的字符集大多都是Unicode,大部分报错都是关于编码和解码的。
2.1. 编码错误UnicodeEncodeError
2.1.1. 错误分析
导致该错误的原因通常是编码方法支持的Unicode字符不全;在工作中,你写了一个txt中文文档,想用ascii编码去保存这个文件,就会报这种错误。
错误复现:
我们知道ascii不支持字符中,那我们用ascii编码方法对Unicode码中进行编码:
# -*- encoding: utf-8 -*-
u"中".encode(encoding='ascii')
报错如下:
UnicodeEncodeError: 'ascii' codec can't encode character '\u4e2d' in position 0: ordinal not in range(128)
这是一个UnicodeEncodeError 类型的错误,提示无法使用指定的编码方法对字符进行编码,报错提示中可以得到3个信息:
当前使用的是acsii编码方法
被编码的字符是'\u4e2d'
ascii编码方法能支持的字符有128个
有时候我们还可以利用这个提示查看编码方法支持的字符个数:
# -*- encoding: utf-8 -*-
u"中".encode(encoding='iso-8859-1')
报错:
UnicodeEncodeError: 'latin-1' codec can't encode character '\u4e2d' in position 0: ordinal not in range(256)
通过报错提示可以看出iso-8859-1能编256个字符。
接着,我们来看下用支持中文的utf-8 编码方法进行编码能得到什么结果:
# -*- encoding: utf-8 -*-
s = u"中".encode(encoding='utf-8')
print("s: ", s)
print("s == 中?" , s == '中')
print("type of s: ", type(s))
print("str==bytes? ", bytes == type(s))
输出:
('s: ', '\xe4\xb8\xad')
('s == \xe4\xb8\xad?', True)
('type of s: ',
关于找一找教程网
本站文章仅代表作者观点,不代表本站立场,所有文章非营利性免费分享。
本站提供了软件编程、网站开发技术、服务器运维、人工智能等等IT技术文章,希望广大程序员努力学习,让我们用科技改变世界。
[Python编码问题详解]http://www.zyiz.net/tech/detail-130713.html
相关文章:

重新开始 2011/11/25
在csdn上写过几篇文章,始终没有坚持下来,也是由于自己没有一个明确的目标的缘故;当自己感觉乱的时候,总是想改变点东西,重新开始,改变了博客类的东西就真的能重新开始吗?现在我想换个博客就换个…

【转载】springboot:如何优雅的使用mybatis
这两天启动了一个新项目因为项目组成员一直都使用的是mybatis,虽然个人比较喜欢jpa这种极简的模式,但是为了项目保持统一性技术选型还是定了 mybatis。到网上找了一下关于spring boot和mybatis组合的相关资料,各种各样的形式都有,…

c3p0连接池用法
使用连接池的时候并不是在代码中不用获取/释放数据库连接,而是在代码中向连接池申请/释放连接,对于代码而言,可以把连接池看成数据库。 换句话说,连接池就是数据库的代理,之所以要使用这个代理是因为直接向数据库申请/…

我所理解的字符编码
1,Ascii和ebcic. 为了方便交流,美国人发明了ASCII编码,后来被确认为国际标准。后来以发明了EBCDIC编码。 一般地说,开放的操作系统(LINUX 、WINDOWS等)采用ASCII 编码,而大型主机系统࿰…

void函数调用时显示不允许使用不完整的_C语言的角落——这些C语言不常用的特性你知道吗?...
变长参数列表头文件定义了一些宏,当函数参数未知时去获取函数的参数变量:typedef va_list宏:va_start()va_arg()va_end()va_list类型通过stdarg宏定义来访问一个函数的参数表,参数列表的末尾会用省略号省略 (va_list用来保存va_st…

centos下为firefox安装flash插件的几种方法
首先去官网去下载RPM格式的安装包,比如:flash-plugin-11.1.102.55-release.i386.rpm,默认下载位置是该用户的下载文件夹。 方法一:用gnome 双击该文件,按提示操作即可。 方法二:命令行,在该文件…
eoLinker AMS 专业版V3.3发布:分享项目可以测试并选择分享内容等
eoLinker AMS是集API文档管理、API自动化测试、开发协作三位一体的综合API开发管理平台,是中国最大的在线API管理平台。目前eoLinker AMS已经为来自全球的超过两万家企业托管超过一百万的API,我们感谢每个曾经以及正在支持我们的企业以及开发者朋友&…

MyBatis基础-CRUD
一、mybatis 环境搭建步骤 第一步:创建 maven 工程第二步:导入坐标第三步:编写必要代码(实体类和持久层接口)第四步:编写 SqlMapConfig.xml第五步:编写映射配置文件第六步:编写测…
python答题系统的代码_Python考试系统自动答题(教务处)
要求 某学校要求登录教务处网站 做一个测试题 30分钟300道题,240分几个,题量不少,题还不好做。 研究发现原来在网站上有题库 但是一道题只有6s 的时间作答 边查边做时间不够 人生苦短,何不Python当歌? 来个自动答题的智…

((ios开发学习笔记九)) Simple TableView 实现(附 实例源码)
实现效果: 实现过程: Step One 创建单个窗体项目 Step Two 创建control 接口 Step Three 创建窗体和关联关系 Step four 实现table view 的接口 control 初始化选择数据 实现Data Source 部分 实现TableView委托部分 源码下载 TestTableView.zip转载于:…

24个为Web开发人员准备的CSS3实用教程
本文搜集了一些关于CSS3的最新教程。你可以根据这些教程或技术来实现网页设计,包括:文字阴影、圆角框、盒模型尺寸计算(box sizing)、透明效果处理、多重背景、边框图像等。以下这些都是非常实用的CSS3教程,提供了许多…

前端基础之JQuery
一、什么是JQuery [1] jQuery由美国人John Resig创建,至今已吸引了来自世界各地的众多 javascript高手加入其team。 [2] jQuery是一种新型的JavaScript库。jq是用js写的,能用jq实现,用js都能…

测试linux下磁盘的读写速率
1) 通过df -h命令查看磁盘情况Filesystem Size Used Avail Use% Mounted on/dev/sda4 289G 61G 214G 23% /tmpfs 7.8G 0 7.8G 0% /dev/shm/dev/sda2 969M 62M 857M 7% /boot/dev/sda1 …

multipart request_Request和Response
Response讲解7.1 Response简介定义辅助 servlet 将响应发送到客户端的对象。servlet 容器创建 ServletResponse 对象,并将它作为参数传递给 servlet 的 service 方法。 要发送 MIME 正文响应中的二进制数据,请使用 #getOutputStream 返回的 ServletOutpu…

SharePoint 客户端经常弹出Windows验证登录框问题
场景描述: Site工作人员UserA创建了一个Task,并且Assign给UserB。UserB接到来自Task List的邮件通知。这时UserA发现Assign的人错了,重新修改Task Item,将任务重新Assign给另外一个用户UserC,并且同时收回了UserB的访问…

SkFlattenable /Registrar/
/** \class SkFlattenableSkFlattenable is the base class for objects that need to be flattenedinto a data stream for either transport or as part of the key to thefont cache.*/ class SK_API SkFlattenable : public SkRefCnt {}以SkFlattenable为基类的对象是&…

启动 ServiceFabric Windows服务报1053
Remote Procedure Call (RPC) Locator和 Windows Firewall是否启动。 以管理员身份运行PowerShell,输入Unregister-ScheduledTask FabricCounters,然后输入Y。 到这一步基本OK了 右下角reset sf后查看是否存在 X:\SfDevCluster\Data\ImageStoreShare 文件…

Spring基础面试题(一)
Spring是什么?Spring是一个轻量级的IoC和AOP容器框架。是为Java应用程序提供基础性服务的一套框架,目的是用于简化企业应用程序的开发,它使得开发者只需要关心业务需求。常见的配置方式有三种:基于XML的配置、基于注解的配置、基于…

C#线程间操作无效: 从不是创建控件 XX 的线程访问它
转自:http://www.arasplm.net/index.php/zh/community/myblog/c-xx-.html 前些天做的要使用到线程的项目,现在和大家分享一下感受! 以下面小列子为例,给出这个问题的解决办法。下面的列子是以一个计数器为列讲解的。 public Form1…

boost安装_【环境搭建】源码安装Boost
写C的话boost是必不可少的,本文将boost的安装过程用写成脚本,直接一行命令解决整个编译安装过程:sudo bash boost-linux-installer.sh下面是boost-linux-installer.sh的内容:#!/usr/bin/env bash

css新闻列表优化-突破思维新方法更利于搜索引擎
效果图如下: 也许你会认为这个是很简单的,呵呵那是因为一般写这个列表的时候用的都是时间写在前面,标题写在后面,那样对于显示来说是先有时间后有标题的,对搜索引擎不是很友好。 老方法大概是这样的: html代…

STL使用记录
1,map 对map实在不熟。。。赶紧记录一下用法吧。 后来再发现新的用法再补充吧 定义: map<int, int> m; 其中的int可以为自定义的任何类型。 m[key值类型的变量] value值; 但是注意如果key值是自定义的结构体的话,一定要重载…

Linux tcpdump命令详解与Wireshark
简介 用简单的话来定义tcpdump,就是:dump the traffic on a network,根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过…

dubbo yml配置_利用springboot+dubbo,构建分布式微服务,全程注解开发(一)
随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。一、先来一张图说起 Dubbo,相信大家都不会陌生࿰…

treeview 保持选中状态
发现当treeview控件失去焦点的时候,会丢失选中状态的指示(条目的蓝色背景)。如果想要保持,只要设置treeview的一个属性即可: this.treeView1.HideSelection false; 但是,发现阴影很浅,但是聊胜…

1-2-Active Directory 域服务准备概述
参照: http://technet.microsoft.com/zh-cn/library/gg398869.aspx Active Directory 域服务准备概述 上一次修改主题: 2010-12-09 要为 Microsoft Lync Server 2010 部署准备 Active Directory 域服务 (AD DS),必须按照特定顺序执行三个步骤。 下表介绍…

iOS----------拨打电话的3种方式
iOS实现拨打电话的方式:方法一、requestWithURL,此方法拨打前弹出提示NSMutableString * string [[NSMutableString alloc] initWithFormat:"tel:%","136****0000"];UIWebView * callWebview [[UIWebView alloc] init];[callWebvi…

linux命令 iperf-网络性能测试工具
iperf命令是一个网络性能测试工具。iperf可以测试TCP和UDP带宽质量。iperf可以测量最大TCP带宽,具有多种参数和UDP特性。iperf可以报告带宽,延迟抖动和数据包丢失。利用iperf这一特性,可以用来测试一些网络设备如路由器,防火墙&am…

SearchHit转成java对象_Java开发中最常犯的10个错误,你中招了吗?
http://www.programcreek.com/2014/05/top-10-mistakes-java-developers-make/阅读目录Array转ArrayList判断一个数组是否包含某个值在循环内部删除List中的一个元素HashTable与HashMap使用集合原始类型(raw type)访问级别ArrayList和LinkedList可变与不可变父类和子类的构造方…

hdu1160FatMouse's Speed(DP)
http://acm.hdu.edu.cn/showproblem.php?pid1160 1A 破题敲了一个多小时 最长上升子序列和最长下降子序列合起来 并把路径保留下来 题中是可以打乱顺序去找的 先按W上升或S下降排下序 再按最升和最降做 View Code 1 #include <iostream>2 #include<cstdio>3 #inc…