python3 requests 遇到 illegal multibyte sequence问题

最新推荐文章于 2026-06-22 16:13:30 发布

原创最新推荐文章于 2026-06-22 16:13:30 发布 · 2.3k 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

爬虫专栏收录该内容

1 篇文章

订阅专栏

本文探讨了使用Python3进行网页抓取时可能遇到的编码问题，具体展示了如何使用urllib3库抓取百度首页，并处理了由于编码不匹配导致的UnicodeEncodeError异常。通过调整解码方式为'gbk'并设置错误处理为'ignore'，成功解决了问题。

用python3可能抓取可能遇到编码问题

# _*_ coding:utf-8 _*_
__author__ = 'zb'

import urllib3

http = urllib3.PoolManager()

r = http.request('GET','http://www.baidu.com/')

print (r.status)

print(r.data.decode())

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xbb’ in position 3654: illegal multibyte sequence

你可以用.decode(‘gbk’, errors=‘ignore’)来解码
如 print(r.data.decode(‘gbk’, errors=‘ignore’))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

A_102

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

requests请求报字符编码异常信息

猿小白的博客

06-08

2041

Traceback (most recent call last): File "C:/Users/aida_/Desktop/源码/pytest01/爱美女网/爱美女网.py", line 19, in <module> print(req) UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 17180: illegal multibyte sequence ...

Python request.get遇到的问题

qq_50000922的博客

02-26

3934

问题：404；动态加载；521；UnicodeEncodeError

3 条评论您还未登录，请先登录后发表或查看评论

关于requests报错UnicodeEncodeError: ‘gbk‘ codec can‘t encode character的解决，保证和别人的不一样哦

lhys666的博客

10-25

2322

昨天，本菜鸡想摘取（爬的美名）一些资料，代码如下 import requests url = 'https://blog.csdn.net/jkx521/article/details/100714226' headers = { 'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0' } req = requests.get(url=url, headers=h

（已解决）'gbk' codec can't encode character '\u2022' in position 545262: illegal multibyte sequence

fwpevil的博客

06-03

4万+

html=requests.get(url,headers=headers) html.encoding=('utf-8') with open('网页源代码.html','w')as f: f.write(html.text) 上面代码运行后报错：UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in po...

解决‘gbk‘ codec can‘t decode byte 0xaf in position 81: illegal multibyte sequence

suofer的博客

01-20

1万+

报错：gbk编码器不能解析位于81中字节0xaf：非法多比特序列显然是文件的编码和解码的格式不一致，所以解决办法是在open()函数中添加解码器格式与文件编码格式一致成功！

python3 爬取网页报错：'gb2312' codec can't decode byte 0xb5 in position 154969: illegal multibyte sequence

bull521的博客

05-07

3464

前几天需要在网页上爬取信息，就使用到了requests库爬取网页，其中遇到的比较大的坑则是中文编码。 python版本：3.72 操作系统：windows10 首先需要爬取网页信息。 def parse_url(url, callback): """ 根据url爬取页面，若成功则调用回调函数 :param url: 链接 :param callback: ...

icodeEncodeError: 'gbk' codec can't encode character '\xe5' in position 259: illegal multibyte seq问题

你微笑时很美的博客

12-27

3755

在保存网页信息时出现的标题错误 response=requests.get('http://www.runoob.com/w3cnote/python-ten-minute-introductory-tutorial.html') print(response.text) with open('python01.html','w+') as f: f.write(response.tex...

Python交互控制台：从REPL原理到IPython实战调试指南

weixin_33672109的博客

06-21

432

Python交互控制台本质上是Read-Eval-Print Loop（REPL）机制的实现，它将代码输入、实时求值与结果反馈构成闭环，是建立编程直觉的核心认知工具。其底层依赖CPython解释器引擎，但Read和Print层可被IPython、Jupyter等前端增强，从而支持语法高亮、智能补全、多行输入与内省调试。这种即时因果反馈能力，使其成为零基础入门、pandas数据清洗调试、API快速探索及Flask路由验证等高频场景的首选沙盒环境。掌握`python -i`、IPython和VS Code集成R

Python入门实战：从环境配置到自动化文件整理脚本

weixin_30482181的博客

06-08

430

Python是一种面向实际问题解决的通用编程语言，其核心价值在于将语法知识快速转化为生产力工具。理解解释器、pip包管理、虚拟环境和pathlib路径操作等基础原理，是构建稳定开发环境的技术前提；掌握文件系统遍历、条件分类与shutil移动等能力，则直接支撑日常办公自动化。这种‘任务驱动+即时反馈’的学习路径，显著区别于传统语法灌输，特别适合财务、运营、教师等非专业开发者快速上手。本文聚焦真实场景中的首个可运行脚本——下载文件夹智能归类器，覆盖Windows/macOS/Linux全平台配置、双击执行封装及

Windows下Python+PyCharm保姆级配置指南：避坑、清障与环境隔离

热门推荐

云水禅心的博客

08-01

56万+

今天，练习一个通过读取txt文本信息（英文版的Walden.txt），统计文本中的英文单词词频。在读取Walden.txt文本时，出现了“UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”错误提示。错误的意思是：Unicode的解码（Dec

python读取中编码错误（illegal multibyte sequence ）

FZUMRWANG的博客

10-05

9万+

读取中文txt文件时，经常会出现: ‘gbk’ codec can’t decode bytes in position 31023: illegal multibyte sequence。主要讲一种情况就是文章中含有utf-8或gbk无法编码的字符情况。好多人都说加入’ignore’，但一直都没有说清楚是在open函数中加入，还是在.read()中加入（其实是在open函数中加入，如下面例子...

illegal multibyte sequence 解决方法

YmeBtc的博客

10-11

9236

每天一点点，记录工作中遇到的问题，及实操可行 python response 解析网页时 ,gbk无法解码错误： UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaf in position 111: illegal multibyte sequence gbk编码，但是有多字符和特殊字符gbk无法解码解决方式1 右键–检查（或显示...

Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytein position 2: illegal multibyte sequence

innetdancer的博客

05-30

9897

错误的意思是：Unicode的解码（Decode）出现错误了，以gbk编码的方式去解码（该字符串变成Unicode），但是此处通过gbk的方式，却无法解码（can’t decode）.''illegal multibyte sequence"的意思是非法的多字节序列，也就是说无法解码了。比如有中文的存在，老老实实用 utf-8。文本中出现的一些特殊符号超出了gbk的编码范围，可以选择编码范围更广的‘gb18030’出现这样的错误，可能是要处理的字符串本身不是gbk编码，却是以gbk编码去解码。

Py中UnicodeDecodeError ~ :illegal multibyte sequence错误解决方案

m0_64910180的博客

03-15

400

Py中UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position8:illegal multibyte sequence错误解决方案。

python读取中编码错误（illegal multibyte sequence 、invalid start byte等错误）

mrx9520的博客

06-19

1576

t=open('D:\我的文档\下载\XXX.docx','r',encoding='GBK',errors='ignore')#errors='ignore'好多人都说加入’ignore’，但一直都没有说清楚是在open函数中加入，还是在.read()中加入（其实是在open函数中加入，如下面例子）。主要讲一种情况就是文章中含有utf-8或gbk无法编码的字符情况。

illegal multibyte sequence简单粗暴的解决方法

Vergilll的博客

06-28

1万+

UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xd0 in position 13131: illegal multibyte sequence 在爬取一个网站的时候发现gbk跟utf-8都无法解析换成了解析复杂度更高的“gb18030”也没用最后换成一个简单粗暴的方式直接在后面加一个“ignore”解决gbk ...

illegal multibyte sequence

zangbianer的博客

11-26

3万+

抓取数据时遇到的问题 gbk无法解码，illegal multibyte sequence 原因：1.utf-8编码 2.gbk编码，但是有多字符和特殊字符gbk无法解码解决方式：打开网页：F12 在console输入document.charset 查看编码方式确定编码方式后，如果是utf-8 就改编码语言，如果是gbk那么问题就出在第二项上解决方式：改用复杂度更高的gb18030，解码...

python——错误总结

qq_41440031的博客

07-21

325

①读取文件时，出现乱码或者UnicodeDecodeError: 'gbk' codec can't decode byte 0xXX in position XX: incomplete multibyte sequence错误原因： 1 中文字符乱入解决：在读取文件时，就指定编码方式如： f = open('C:\\Users\\taotao\\Desktop\\1.txt', encoding='utf-8') ...

python3 读取文件时，报编码错误（illegal multibyte sequence ）

hhd1988的专栏

11-11

5932

问题现象：有时当读取一个文件时，报出以下错误，很是捉急。 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 7205: invalid continuation byte 问题原因: 文件中含有utf-8或gbk无法编码的字符，或者是打开的编码不对。解决方法：解决方法一：用 utf-8 编码打开（实际文件的编码方式）如下：open('d:/data/synopses_list_wiki.tx..