如何解决用 Beautiful Soup 抓取网页却得到乱码的问题

2025-03-21 08:57:00
推荐回答(1个)
回答1:

可能编码识别错了,建议创建soup对象时手动把正确的编码传过去,国内的网站编码主要是gb2312和utf8,对于大部分非utf8编码中文网站可以用gb18030通吃 > > > encoding = "gb18030" > > > soup = BeautifulSoup(page, fromEncoding=encoding)