TG 爬虫技术怎样处理网页中动态加载的 SVG 图形数据提取?

量子风筝量子风筝09月19日280

用TG爬虫抓网页上的SVG图,但是图是动态加载的,怎么抓呢?有办法吗?

1 个回答

咖啡机蒸汽
咖啡机蒸汽回答于 09 月 19 日
最佳答案

SVG 图是动态加载的,说明不是一开始就写在 HTML 里的,而是用 JS 后面生成的。

如果用 TG 爬虫,可以从以下几个方向考虑:

1. 打开浏览器开发者工具(F12),看 SVG 是从哪个接口请求的,找到对应接口后直接用 TG 调接口拿数据。

2. 如果 SVG 是前端动态渲染的,可以考虑用 TG 的无头浏览器功能,如 Puppeteer 或 Playwright,等页面加载完成后再提取 SVG 内容。

3. 注意 SVG 数据有时会压缩或转义,提取后可能需要做一些格式处理才能用。

实际操作多调试几次应该就可以解决。

您的答案