TG 爬虫技术怎样处理网页中动态加载的 SVG 图形数据提取?
1 个回答
SVG 图是动态加载的,说明不是一开始就写在 HTML 里的,而是用 JS 后面生成的。
如果用 TG 爬虫,可以从以下几个方向考虑:
1. 打开浏览器开发者工具(F12),看 SVG 是从哪个接口请求的,找到对应接口后直接用 TG 调接口拿数据。
2. 如果 SVG 是前端动态渲染的,可以考虑用 TG 的无头浏览器功能,如 Puppeteer 或 Playwright,等页面加载完成后再提取 SVG 内容。
3. 注意 SVG 数据有时会压缩或转义,提取后可能需要做一些格式处理才能用。
实际操作多调试几次应该就可以解决。