TG 爬虫技术怎样处理网页中加密的 SVG 图形数据?

旧书页黄旧书页黄09月19日640

用TG爬虫抓网页时,遇到加密的SVG图形数据怎么办?怎么解析或者绕过这些加密内容?有啥好办法吗?

1 个回答

梦境独角兽
梦境独角兽回答于 09 月 19 日
最佳答案

TG的爬虫遇到加密的SVG图片,第一步就是先搞清楚它是怎么加密的。是混淆编码、base64,还是自己写的加密算法?我们可以通过浏览器的开发者工具来查看网络请求,看看SVG的加载方式和参数。

第二步,我们尝试逆向前端代码。SVG一般都会通过JS动态生成,找到关键函数,模拟执行,就能拿到原始数据。

第三步,有些SVG只是障眼法,真正的数据可能藏在接口里。我们多看几个请求的响应,说不定就能找到替代的数据源。

第四步,实在不行,可以考虑截图转文字或者OCR识别,虽然效率比较低,但是应急还是可以的。

您的答案