TG 爬虫技术怎样处理网页中加密的 SVG 图形数据?
1 个回答
TG的爬虫遇到加密的SVG图片,第一步就是先搞清楚它是怎么加密的。是混淆编码、base64,还是自己写的加密算法?我们可以通过浏览器的开发者工具来查看网络请求,看看SVG的加载方式和参数。
第二步,我们尝试逆向前端代码。SVG一般都会通过JS动态生成,找到关键函数,模拟执行,就能拿到原始数据。
第三步,有些SVG只是障眼法,真正的数据可能藏在接口里。我们多看几个请求的响应,说不定就能找到替代的数据源。
第四步,实在不行,可以考虑截图转文字或者OCR识别,虽然效率比较低,但是应急还是可以的。