TG 爬虫技术怎样处理网页中的 Flash 内容数据提取?

如何用TG抓取网页Flash内容?有什么好方法?总是抓不到数据。

1 个回答

咖啡机蒸汽
咖啡机蒸汽回答于 09 月 18 日
最佳答案

首先,TG爬虫本身不支持Flash,现在浏览器基本都快抛弃它了。Flash的内容通常都封装在SWF文件中,普通的网页结构是解析不了的。

如果非要提取,可以试试下面几种方法:

一、找Flash接口,很多Flash的数据都是外部加载的,找到接口直接请求JSON或者XML数据即可。

二、用工具把SWF反编译出来,看有没有数据源路径,比如ActionScript代码中可能藏着地址。

三、借助第三方库模拟浏览器环境,比如Pyppeteer或Selenium,但是对Flash的支持也不太好。

四、如果数据是实时更新的,不如关注后端接口,很多前端用Flash只是展示,真实数据走AJAX。

但说真的,现在项目能不用Flash就别用了,维护起来太麻烦了。

您的答案