#星座剖析团#
今日头条主题活动星座剖析团,大家找一个星座剖析的网址试一下,看一下能否抓数据。
就这个吧,照片看上去萌萌哒的。
网站数据分析
网站防护做的好呀,没有办法见到数据,只有从网站地址剖析下手了。
一般来说,网址可以根据一些查询主要参数,来完成查询的,大家就撰写查询函数来抓数据,有一些网址干了url静态数据化,我们可以立即依据展示出的静态数据url来抓。
这类爬取是最容易的,可是又最不便,由于需看Html代码,从代码中寻找要的数据。
上面的图片中给予了每个星座的url,也有相匹配运程查询。我们要做的便是把上边的2段代码拷贝出去,搞好爬取提前准备,获取出星座url和运程url。
像这种的內容:
及其:
这一环节便是最主要的文本处理,最先用Web.BrowserContents函数载入html文字,随后分拆出我们要的那一段代码,可以用Text.Split函数。还可以同时到html文字中拷贝必须的代码段。
Power Query就这一点比较好,数据可视化实际操作,为了更好地之后可以自动更新数据,大家也需要区别,这一数据是否变量定义,如果是常量,大家拷贝就没什么问题,假如会转变,那么就最好用从根源逐渐就用函数与公式计算,确保更新数据时不可能产生问题。
大家也是要一些文字,因此立即用html表格就可以。
都不用界定函数,立即加上列就可以爬取。
抓取
通过以上的剖析,大家可以直接用自定列爬取数据:
你能说这一Html.Table函数的主要参数不会写,实际上我就不容易,这一没事儿,可以试抓一页,让指导自动生成,随后大家拷贝回来就好了:
随后看代码:
大家把前二行融合到一行就可以了。
最终大家看搞好的数据:
一样的大道理,我们可以尝试抓明日运程,一周运程这些,也不做讲解了。
最终或是做一个数据可视化图型看一下:
★《布宫号》提醒您:民俗信仰仅供参考,请勿过度迷信!