淘宝用Excel实现生意参谋爬虫,伪装登陆状态?
135****6276 |2020-08-31|11:37|发布在分类 / 生意参谋|阅读:547
135****6276 |2020-08-31|11:37|发布在分类 / 生意参谋|阅读:547
在自定义列公式中输入Json.Document(Web.Contents(url,[Headers=headers,Query=query]))先不要着急点确定,需要把url,headers,query这3个单词替换成上文整理好的3段对应代码需要用到M语言的几个函数:Json.Document() 用来解析Json代码Web.Contents(url,[Headers=headers,Query=query]) 用来获取页面数据首先找到想要爬取的数据,此文以爬取生意参谋-首页-整体看板的数据为例将3列选中(先点击第一列列名,选中第一列,按住Shift健,再选中最后一列),点击“转换”标签中的“逆透视列”按钮,进行逆透视点击“数据“选项卡-”新建查询“-”从其他源“-“空白查询”此时打开了查询编辑器(PowerQuery),现在需要一个自动生成时间戳的列点击双向箭头图标,可以把使用原始列名作为前缀前面的勾去掉,点击“确定”按钮继续点击双向箭头图标,点击“确定”按钮继续点击双向箭头图标,点击“确定”按钮点击右边的双向箭头图标,点击“确定”按钮在url和query代码中,需要把包含时间戳的字段进行替换,以识别成对应的单元格接下来我们需要获取3部分内容,URL,Headers,Query
这个问题还有疑问的话,可以加幕.思.城火星老师免费咨询,微V.信X号是为: msc633。
推荐阅读:
微信扫码回复「666」