天涯论坛

 找回密码
 立即注册
搜索
查看: 112|回复: 5

抓取网页数据,上班亦能看股票

[复制链接]

3107

主题

176

回帖

9909万

积分

论坛元老

Rank: 8Rank: 8

积分
99098703
发表于 2024-7-9 19:06:26 | 显示全部楼层 |阅读模式

小伙伴们,你还好吗?

今天老祝和大众一块学习一个导入网页数据的技巧。

非常多时候,咱们必须将网页中的数据导入到Excel里做进一步的分析汇总,例如每日的股市行情、外汇牌价、开奖信息等等。

接下来咱们演示一下,从下面这个网页中导入中国银行的每日外汇牌价。

在这个网页中,外汇牌价的信息一共有10页,倘若运用Excel 初期版本中的导入网页数据功能,默认只能导入第1页的信息。

接下来咱们以Excel 2019为例,说说导入所有10页信息的详细操作过程。

过程1

依次单击【数据】→【自网页】,输入以下网页链接:

https://www.boc.cn/sourcedb/whpj/index_1.html

在【导航器】对话框中选取 Table 0,将数据加载到Power Query编辑器。

重视此时只加载了第1页的信息,还必须咱们进一步的处理一下。

过程2

单击【高级编辑器】按钮,弹出【高级编辑器】对话框。在let语句之前添加以下内容,将查找转换为参数化的函数:

(page as number)  as table=>

据述这个两个as语句指的是定参数类型的,这儿咱们先暂时记住这般用。

接下来将url中暗示页面的数值“1”替换为以下内容,来构建一个动态的查找参数字符串:

" & Number.ToText(page) & "

单击【完成】按钮,会显现这般的界面:

过程3

接下来要生成一组序号,做为刚才定义的函数的页码参数。

在左侧的查找列表中单击右键,新建空查找在【高级编辑器】里输入以下内容:

{1..10}

这儿的10,能够按照实质页码数来确定。最后单击【到表】按钮,转换为Table。

过程4

双击查找叫作“Table 0”,输入一个容易记忆的名叫作例如“ Web”

过程5    

在“查找1”中添加自定义列:

=Web([Column1])

过程6

因为咱们定义的页数比网页中的实质页数要多,因此最后一行显现了错误值,必须先将其删除,而后再展开数据,加载到工作表中。

最后,咱们还能够依次单击【数据】→【所有刷新】→【连接属性】,设置一下刷新频率,使Excel能够根据指定的时间在后台自动刷新:

今天咱们的内容便是这些吧,祝小伙伴们和家人安好~~

图文制作:祝洪忠





上一篇:网站移植抓取技术,泄漏访客手机号码售价1元1条
下一篇:网站只收录首页,其他页面不收录怎么处理-AI推联盟
回复

使用道具 举报

0

主题

1万

回帖

1

积分

新手上路

Rank: 1

积分
1
发表于 2024-9-7 05:12:36 | 显示全部楼层
软文发布平台 http://www.fok120.com/
回复

使用道具 举报

3048

主题

2万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109040
发表于 2024-10-8 04:48:17 | 显示全部楼层
你的见解真是独到,让我受益良多。
回复

使用道具 举报

2996

主题

3万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109194
发表于 2024-10-12 06:16:18 | 显示全部楼层
对于这个问题,我有不同的看法...
回复

使用道具 举报

2946

主题

2万

回帖

9997万

积分

论坛元老

Rank: 8Rank: 8

积分
99979427
发表于 2024-10-16 18:13:59 | 显示全部楼层
软文发布平台 http://www.fok120.com/
回复

使用道具 举报

3089

主题

3万

回帖

9909万

积分

论坛元老

Rank: 8Rank: 8

积分
99098770
发表于 昨天 23:09 | 显示全部楼层
期待楼主的下一次分享!”
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|天涯论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-23 00:32 , Processed in 0.377714 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.