注意: 本文已完成其工作,随后将不再使用。 为防止出现“找不到页面”问题,我们将删除已知无效的链接。 如果创建了指向此页面的链接,请删除这些链接,以便与我们一起为用户提供通畅的 Web 连接。
在本教程中,你将使用 Excel 的Power Query体验创建从网页导入数据的查询。 在此过程中,你将在网页上的可用表之间导航,并应用数据转换步骤来仅显示想要查看的数据。 Power Query记录所有步骤,每当刷新数据时,都会重复这些步骤。
步骤 1:连接到维基百科页面
Excel 2016:在“数据”选项卡上,单击“从其他源 > Web新建查询 >”。 如果未看到 “新建查询 ”按钮,请单击“ 数据 > Web”。
Excel 2010-2013:在“Power Query”选项卡上,单击“从 Web”。 如果未看到“Power Query”选项卡,请确保已下载并安装Power Query加载项。
-
在“ 从 Web ”对话框中,将维基百科 URL (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship) 粘贴到 URL 文本框中。
-
单击“确定”。
建立与网页的连接后,可以在 “导航器 ”窗格中看到此维基百科页面上提供的表列表。 可以单击每个表以查看显示在右侧窗格中的快速预览。
-
双击“结果[编辑]”表,将打开包含锦标赛数据的查询编辑器。
步骤 2:调整数据
在查询编辑器中打开表后,可以清理和调整数据,使其符合你的需求。 在此步骤中,你将通过删除除 Year 和 Final Winners 之外的所有列来重塑数据。
-
在 “查询预览” 网格中,使用 Ctrl+单击 选择 “年份 ”和“ 最终获胜者 ”列。
-
单击“ 删除列 ”> “删除其他列”。
步骤 3:清理数据
在此步骤中,你将通过替换值并筛选数据来清理数据。
-
选择“ 年份 ”列。
-
在查询编辑器中,单击“替换值”。
-
在“ 替换值 ”对话框中,在“ 要查找的值 ”文本框中键入“详细信息”,并将“ 替换为 ”文本框留空。
-
单击“确定”。
步骤 4:筛选列中的值
现在,你将筛选 “年份 ”列以显示不包含“Year”的行。
-
单击 “年份 ”列上的筛选器下拉箭头。
-
在 “筛选器” 下拉列表中,取消选中“ 年份”。
-
单击“确定”。
步骤 5:命名查询
现在,可以命名已创建的查询。
在 “查询设置” 窗格中的“ 名称 ”文本框中,输入 “欧洲杯优胜者”。 如果单击“ 所有属性” 链接,还可以在“ 说明 ”文本框中输入查询说明。
步骤 6:将查询加载到工作表
最后,现在可以将 欧洲杯优胜者 查询加载到工作表中。
-
在左上角,单击“ 关闭 & 加载”。
Power Query会将查询结果返回到工作表。
如果需要稍后更新数据,请右键单击数据范围内的任意位置,然后单击“ 刷新”。 网页中的任何新信息都将自动更新。
步骤 7:了解幕后发生的情况
-
单击数据中的任意位置,然后在“ 查询 ”选项卡上单击“ 编辑”。
-
在右侧,请注意 “已应用步骤”列表。 执行查询活动时,已创建查询步骤。 每个查询步骤都有一个用“M”语言编写的相应公式。
-
下面是每个步骤的说明:
查询步骤 |
任务 |
公式 |
---|---|---|
源 |
连接到 Web 数据源 |
= Web.Page (Web.Contents (“http://en.wikipedia.org/wiki/UEFA_European_Football_Championship”) ) |
导航 |
选择要连接的表 |
= Source{2}[Data] |
已更改的类型 |
更改类型 - Power Query自动执行此操作 |
= Table.TransformColumnTypes (Data2,{{“Year”, type text}, {“Host”, type text}, {“”, type text}, {“Final Winner”, type text}, {“Final Score”, type text}, {“Final Runner-up”, type text}, {“2”, type text}, {“Third place match Third place”, type text}, {“Third place match Score”, type text}, {“Third place match Fourth place”, type text}, {“3”, type text}, {“Number of teams”, type text}) |
RemovedOtherColumns |
删除其他列 以仅显示感兴趣的列 |
= Table.SelectColumns (#“Changed Type”,{“Final Winner”, “Year”}) |
ReplacedValue |
替换值 以清理所选列中的值 |
= Table.ReplaceValue (#“Removed Other Columns”,“Details”,“”,Replacer.ReplaceText,{“Year”}) |
FilteredRows |
筛选 列中的值 |
= Table.SelectRows (#“Replaced Value”,每个 ([Year] <> “Year”) ) |
单击“Power Query”功能区中的“高级编辑器”选项,即可完整查看 M 代码。 有关 Power Query 公式语言的详细信息,请参阅了解 Power Query 公式。
需要更多帮助吗?
可随时在 Excel 技术社区中咨询专家或在社区中获取支持。