QlikView - 网页文件


QlikView 可以处理来自 Web 的 HTML 格式文件。它可以从 HTML 表格中提取数据。要处理的 Web 文件的 URL 作为输入给出,QlikView 会获取文件的结构和内容。然后,它分析页面的结构,从页面中存在的 HTML 表中提取相关数据。我们从脚本编辑器的“数据”选项卡下的“来自文件的数据”部分中选择“Web 文件”选项。

1_webfile_load

将 URL 作为输入

选择 Web 文件选项后,我们会看到一个新窗口,可将 URL 作为输入。在此示例中,我们选择亚洲主权国家和附属领土列表作为维基百科的输入页面。提及 URL 并单击“下一步”。

网络文件向导

从 Web 文件中选择表

打开所选的 Web 文件时,会出现如下所示的窗口。在这里,我们可以看到网页中存在的各种表,标记为@1、@1、@3 等。选择第一个表并单击“下一步”两次。

3_webfile_文件类型

选择表的列

从上表中,我们可以通过使用十字号删除不需要的列来仅选择我们需要的列。

4_webfile_choose_fields

加载脚本

将文件加载到 QlikView 中是通过加载脚本完成的,可以在下面给出的屏幕截图中看到。因此,当我们使用任何分隔文件时,我们可以根据文件格式调整下面给定的脚本。

5_webfile_load_script

现在脚本向导提示以 *.qvw 文件扩展名的形式保存文件。它要求您选择需要保存文件的位置。单击“下一步”继续。现在是时候查看从 Web 文件加载的数据了。我们使用Table Box工作表对象来显示此数据。

创建表格框

是一个工作表对象,用于将可用数据显示为表格。它是从菜单Layout → New Sheet Object → Table Box调用的。 表框选项

单击下一步后,我们可以选择从表框中选择字段。您可以使用升级或降级按钮重新排列字段。

6_webfile_table_box_fields

表框数据

完成上述步骤后,将出现“表格框工作表对象”,其中显示从 Web 文件读取的数据。标记非英文字符!

7_webfile_final_data