Python - HTTP 数据下载


我们可以使用处理 ftp 或文件传输协议的 python 模块从服务器下载数据。我们还可以读取数据,然后将其保存到本地系统。

我们需要安装ftplib模块来实现这一点。

pip install ftplib

获取文件

我们可以使用getfile方法获取特定文件。此方法将文件的副本从远程系统移动到启动 ftp 连接的本地系统。

import ftplib
import sys
 
def getFile(ftp, filename):
    try:
        ftp.retrbinary("RETR " + filename ,open(filename, 'wb').write)
    except:
        print "Error"
 
 
ftp = ftplib.FTP("ftp.nluug.nl")
ftp.login("anonymous", "ftplib-example-1")
 
ftp.cwd('/pub/')          change directory to /pub/
getFile(ftp,'README.nluug')
 
ftp.quit()

当我们运行上面的程序时,我们发现文件 README.nlug 存在于发起连接的本地系统中。

读取数据

在下面的示例中,我们使用模块 urllib2 读取所需的数据部分,我们可以将其复制并保存到本地系统。

当我们运行上面的程序时,我们得到以下输出 -

import urllib2
response = urllib2.urlopen('http://www.tutorialspoint.com/python')
html = response.read(200)
print html

当我们运行上面的程序时,我们得到以下输出 -

<!DOCTYPE html>
<!--[if IE 8]><html class="ie ie8"> <![endif]-->
<!--[if IE 9]><html class="ie ie9"> <![endif]-->
<!--[if gt IE 9]><!-->  <html> <!--<![endif]-->
<head>
<!-- Basic -->
<meta charset="ut