- Python-网络编程
- Python-网络简介
- Python-网络环境
- Python - 互联网协议
- Python-IP 地址
- Python-DNS 查找
- Python-路由
- Python - HTTP 请求
- Python-HTTP 响应
- Python - HTTP 标头
- Python - 自定义 HTTP 请求
- Python - 请求状态代码
- Python-HTTP 身份验证
- Python - HTTP 数据下载
- Python - 连接重用
- Python - 网络接口
- Python-套接字编程
- Python-HTTP 客户端
- Python-HTTP 服务器
- Python - 构建 URL
- Python - Web表单提交
- Python - 数据库和 SQL
- Python-远程登录
- Python - 电子邮件消息
- Python-SMTP
- Python-POP3
- Python-IMAP
- Python-SSH
- Python-FTP
- Python-SFTP
- Python - Web 服务器
- Python-上传数据
- Python-代理服务器
- Python - 目录列表
- Python-远程过程调用
- Python - RPC JSON 服务器
- Python - 谷歌地图
- Python - RSS 源
Python - 构建 URL
requests 模块可以帮助我们构建 URL 并动态操作 URL 值。URL 的任何子目录都可以通过编程方式获取,然后可以用新值替换其中的某些部分来构建新的 URL。
构建_URL
下面的示例使用urljoin来获取 URL 路径中的不同子文件夹。urljoin 方法用于向基本 URL 添加新值。
from requests.compat import urljoin base='https://stackoverflow.com/questions/3764291' print urljoin(base,'.') print urljoin(base,'..') print urljoin(base,'...') print urljoin(base,'/3764299/') url_query = urljoin(base,'?vers=1.0') print url_query url_sec = urljoin(url_query,'#section-5.4') print url_sec
当我们运行上面的程序时,我们得到以下输出 -
https://stackoverflow.com/questions/ https://stackoverflow.com/ https://stackoverflow.com/questions/... https://stackoverflow.com/3764299/ https://stackoverflow.com/questions/3764291?vers=1.0 https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
分割 URL
除了主地址之外,URL 还可以分为许多部分。用于特定查询的附加参数或附加到 URL 的标签通过使用 urlparse 方法进行分隔,如下所示。
from requests.compat import urlparse url1 = 'https://docs.python.org/2/py-modindex.html#cap-f' url2='https://docs.python.org/2/search.html?q=urlparse' print urlparse(url1) print urlparse(url2)
当我们运行上面的程序时,我们得到以下输出 -
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f') ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')