绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
Python3 URL解析库 — urlparse
2020-06-10 06:45:38

MedusaSorcerer的博客


docs.python.org/zh-cn/3.8/l…

解析一个 URL 获得各个概念所对应的值在 Python 中显得很简单, Python3 中将 urllib2urlparserobotparse 并入了 urllib 模块中, 所以原本在 Python 导入的方式在 Python3 中应该这样导入:

from urllib.parse import urlparse
复制代码

使用它我们可以获得 ParseResult 对象, 我们可以通过下标或者属性名来访问对象属性:

  • scheme (协议)
  • netloc (域名)
  • path (路径)
  • params (可选参数)
  • query (连接键值对)
  • fragment (特殊锚)
属性名 索引值 说明 空值情况下表达
scheme 0 URL 协议 ""
netloc 1 URL 域名 ""
path 2 URL 请求路径 ""
params 3 URL 可选参数 ""
query 4 URL 键值对参数 ""
fragment 5 URL 特殊锚 ""
username 用户名 None
password 密码 None
hostname 主机名(小写) None
port 如果存在, 则是整数端口号 None

我们测试下这个函数的使用:

#!/usr/bin/env python
# _*_ Coding: UTF-8 _*_
from urllib.parse import urlparse

result = urlparse('https://juejin.im/user/5da32395e51d4578200cc9c5/posts?params=123&username=123')
print(result)
复制代码

输出的结果是:

ParseResult(
    scheme='https', 
    netloc='juejin.im', 
    path='/user/5da32395e51d4578200cc9c5/posts', 
    params='', 
    query='params=123&username=123', 
    fragment=''
)
复制代码
分享好友

分享这个小栈给你的朋友们,一起进步吧。

MedusaSorcerer
创建时间:2020-06-29 16:36:50
学无止境, 学无止尽。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • zuike2000
    栈主
戳我,来吐槽~