您的当前位置:首页正文

tldextract模块的使用

2024-12-02 来源:个人技术集锦
  • tldextract是一个第三方模块,意思就是Top Level Domain extract,即顶级域名提取
  • 使用时 需要安装,命令如下
    • pip install tldextract
  • URL的结构,news.baidu.com 里面的news.baidu.com叫做host,它是注册域名baidu.com的子域名,而com就是顶级域名TLD
import tldextract

tld = tldextract.extract('http://news.baidu.com/')
print(tld)
# result: ExtractResult(subdomain='news', domain='baidu', suffix='com')
  • 返回结构包含三部分:subdomain, domain, suffix
显示全文