tldextract
是一个第三方模块,意思就是Top Level Domain extract
,即顶级域名提取pip install tldextract
URL
的结构,news.baidu.com
里面的news.baidu.com
叫做host
,它是注册域名baidu.com
的子域名,而com
就是顶级域名TLD
。import tldextract
tld = tldextract.extract('http://news.baidu.com/')
print(tld)
# result: ExtractResult(subdomain='news', domain='baidu', suffix='com')