Mô-đun này cung cấp các chức năng để chia nhỏ các URL thành các phần cấu thành của chúng, như được xác định bởi các RFC có liên quan
phân tích cú pháp
Giá trị trả về từ hàm là một đối tượng hoạt động giống như một bộ có 6 phần tử
from urlparse import urlparse parsed = urlparse['//netloc/path;parameters?query=argument#fragment'] print parsed
Các phần của URL có sẵn thông qua giao diện tuple là lược đồ, vị trí mạng, đường dẫn, tham số, truy vấn và đoạn
$ python urlparse_urlparse.py ParseResult[scheme='http', netloc='netloc', path='/path', params='parameters', query='query=argument', fragment='fragment']
Mặc dù giá trị trả về hoạt động giống như một bộ, nhưng nó thực sự dựa trên một , một lớp con của bộ hỗ trợ truy cập các phần của URL thông qua các thuộc tính được đặt tên thay vì các chỉ mục. Điều đó đặc biệt hữu ích nếu, giống như tôi, bạn không thể nhớ thứ tự chỉ mục. Ngoài việc dễ sử dụng hơn cho lập trình viên, API thuộc tính còn cung cấp quyền truy cập vào một số giá trị không có sẵn trong API tuple
from urlparse import urlparse parsed = urlparse['//user:pass@NetLoc:80/path;parameters?query=argument#fragment'] print 'scheme :', parsed.scheme print 'netloc :', parsed.netloc print 'path :', parsed.path print 'params :', parsed.params print 'query :', parsed.query print 'fragment:', parsed.fragment print 'username:', parsed.username print 'password:', parsed.password print 'hostname:', parsed.hostname, '[netloc in lower case]' print 'port :', parsed.port
Tên người dùng và mật khẩu khả dụng khi có trong URL đầu vào và Không có khi không. Tên máy chủ có cùng giá trị với netloc, tất cả đều là chữ thường. Và cổng được chuyển đổi thành số nguyên khi có mặt và Không có khi không
$ python urlparse_urlparseattrs.py scheme : http netloc : user:pass@NetLoc:80 path : /path params : parameters query : query=argument fragment: fragment username: user password: pass hostname: netloc [netloc in lower case] port : 80
Hàm urlsplit[] là một thay thế cho. Nó hoạt động hơi khác một chút vì nó không tách các tham số khỏi URL. Điều này hữu ích cho các URL tuân theo RFC 2396, hỗ trợ các tham số cho từng phân đoạn của đường dẫn
from urlparse import urlsplit parsed = urlsplit['//user:pass@NetLoc:80/path;parameters/path2;parameters2?query=argument#fragment'] print parsed print 'scheme :', parsed.scheme print 'netloc :', parsed.netloc print 'path :', parsed.path print 'query :', parsed.query print 'fragment:', parsed.fragment print 'username:', parsed.username print 'password:', parsed.password print 'hostname:', parsed.hostname, '[netloc in lower case]' print 'port :', parsed.port
Vì các tham số không được tách ra, API tuple sẽ hiển thị 5 thành phần thay vì 6 và không có thuộc tính params
$ python urlparse_urlsplit.py SplitResult[scheme='http', netloc='user:pass@NetLoc:80', path='/path;parameters/path2;parameters2', query='query=argument', fragment='fragment'] scheme : http netloc : user:pass@NetLoc:80 path : /path;parameters/path2;parameters2 query : query=argument fragment: fragment username: user password: pass hostname: netloc [netloc in lower case] port : 80
Để chỉ cần tách mã định danh phân đoạn khỏi một URL, như bạn có thể cần làm để tìm tên trang cơ sở từ một URL, hãy sử dụng urldefrag[]
Phần thứ tư là Tên miền cấp cao nhất, Phần này thường mô tả mục đích của trang web. cho e. g, nếu Tên miền cấp cao nhất là. org chúng tôi xác định trang web là trang web của Tổ chức nếu trang web kết thúc bằng. com chúng tôi xác định nó là một trang web thương mại, v.v. Để biết thêm về Tên miền cấp cao nhất, hãy truy cập TẠI ĐÂYMột thuật ngữ thay thế cho một địa chỉ web là một URL. Ví dụ: điểm hướng dẫn. com là một URL dựa trên từ. Địa chỉ IP cũng có thể được sử dụng làm URL [ví dụ:. 192. 168. 2. 24]. Vì tên dễ nhớ hơn so với số nên hầu hết người dùng gửi địa chỉ của tên khi tìm kiếm trên internet
URL là phương pháp mà trình duyệt web yêu cầu máy chủ web cung cấp các trang cụ thể. Cú pháp/định dạng của một URL được đưa ra dưới đây
cú pháp
scheme://prefix.domain:port/path/filename
Thông số
lược đồ - chỉ định loại dịch vụ Internet [http hoặc https đang được sử dụng chung]
tiền tố - chỉ định tiền tố tên miền [www là mặc định cho http]
tên miền - mô tả tên miền internet [ví dụ:. hướng dẫn. com]
port − chỉ định số cổng của máy chủ [80 là mặc định cho http]
đường dẫn - thiết lập đường dẫn phía máy chủ
tên tệp - chỉ định tên của tài nguyên hoặc tài liệu
Lược đồ URL điển hình
HTTP - giao thức truyền tải siêu văn bản
HTTP được sử dụng trong các trang web phổ biến. Đây không phải là một giao thức được mã hóa
HTTPS - giao thức truyền tải siêu văn bản an toàn
HTTPS được sử dụng trong các trang web an toàn. Đây là một giao thức được mã hóa
FTP - Giao thức truyền tệp
FTP được sử dụng để tải xuống hoặc tải lên tệp
Bây giờ chúng ta hãy xem cách lấy tên máy chủ trong một URL
Sử dụng thuộc tính tên máy chủ của vị trí cửa sổ hiện tại
Trong phần này, chúng ta sẽ xem cách lấy tên máy chủ trong url bằng thuộc tính tên máy chủ của vị trí cửa sổ hiện tại
cú pháp
Thực hiện theo cú pháp dưới đây để có được tên máy chủ
First window.location.hostname;
Ở đây chúng tôi truy cập thuộc tính tên máy chủ từ vị trí của cửa sổ hiện tại
thuật toán
BƯỚC 1 – Nhận URL hiện tại
BƯỚC 2 – Hiển thị tên máy chủ từ URL hiện tại bằng cách sử dụng cú pháp tên máy chủ vị trí cửa sổ hiện tại
Ví dụ
Trong ví dụ này, chúng tôi đã đặt Dom trống để hiển thị đầu ra. Chúng tôi đã viết mã để lấy tên máy chủ từ vị trí trang web hiện tại
________số 8Sử dụng thuộc tính tên máy chủ của URL
Trong phần này, chúng ta sẽ xem cách lấy tên máy chủ trong một URL bằng cách sử dụng thuộc tính tên máy chủ của bất kỳ URL nào. Ở đây, chúng tôi đã tạo đối tượng URL tùy chỉnh bằng cách sử dụng hàm tạo URL[] mới
cú pháp
Thực hiện theo cú pháp dưới đây để có được tên máy chủ
var url = new URL["www.sample.com"]; var hostname = url.hostname;
Ở đây chúng tôi truy cập trực tiếp vào thuộc tính tên máy chủ từ URL. Chúng tôi sử dụng phương thức URL mới để tạo một URL mới và sau đó thuộc tính tên máy chủ của url này được lấy
Ví dụ
Trong ví dụ này, mã tạo một url mẫu bằng phương thức URL[] mới. Tên máy chủ được hiển thị bằng cách truy cập thuộc tính tên máy chủ của chính URL đó
$ python urlparse_urlparse.py ParseResult[scheme='http', netloc='netloc', path='/path', params='parameters', query='query=argument', fragment='fragment']0
Trong hướng dẫn này, chúng ta đã học cách lấy tên máy chủ trong một URL bằng cách sử dụng thuộc tính tên máy chủ trong JavaScript
Thuộc tính tên máy chủ là thuộc tính JavaScript tích hợp và dễ dàng truy cập tên máy chủ từ URL hiện tại cũng như từ bất kỳ URL nào được tạo bằng phương thức URL[] mới