Tìm hiểu URL trong HTML
Mỗi tài liệu trên Web có một địa chỉ duy nhất. Địa chỉ này được biết như là Uniform Resource Locator (URL).
Một số thẻ HTML/XHTML bao gồm một giá trị thuộc tính URL, bao gồm các hyperlink, các hình ảnh nội tuyến, và các form. Tất cả chúng sử dụng cùng cú pháp để xác định vị trí của một web nguồn, bất chấp kiểu hoặc nội dung của nguồn đó. Đó là tại sao nó lại được biết đến như là một Uniform Resource Locator.
Các phần tử URL
Một URL được tạo bởi một số phần, mỗi phần cung cấp thông tin tới trình duyệt web để giúp đỡ tìm kiếm trang web. Nó là dễ dàng hơn để học các phần của một URL, nếu bạn nhìn vào ví dụ về URL bên dưới đây, có 3 phần chính: phần scheme, địa chỉ host, và đường truyền file. Khu vực dưới đây sẽ giải thích chi tiết từng phần:
http://www.hoconline.club/index.htm
Phần Scheme
Scheme (giản đồ) nhận diện kiểu của giao thức và URL bạn đang kết nối tới và vì thế, cách mà nguồn nên được thu nhận. Ví dụ, hầu hết các trình duyệt web sử dụng HTTP (Hypertext Transfer Protocol) để truyền thông tin để giao tiếp với các Web Server và đây là lý do một URL bắt đầu với http://.
Có các Scheme khác có sẵn và bạn có thể sử dụng chúng dựa trên yêu cầu của bạn:
Scheme | Miêu tả |
---|---|
http:// | Hypertext Transfer Protocol (HTTP) được sử dụng để yêu cầu các trang từ Web Server và gửi chúng lại từ các Web Server tới các trình duyệt. |
https:// | Secure Hypertext Transfer Protocol (HTTPS) mật mã hóa dữ liệu được gửi giữa trình duyệt và Web Server sử dụng một chứng nhận kỹ thuật số (digital certificate). |
ftp:// | File Transfer Protocol là phương thức khác để truyền tải các file trên Web. Trong khi HTTP là phổ biến hơn nhiều để duyệt các trang web bởi vì tính tương thích của nó với các trình duyệt. FTP vẫn còn là giao thức được sử dụng rộng rãi để truyền các file lớn thông qua Web và để tải các file nguồn lên Web Server của bạn. |
file:// | Được sử dụng để chỉ rằng một file là trên một đĩa cứng nội bộ hoặc một thư mục được chia sẻ trên một LAN. |
Địa chỉ Host
Địa chỉ Host là nơi một website có thể được tìm, hoặc là địa chỉ IP (tập hợp 4 số giữa 0 và 258, ví dụ 68.178.157.132) hoặc tên miền phổ biến hơn cho một site như www.vnexpress.net. Ghi chú rằng "www" không thực sự là một phần của tên miền mặc dù nó thường được sử dụng trong địa chỉ Host.
Đường truyền File
Đường truyền File luôn luôn bắt đầu với một dấu gạch chéo, và có thể chứa một hoặc nhiều tên thư mục hoặc tên folder. Mỗi tên thư mục được phân biệt nhau bởi dấu gạch chéo và đường truyền file có thể kết thúc với tên file ở cuối. Ở đây, index.htm là một tên file mà có sẵn trong thư mục html.
http://www.hoconline.club/html/index.htm
Các phần khác của URL
Sử dụng các ủy nhiệm (credential) là một cách xác định một tên người dùng và mật khẩu cho phần được bảo vệ bằng mật khẩu của site. Các ủy nhiệm có thể ở trước địa chỉ host, và chúng được phân biệt với địa chỉ host bởi một ký hiệu @. Ghi chú cách mà tên người dùng được phân biệt với mật khẩu bởi một dấu hai chấm. URL sau chỉ tên người sử dụng admin và mật khẩu là admin123.
http://admin:[email protected]/admin/index.htm
Sử dụng URL trên, bạn có thể xác nhận người quản lý và nếu ID và mật khẩu được cung cấp là chính xác thì khi đó người quản lý sẽ có quyền truy cập vào index.htm có trong thư mục chính.
Bạn có thể sử dụng một URL dạng telnet để kết nối tới một Server như sau:
telnet://user:[email protected]:port/
Thông tin quan trọng khác là số hiệu cổng - Port Number của Web Server. Theo mặc định, HTTP Server chạy trên cổng số 80. Nhưng nếu bạn đang chạy một Server trên bất kỳ số hiệu cổng nào thì sau đó nó có thể được cung cấp như sau, giả sử Server đang chạy trên Port 8080:
http://www.hoconline.club:8080/index.htm
Fragment identifiers – Các định danh mảnh có thể được sử dụng sau một tên file để chỉ một phần cụ thể của trang mà trình duyệt nên đi tới ngay lập tức. Sau đây là ví dụ để tới phần đầu trang html_text_links.htm:
http://www.hoconline.club/html/the_text_links.htm#top
Bạn có thể truyền một số thông tin tới Server bởi sử dụng URL. Khi bạn sử dụng một form trên một trang Web, ví dụ như một form tìm kiếm hoặc một order form trực tuyến, trình duyệt có thể neo thông tin bạn cung cấp tới URL để truyền thông tin từ trình duyệt của bạn tới Server như sau:
http://www.hoconline.club/cgi-bin/search.cgi?searchTerm=HTML
Tại đây, searchTerm=HTML được truyền tới Server, mà search.cgi script được sử dụng để phân tích thông tin đã truyền này và thực hiện các hành động liên quan.
Các URL Tuyệt đối và URL Quan hệ
Bạn có thể định vị một URL theo một trong hai cách sau:
Absolute - Tuyệt đối - Một URL Tuyệt đối là địa chỉ một nguồn đầy đủ. Ví dụ: http:/hoconline.club/html/the_text_links.htm
Relative - Quan hệ - Một URL Quan hệ chỉ dẫn nơi nguồn có liên quan tới trang hiện tại. URL đã cung cấp được thêm với phần tử
để tạo một URL đầy đủ. Ví dụ: /html/html_text_links.htm
Các ký tự Dành riêng và Không an toàn
Các ký tự dành riêng là những ký tự mà có ý nghĩa đặc biệt trong URL. Ví dụ, ký tự gạch chéo phân biệt riêng rẽ các phần tử của một pathname trong một URL. Nếu bạn cần bao gồm một dấu gạch chéo trong một URL mà không được cho là một phần tử riêng rẽ, thì khi đó bạn cần mã hóa nó như là %2F.
Các ký tự không an toàn không có ý nghĩa đặc biệt trong URL nhưng có thể có một ý nghĩa đặc biệt trong bối cảnh mà URL được viết. Ví dụ, dấu trích dẫn kép ("") giới hạn các giá trị thuộc tính URL trong các thẻ. Nếu bạn cần bao gồm một dấu trích dẫn kép này trực tiếp trong một URL, bạn có thể sẽ làm trình duyệt bối rối. Thay vào đó, bạn nên mã hóa dấu trích dẫn kép này để tránh bất kỳ xung đột nào có thể xảy ra.
Bạn có thể kiểm tra chương HTML - Mã hóa URL để hiểu việc mã hóa này, các ký tự dành riêng và không an toàn.
Bài học HTML phổ biến khác tại hoconline.club: