您是否想过在浏览器中输入“google.com”到看到熟悉的搜索页面出现之间的几分之一秒内发生的一系列复杂事件?在这个详细的探索中,我们将揭开网络技术、网络协议以及使我们的在线体验成为可能的错综复杂的数据的迷人世界。
当您输入“google.com”并按 enter 键时,您的浏览器就会启动:
url 解析:浏览器首先分析您输入的 url。它标识协议(在本例中,隐含“http://”或“https://”)、域名(“google.com”)以及任何其他路径或查询参数(在这个简单示例中没有) .
hsts 检查:对于 google 等具有安全意识的网站,浏览器会检查其 http 严格传输安全 (hsts) 列表。如果 google.com 在此列表中(确实如此),浏览器会自动将请求升级到 https。
缓存检查:在连接到网络之前,浏览器会检查其本地缓存。该缓存存储以前访问的信息,包括:
如果找到其中任何一个并且仍然有效(未过期),浏览器可以跳过以下一些步骤。
如果浏览器在缓存中找不到必要的信息,则会向操作系统 (os) 寻求帮助:
hosts 文件检查:操作系统首先查找本地“hosts”文件。该文件可以将域名映射到 ip 地址,从而可能绕过 dns 查找。但是,对于大多数用户来说,google.com 不会在此文件中。
dns 客户端缓存:操作系统维护自己的 dns 缓存,与浏览器的缓存分开。接下来检查这里。
解析器配置:如果 ip 不在本地缓存中,操作系统准备询问 dns 服务器。它读取其网络配置以找出要查询的 dns 服务器(通常由您的互联网服务提供商提供或手动设置)。
如果 google.com 的 ip 地址未缓存,我们需要要求域名系统 (dns) 将人类可读的“google.com”转换为机器可用的 ip 地址。
dns 以层次结构组织:
根服务器:位于层次结构的顶部。他们知道在哪里可以找到 .com、.org、.net 等顶级域名 (tld) 的权威服务器。
tld 服务器:这些服务器了解在其 tld 下注册的所有域。 .com tld 服务器了解 google.com。
权威名称服务器:这些服务器负责了解有关特定域的所有信息,包括其 ip 地址。
缓存:此过程中的每个步骤都可能涉及缓存,因此并不总是需要完整的旅程。解析器通常会在 google 指定的时间内缓存最终结果(生存时间或 ttl)。
负载平衡:像 google 这样的大型服务通常会返回多个 ip 地址。这可以实现负载平衡并提高可靠性。
假设 dns 查找返回以下(简化的)结果:
google.com. 300 in a 172.217.167.78
这意味着:
现在我们有了 google 的 ip 地址,是时候建立连接了。
应用层:您的浏览器在此运行,使用 http(s) 进行通信。
传输层:此处使用 tcp 来确保可靠、有序的数据传输。
互联网层:ip 用于在网络之间路由数据包。
链路层:处理数据的物理传输,无论是通过以太网、wi-fi、蜂窝网络等。
为了建立连接,需要进行三向握手:
此过程为对话建立序列号,确保数据包可以正确排序,并且可以检测和重新传输任何丢失的数据包。
对于 https 连接(google 使用),会发生额外的 tls(传输层安全)握手:
建立安全连接后,您的浏览器将向 google 主页发送 http get 请求。
get / http/2 host: www.google.com user-agent: mozilla/5.0 (windows nt 10.0; win64; x64; rv:89.0) gecko/20100101 firefox/89.0 accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 accept-language: en-us,en;q=0.5 accept-encoding: gzip, deflate, br connection: keep-alive upgrade-insecure-requests: 1
此请求包括:
google 的服务器接收此请求并进行处理。这可能涉及:
google 的服务器发回 http 响应,可能如下所示:
HTTP/2 200 OK Content-Type: text/html; charset=UTF-8 Date: Sat, 21 Sep 2024 12:00:00 GMT Expires: Sat, 21 Sep 2024 12:00:00 GMT Cache-Control: private, max-age=0 Server: gws X-XSS-Protection: 0 X-Frame-Options: SAMEORIGIN [... other headers ...] <meta charset="utf-8"><title>Google</title> [... rest of the HTML ...] [... body content ...]
此回复包括:
您的浏览器现在具有 html 内容并开始渲染页面:
解析 html:浏览器解析 html,创建文档对象模型 (dom)。
请求额外资源:当它遇到 css、javascript、图像等链接时,它会发送对这些资源的额外 http 请求。
解析 css:浏览器解析 css 并将样式应用于 dom 元素,创建 css 对象模型 (cssom)。
执行javascript:浏览器执行javascript,可以修改dom和cssom。
渲染:浏览器使用最终的 dom 和 cssom 在屏幕上渲染页面。
看似简单的操作(输入“google.com”并按 enter)实际上涉及一系列复杂的步骤,从 dns 查找和网络协议到服务器端处理和客户端渲染。这种复杂的舞蹈在短短几毫秒内发生,展示了为我们的在线体验提供动力的令人难以置信的工程。
了解这些流程不仅可以满足我们的好奇心,还可以帮助 web 开发人员和 it 专业人员优化网站、解决问题并构建更高效、更安全的 web 应用程序。下次您导航到某个网站时,请花点时间欣赏幕后的技术奇迹,将网络带到您的屏幕上!
本博客中的图像是人工智能生成的。
另请阅读http 与 https 它们之间的区别