您当前的位置:首页 > 电脑百科 > 站长技术 > 搜索引擎

你看到百度首页时发生了什么

时间:2021-04-19 14:33:46  来源:今日头条  作者:香烟与茶
你看到百度首页时发生了什么

 

你打开浏览器输入www.baidu.com于是百度首页就出现了,但你知道这中间经历了怎样复杂的一个互联网技术的全过程吗?

  • 网络上成千上万的服务器,浏览器怎么找到百度服务器在哪儿?
  • 浏览器怎么从百度服务器拿到的首页内容?
  • 拿到的内容怎么就整齐漂亮地展示在我们面前了呢?
  • 输入了关键词页面是怎么切换到搜索结果的呢?

今天就带你深入到互联网的技术世界畅游一番。

百度的IP地址

当我们在浏览器地址栏输入www.baidu.com以后,浏览器是怎么找到百度服务器在哪儿呢?浏览器首先要找到www.baidu.com对应的IP地址。www.baidu.com只是网站的名字,专业术语叫做‘域名’。IP地址相当于网站的身份证号。

百度的IP是多少呢?用你的windows打开一个命令行窗口。输入

ping www.baidu.com-t

你看到百度首页时发生了什么

 

你看,百度的IP地址是14.215.177.38

你试试在浏览器地址栏输入这个IP地址呢。是不是也看到了百度的首页?

你看到百度首页时发生了什么

 

DNS服务器

那么,是谁告诉我们百度的IP地址呢?这就是DNS服务器。我们要上网冲浪,必须要设置DNS服务器的IP。聪明的你马上会想:那DNS服务器的IP地址又是多少呢?

看这个:
https://zhuanlan.zhihu.com/p/90403282

国内有很多互联网服务商都提供了DNS服务器,这些DNS服务器是互通的,都可以查询到任意域名的IP地址。

那你现在上网用的是哪个DNS服务器呢? 这个就要看你的路由器里面的设置。我们安装电信宽带时,电信路由器里面就已经设置好电信的DNS(14.114.114.114)。所以你才能顺利地上网。不信你可以进入到自家路由器的设置界面去看看。

GET首页内容

浏览器拿到了域名的IP,就可以通过IP跟百度服务器通话了。首先会发送GET请求,告诉百度服务器,我要访问你,请给我首页。

chrome浏览器,右键‘检查’,进入调试模式,切换到‘network’标签页,你可以看到这个对话的内容:)

你看到百度首页时发生了什么

 

‘Request Method’表示对话的方式是GET,可以看到‘Remote Address’就是百度服务器的IP。

百度服务器回复了什么

那百度服务器回复了浏览器什么呢?切换到‘response’标签页,可以看到回复的内容:

你看到百度首页时发生了什么

 

回复的内容就是首页的html。HTML是专用于网页的语言格式,包含了页面上要显示的各种内容、其它额外内容的地址、你看不到的一些搜索优化的标签、隐藏在页面背后的一些代码动作。。。这就是我们常说的前端开发要去搞的事情了。

我们把‘Response’里面的内容全部复制下来,保存到本地的一个baidu.html里面。然后直接打开本地的这个baidu.html,可以看到完全一样的效果。(相当于复制了一个百度首页)

你看到百度首页时发生了什么

 

为什么还有那么多网络包

刚才的‘Response’截图里面左侧可以看到除了首页的HTML,还有一大堆其它网络包。这是为什么呢?

可看到很多网络包都是xxxx.css。css是HTML的伴侣,用来指定页面上的各种元素的样式(颜色、大小、位置等等),HTML+CSS就可以让浏览器把页面精美的呈现在我们面前。

那图片呢?对的,图片在HTML里面都是地址,还需要浏览器一个个地下载下来,所以还有很多网络包都是xxxxx.png

最后还有一部分xxxxx.js。JS也是HTML的伴侣,是一些代码,用来动态控制页面里面的样式、逻辑、交互等等。比如当我们点击‘百度一下’按钮的时候,就是JS在处理接下来的事情了。

百度首页有多大

目前你已经知道我们并非只是几次网络包就把百度首页搞定了。那我们的浏览器打开一次百度首页到底发生了多大数量的网络传输呢?也就是我们常说的占用了多少的带宽。

你看到百度首页时发生了什么

 

从调试模式的监控结果可以看到一共有105个网络包,总共2.3MB,3秒左右完成了百度首页的显示。

每次都会下载图片吗

你可能会想一个问题,浏览器每次都把页面上的所有图片都下载一遍,很浪费带宽啊。比如百度首页的logo大部分时间都是这个(除了一些节日),我今天开百度明天开百度或者一天开几次百度,都要下载这个logo吗?

你看到百度首页时发生了什么

 

互联网技术世界可是很先进的,当然不会。浏览器都有cache也就是缓存技术,任何一个网站第一次访问时,浏览器都会对网站的重要资源(如css、js、图片等)生成本地缓存,后面再访问这个网站时,如果是相同资源就不会从网络下载了,而是直接使用本机的缓存。

所以,某个网站,你第一次访问时,一定是最慢的。

所以,你的电脑随着访问的网站越多,C盘空间会越来越吃紧(浏览器cache通常都在c盘,例如chrome的cache通常位于:C:UsersAdminAppDataLocalgoogleChromeUser DataDefaultCache

cache技术减少了网络消耗,加速了页面的呈现速度,但有时也会因为cache技术导致一些问题。例如百度更换了logo.png的内容,但浏览器还在用cache里的logo.png,于是你看到的还是旧的logo。

所以聪明的程序员会在HTML里面对重要的资源都加上?v=1.14,当网站有改动时就修改版本号来告诉浏览器这个资源的版本号更换了,请从服务器获取最新的资源文件而非使用本地的。

总结一下

以上就是我们看到百度首页的完整技术过程,当然这里面没有深入到网络协议层展开讲,那就更加复杂了。

至少你现在知道从输入地址到页面出现,背后都发生了什么。



Tags:百度   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
IT之家 12 月 23 日消息,百度地图今日宣布,第二代车道级导航正式上线。据介绍,百度地图第二代车道借助北斗 + 5G,在实现全程车道级导航效果的基础上,全面升级最优车道推荐、全 /...【详细内容】
2021-12-24  Tags: 百度  点击:(10)  评论:(0)  加入收藏
IT之家 12 月 20 日消息,百度网盘青春版 iOS 客户端今日晚间率先开启内测,安卓客户端将在稍后内测。使用苹果 iPhone 的IT之家小伙伴可以点此下载内测版,需要先下载 TestFlight...【详细内容】
2021-12-21  Tags: 百度  点击:(9)  评论:(0)  加入收藏
之前我们讲到说,有些网站在复制的时候会提示一个弹窗,我们可以去掉网站的copy事件监听就可以了,但是我们经常用到的一个网站,百度文库,网站不是这样设计的。 可以随便打开一个百...【详细内容】
2021-12-03  Tags: 百度  点击:(9)  评论:(0)  加入收藏
图片来源@视觉中国文 | 一刻商业,作者 | 云梦泽,编辑 | 于沐沉寂已久的百度贴吧又受到了关注。不过,此次引发讨论的却是“百度贴吧用户流失近九成”的话题。根据易观千帆公布数...【详细内容】
2021-11-10  Tags: 百度  点击:(22)  评论:(0)  加入收藏
《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个由百度开源的低代码前端框架——amis...【详细内容】
2021-11-05  Tags: 百度  点击:(65)  评论:(0)  加入收藏
很多新手站长容易出现网站标题修改后,百度快照迟迟不见更新,这种情况应该如何操作?对于不同的网站,搜索引擎的反应速度不太一样,很多网站在修改标题或者内容标题后,收录显示于本身...【详细内容】
2021-10-27  Tags: 百度  点击:(30)  评论:(0)  加入收藏
最权威的学术名词搜索工具,科研更专业! 写科研论文或者其他工作、学习上的素材,需要对一些名词做严谨的解释、使用或者了解,网络上鱼龙混杂,万一遇上个“半桶水”,可是要出洋相的...【详细内容】
2021-10-27  Tags: 百度  点击:(20)  评论:(0)  加入收藏
从开始分享软件工具到现在,询问百度网盘名不限速下载的问题就没有间断过,看来大家也是苦百度网盘已久,本文咱们就分享一下百度网盘不限速下载的方法。 文章比较长,实际上操作...【详细内容】
2021-10-25  Tags: 百度  点击:(525)  评论:(0)  加入收藏
在SEO优化的职业里,运用搜索引擎对网页内容的检索原理,对网站内部外部资源进行优化整合,然后到达抱负的作用,便利客户快速找到想要的信息。在分类上也可分白帽SEO和黑帽SEO。一...【详细内容】
2021-10-22  Tags: 百度  点击:(36)  评论:(0)  加入收藏
霸屏通俗来讲就是霸占屏幕,百度霸屏就是在百度搜索的结果中,除了竞价内容,剩下的都是我们品牌词或网站的内容。以用户的搜索习惯来说,一般翻两三页就不会再继续翻下去了。所以我...【详细内容】
2021-10-22  Tags: 百度  点击:(50)  评论:(0)  加入收藏
▌简易百科推荐
今天不讲信息流,讲点其他的,比如搜索搜索是什么东西?见过开店卖东西吧,原理大同小异。比如我在步行街租个店铺,开个鞋店,每天在店里等着来步行街的人进我店里买我的鞋。百度搜索就...【详细内容】
2021-12-24  运营王明皓    Tags:搜索   点击:(9)  评论:(0)  加入收藏
在过去的时间中,我写了比较多的关于谷歌SEO推广,今天来写写GoogleAds广告账户免费诊断分析。今天我们的主题是:如何借助GoogleAds广告账户免费诊断分析工具,来诊断并优化你的Goo...【详细内容】
2021-10-26  优易化海外营销推广    Tags:GoogleAds   点击:(43)  评论:(0)  加入收藏
霸屏通俗来讲就是霸占屏幕,百度霸屏就是在百度搜索的结果中,除了竞价内容,剩下的都是我们品牌词或网站的内容。以用户的搜索习惯来说,一般翻两三页就不会再继续翻下去了。所以我...【详细内容】
2021-10-22  聪少爱学堂    Tags:霸屏引流   点击:(50)  评论:(0)  加入收藏
网络推广计划表示在网站优化时,内容优化也是重中之重,其中有关文章的优化也让站长们苦恼不已,因为不太清楚蜘蛛对网站文章的质量评判是如何的,很难做到更精准的蜘蛛“取向”,那么...【详细内容】
2021-10-22  云霸屏    Tags:搜索引擎   点击:(45)  评论:(0)  加入收藏
我们在做SEO优化的过程中,通常都会用到百度站长平台、5118、站长工具等seo工具,用来分析查询关键词排名。特别是百度站长平台中的分析数据很多,其中百度站长工具中的流量与关键...【详细内容】
2021-10-22  双丝网络    Tags:百度站长平台   点击:(35)  评论:(0)  加入收藏
网络推广费用了解到,网站关键词排名效果想要更好,就要扎实的做好优化工作。关键词排名高的网站能更优秀的出现在搜索引擎首页,获得更多的用户浏览,得到更高的权重,从而给企业带来...【详细内容】
2021-09-25  云霸屏  搜狐号  Tags:蜘蛛   点击:(39)  评论:(0)  加入收藏
百度搜索贸易风算法,消除了使用翻页键诱导用户行为,简单地告诉我们,只要你的翻页按钮存在异常跳转行为,无论跳转到哪个页面,都属于该算法的覆盖范围。百度的搜索交易风算法主要攻...【详细内容】
2021-08-31  羽西223    Tags:信风算法   点击:(66)  评论:(0)  加入收藏
1 前言现今互联网上的很多产品、战略决策都由数据驱动,以BulletTech为例,在运营微信公众号时,通过后台数据我们对每篇文章都会进行流量来源、裂变和阅读完关注等重要指标的监控...【详细内容】
2021-08-02  BulletTech    Tags:Google Analytics   点击:(93)  评论:(0)  加入收藏
昨晚松松编辑杰哥了解到,百度搜索最近对算法更新了,全面升级“蓝天算法”2.0版本,主要针对高权重网站出租二级目录和二级域名行为,这是要开始加大清洗目录出租站点了吗? 根据杰...【详细内容】
2021-07-29  卢松松    Tags:蓝天算法   点击:(76)  评论:(0)  加入收藏
网罗天下谈运营2021-07-20在做SEO的过程中,对于企业主而言,没有人刚开始建立网站的时候就会先知先觉,采用完全正确的SEO优化方法,这很必然会导致一些问题,比如:① 站内目录层级繁...【详细内容】
2021-07-21  Lollipop    Tags:网站不收录   点击:(81)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条