SEO︰为什么网页刊登了 ,Google 搜寻却找不到?
为什么网页刊登了,但是在 Google 搜寻引擎却找不到?今天来了解为什么在它找不到你的新网站。
预计阅读时间︰5 分钟
你有没有试过新网站推出后,在 Google 搜寻引擎却找不到自己的网页?或是更新网站后,搜寻结果依然显示旧资料?遇到这些事情可以怎么办?导致以上情况的问题有千百种,但寻根究底,这些问题始终都是围绕著 Google search engine (搜寻引擎) 所衍生的!
内容大纲
Google 搜寻引擎是怎样运作的?
Crawling方面问题
Indexing 方面问题
Ranking 方面问题
总结
Google 搜寻引擎是怎样运作的?
要知道为什么 search engine 中找不到公司已刊登的网页,我们首先要了解 Google 搜寻引擎的运作方式。Google 搜寻引擎可简单分为三个阶段,分别为 Crawling(检索),Indexing(建立索引)和 Ranking(排名)。
阶段一:Crawling(检索)
Google 会追踪已知网页的连结并连到不同网页,以此发现其他新网页。你可以把网络世界想象为一个巨大的蜘蛛网,Google 无时无刻都依靠连结发掘新网页,代表著蜘蛛网无时无刻都在不断延伸。当 Google 发现你新发布的网页时,它会派爬虫机器人像蜘蛛一样在这巨大的网路上爬行,来检索你网页上的资料,包括文字、图片、影片和程式码等网页资料。这就是在Crawling 阶段会进行的事情。
阶段二:Indexing(建立索引)
接下来 Google 继续分析你网页上的文字、图片和影片等内容,把相关网页资讯分类并且归档在 Google 的大型资料库里面。这过程就好像图书馆管理员收到新书后,将新书分类编目、然后收进图书馆的书架上。
阶段三:Ranking(排名)
当人们在 Google 使用输入关键字搜寻时,Google 就会从庞大的资料库中,综合各种考量及演算法,找到最相关的搜寻结果,推荐给使用者,为你的品牌带来搜寻流量。
Crawling 方面问题
网页刚刚刊登,Google 还没有检索到?
很多人一刊登新网页,就急著去搜寻引擎检索,却始终找不到自己新刊登的网站。其实,Google 搜寻引擎就像每天 24 小时全年无休工作的图书馆管理员,每天不间断地透过助手(爬虫机器人)把新书(新网页)归类放到书架上(检索结果)。但是效率再高,也需要时间去处理这些每分每秒都在不断增加的新网页。Google 在「 Search Console 说明」中有表明,提交索引建立要求后需要等待一、两天至数周时间,时间长短会受到许多因素的影响。所以刊登后就急著去 Google 检索,是有机会找不到的!
如果想确定搜寻引擎有否收录到你的网页,只需要在 search engine 上搜索 ”site:你的网址“ 就可以。以 FIMMICK Blog 为例,在 search engine 上输入:“site:www.fimmick.com”,就可以看到引擎收录的结果。
如果想加速 Google 检索到你的网站,缩短等待时间,你可以到 Google Search Console 申请索引建立要求,以此帮助 Google 更快地发现并检索你的网站内容。但只限于网址不多的情况,而且多次要求检索同一网址并不会加快检索速度。
网页页面不符合规定的标准
大家都知道,如果希望 Google 更快地检索到公司网页内容,自然要遵循它的游戏规则。如果违背这些规则,品牌网页就会到 search engine 惩罚和降低排名。
例如,为了避免占用不必要的资料储备库空间,Google 通常不会把两个差不多的网页都收录到它的 data base 中,就如一山不能藏二虎。如果你的网站页面与其他网站内容高度相似或重复,缺乏原创、高质量的内容,Google 可能就不会帮你进行索引。同时,如果 Google 人员在审查内容时,看见不符合「垃圾内容政策」的内容,例如伪装、恶意软体和恶意行为、滥填关键字,就有机会降低你的排名,甚至直接把页面直接删除。
如果不想被降低 SEO 排名或受到 Google 的惩罚,请尽量不要把其他网页内容直接放到自己品牌网页中,或是在页面上加入规范网址标签,令 Google 得知文章作者是谁,从而进行索引。在建立网页过程中也要仔细了解 Google 的「垃圾内容政策」,防止自己不小心踩到地雷。
Indexing 方面问题
网页机器人 (robot.txt) 设置出了问题,导致网页内容无法被读取
Robot.txt 主要告诉爬虫机器人可以查询自己网页上哪些内容,同时拒绝机器人访问你的顾客资料、后台等。但是如果你的 robot.txt 设定错误,小则网页内容无法被正确检索,重则把重要的顾客资料暴露在 Google 搜寻结果,只要任何人一搜寻,就能看到你公司顾客的名单、地址,联络方式等重要资料。
最常见在 Crawling 阶段发生的问题是品牌在建立或更新网页过程中,设定了 Robot.txt 去拒绝所有爬虫机器人的访问,但网页完成后,却忘记移除这项设定,最后导致 Google 爬虫机器人完全无法读取公司网页内容。
虽然 robot.txt 只是一个不起眼的档案,但在完成网页后还是要谨慎地检查一下网页机器人的设定是否正确,避免因设定出错而导致 Google 无法有效对网页进行索引。
Ranking 方面问题
关键字竞争太大,把你的内容淹没了
如果你确定 google 已经检索到品牌网页 ,但在搜寻特定关键字时,仍然找不到自己的网页,那有可能你所选择的关键字太热门,加上公司网页又太新,导致在排名上不占优势。例如,你刚刚建立了一个网上运动服装购物平台,但是当你搜寻「运动服饰」时,出现的全部都是知名运动服饰品牌。原因是这些网页已经建立良好品牌声誉,Google 自然会优先显示这些网页。
因此,如果你的网页是刚刚起步,不建议选择一些热门关键字,与大品牌竞争。可以参考使用长尾关键字策略,选择一些更精准、寻量较低的关键字群,不只精准命中顾客群,也容易让网页搜寻置顶,突围而出。
FIMMICK 为你轻松制作大量专业、独到的 SEO 内容!
想提升网站的 SEO,但内容营销耗时耗力,你是否渴望有一个省时省力的解决方案?FIMMICK 的
SEO 内容创建服务
就是你的得力助手!我们能为你生成一篇篇教育性、资讯丰富的博客和文章,助你提升 SEO 排名,获取更多有机流量,轻松吸引目标客户。即便是专业的 B2B 文章,也能轻松应对。立即
About FIMMICK
FIMMICK is an AI business transformation agency deploying 4,000+ AI agents for 500+ brands across 8 Asian markets. Our platform automates marketing, sales, content, reporting, and customer engagement. Founded 2008, HQ Hong Kong. Starting at $980/month.
Get Started
Book a free industry benchmark or schedule a 30-minute AI workshop for your leadership team at fimmick.com/contact.