朗宸网站制作让您的品牌在商业策略、行销、创意文案、视觉暨互动设计等专业领域都值得期待。
seo和sem的区别是什么?sem和seo的区别和联系、seo与sem的含义与区别、seo和sem的区别是什么、seo跟sem区别、SEO与SEM的区别和联系、SEO与SEM的区别和联系、seo与sem的联系与区别、seo与sem的区别?seo和sem的区别有哪些、seo和sem有什么联系
...2023-07-22
什么是SEO? 如何进行SEO优化? 搜索引擎优化、Google SEO、百度 SEO、baidu SEO、seo什么意思、seo 工具、seo是什么?如何优化?seo怎么做?seo是什么、seo是啥、seo 百度百科、SEO综合查询、google推广公司、百度seo优化公司、搜索引擎优化公司、seo全国较好的公司、谷歌seo优化公司、谷歌优化公司、Visual studio code创建HTML的方法、visual studio code创建HTML的方法步骤、Visual studio code创建HTML的方法
...2023-07-17
上海放心的搬家公司、上海搬家公司哪家好?上海搬家公司哪家专业?上海搬家公司哪家靠谱?上海搬家公司哪家好一些?上海出名的搬家公司、上海专业的搬家公司、上海靠谱的搬家公司、上海有名的搬家公司
...2023-07-15
上海seo优化
...2023-07-11
上海Seo优化公司,上海Seo搜索引擎优化选择朗宸网络,有排名才有转化 https://www.just-lca.net
...2023-07-08
LV总裁带儿女现身北京巡店、上海高端网站制作,上海网站制作,上海网站设计,上海网站建设公司,上海响应式网站制作
...2023-06-29
选择一个比较适合的域名及域名选择的重要性:上海网站建设、上海高端网站定制、上海网络推广、上海网站优化
...2023-04-01
什么是百度端口户?百度竞价推广怎么开高返点户?上海网站建设、上海网站设计、上海网站制作、上海网站定制
...2023-03-26
SEO推广和SEM推广哪个好?这两种营销方式该如何选择?(上海网站定制)
...2023-03-24
SEO和SEM的不同点 (上海网站制作)
...2023-03-24
上海SEO按天计费到底合不合理
...2021-08-28
上海网站建设,怎样才能真正提升网站域名的权重,上海做网站的开发公司、建网站公司上海、上海有实力建设网站私人订制、上海建站服务、上海建网站价格、上海企业制作网站、上海网站制作开发、上海做网站的开发公司、建网站公司上海、上海网站建设在线、网站建设公司、上海网站制作专业、公司企业网站制作、无锡做网站的公司、无锡小程序开发工作室
...2021-09-06
上海网站建设联系电话,,上海网站建设、上海网站制作、上海网站定制、上海网站开发
...2021-07-04
苏州seo网站排名、苏州关键词排名工具、 苏州网站制作排名、关键词优化推广排名seo免费优化网站 苏州百度快照优化排名推广
...2022-07-19
上海高端网站制作,上海做网站企业、上海模板建站定制网站、 如何创建网站、企业网站设计、网页设计界面网站推荐、网页设计品牌网站、高端的设计网站、上海网站设计与制作、上海的设计优化公司、上海专业做网站、上海网页模板建站、上海建站网、高端的设计网站、上海网络网站建设、上海网页设计制作网站、上海网站设计与制作、上海高端建设网站、定制建站网站建设、上海网络开发公司、上海网站建设维护、上海小程序建设、上海网站建设软件、上海网站建设开发、高端网页开发、网站制作高端、上海高端网站制作公司、上海高端网站开发、网站开发、做高端网站公司、上海定制网站设计、上海高端做网站、上海网站高端定制、上海高端品牌网站制作
...2021-10-08
企业建站的公司,,上海网站建设、上海网站制作、上海网站定制、上海网站开发
...2021-07-04
杭州关键词排名工具、浙江seo关键词、杭州专业seo公司、杭州关键词排名系统、浙江专业网站seo、杭州网站seo外包、杭州朗宸seo、杭州优化排名哪家好
...2022-07-19
网站设计记住这三点优化技巧,上海网站建设、上海网站制作、上海网站定制、上海网站开发
...2021-04-08
上海网站设计_开始考虑Seo时你需要知道的一些信息,淘宝卖家如何进行SEO优化?搜索引擎优化方法-如何做seo优化-什么叫网站优化? seo网站优化外包服务,百度自然排名快速推广,seo优化推广、英文seo推广外贸seo排名谷歌seo优化、如何做SEO网站优化?如何做SEO网站排名?seo怎么入门-seo入门的几个步骤?Seo网站关键词优化如何?Seo网站优化培训多少钱?如何对Seo关键词进行优化?5118关键词、怎样做好SEO是我们的网站收录的更好?如何利用SEO来赚钱?还在用SEO书本上的理论吗?seo基础知识,如何做好网站分析,大数据时代分析至关重要、如何做免费的SEO推广?seo怎么入门-seo入门的几个步骤?企业如何利用SEO优化来处理网络负面舆情新闻?SEO是如何进行搜索引擎优化的?新站如何做SEO布局?站内seo方案、自己的网站怎么做seo、网络推广公司哪家做得好
...2021-10-15
新老域名对于网站优化的好处有哪些
...2021-06-30
有办法预测某个特定网页的搜索引擎排名吗?这里我想告诉大家这个是可以实现的。JR Oakes 和他的同事在2015年末利用机器学习概念做了一个实验,基本实现了预测搜索引擎排名。下面就是他们原文的译文,上海网站制作,上海高端网站建设,专业网站设计希望这些成果能够启发大家。机器学习正在越来越快地成为很多大公司的一个不可获取的工具。相信每个人都听说过谷歌的人工智能算法打败了前世界围棋**,以及谷歌的搜索结果排名算法 RankBrain。机器学习早就不是数学研究者们的神秘课题了。在有大量数据的行业里,技术总会有很多方法变得有用。机器学习也有能力改变传统的网站推广和 SEO(搜索引擎优化)。去年晚些时候,我和我的同事开始了一项实验,我们将一个流行的机器学习算法应用到了预测谷歌对特定网页的排名中。最终我们得到了一个 41% 正确肯定和 41% 正确否定的数据集。
在接下来的几段里,我将会带你过一遍我们的实验,我还会讨论一些对 SEO 很重要的技术问题。
我们的实验
在 2019 年年末的时候,我们开始越来越多地听说机器学习以及它在处理大量数据上的能力。我们越认真工作,它就变得越专业,而且很快它就会帮助我们运转这个世界。
那个时候,我们遇到了才华横溢的巴西数据科学家 Alejandro Simkievich。最有趣的事情是他正在研究搜索领域的相关性和转化率优化(CRO)等问题,并且正在准备参加 Kaggle 竞赛。(Kaggle 是一个针对科学家和机器学习爱好者举办机器学习竞赛的网站)
Simkievich 是数据科学和机器学习咨询公司 Statec 的创始人,该公司在消费品、汽车、营销和互联网行业拥有很多客户。Statec 的很多工作都集中在评估电子商务搜索引擎的相关性上。我们和他的合作似乎是一种自然结合,因为我们也痴迷于利用数据来帮助人们做出 SEO 决策。
我们决定试试能否使用抓取工具、排名追踪、链接工具和其他一些工具的可用数据来预测网页排名。我们知道完全预测正确的可能性非常低,但我们仍能在利用机器学习上获得一个了不起的成功。
数据
机器学习基本上是使用计算机程序采集数据,并转化这些数据,生成有价值的信息。「转化」是用得非常泛的词语,它不能很公正地指代它涉及的所有那些事物,但是它有助于我们理解。此处的关键是,所有机器学习都是从某类输入数据开始的。(注:有许多讲解机器学习基础知识的教学讲座和课程可免费获得,所以我们在这里不做深入介绍。如果你有兴趣了解更多,可去 Coursera 上参加吴恩达的免费课程。)
我们的基本论点是我们必须发现用于训练机器学习模型的数据。就这点而言,我们并不十分清楚什么是有用的,所以我们采用一种生活化的方法,并抓住我们能想到的尽可能多的特征。 GetStat 和 Majestic 提供了许多极其重要的数据集,而且我们构建了一个网络爬虫去捕获其它所有东西。
机器学习正快速成为许多大公司不可或缺的工具。确切地说,每个人都听说过谷歌的人工智能算法打败了前世界围棋**,还听说过像 RankBrain 这样的技术,但是机器学习无需故作神秘,只在数学研究领域内闭门造车。有许多可以利用的文献资料和技术,它们对于有诸多可以操作的数据的行业都是有用的,给这些行业带来了希望。
在下文中,我将带你了解我们的实验,而且我还将讨论一些重要的文献和技术,它们对初步理解 SEO 是重要的。
我们的目标是最终取得足够数据成功地训练一个模型,而且这意味着我们需要很多数据。对于**个模型,我们有大约 20 万观测值(行)和 54 个属性(列)。
背景知识
就像我之前说的,我不会讲很多关于机器学习的细节,但重要的是掌握下面这几点。总的来说,现在的大部分机器学习工作都是在处理回归、分类和聚类算法。我将在这里定义前面两个,因为它们与我们的这个项目有关。
回归算法通常用于预测一个数字。如果你需要创建一个基于股票特征预测股票走势的算法,你就得选择这个模型。它们被称作连续变量。
分类算法用于预测诸多可能答案中的一个类别的成员。这可以是简单的「是或否」分类,或者「红、绿或蓝」的分类。如果你需要基于特征预测一个不认识的人是男还是女,你就得选择选择这个模型。它们被称作离散变量。
搞定谷歌排名
既然我们有了数据,我们尝试了几种方式预测每个网页的谷歌排名。起初,我们使用回归算法(regression algorithm)。即,我们追求预测在搜索给定的词语时网站的**排名(比如,搜索词语 Y,预测某网站的排名为 X),但是,在几周之后,我们意识到这项任务太困难了。首先,排名指的是一个网站与其它网站的相对关系,而不是指网站的内在属性。既然我们不可能拿在给定搜索词条件下所有的网站排名去训练我们的算法,我们重新表述了问题。 !
我们认识到,就谷歌排名而言,最紧要的是在给定搜索词时一个给定的网站是否最终能排在**页。因而,我们重新剖析了问题:如果我们预测在搜索某个词时一个网站的谷歌排名是否能进前十,又会怎样呢?
从那点来看,问题转变成二进制(是或否)分类问题,我们只有两个分类:1)网站是排在前十的,2)网站不是排在前十的。此外,我们决定预测一个给定网站属于这两类的概率,而不是做出是或否的预测。
随后,为了迫使我们自己做出更明确的决策,我们设定用来衡量一个网站是否能排进前十的阈值。例如,如果我们预测阈值是 0.85 ,然后如果我们预测网站排进前十的概率高于 0.85 ,我们就认为这个网站将进入前十。
为了衡量这个算法的性能,我们决定使用混合矩阵。
下面这个图表概述了整个过程:
理清数据
我们使用了一个有 20 万条记录的数据,包括大约 2000 个不同的关键词/搜索词。总体上,我们可以把这些关键词依据属性分为以下几类:
数字属性
类别变量
文字属性
数字属性指的是该关键词可以表示无限或有限区间内的任意数字。
类别变量是指一个可以表示有限数量的值,每个值代表一个不同的群体或类别。
文字属性显然指文本,包括搜索关键词,网站内容、标题、元数据描述(meta description),锚文本、标题(H1 H2,H3)等。
特征工程
我们设计了与排名有关的额外属性。
大多数属性是布尔逻辑体系的(真或假),但是一些是数值的。例如,布尔逻辑属性是网站文本中的**搜索词是什么,而数值属性是网站文本中有多少被标记的搜索词。
下面是我们设计的一些属性。
运行 TF-IDF算法
为了预处理文本特征,我们使用了 TF-IDF 算法(检索词频率,反转文档频率)。此算法将每个实例视为文件,并将所有实例集合视为一个语料库。然后,它为每个词赋予分数,词汇在文件中出现的频率越高,在语料库中出现的频率越低,那么其分数就越高。
我们试过两种 TF-IDF 方式,只得到依赖于模型的略微不同的结果。**种方式由首先连接所有的文本特征构成,然后应用 TF-IDF 算法(也就是说,单个实例的所有文本列连接而成文件,一系列这样的实例构成语料库)。第二种方式是指对每个特征分开应用 TF-IDF 算法(也就是说,每个单独的文本列是一个语料库),然后连接由此得出的数组。
用 TF-IDF 算法得出的数组是非常稀疏的(对于给定的实例大多数行列的数据是零),所以我们应用降维手段(奇异值分解)减少属性/行列的数量。
最后一步是连接所有从特征类别中得出的行列形成一个数组。这是我们做完以上所有步骤(理清特征,将分类特征转变为标签并在标签上运行独热码,应用 TF-IDF 算法于文本特征并将所有特征按比例排列到平均值两端)后再去做的。
模型和集合
在获得和连接所有属性后,我们对它们运行了许多不同的算法。结果显示最有前途的算法是渐进增长分类器( gradient boosting classifier),脊分类器( ridge classifier)和一个两层的神经网络。
最终,我们使用简单的平均值将模型结果集中在一起处理,因此我们得到了一些额外收获,因为不同模型倾向于有不同的偏差。
优化阈值
最后一步是设定阈值将概率估算转变为二进制预测(「是的,我们预测此网站位于谷歌排名前十」或「不是的,我们预测此网站不会进谷歌排名前十。」)为了做到这点,我们优化了交叉确认集(cross-validation set ),然后使用了在测试集上得到的阈值。
结果
我们认为对于测量模型有效性的最有代表性的度量是混淆矩阵。混淆矩阵是一种可视化的表格,主要用于比较分类结果和实际测得值。混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。
我确信你听说过「一个坏掉的钟每天有两次能正确指示时间」这句格言。输入每个关键词得到 100 种结果,随意瞎猜总能以 90% 的正确率预测「不能排在前十」的情况。混淆矩阵确保肯定的和否定的答案都是正确的。在我们**的模型中,我们获得大约 41% 的正确肯定和 41% 的正确否定。
将模型效果可视化的另一途径是使用特征曲线(ROC curve)。特征曲线是「用图示法说明二进制分类器系统随着鉴别力阈(discrimination threshold)而变化的效能。」在这整个系统中使用的非线性模型是 XGBoost 和一个神经网络,而线性模型是逻辑回归。整个系统的布局则是线性与非线性模型的结合。
XGBoost 是「极端渐进增长(Extreme Gradient Boosting)」的简称,渐进增长是「一种针对回归和分类问题的机器学习技术,它生成弱预测模型集成形式的预测模型,典型的是决策树。」
下面的图表揭示了特征类别对此模型最终预测的准确率做出的相对贡献。与神经网络不同, 伴有其它模型的 XGBoost 允许你轻易地窥视模型内部,从而判断特定特征持有的相对预测权重。
我们能建立从我们给定的特征中表示预测力的模型,对此我们非常惊讶。我们感到焦虑的是,特征的局限会导致此项目无果而终。理想情况是,我们有一种方法抓取所有网站,从而获知它们的整体相关性。也许,我们可以在公司拥有的谷歌评论数量上收集数据。我们也明白谷歌拥有关于链接和引用量的大量数据,而这些数据比我们希望收集到的数据好得多。
结论
机器学习是一个即使你不知道它是如何工作的你也能使用的强大工具 。我读了很多关于 RankBrain 和工程师无法理解它是如何工作的文章。这是机器学习神奇和美丽的原因。类似于生命在进化过程中会获得不同的特征一样,机器学习在过程中找到了答案,而不是给出既定的方法。
当我们对**个模型的结果感到满意的时候,我们更需要知道,相比于这种小规模的样本,互联网的规模更加巨大。我们的一个关键目标是建立一个能够处理互联网上的海量数据和信息的机器学习工具,我们也正在改进当前的这个模型。
对于我自己来说,这个项目**的意义是我开始了解机器学习对我们这个行业的巨大价值。在我看来,机器学习对 SEO 有着以下几点影响:
文本生成、总结和归类。
永远不要写另一个 ALT 参数
观察用户行为和对访客归类/打分的新方法
通过语音和智能Q&A问答的文本、产品、推荐系统来进行导航的新方法。
挖掘分析并深入了解访客、会话、趋势和潜在可行性的新方法
———————————————————————————————
朗宸广告非常尊重知识产权,我们基于原创且积极支持原创分享,网站出于对专业的严谨态度本着雅俗共赏的精神,部分素材可能引用自网络来源: 内容若涉及到素材元素、图片、配乐、字体及相关的文本阐述等…其著作权归作者所有,此站仅作为交流展示,无任何商业用途,如有侵犯任何第三方权益,请及时联系上海朗宸,我们将及时予与删除!谢谢!
分享声明: 朗宸广告积极倡导并支持原创,本站若有转载网络媒体稿件只是本着共同学习、分享传播更多的行业资讯,相关稿件不代表本站作者的观点,故不承担此类信息的侵权行为及连带责任。如果您发现本网站的内容侵犯了您的论点,请将您的原版内容及出处发送至我们的工作邮箱,朗宸在校对确认后即时删除以保证您的版权合法权益_Mail:172576222@qq.com
Whether you are a small start-up enterprise or a well-developed Chinese and foreign enterprise, we will provide you with
professional planning solutions. You can try to call us at +86_21_54424321 (+86_13524363555), or ask for a quote for more information, thank you!
We provide video production, consulting services, brand strategy, promotion, management etc.
上海朗宸网络互联是一家综合型品牌全⽅案整合策划服务商,为客户度身定制品牌创意及推广解决方案,提供从前期VIS品牌形象定位、高端网站建设,专业网站设计制作,网站定制,响应式网站,各类商城网站搭建,系统定制开发优化及企业视频制作全链式视觉服务...
Copyright©justLCA. All rights reserved 朗宸-版权所有, 盗版必究
沪公网安备31010595021583号,沪ICP备12048239号-6 法律: 周再辉
技术支持: 上海网站建设 *您还可以了解我们公司旗下更多业务
QQ-line:172576222
Service:13524363555
Back to the top,Tks!