Google有关Blog Ranking的Patent.
读了1下 Google 有关 Blog Ranking 的 Patent,总结以下。
正面的指标值:
- [0038] 定阅数
统计分析 blog 在各种各样 reader 中被定阅的数量。被定阅的越多,ranking 越高。但另外会应用1些方式解决“subscriptions spam”,诸如认证定制人和 IP 的唯1性。
- [0039] 检索点一下数
统计分析 blog 做为检索結果时被点一下的次数。点一下次数越多,ranking 越高。
- [0040] 在别的 blogger 的 blogroll 里的出現次数
blogger 一般会应用 blogroll 来梳理指到别的 blogger 的连接结合。统计分析全部 blogroll 中,指向某个 blog 的连接越多,ranking 越高。
- [0041] 来自高品质的 blogroll 的连接数
高品质的 blogroll 的连接大多数都指向知名的或值得信赖的 blog。
- [0042] 来自高品质的 blog 的 blogroll 的连接数
这里的假设是知名的或值得信赖的 blogger 不容易放指向 spam blog 的连接。
- [0043] 有Tag
blog 作者假如剖析了 blog 內容,分类并打到了 tag,至少能够表明作者的心态较为用心。
- [0044] 来自电子邮件和闲聊纪录的连接数
假如在 Email 文章正文里或闲聊纪录里出現了指向 blog 的连接,会加分。GEmail 和 Gtalk 被用在了这里。
- [0045] PageRank
PageRank 越高对应的 blog 也就越关键。考虑到到blog的升级较为经常,全新的 blog post 将会都还没PR。这时候能够用对应的 blog 的 PR 来替代。
在其中 [0040-0042],实际上是相近于传统式网页页面间 PageRank 测算的1套方式,只但是这里把它限定在了 blog 之间。
负面的指标值:
- [0047] 升级频率出现异常
升级过度经常或十分有规律性,会被觉得是在 spam,ranking 会减少。这里提示喜爱在每日的固定不动時间升级 blog 的盆友留意1下了。
- [0048] feed 內容和 blog 內容的不1致
spammer 有将会会以便提高自身的 ranking 而把有使用价值的內容放到 feed 里边,另外在 blog 內容里边放1些指向不有关內容的广告宣传连接。以便处罚这类状况,针对 feed 內容和 blog 內容不1致的状况,要减少 ranking。
- [0049] 出現反复內容
一些 spammer 以便让一些內容可以数次长期的出現在 feed 里边,会反复公布一样的內容。这样的状况会被处罚。
- [0050] 废弃物词过量
根据词频统计分析(bi-gram 或 tri-gram 等),假如 blog 內容里废弃物词的较为太高,会减少 ranking。
- [0051] 大部分 blog 长度相仿
这个关键是对于应用设备全自动转化成 blog 的状况。
- [0052] 连接出现异常
当 blog 里的连接多为指向单1网页页面,或单1的外站,会被觉得是在 spam,ranking 会减少。
- [0053] 广告宣传太多
假如1个 blog 网页页面内含有过量的广告宣传,会减少 ranking。
- [0054] 广告宣传出現在文章正文里
1般 blog 网页页面会包含3层面的內容:近期发布的 blog,blogroll 和 metadata。假如广告宣传出現在文章正文里,会减少 ranking。不知道道 adsense 的广告宣传有木有独特待遇?