文章推荐量和阅读率的高低决定因素很多,但基础的仍然在于文章质量和文章内容是否符合算法要求。
一、百家号的推荐机制释疑
目前就百家号的算法(智能推荐)原理,并没有一个标准的说法,根据笔者近几年运营百家号的经验,以及与百家号运营和客户端方面朋友的交流,可以大致总结一下百家号推荐机制(算法)方面的基本流程和大致标准。
百家号的推荐机制是一个机器算法+人工干预的方式。
在算法方面,百家号把推荐机制分成了多个阶段,至于具体有多少个阶段,目前尚不清楚,至少从表现来看,刀客一年前的文章仍然在推荐。
具体到新发布的文章推荐,决定推荐量高低环节,是前两个阶段完成的。
文章发布审核通过后,系统会通过算法会识别文章内容特征并标注很多个标签,同时在读者库里,也会根据每个读者的阅读习惯给每个读者打很多标签,系统通过算法匹配新发布的文章与读者关系,把文章推荐给潜在可能阅读的用户。这个推荐量不会很大,我们可以将其看成算法的小样测试。
第一阶段的小样推送后的反馈数据(点击量、评论量、转发量、阅读完成率等)将成为第二阶段推荐的依据,而第二阶段的推荐量基本上决定了一篇文章最主要的阅读量。
在第二阶段的推荐中,系统会通过算法找到第一阶段反馈数据中读者代表性的特征和标签,系统认定这类用户对该内容感兴趣。平台根据第一次推荐后的效果把文章扩大范围推荐给与第一阶段阅读和互动相似的读者人群,从而进一步提高文章和读者的精准匹配,提高文章的点击率和阅读完成率。
第一阶段读者反馈数据的好坏决定了第二阶段推荐量的大小,而第二阶段的推荐量大小,基本上决定了文章推荐量和阅读量的高低。
另外一个需要说明的是,百家号对优质内容的推荐与别的平台不同,一些平台基本上是24小时推荐,24小后不再推荐之前的内容,而百家号的算法会根据用户反馈数据,长期进行推荐。如果一篇文章内容质量很好,用户的评论量、转发量、阅读完成率等方面表现优势,那么这篇文章推荐一个月,甚至两个月都是有可能的。
以上是百家号的机器推荐部分的大致原理,那么百度号推荐机制中的人工干预又出现在什么方向呢?
一个方面表现在,对于优秀作者的优秀作品,百家号的运营会进行编辑推荐的干预,从而从第一阶段的推荐加大优秀作品的推荐量,当然这一部分内容占比不是很大。同时,百家号的运营会根据近期的热点事件进行专题方向的策划,这些新闻专题的策划,往往推荐量是有加权的。
人工干预的另外一个方面就是文章受到了比较多的投诉,在这种情况下,需要人工进行实际的审核,同时对于机器审核出现的误差,进行人工审核。
在智能推荐机制中,在算法匹配过程中,除了读者阅读个性标签和文章内容标签的匹配外,还会涉及到读者所处的场景和百度体系中的社交关系。对读者来说,与你兴趣相投的朋友在什么场景下阅读什么内容,很可能会给你推荐什么内容,在智能算法上,并不只是简单的算法模型,更多的是基于每个人个人属性的考量。
从推荐机制上,我们大致可以看出影响推荐量低的几个主要因素。
1. 第一次推荐的点击率低 第一次推荐或才说首次推荐是决定文章推荐量的最核心的一步,造成第一次推荐点击量低的原因主要在于文章的内容质量、垂直度(每个账号的都会有专注的领域标签,如果发布非本领域的文章,算法会重新计算内容分类,不仅造成审核时间长,而且会影响到内容和用户的匹配准确度)、标题和关键段落的表达的文字张力。
2. 内容质量低
3. 内容无吸引力
4. 内容潜在用户少,内容生僻
5. 同类型的文章过多
6. 文章非首发,受查重机制的影响
二、百家号对文章质量的判断机制
那么什么样的文章,百家号会加大推荐量呢?这就涉及到了百家号对文章质量的判断。
算法在识别内容特征的过程中,并不能象人工审核一样,可以从复杂的文字表述中得出一个比较准确但很模糊的概念,算法是以数据为依据的,这与人工审核有着很大的区别。
百家号识别内容质量的维度,大致可以分为文章篇幅、内容的专注度、特征标签、图片质量、文章的独家性以及独家观点等几个方面。
1. 文章篇幅
自媒体从基本分类上,很少有纯新闻类的内容,一则是由相关法规决定的,另一方面,个人化媒体在新闻源上很少有优势。所以原则上看,自媒体的内容大致都会限定在知识和评论两个方向。对于这两个方向以及相似的方向的文章而言,很难用短文能表达清楚。从百家号的推荐机制的实现情况来看,百家号上很少有1000字以下的文章有好的推荐量,所以要获得推荐量,文章篇幅是算法识别的第一关键点。文章最好在1000字以上,1500字到2000字是比较好操作的一个篇幅容量。
2. 内容专注度
帐号的专注度不仅会影响百家号指数的变化,而且会影响到文章内容特征的识别,所以在垂直帐号上,不要发布与帐号领域不匹配的文章。
3. 内容价值和特征标签
在算法提取内容特征标签时,内容详实,给读者有价值,可读性高的文章,自然会带来更多的第一阶段推荐的用户互动,同样,这些特征标签的匹配精度的提高,会对第二阶段的推荐量产生根本性的影响。在系统中,这类特征的文章自然会被认定为优质内容。
4. 图片质量
图文并茂一直是读者阅读的一个基本要求,在算法时代也没有变化,同样在百家号的算法体系中,对图片质量和数据的要求更容易差别。根据目前的情况,一篇文章5~6图片是一个比较好的选择,同时这些图片的质量越高,越容易被系统判定为优质内容。
5. 独家性
独家性表现在独家观点和独家首发两个方面。由于目前各平台的除重机制非常严格,系统很容易判定文章内容是否是本平台首发。如果不是本平台首发的文章,在推荐基数上会受到严重的影响。
观点鲜明的独家观点是读者喜欢的一个重要因素,而容易引起读者讨论的观点,自然会表现在第一阶段推荐的用户反馈数据上,这也就影响到了算法对文章质量的判断。
信息的智能分发是一个比较复杂的系统,同时各平台的系统也在不停的升级迭代,如何写出符合算法平台需要的高质量文章,需要自媒体作者在写作的同时,通过后台数不断进行分析和总结。
实际上,无论是传统媒体时代还是智能分发时代,无论是人工审核还是机器审核,变化的只是不同的维度标准,对于高质量的文章,仍然是目前各平台急缺的内容。
伍佰目录声明:本站部分文章来源于网络,版权属于原作者所有。如有转载或引用文章/图片涉及版权问题,请联系我们处理.我们将在第一时间删除!
联系邮箱:tsk@qq.com