我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:在线斗牛棋牌 > 放射性衰变 >

如何给一条 Twitter 消息建立衰变模型?

归档日期:06-26       文本归类:放射性衰变      文章编辑:爱尚语录

  有时流量数据会让人上瘾。谁不想看看到底谁在浏览自己的网页呢?但你肯定没有见过《连线》作者  Rhett Allain 这么玩儿数据的:为一条含有链接的推讯建立衰变模型。 bit.ly 会给任何 bit.ly 链接提供即时数据。你只需在 bit.ly 链接后面加上一个“+”即可以看到该页面的访问信息,比如这个: 。很酷吧。

  有时流量数据会让人上瘾。谁不想看看到底谁在浏览自己的网页呢?但你肯定没有见过《连线》作者

  Rhett Allain这么玩儿数据的:为一条含有链接的推讯建立衰变模型。

  bit.ly会给任何 bit.ly 链接提供即时数据。你只需在 bit.ly 链接后面加上一个“+”即可以看到该页面的访问信息,比如这个:

  链接,流量高峰几乎可以肯定是因为《连线》官推(@wired)发了一条含有该链接的推讯,该账户有85万粉丝。而 Rhett(

  Rhett当时的第一反应就是这些数据看上去像是放射性衰变。于是他打算计算出一条转发推讯的半衰期。什么是半衰期呢?

  N),并且假定这些东西减少的速度与其数量成比例。在给定的时间间隔 Δt 内,可以表达如下:

  下面是流量数据和指数函数的拟合情况(通过 Vernier 的 Logger Pro 软件模拟而成):

  点击基准数为 Logger Pro 自动添加。这表明在指数衰变模型下,Rhett每分钟能获得约20次点击。

  N 并非总点击数,而是每分钟点击数。把点击数作为时间的函数,可以得到一条plot曲线。

  似乎衰变模型并不适合这种情况。每分钟点击次数的减少速度似乎和每分钟点击数无关。于是他打算换个方法。

  *有85万关注者可能会看到这个链接。此处忽略了那些看到链接的非关注者。将此变量设为

  *这些关注者中的确有些会查看自己的 Twitter 消息。假定这部分关注者为

  F 个关注者,但如果他们点击过的话不会再次点击。担忧例外,比如 Rhett 的老爸通常一个链接会点击两次,因为他认为只有这样才能打开链接。

  c呢?这部分人更少。假定你是一名 Twitter 用户,第一分钟内没有点击该链接。现在你在看到这个链接之前已经看过20条推讯。那么你点击这条含有链接的连线官推的几率有多大呢?这取决于推讯的多少,以及你的冲动程度。但显然不是线性函数关系,因为如果是的话过一段时间之后几率会变成零。

  假定你是一名看到这个链接的人,并假定每分钟你都会在feed中看到一个新链接。Rhett 假定你点击某个链接的几率和链接总数成比例。所以,前两分钟内:

  l 是某个常量,代表增加的推讯数。0.25 是一个假定比例,针对没有链接被点击的情况。

  B)也为常量。还有另一个假设,有些点击者会转发该链接,假定其为二阶效应,可以忽略不计。

  l0 = 25,亦即假定每分钟普通推友能看到25条新推讯。通过这些推讯,Rhett得出一个概率系数0.45。结果好于预期。

  Rhett 打算通过这次事件验证上面的出的模型。假定两者粉丝情况类似,以便得出相同的

  Rhett 首先验证第二点。这种可能性很大,后者粉丝明显少于前者,但在第一分钟内点击次数类似。Rhett把

  的粉丝更有可能查看自己的 Twitter feed。他觉得这说得过去。或许很多连线的粉丝都真正注意吧。

  Rhett Allain 为东南路易斯安那大学物理学助理教授,喜欢教授和讨论物理学。有时把东西拆散了无法组装回原样。你可以在 Twitter 上关注他(

  原创文章,作者:pestwave。转载或内容合作请点击转载说明,违规转载法律必究。

  非要用一句话来描述  Zaarly,那就是「‘移动版’的Craigslist、赶集、58同城」。通过信息化技术,把供需双方更好的结合在了一起——这种 O2O 模式的移动电商真是商机无限啊! Zaarly 的概念很简单。首先由有需求的用户发出需求,比如我想要买一台Mac 电脑,打算什么时候、大概多少钱买,位置在哪里等。你的需求会通过Zaarly 发布到本地社区中,用户也可以选择发布的同时更新到Twitter 等社交网络。

本文链接:http://shmmy.com/fangshexingshuaibian/129.html