梦想破碎是没有声音的,它只是缓慢又沉默地离开了。 by 苏更生

标签:机器学习

大数据

【译】读懂这100篇论文,你也能成为大数据专家

【译】读懂这100篇论文,你也能成为大数据专家
今天在网上闲逛,无意间发现了这一篇好文,原文作者是PayPal高级工程总监Anil Madan,文章对当前大数据领域用到的一些技术、框架等都做了一遍梳理。本文由CSDN翻译。通过阅读本文,可以对当前大数据领域有一个很好的认识,如果需要深入了解某项技术,可以阅读文章中所给的文章或...

cricode 2年前 (2015-02-14) 6359℃ 0评论 14喜欢

机器学习

扒一扒”极客头条”的排名算法

  在这个信息爆炸的时代,我们从未缺乏信息,我们缺乏的是如何在最短是时间内从海量的噪音数据中找到对自己真正有用信息的能力。当然,我们希望有这么一个推荐引擎,能将我们自己喜欢的内容推送到我们的眼前,免除我们自己挖掘信息的烦恼。 极客头条通过用户自荐和编辑推荐两种方式,干...

Jay13 3年前 (2014-06-19) 5319℃ 4评论 3喜欢

机器学习

基于用户投票的排名算法(六):贝叶斯平均

上一篇介绍了“威尔逊区间”,它解决了投票人数过少、导致结果不可信的问题。   举例来说,如果只有 2 个人投票,”威尔逊区间”的下限值会将赞成票的比例大幅拉低。这样做固然保证了排名的可信性,但也带来了另一个问题:排行榜前列总是那些票...

Jay13 3年前 (2014-06-19) 2805℃ 0评论 3喜欢

机器学习

基于用户投票的排名算法(四):牛顿冷却定律

这个系列的前三篇,介绍了 Hacker News,Reddit 和 Stack Overflow 的排名算法。   今天,讨论一个更一般的数学模型。   这个系列的每篇文章,都是可以分开读的。但是,为了保证所有人都在同一页上,我再说一下,到目前为止,我们用不同方法,企图解决的都是...

Jay13 3年前 (2014-06-19) 3380℃ 0评论 3喜欢

机器学习

基于用户投票的排名算法(三):Stack Overflow

Reddit 排名算法的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。   但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一的程序员问答社区 Stack Overflow,就是这样一个网站。   你在上面提出各种关于...

Jay13 3年前 (2014-06-19) 2998℃ 1评论 5喜欢

机器学习

基于用户投票的排名算法(二):Reddit

Hacker News 排名算法的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。   Reddit 是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示”赞成”和”反对&...

Jay13 3年前 (2014-06-19) 2746℃ 0评论 7喜欢

机器学习

基于用户投票的排名算法(一):Delicious和Hacker News

互联网的出现,意味着”信息大爆炸”。   用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。   各种各样的排名算法,是目前过滤信息的主要手段之一。对信息进行排名,意味着将信息按照重要性依...

Jay13 3年前 (2014-06-19) 2976℃ 0评论 8喜欢