• 书信范文
  • 文秘范文
  • 党团范文
  • 工作总结
  • 工作计划
  • 工作报告
  • 心得体会
  • 合同范文
  • 节日大全
  • 自我鉴定
  • 演讲稿
  • 汉字意思
  • 其他范文
  • 当前位置: 蓬勃范文网 > 范文大全 > 其他范文 > 正文

    今日头条办公地址

    时间:2017-01-12来源:蓬勃范文网 本文已影响

    篇一:今日头条公司岗位需求招聘信息

    “今日头条”是一款基于数据挖掘的推荐引擎产品,是国内移动互联网领域成长最快的产品服务之一。“今日头条”第一个版本于2012年8月上线,截止2014年1月,“今日头条”已在为超过8000万忠诚用户服务,每天有近千万的用户在头条上找到让他们了解世界,启发思考,开怀一笑的信息,并活跃地参与互动。我们是一支拥有丰富创业和成熟公司经验的靠谱团队,聚集了来自一流学校和公司的顶尖人才。公司处于高速发展期,在创立一年之内,已成功获得了顶级VC和华尔街投资银行家的数千万美元的风险投资。

    我们崇尚简单,始终关注用户需求,热衷于把从用户界面上的每一个细节体验到后台的海量数据处理都做到极致;我们推崇在轻松,快乐的环境中学习,积累,分享和成长。在这里,我们每天都在创造价值,产生影响。

    我们的工作地点是: 北京市海淀区知春路(离地铁站5分钟)。请在简历中注明申请职位名称, 发送至: hr@bytedance.com

    我们为你提供的:

    ?

    ? 数据分析(高级)工程师

    研发(DATA) ? ?

    ? 文本分析与挖掘(高级)工程师

    ?

    ? ?

    ?

    研发(WEB) ? ?

    研发(客户端) ? ?

    研发(运维) ? ? ? ?

    ? ? ? ? ? ? ? 产品 ?

    ? ?

    ? ? 产品经理(娱乐类产品数据分析,需求调研)

    产品合作 产品合作与市场?

    ? 商业化 ? 广告产品助理

    ? ? ? ? 运营

    财务

    法务

    人力资源 ? ? ? ? ? 法务助理 招聘经理/专员

    数据平台(高级)工程师

    职位描述:

    1.设计和实现通用的数据分析系统,降低数据的使用门槛,支持业务团队基于通用的系统高效地、自助化、规范化地进行数据处理和分析,实现数据的最大价值;

    2.为海量用户行为数据构建设计良好的数据 pipeline、数据仓库、调度系统、分析系统、流程规范;

    3.保证系统稳定、高效运行;具备生产环境快速 trouble-shooting 的能力;

    4.高水平小团队,紧密合作,高效工作,做有影响力的事情;

    职位要求:

    1.崇尚数据说话,深信数据在驱动业务、支撑决策上的价值;

    2.熟悉一项或多项常用的数据分析相关的工具和平台,e.g. SQL, Python, Hadoop, Mapreduce, Hive, Storm, Spark, scribe, kafka, etc.

    3.优秀的编码能力,对新技术有强烈的学习热情;

    4.优秀的理解和沟通能力,快速理解业务背景,对数据敏感;

    5.有大规模互联网数据仓库、数据平台设计经验者优先;

    工作地点:北京市海淀区知春路(离地铁站5分钟)

    请将简历发送至:hr@bytedance.com

    数据分析(高级)工程师

    职位描述:

    1. 通过用户行为数据分析、实验方法量化评估用户对推荐系统的满意程度,发现影响用户留存、增长、参与度的关键因素,为推荐系统的进一步改进提供参考。

    2.高水平小团队,紧密合作,高效工作,做有影响力的事情;

    职位要求:

    1.有用户行为分析经验,熟悉在线实验方法和解释实验结果;

    2.对数据敏感,掌握量化分析方法;善于从数据中发现有意义的、重要的问题,提出假设并使用数据进行验证;

    3. 掌握常用的文本处理工具(e.g. Unix, Python)和数据分析工具(e.g. Hive, R);

    工作地点:北京市海淀区知春路(离地铁站5分钟)

    请将简历发送至:hr@bytedance.com

    基础架构(高级)工程师

    职位描述:

    1.为公司研发部门打造先进的存储、计算、消息队列、云平台等分布式系统,为海量数据和大规模业务系统提供基础设施;

    2.高水平小团队,紧密合作

    今日头条办公地址

    ,高效工作,做有影响力的事情;

    职位要求:

    1.掌握分布式系统原理,对存储、队列、计算、集群管理中的一项或多项有深入的理解和认识;

    2.强悍的 system 设计&编码能力,追求优雅的设计和优秀的代码质量,快速行动;

    3.思路清晰,具备生产系统快速 trouble-shooting 的经验和能力;

    4.存储方向:对 memcache, Redis, LevelDB, RocksDB, MySQL, HBase, scribe, kafka 的一项或多项有经验者优先;

    5.Hadoop 方向:对 Hadoop/YARN, Mapreduce, spark, storm, Hive, Impala 的一项或多项有经验者优先;

    6.云平台方向:对 YARN, mesos, CoreOS, docker 的一项或多项有经验者优先;

    请将简历发送至:hr@bytedance.com

    DevOps (高级)工程师

    职位描述:

    1.关注研发全流程的效率提升,设计和实现源代码配置管理、代码构建、单元测试、持续集成、代码发布、容量规划、监控等工具和平台;

    2.认同并坚持以下原则:

    Don't Repeat Yourself.

    Measure Everything, Automate Everything.

    3.高水平小团队,紧密合作,高效工作,做有影响力的事情;

    职位要求:

    1.熟悉对 DevOps 工具链和生态系统,对业界动态和新技术保持敏锐关注和尝试的热情;

    2.优秀的沟通能力,与业务工程师对业务场景、问题、需求保持有效沟通;

    3.优秀的编码能力,针对具体的业务场景快速设计和实现 in-house 的工具平台;

    请将简历发送至:hr@bytedance.com

    推荐系统(高级)工程师

    职位描述:

    参与个性化推荐系统算法和系统架构的研发和优化,给用户提供前所未有的高质量和明确的个性化推荐

    职位要求:

    1.具备强悍的编码能力

    2.有扎实的数据结构和算法功底

    3.有推荐系统相关经验,熟悉常用的推荐算法

    4.熟悉linux开发环境,熟悉C++和python语言的优先

    5.有大规模海量数据机器学习/数据挖掘/计算广告/搜索引擎相关经验者优先

    6.有自然语言处理相关经验者优先

    7.有hadoop相关经验者优先

    需要提交的材料:

    篇二:今日头条运作模式

    今日头条的价值在哪里?今日头条运营模式是什么?(2014-07-16 14:20:43)转载▼标签: 张一鸣客户端新闻手机app新闻头条分类: 互联网创业 今日头条的价值在哪里?今日头条运营模式是什么?导语:很少有人再去想,为什么不能存在这样一家媒体,上面发布的每一篇新闻都是自己关心的。事实最终证明,用推荐引擎分发新闻,是一条切实可行的道路。 资讯类APP“今日头条”今日确认获得1亿美元的C轮融资,估值超过5亿美元。据了解,此轮融资由红杉资本和新浪微博领投。此前“今日头条”已经进行过两轮融资,2012年7月获得SIG海纳亚洲等数百万美元A轮投资,2013年9月获得DST等数千万美元B轮投资。自2012年8月份上线以来,今日头条已经累计用户超过1.2亿。

    一支没有任何新闻门户基因的创业团队,却做出了一款用户规模近1亿的热门新闻客户端产品,这听上去有些不可以思议,但它的确发生了。

    在2013年的新闻客户端大战中,张一鸣和他的今日头条成为了最大的黑马。

    2012年8月,今日头条上线,用“生不逢时”形容它当时的境遇再合适不过了。彼时四大门户均已推出了自己的新闻客户端产品,其中搜狐、网易新闻客户端的用户规模更是已经接近4000万。虽然几大门户的新闻客户端之间还在贴身肉搏,但是对于刚刚踏上战场的今日头条来说,这场战争似乎已经结束了。对手们都是装备精良、割据一方的正规军,而自己则是势单力薄的游击队,胜负看上去实在没什么悬念。

    不过,剧情却没有像大家预想的那样发展。在这场本该属于门户豪强的游戏里,今日头条不仅顽强活了下来,还生生从对手们那里抢下了一块不小的地盘。截至2014年2月中旬,今日头条的用户规模已经超过9000万,日活跃用户1000万,并且保持每月1000万以上的新增用户,看来过亿只是时间问题。

    它究竟是怎么做到的?

    像调教电台一样,调教你的新闻客户端

    今日头条CEO张一鸣是一位典型的连续创业者

    用豆瓣或者虾米电台听歌,正在成为越来越多年轻人的习惯。

    对于喜欢民谣的文艺青年来说,广播里冷不丁冒出一首凤凰传奇的歌简直是件难以忍受的事,而在豆瓣或虾米电台这样的产品上,用户可以依据个人偏好,通过点赞、跳过或者垃圾箱等几个简单的按钮,逐步调教出属于自己的个性化电台,这样既满足了发现新歌的需求,同时也能最大程度确保播放的都是符合自己口味的歌曲。

    不过,你知道新闻客户端其实也能这么玩吗?

    这就是今日头条这款产品最大的特色,用户可以像调教电台一样,调教自己的新闻客户端。 一叠厚厚的报纸,令你感兴趣的新闻加起来可能只有一个版;在门户上泡了半个小时,真正用来阅读新闻的时间可能只有5分钟,剩下的25分钟全部花在了浏览标题上面;而RSS工具始终是极少数精英人群的专利。这就是传统新闻内容分发方式的真实写照。

    多年来,受众对这种模式已经麻木了,很少有人再去想,为什么不能存在这样一家媒体,上面发布的每一篇新闻都是自己关心的。而这正是今日头条想要做到的事情。

    一旦绑定你的社交媒体账号,今日头条的推荐引擎就能迅速根据你账号的标签、好友、转发等信息分析出你大致的兴趣爱好,从而向你推荐相应的内容,而且,随着算法的不断进化以及用户使用时长的增加,这种推送也会变得愈发精准,目前今日头条9000万的用户中有1/3都绑定了自己的社交媒体账号。

    凭借这一招鲜的推荐绝活,今日头条这家一年前还名不见经传的创业公司,已经成为了引领行业发展方向的标杆,并且受到资本的追捧。

    今年1月中旬,搜狐在发布搜狐新闻客户端4.0版本的同时,宣布了“个性化、视频化、本地化和社交化”的产品发展规划。其中的“个性化”正是要以今日头条为学习模板。搜狐产品副总裁方刚在搜狐新闻客户端合作伙伴年会上明确表示,下一步会根据用户的阅读行为

    和喜好向其推荐新闻,最终实现“千人千面”的目标,即每个用户看到的新闻都不尽相同。值得一提的是,方刚特意在演讲PPT中提到了今日头条,并且坦言正是因为今日头条这匹黑马的杀出,令搜狐新闻客户端2013年未能完成预定的目标。

    穿着新闻外衣的推荐引擎

    虽然有着一个新闻性十足的名字“今日头条”,而且看上去与同类产品大同小异,但在骨子里,今日头条则完全是另外一个物种。与其将它称为新闻客户端,其实叫它推荐引擎更为准确,因为从出发点上,今日头条就与门户网站的新闻客户端截然不同。

    传统门户想要做的是一款提供新闻资讯的移动App,完成从PC向移动的过渡,而张一鸣想做的却是一款基于移动互联网的推荐引擎,新闻资讯仅仅是它所承载的内容而已。而之所以将推荐内容选定在新闻资讯,实际上是一个排除法后的产物。

    今日头条CEO张一鸣告诉《商业价值》,他们先将能够被推荐的信息按照题材和类别全部罗列了出来,接着进行筛选。

    “我们首先排除了小说,比如一年你就看10本书,你可能就用我10次。后来觉得也不该推荐游戏,因为它也是一次投入很久,用户选择的频次也少,依此类推,还有许多东西都是不这么优先的。”张一鸣说。

    除了排除这些不适合推荐的内容,还有一类则是操作起来难度较大的。“比如全购物领域就不太好做,比如你家里灯泡坏了就想换灯泡,窗帘坏了想换窗帘,但是我怎么知道它们什么时候坏呢?因为没办法拿到这些信息,它们坏了也不会通知我。”

    经过层层筛选,张一鸣最终选择了用户使用频次高、覆盖广、适宜推荐的新闻资讯作为推荐的内容。

    用推荐引擎分发新闻,是对传统新闻门户工作方式的一次巨大颠覆。

    传统的新闻门户都有着庞大的编辑团队,编辑从每天抓取到的海量新闻中,按照一定的价值判断标准,选择出一些所谓重要的、用户感兴趣的新闻推荐到首页,或者排在靠前的位置。

    这种模式固然可行,但并不完美。人工推荐模式的背后所追求的是信息覆盖的广度,只有大家都感兴趣的新闻才能为网站带来足够多的流量,所以这就意味着一些小众的的长尾信息需求无法得到满足。

    举个简单的例子,如果一位用户喜欢一支乏人问津的NBA弱旅,那他就很难在门户首页上看到这支球队的消息。因为放在首页的永远是那些战绩最好、最炙手可热的球星和球队的消息。

    想要解决长尾的信息需求,推荐引擎就成为了最好的选择。但对于门户网站来说,多年来的工作习惯早已养成,而且传统的人工编辑模式依旧运转良好,因此也没有足够的动力和危机感去推动这样的改革。况且庞大的编辑团队也是转型的负担,一旦全部改用机器推荐了,那么这些编辑怎么办?此外,一些政策层面的因素也制约着传统门户的手脚。

    不过,这些“拖后腿”的因素在张一鸣这里并不是问题,没有任何门户工作经验反而是他能够做成今日头条的原因。张一鸣是一位典型的连续创业者,他曾是饭否的技术合伙人,负责饭否的搜索、热词挖掘。离开饭否后,他创办了房产搜索网站九九房,在公司走上正轨后,对技术更感兴趣的他将公司交给了他人打理,自己则开始了新一次创业——字节跳动科技,并将公司的目标锁定在了推荐引擎上面。

    2012年3月,新公司推出了成立后的第一款产品——搞笑图;5月,第二款产品内涵段子上线;8月,今日头条上线。这也是今日头条至今为止三款最重要的产品。所有产品后台的技术架构基本是一样的,都是利用推荐引擎分发信息,但产品难度逐次增加。对于张一鸣而言,无论是搞笑图还是内涵段子,其实都是为了今日头条练手和铺垫。

    事实最终证明,用推荐引擎分发新闻,是一条切实可行的道路。

    虽然其他新闻客户端产品都有不少的编辑原创内容,比如网易的“每日轻松一刻”就颇受用户欢迎,但是张一鸣却不为所动,坚持将机器推荐进行到底,最大程度上排除人工的因素。

    当然,今日头条也并非完全没有编辑团队,但他们所承担的主要工作是审查内容,规避政策和法律层面的风险。

    正因为是与传统新闻客户端完全不同的物种,张一鸣也并没有把其他的新闻客户端视为自己的对手。在被问及谁才是今日头条最有威胁的对手时,张一鸣给出的答案十分简单,“(我们的对手)不是我们的同行。”

    那究竟真正对手是谁,张一鸣并不愿多说,不过在他看来,至少微信的朋友圈都是一个比新闻客户端更具威胁的产品。

    虽然张一鸣没有透露自己的“假想敌”,但是不妨推测一下,今日头条的对手一定是与它类似、帮助用户发现新内容的产品,环顾眼下国内的热门应用,豌豆荚与今日头条似乎有不少共通的地方。

    需要注意的一点是,张一鸣从来没有把推荐引擎的内容只局限在新闻资讯上面。“我们做今日头条的时候就还犹豫要不要做一个更综合的东西,比如叫今日发现。后来觉得没有必要了,就在上面扩充就好了。”据他介绍,今日头条下一步会向用户推荐更多新闻之外的内容,比如会根据用户所处的不同使用场景向其推荐更多维度的信息。比如一位用户要去丽江旅游,今日头条会贴心地为他推荐丽江旅游攻略,或者当地的美食信息等。

    总而言之,如果你现在还只是将今日头条当做是一款新闻客户端,那就大错特错了。从新闻客户端到信息分发商

    虽然有着一款颇具竞争力的产品,但是今日头条的崛起背后也有许多其他的因素。事实上,对于普通用户来说,并不知道推荐引擎或者个性化新闻究竟意味着什么,促使他们选择今日头条的原因仅仅是因为它的名字。在许多对手眼中,今日头条的崛起在很大程度上也是占了名字的便宜。

    相对于传统新闻门户清一色的“网站名+新闻客户端”的命名方式,今日头条的名字从营销角度讲更容易抓住受众的眼球,尤其是对互联网公司并不十分了解的小白用户,今日头条这个直白的名字能够瞬间抓住他们的眼球。

    为了给产品起名,张一鸣和团队着实花了一番功夫。他们将历史上成功和失败公司的名字先列出来进行参考,然后又找来各大应用市场的排行榜,研究前100名产品的命名规律,尤其是其中的新产品。

    “我们是比较重视方法论的团队,我们把名字分为3类,一类是像百度这种意义很完整、很综合的名字,一类是像小米这种拟物的、具象的名字,最后还有一类就是大白话,我们对这三种做了分析,最后发现排行榜上靠前的都是大白话类型的,比如铃声大全、高清影视之类的,所以我们知道一定不能起一个很装的名字。”

    最终,“今日头条”这个名字从近百个候选方案中脱颖而出。也正是由于这个新闻性十足的名字,许多用户选择了今日头条,而在使用过程中,随着推荐新闻的愈发精准,不少用户渐渐喜欢上了这款产品。

    当然,今日头条的崛起并不能简单归结于某个因素。

    “做得差的公司有时候并不是做错了什么,他们也做对了很多事,而做得好的公司只是因为做到了更加极致,过了及格线而已。”张一鸣说,“我们在不少事情上做得还不错。比如我们的名字相对于错的来说是还不错,我们的技术稳定相对于差的公司做得还不错。推广虽然没有做到最好,但是关键时间点,该做的事情我们也都做了。”

    个性的产品,出色的运营等等多重因素的叠加最终成就了今天的今日头条。而在产品初步成功后,今日头条从去年11月开始,启动了自己的商业化。

    对于商业模式,张一鸣从创业初就已经想得十分清楚,就是坚定地选择了广告这一条路径,而诸如游戏联运、电商、增值业务、会员机制等业内的常见做法则并不在他的考虑范围之内,他解释说,因为并没有看到用户有这方面的需求。

    推荐引擎的信息分发模式对于广告主来说,有着很大的吸引力。启动商业化后,很快就有不少知名厂商找上门来寻求合作。包括东风雪铁龙、沃尔沃、乐视等公司都已经是今日头条的客户,眼下,公司的收入足以覆盖每月的运营成本。春节过后,今日头条的广告系统1.0版本也已上线,商业化又向前迈进了一步,据张一鸣介绍,公司今年的营收目标是达到2亿。

    对于传统门户来说,今日头条的闪电崛起又是一个外来势力搅局的经典商业案例,一个毫无媒体从业背景的创业者,只用了一年时间就摇生变,成为了传媒新贵,这给整个传媒产业带来了许多新的思考,尤其是这种利用推荐引擎分发新闻资讯的创新方式,究竟会对整个媒体行业,尤其是内容生产方式造成怎样的深远影响,这绝对是一件值得长期关注的事情。

    篇三:今日头条算法

    无论2016年科技圈热门的噱头有多少,对数据基础设施方面的耕耘仍然是决定实力的关键。阿里之类电商数据帝国自不待言,今日头条、一点资讯等在资讯数据领域的开拓更加值得注目。比起电商的物流数据,资讯算法驱动与用户数据分析是更加 “触及灵魂”的事情。

    1月15日,在头条主办的“珠海未来媒体峰会”上,技术出身的CEO张一鸣走到台前,向台下一众媒体人发表演讲:《我眼中的未来媒体》。他纵横媒体发展史、国内外现状,从古腾堡到贝索斯,从App Store到Instant Articles, 看似雄辩地证明媒体人把内容输送到算法推荐平台是大势所趋。一点资讯紧跟其后。1月20日,在其与凤凰博报联合举办“凤凰一点通”年度影响力自媒体盛典上,一点资讯宣布打通两家平台,资源共享。一点资讯 副总裁吴晨光面对台下上百位自媒体人,也在极力渲染一点资讯的读者画像等算法技术。鹬蚌相争刚刚白热化,已有一只黄雀在身后——腾讯的同类产品“天天快 报”已经低调运营了一段日子,不知道在憋什么大招。

    人们应该记得,2014年多家传统媒体因版权问题对今日头条发起声势浩大的诉讼。2015年11月也有媒体发起对一点资讯的版权诉讼,但反响很小。再到如今,媒体人坐在台下为张一鸣鼓掌捧场。也许真是时势变化,技术的发展已经让内容生产者从惊恐到不得不适应。

    头条不是百度,推荐引擎有别于搜索引擎。 其实头条所自豪的算法推荐也不是这几年才出现,谷歌、百度都是前辈,为什么是头条让算法成了颇具神秘感的明星?

    头条出名以来,一直有人吐槽推荐算法不准确、制造信息茧房,一些评论者宣称装了就卸载。我也有同感。不过就像帝吧远征之人力洪流带来的震撼,今日头条巨大的流量也促使我重新审视算法洪流。别忘了头条招聘启事上写着:“ 对用机器学习算法解决现实问题有强烈的渴望和坚定的信仰。” 尚显粗糙的算法,正在成长的生命

    我先抛出对算法的总体观点,有三个层面:

    首先,算法是一种类似金融资本的东西,是方法。就像财务投资者不必追求理解公司具体产品本身,只在乎能否增值。算法不管内容实质是什么,只管能否数字化、分类集合、反馈优化,是处理海量信息的方法。与资本一样,它能提升效率,也与个体有矛盾。

    第二,张一鸣在演讲中说Facebook把技术支持变成了一项接近水、电、煤气这样公共服务的事情。 再进一步,当算法深入生活的方方面面,积累的智能本身将成为基础设施。KK(凯文·凯利)在新书《必然》里说到,未来的人工智能网络(主要包含算法)将会成为“如同电力一样无处不在、暗藏不现的低水平持续存在”。比如办公室的桌椅和电脑都会识别你,记录你喜欢的姿势,在你一走进办公室就调整好姿态,打开你常用的软件、网站等等。

    但对于资讯内容传播来说,这还不够。内容不是桌椅,桌椅只要伺候我们,内容却是装载了他人灵魂的存在,要和我们互动、砥砺。 这就是第三层,算法要想触及灵魂,还得努力。

    头条到底是什么?有人已经说了它不是新闻客户端,而是信息分发平台。仅此而已? 张一鸣演讲称:

    “将对媒体在今日头条平台上的用户数据进行更详尽的统计分析。除了性别、终端、年龄、地域分布等用户属性基本分析外,还将提供用户的兴趣和情感 倾向分析。通过这一功能媒体可以知晓受众喜欢哪些分类的文章、用户最喜欢文章里的哪些关键词、关注你的人还喜欢哪些内容等等。”

    这话本意是针对微信,微信公众平台目前恰好只能提供受众的“性别、终端、年龄、地域分布”分析。兴趣和情感,这是算法更高的追求。

    头条的销售人员在推销自家产品时,可以告诉一家汽车制造商:用户的阅读行为数据能够展现出哪个地方的人最喜欢你们的哪一款车,我们将把你们的广 告推送给合适的读者。今日头条的同类产品“一点资讯”也在做同样的事情。创始人郑朝晖曾对内容总监吴晨光强调:“比阅读重要的是阅读者的行为。”

    所以头条们在做什么?今日头条是伪装成新闻客户端的用户行为数据收集器和分析器!(这感觉就像有位美国政治学者说的,现代中国是一个伪装成民族国家的文明帝国。) 每一篇新闻都应该被看作一道对用户的测试题,用户的每一次点击、评论都是一种回答, 都被系统记录,和关键词、Dom标签、作者、阅读时间、网络环境(wifi还是4g?)等等一起构成多维数据矩阵,刻画出这个读者的特征。每道“测试题” 都很粗糙,但是就像KK的“蜂巢思维”所言,海量资讯一起测试出的用户特征就比较准确。而且用户因为是在无意识中完成测试的,答案比较真实。这就是头条们 的技术和商业模式核心所在。

    读者难免会质疑,你倒是收集好数据了,可是给了我们什么?读者也不需要流量,要的是信息的准确和善解人意。

    我们不妨把算法看作一个正在成长的生命。

    普通读者这些年对算法推荐的直观感受并不佳:浏览了某个淘宝页面之后再去其他网站,页面也会浮现同类产品的广告,如果浏览的是情趣用品呢??在头条看新闻也很容易遇到这种情况——相似资讯不断涌来。(可参见虎嗅上这个批评:《我为什么看衰内容的个性化推荐?》)

    粗解今日头条的算法

    经常被头条员工拿出来说的简单算法是 AB测试和 双盲检验。

    算法架构师曹欢欢和增长团队的张楠都公开讲解过,如何用 AB测试来判定一个产品修改的效果。比如一个按钮是用红色好还是用蓝色号,那么就各向1%的用户发布两种颜色产品,哪个下载得好就推哪个。如果用在新闻上,就是同一条新闻由编辑给两种标题,测试哪个标题点击好。

    双盲检验,是先让算法判断一个新闻的分类和推荐对象,然后让两个编辑分别检验,如果结果一样,就通过,不一 样就请第三人判断并汇报程序员,重新调整算法。在我看,这背后是一个类似神经算法的“刺激-反应”模式——根据算法反应对错调整某个参数(权重),也是一 种人工智能里常见的“半监督式学习”。这大概也是张一鸣口中人机结合、发挥人的智慧的证据之一。

    不过在这个例子中,编辑的角色比较被动,像工厂流水线上的螺丝。

    我注意到今日头条在拉勾网打出一个百万美元年薪的广告,招募算法架构师, 要求擅长:贝叶斯学派相关算法,超大规模离散LR,深度神经网络,各种tree-based的算法等。其他算法工程师岗位要求大同小异。

    这些在技术人士眼中并不特别,很多IT公司必备,多和概率统计学有关。比如贝叶斯算法,常用的邮件客户端上就有出现。

    Foxmail截图

    我想尽我所能简单介绍一下这位百万年薪工程师具备的算法知识,不从数学专业角度(专业角度我也不懂,否则我就去应聘了~),而是从用户角度思考“算法想要什么”。

    以招聘启事中的tree-based算法为例。为了处理信息,算法的初始诉求往往是对海量信息做分类聚合。人类眼中的词汇在它眼里都是参数(维 度),一千个不同词汇组成的一篇文章就是一千个维度组成的一个向量。然后机器在代数世界里衡量不同向量的相似度——简单向量距离分类法、贝叶斯算法、 KNN(K最近邻居)算法、线性回归、逻辑回归??

    维度太多,于是算法进化了,不再把每个词当作维度,而是把html代码里的节点标记(DOM)作为维度,这样就大大减少了维度个数。人类看见的 标题、文字、图片,被代码放在不同的DOM节点里,比如head,比如body,比如TR、TD(表示表格的代码),构成树状结构。算法以这些节点为维 度,用各种算法对比不同的文档异同——k means(硬聚类)算法,minimax(极小化极大算法)??再进一步,引入图论范畴的模式树,就有了更高级的tree-based算法。

    下图是个常见的html dom展示,不需要看懂,只要了解机器眼中的文章是什么样子。

    (机器眼中,各种标记最重要,然后通过各种公式来处理。图片来自爱范儿,公式来自酷勤网) 算法五花八门,我说的也不准,主要看气质——算法这个孩子不知道新闻说了什么,只知道哪些新闻是同类,哪些是热点(点的人多当然就是热点,机器 可以通过一种“组合”算法来判断,可以参见南京大学新闻传播学院助理研究员、奥美数据科学实验室主任王成军的文章《“今日头条”怎么计算:“网络爬虫+相 似矩阵”技术运作流程》)。文章标签、关键词等也起到作用。

    算法的行为很有趣,好像在努力用各种办法躲避对内容灵魂本身的认知,只通过外表的形式特征去猜内容的相关度。

    读者身上没有关键词,没有标签,算法如何把握? 数学家们有办法,贝叶斯算法就是一种。经典的贝叶斯问题在小学奥数里就有(美剧《生活大爆炸》里也出现过):假如分别有A、B两个口袋,口袋A里有7个红球和3个白球,口袋B里有1个红球和9个白球,现从这两个口袋里任意抽出了一个球,且是红球,问这个红球是来自口袋A的概率是多少?

    让我们换一个更具新闻性的表达方式:假如已知韩国每5年发射一次卫星且每次爆炸失败率是60%,朝鲜每2年发射一次卫星且每次爆炸失败率是40%。现在从朝鲜半岛传来一声卫星发射失败爆炸的巨响,请问这枚火箭来自朝鲜的概率是多少?

    根据贝叶斯公式【P(B|E) = P(B) × P(E|B) / P(E))】就可以推导出这个概率来,也就是逆向计算概率。

    相关热词搜索:头条 办公地址 今日 今日头条总部公司地址 今日头条 办公地点 今日头条办公地址郑州

    • 今日头条办公地址 相关文章: