⑴ App运营如何构建用户兴趣模型
一、用户兴趣模型的构建
俗话说,巧妇难为无米之炊。既然是以用户兴趣模型为基础的APP PUSH信息,首先得有用户兴趣模型的存在。那怎么构建起app用户的兴趣模型库呢?
1、搜集用户行为信息
行为可以反映兴趣。一个男人想要追到自己看上的女人,最大捷径莫过于多注意女人平时的行为,从而了解她的兴趣爱好,最后投其所好。同理,一个app运营想要做好用户兴趣模型,首先要做的就是利用各种利用到的手段搜集想要的用户行为信息。
什么是用户行为信息
用户在一个网页、网站或app产品上的任意操作统称为用户行为。以购物购物app为例,用户从打开app、登陆账户、查找或浏览商品、加入购物车、支付订单、分享商品、收藏商品等都属于用户行为信息。再如,一个用户在某视频app上观看过的节目内容,用户观看某个视频的次数和观看时长等都是用户在改app产品上的行为信息。
怎么搜集用户行为信息
不管是网站还是app,常见的用户行为搜集方式主要有以下两种:
显示搜集:很多产品的新用户注册页面把这种搜集用户行为信息的方式诠释的很好,如下图所示知乎注册页面和人人都是产品经理注册页面,一个简单的注册页就搜集到了几个重要的用户信息:手机号姓名。
除了用户的注册行为之外,用户显示反馈(如卸载某软件弹出一个网页让你填写反馈信息类)和表单填写等能够直接获得用户行为信息的方式都属于显示搜集范畴。
该方式的优势:简单粗暴,效果直观,且搜集到的用户行为信息能在很大程度上反映出用户喜好。
隐式搜集:通过技术手段在后台全程记录用户在网站、网页或app上的所有操作行为,并从这些操作行为中提取用户兴趣信息的。
如下图所示,这是我某天晚上把淘宝某店铺的一件宝贝加入了购物车,第二天早上就收到了一条提醒“交易剩下时间不多”的短信。该店铺的小二之所以会发这条短信给我,是因为他在后台能够看到我“加入购物车”这一行为。这是典型的隐式搜集用户行为信息的案例。
该方式的优势:用户不直接参与,用户体验较好。
2、提取用户兴趣信息
用户访问某个页面,进行某种操作背后在很大程度上代表他们的兴趣爱好,即用户行为信息是用户对产品较为真实的需求。再者,我们搜集那么多用户行为数据,也是为了更好的了解用户的兴趣点。
比如微博、微信、陌陌,同样是社交软件,但每个用户使用它们的目的都是不一样的,有的是为了获取新闻热点事件,有的是是为了发展潜在客户或机会,有的单纯是为了加强和还有的联系等。产生这种结果,是因为每个用户的兴趣点不一样,所以每个用户的行为也会不同。
所以,运营在有了用书行为数据后,要能够从用户行为信息中提取出用户兴趣信息。用户兴趣信息提取建议从两方面着手:用户访问内容、用户浏览行为。
有了行为数据之后,如何提取出用户兴趣信息并用一种恰当的表示方式描述用户兴趣
3、展示用户兴趣信息
运营根据用户行为信息成功提取出用户兴趣后,要用一种比较恰当的表示方式对用户兴趣进行描述。这么做的目的有两个:一是为了能够让用户兴趣信息更直观;二是为了让之后的用户兴趣建模更具科学性。
用户兴趣信息展示的方法有3种:
主题展示法:
以主题类别概念集合为依据来表示用户的兴趣点。如下图所示,新用户下载豆瓣app并打开进入首页之前,会让用户选择自己感兴趣的主题。
优势:用户兴趣信息直观,且可操作性强。
不足:展示信息的精准度有待商榷。
关键词展示法:
顾名思义,就是通过用户主动提供或采用相关算法筛选出一些能够代表用户兴趣的关键词来展示用户兴趣信息。如柏拉图app制作的“个性标签”H5帮用户生成的那张个性标签图就是用的关键词展示法。
优势:操作简单快捷。
不足:可能需要用户的主动参与,体验不够好。
向量空间展示法:
通过计算关键词的权重,把用户的兴趣展示城有关键词和权重构成的单个分项组成的一个特征向量序列。也就是说,向量空间展示法是关键词展示法的升级版,加入了关键词的权重信息,把文本表示成带权重的信息的词项向量。
下图为向量空间展示法的计算公式。
W(t,d):词t在文本d中的权重;
TF(t,d):词在文本d中的词频;
N:训练文本总数;
Nk:训练文本集中出现t的文本数。
优势:不用人工参与,用户信息直接从服务端获取。
不足:计算得到的用户兴趣文本特征词语数量庞大,增加运营工作量。
4、构建用户兴趣模型
根据前面的用户兴趣信息提取、展示、分析和挖掘,结合用户实际需求,并以用户数据实体为中心规约数据维度类型,将得到的用户兴趣喜好用结构化的形式为用户建立一个兴趣模型。这个环节通常也被称之为用户画像的建立,即给用户打标签,让用户兴趣信息标签化。
二、如何根据用户兴趣模型让用户对app活动有求则应
用户兴趣模型构建好之后,用户兴趣行为、用户兴趣标签、用户兴趣画像等关于用户兴趣的数据都齐全了,后续的个性化、精准活动推送就比较简单了。
一款app基于用户兴趣的个性化活动推送方式可以采取两种形式,一是在app内进行SDK埋点,根据用户实际场景和需求触发精准活动;二是根据用户兴趣模型,主动PUSH相应的app活动。
1. SDK埋点定向触发个性化活动
确定好活动场景和用户兴趣信息确定好活动投放位置,然后在app内相应的位置进行SDK埋点,当用户完成了预定的操作或者符合相应的条件(如活动触发行为)才能触发某个活动。
如某次app活动主要的目的是什么,是为了给app拉新、留存还是为了促活app用户。不同场景的活动在app内的投放位置不同,如你是为了激活新用户,你就把用户可能感兴趣的活动页面投放在app用户注册完成页面之后。用户注册成功,立即弹出一个新用户抽奖的活动。
再比如一款购物app,想要提高用户的复购率,可以根据用户浏览商品的喜好,在用户将商品加入购物车时投放投放该商品的优惠券活动,或在用户下单后,根据用户兴趣投放一些周边产品的打折优惠活动。下图为外卖app饿了么下单后分享后的触发优惠券活动。
2. 主动PUSH活动
主动PUSH信息是通过用户兴趣模型数据库中的用户兴趣标签智能判断用户对什么类型的活动感兴趣,然后直接推荐相应的活动给用户。这一点,现在主打“兴趣阅读”的移动新闻类app产品做得比较出色。
如天天快报、今日头条等,都是采用“智能计算用户兴趣—+编辑运营”的方式为用户推荐内容的,这样做的好处是符合app用户的阅读习惯和喜好,达到个性化阅读推荐的效果。
总结
最后,无论是信息的个性化推送,还是活动的个性化推送,个性化推送都是为了更好地实现信息与用户个性需求相匹配的过程。在这个过程中,用户兴趣模型的建立是非常关键,又因用户行为或兴趣会随着时间或其他因素而改变。所以,建议app运营有周期性地对用户兴趣模型进行更新或修改。
⑵ 阅读、电影和音乐的推荐算法,哪一个更难做
“阅读、电影和音乐的推荐算法,哪一个更难做?为什么?”关于这一问题,小编从诸多网友的回复中为你筛选了最用心、最高赞的回答!快来看看吧~
来看看网名为“幸运的ZLT0502”的网友是怎么说的:
电影---音乐----阅读!从我的经验来看,阅读是最难做到的,其次是音乐,最简单的就是电影。当然,是在有很多数据的前提下。从几个领域的特点来看:1.电影的item数量相对较少,好的电影有很长的生命周期,加上电影社区的用户行为,视频网站或预订网站,都很好获得,所以特别适合合作过滤。即使这不是一部大热门电影,你也可以根据导演、类型、明星等制作内容。这些都是结构化的信息,所以没有难度。音乐的item比电影要多一些,生命周期也非常不同,但它也可以用于基于用户行为的协同过滤。该算法如何表达和更新用户的兴趣?如何根据兴趣标签计算推荐结果?至少我没有看到特别成功的推荐阅读应用程序。算法上,都各有难度,但阅读类的,由于分类太多,在算法上自然要更加复杂。



来看看网名为“派网友”的网友是怎么说的:
个人认为无论是基于用户行为(协同过滤),还是基于内容相似度的推荐算法,难度从高到底都依次是:音乐-阅读-电影。
对于ID为“楼船吹笛雨潇潇”网友的精彩回答,大家纷纷点赞支持,他是这么说的:
我觉得是各有所难,并不能说哪个难,哪个容易。推荐的成功率:公共决策对推荐的影响:判断价值的建议:三者各有难度,但是个人在长期的习惯中可以对其中一种或者多种情景中加以选择和实践,但这也不是一蹴而就的事情,慢慢来吧。



你赞同哪位网友的观点呢?
⑶ 基于用户行为分析建立用户偏好模型
基于用户行为分析建立用户偏好模型
我们经常将个性化推荐的思想简单地抽象为:通过用户的行为推测出用户的兴趣,从而给用户推荐满足他们兴趣的物品。那我们其实就是要通过用户行为分析建立一个用户偏好(偏好即兴趣)模型,模型中包含各个用户的一个或更多个偏好。
插叙一段
像“用户行为”,“用户兴趣”这样的词,大多数人都有一个默认的感知,甚至对于这种词的理解可能已固化为常识,所以我很少见到有文章使用这些词时解释它们。我感觉涉及到算法模型时,对这些词的不加限定的宽泛认知就容易影响对算法模型的深入理解,会导致感知模糊却不自知。因为不同人对这些词的基本理解可能一致,但是拓展理解各不相同。本文会作出限定解释,且本文所谈用户行为都是指网络(可以是电信网络,互联网)上的行为。
概念解释
实体域
当我们想基于用户行为分析来建立用户偏好模型时,我们必须把用户行为和兴趣主题限定在一个实体域上。个性化推荐落实在具体的推荐中都是在某个实体域的推荐。比如对于阅读网站,实体域包括所有的图书,我们可以称之为图书域。其他还有,个性化音乐推荐,个性化电影推荐,个性化资讯推荐等。
用户行为
用户在门户网站点击资讯,评论资讯,在社交网站发布状态,评论状态,在电商网站浏览商品,购买商品,点评商品,以及在其他类型网站的种种行为都可是用户行为。本文所指的用户行为都是指用户在某实体域上的行为。比如用户在图书域产生的行为有阅读,购买,评分,评论等。
兴趣主题
用户的兴趣维度,同样是限定在某实体域的兴趣,通常可以以标签的形式来表示。比如,对于图书阅读,兴趣主题可以是“悬疑”,“科技”,“情感”等等分类标签。值得一提的是,兴趣主题,只是从用户行为中抽象出来的兴趣维度,并无统一标准。比如qq阅读和豆瓣阅读的图书分类标签大不一样。而兴趣维度的粒度也不固定,就像门户网站有“新闻”,“体育”,“娱乐”等一级分类,而新闻下有“国内”,“社会”,“国际”二级分类,娱乐下有“明星”,“星座”,“八卦”二级分类。我们选取什么粒度的兴趣空间取决于我们对用户偏好模型的要求。
兴趣空间
在同一层次上兴趣维度的集合,比如豆瓣阅读中,可以用“新上架”,“热门”,“特价”,“免费”来构成一个兴趣空间(当然,如果使用这个兴趣空间来表征用户的兴趣,就太粗了,这里只是假设),也可以用“小说”,“幻想”,“计算机”,“科技”,“历史”·····“美食”构成一个兴趣空间。这是两种不同的分类维度。如果将“新上架”也加入到后者集合里,就显然有些莫名其妙。值得一提是,这也并非不可能,这取决于一个如何看待这个集合的问题,如果不把它看作基于内容的分类,而是图书标签库,那么也是可行的,甚至利于建立更好地模型。本文后面我有提到。
用户行为数据
项亮在他的《推荐系统实践》的2.1节有详细介绍。通常在经过对行为日志的汇总处理后生成的比较容易理解的数据就是一份描述用户行为的会话日志。这种日志记录了用户的各种行为,比如在图书阅读app中这些行为主要包括点击,试读,购买,阅读(在本地app中,阅读行为有可能追踪不到),评分,评论。
建立用户偏好模型
基于用户行为分析建立用户偏好模型的核心工作就是:将用户的行为转换为用户的偏好。
我们采用矩阵运算的思维方式,以图书阅读为例说明。
下图表示用户(user)集合:
下图表示图书(item)集合:
那么用户的行为矩阵可以表达为:
行表示用户,列表示图书,我们暂只考虑图书的购买行为,1表示用户看过该图书,0表示用户没有看过该图书。
如何将上述用户行为矩阵转化为用户兴趣矩阵(即行代表用户,列代表兴趣维度),一种显着的方法是我们先确定图书与兴趣维度的对应关系矩阵。而这个的前提是我们确定了使用何种兴趣空间。一种常见的方式是专家给出一些样本的分类结果,也就是一般意义的训练数据,然后通过分类算法,得到分类模型,然后应用到其余数据的分类问题当中,解决其余大量数据的分类问题。这种分类的特点是一本图书只被标记为一种类别,假如有3个类别,
那么图书-兴趣矩阵为:
那么用户行为矩阵转换为用户兴趣矩阵的运算公式即可表示为下图,行表示用户,列表示兴趣,算出的矩阵再经过归一化后,每个值就代表某个用户在某个兴趣的偏好权重。
选择这样的兴趣空间的局限显而易见:一本图书只能属于一个兴趣维度。实际情况中,一本图书通常不只属于某个分类,并且当图书的数据巨大时,寄希望于编辑分类可能会越来越难以维持,所以通常是由用户主动给图书添加标签,或者机器基于内容,提取关键词。但是这种形式得到的标签集会存在同义,生僻,维度过多等情况,需要经过标签清洗的重要工作。前面已经看到兴趣空间的选择真的是非常重要,直接影响所得到用户的兴趣矩阵。所以同样的方法都得到了用户偏好,但是好不好用,就跟这部分工作有关了。
用户行为加权
上面展示的用户行为矩阵示例是一个非常简单的,直接可以从数据库里提取的例子。而实际中在数据能够支撑的情况下,我们不可能只考虑一种行为。为了获得更合理的行为矩阵,我们就需要进行行为加权。比如,A1表示用户点击的行为矩阵,A2表示购买的行为矩阵,A3表示评分的行为矩阵,那么加权矩阵就是:
至于各矩阵的权重跟我们建立用户偏好模型的目的有关,如果我们更希望找准用户的品味偏好,那么权重可能是:a1 < a2 < a3;如果我们更希望用户购买,那么权重可能是:a1 < a3 < a2。
其他用户行为分析方法
上面介绍的方法也算是一种主流的方法。但是从上面介绍的“兴趣主题”,“兴趣空间”也可以看出作出好的分类并不容易,分类粒度,分类维度等都不好控制,用户打标签也需要复杂的标签清洗工作。在图书,电影这样的实体域,我们还可以通过类别给用户推荐喜欢的物品,而在个性化资讯推荐领域(这里仅举个例子,资讯推荐应该有其特殊之处),我们不见得能通过类别推荐用户喜欢的资讯,甚至用户本身也不在意类别。我们并不需要显式地构建物品-兴趣对应关系矩阵,也可以将用户和所喜欢类别的物品关联起来。这就涉及到隐含语义分析技术。这个部分会日后在此文补充。
小总结
以上可以看出基于用户行为分析的用户偏好建模的常规方法非常简单明了。事实上也的确如此,在使用这些方法或者思想编写程序计算都不是什么难事。而实际上,我们遇到的问题却并非是方法本身,而是数据本身。数据方面的两大问题是稀疏和长尾分布。通常有行为数据用户很少,而用户的行为对象也集中在不多的物品上。方法易学,而数据问题只能在实战中才能深刻体会,才会发现主要的精力和难点都在解决数据的稀疏和长尾上。希望日后能结合实际问题写写解决数据问题的文章。
此外,上面虽然是用矩阵运算的思想讲述,但我在实际项目中发现其运算的本质其实是对用户行为的统计。所以在实战中,不一定要先建矩阵,再做计算,直接在数据库里使用sql计算非常方便。
⑷ 58同城招聘上投了简历会有 企业已查看,和感兴趣的标签分别是什么意思
这是一种标记,企业已查看,是表明企业用户已经浏览过您的信息了,如果感兴趣,就标记为感兴趣,表明公司比较满意你。你就有面试的机会。
58同城成立于2005年12月12日,总部设在北京,在全国目前共拥有27家直销分公司。网站定位于本地社区及免费分类信息服务,帮助人们解决生活和工作所遇到的难题。3月2日消息,58同城正式宣布并购安居客集团,交易以现金加股票的方式进行,交易金额达到2.6701亿美元。
2015年4月17日,58同城发布公告称,公司战略入股分类信息网站赶集网。2015年5月8日宣布并购中华英才网。2015年8月7日 向莱富特佰增资持70%股份,加强汽车布局。

(4)兴趣标签计算方法扩展阅读
网站特色
信息导航
58同城信息版块分为房屋信息、跳蚤市场、票务、宠物、车辆买卖与服务、交友征婚、黄页、招聘等。
信息分类
58同城作为中国的分类信息网站,本地化、自主且免费、真实高效是58同城网的三大特色。其服务覆盖生活的各个领域,提供房屋租售、招聘求职、二手买卖、汽车租售、宠物票务、餐饮娱乐、旅游交友等多种生活信息,覆盖中国所有大中城市。
同时还为商家建立了全方位的市场营销解决方案,提供网站、直投杂志《生活圈》《好生活》、杂志展架、LED广告屏“社区快告”等多项服务,并为商家提供精准定向推广的多种产品,如“网邻通”、“名店推荐”等等。
其中“名店推荐”产品首次在行业内针对网络商户一直面临的信用体系问题,推出“万元先行赔付计划”,在行业内开创先河。
58同城是国内领先的生活分类信息网站,海量生活信息免费发布查询。提供找房子、找工作、二手物品买卖、二手车、58团购、商家黄页、宠物票务、旅游、交友等多种生活信息。每天千万人使用!58同城,您身边的生活帮手!
58同城网同时也为商业合作伙伴提供:最准确的目标消费群体、最直接的产品与服务展示平台、最有效的市场营销效果以及客户关系管理等多方面服务。宗旨是:为没有工作的人,创作一个属于自己的平台。
明星代言
自2011年4月24日起,北京的公交车和地铁上出现了大量58同城的广告,因《宫》而人气暴涨的杨幂成其代言人。据业内人士分析,自优酷和当当相继在美国上市后,中国互联网企业赴美上市潮一直就没有冷却过。
58同城的广告一出,便引起业内相关人士和媒体的各类猜想。向来低调的58同城此次化身“一个神奇的网站”,广告词:“这是一个神奇的网站,58同城,不用中介租房子,不用花钱招人才。58同城,一折吃喝玩乐,闲置物品能换钱,一个神奇的网站”。
发展年表
2011年4月7日,谷歌公布了2月份最新全球网站TOP1000排行榜,国外网站Facebook、Youtube、yahoo继续占据前三甲的位置。国内网站中,开创中国搜索时代的网络位列第7。拥有超过6亿用户的qq成为国内门户网站的领头羊,稳居10强,位列第10。
58同城于2012年2月启用“日租”双拼域名rizu点com推出新平台,网站页面仅为一张静态图片,但网站短租运营性质明显。
2013年10月31日晚间,分类信息网站58同城(0, 0.00, 0.00%)2013年10月31日在纽交所挂牌上市。58同城最终确定发行价为17美元。按发行价17美元计算,58同城此次IPO估值约为13亿美元。
2013年的万圣夜,58同城正式挂牌交易了。最终发行价17美元每份ADS、开盘价21美元,首日收盘暴涨42%,为中概股此轮赴美IPO开了个好头。
58同城成功逆袭上市,表明了其商业模式获得了投资者的认可,更表明了姚劲波“电子商务”(招股书中提到58同城类阿里的商业模式)的概念包装成功。同时上市过程中还有一个细节值得注意,则是58同城的发行价由13-15美元每份ADS不断上调一直调整至17美元每份ADS,不断上调的背后则是机构对其信心增加的过程。
2014年4月,58同城金融服务平台正式上线运营,主要涉足贷款,理财。58金融面向58同城自有平台的小微企业或个人用户提供贷款和理财产品,其中包括车贷、房贷、个人消费贷和企业贷等其他安全高收益理财产品。58金融的合作伙伴包括银行类机构、P2P平台、小贷等。
2014年6月28日晚间,58同城发布公告称,已经获得了腾讯控股有限公司7.36亿美元投资,腾讯将以每股20美元的价格向58认购买36,805,000股A类和B类普通股,在本次交易完成后,腾讯控股获得58同城完全摊薄后19.9%的股份 。根据本次战略投资,58将有机会获得来自腾讯QQ、微信、QQ.com以及QQ浏览器等各个平台的流量, 进一步加强在本地服务领域的地位。
2014年9月26日,58同城正式对外发布公告称,58同城与北京电子城投资发展有限公司签订协议,宣布将斥资10.33亿人民币(1.684亿美元),购买总面积45000平米的办公区,第一幢大楼预计在2015年10月正式投入使用。
公告显示,新购置的办公区将用于建设58同城北京研发总部,满足因业务发展而不断增长的办公区面积需求;同时,新办公区将作为全国业务发展的新根据地,使得公司能专注于移动互联网、网络金融及移动应用领域的创新。
⑸ 怎么做新媒体数据分析
目标人群的“画像”信息提取
(1)目标人群的年龄分析

目标人群的情感需求在Censydiam动机分析模型中的反映
由上述分析可知,公众号的粉丝的情感需求在Censydiam消费动机分析模型主要对应模型中的3个象限,即“享乐/释放”、“舒适/安全”和“个性/独特”。这三类情感需求象限其实对应的是三类不同的粉丝群体,所以在后续的公众号定位及栏目规划时需要兼顾三者的差异性需求。
好了,通过间接手段,我们获取了目标人群的用户画像,了解了他们的基本特征,这对我们进行公众号的内容规划、风格调性和粉丝获取渠道都很有帮助。
然而,对于微信公众号的定位来说,仅有上述信息是不够的,因为我们还需要确认目标人群的阅读偏好,知道哪些内容是他们喜闻乐见的,据此可以“投其所好”。