谈谈用户识别的几种 *** 。
用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也能够帮助你更好地跟踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。
通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的 *** :
识别用户的几种 ***
当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在WEB日志里面,关于WEB日志的详细说明可以参考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能导致用户识别的不准确性,关于WEB日志的缺陷可以参考之前的文章——WEB日志的作用和缺陷,所以我们在选择用户识别 *** 的过程中,在条件允许的情况下尽量选择更为准确的 *** :
1、基于IP的用户识别
IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、 *** 、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。
2、基于IP+Agent的用户识别
同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP *** 、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别 *** 爬虫等特殊“用户”,但同样准确度也欠高。
3、基于cookie的用户识别
当你通过自定义Apache日志格式或者JavaScript的 *** 获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。
用cookie识别用户的 *** 当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑*问你的网站,这个时候cookie就无法直接对应到该用户了。
4、基于用户ID的用户识别
基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录userid。
所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从更大程度上识别唯一用户。
这里推荐一个网站日志中cookie项的自定义设置 *** ,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该 *** 只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。
获取用户信息的途径
通过以上的 *** 实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的Profile:
1)用户注册时填写的用户注册信息及基本资料;
2)从网站日志中得到的用户浏览行为数据;
3)从数据库中获取的用户网站业务应用数据;
4)基于用户历史数据的推导和预测;
5)通过直接联系用户或者用户调研的途径获得的用户数据;
6)有第三方服务机构提供的用户数据。
识别并获取用户信息的价值
通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种 *** 在网站是实现一些有价值的应用:
基于用户特征信息的用户细分;
基于用户的个性化页面设置;
基于用户行为数据的关联推荐;
基于用户兴趣的定向营销;
小弟也是个新手,天天潜在落伍等站长网学习。学习了很多经验和技巧。今天小弟与大家分享我当天做站当天收录的技巧。我是五月二号做的这个站(回到过去伤感美文网)!本站最早的内容也是五月二号不信的可以去查看看。做完这个站 我也没时间管理 毕竟马上高考了。就放在那里了。直到昨天我来查学校没事看看。就查看...
我的一个网站因服务器IP被K导致连带性惩罚,其中也包括www.163tao.com。这事已经过去了二个月,起初的感觉就是天昏地暗、手足无措甚至一度想放弃网络。但是每当想起作为一个生活在网络中的人来说,放弃网络真的不容易。所以,站长们的网站在被百度惩罚、降权或者服务器IP都被K时也不要放弃!如...
我是一个销售人员,以下讲的内容可能是销售多一些,网站的专业知识少一些,请见谅。看到现在的很多的网站是长江后浪推前浪,前浪死在沙滩上,甚至有的还不知道怎么死了! 我想跟大家分享一下我多年来的做站经验。一个网站的成功来自三个方面。 一.良好的的商业模式,占成功的20个百分点。许多网站做的很好...
关于百度收录新站问题,目前困扰着很多站长。为什么百度收录了首页不收录内页。当然这与近期百度对新站审核政策的改变有很大关系。看着网站收录页面慢慢的被搜索引擎缩水是很头痛的,在这个时候一定要先从外部因素开始检查,看看时候网站友情链接里面是否有站受到搜索引擎惩罚,是否有站涉及黄、毒、赌以及扰乱社会...
在网络混了快两年了,现在才觉得当初没考上大学还值点,爸爸妈妈的辛苦没白费,起码能为自己赚点生活费,还能供供家里。刚入网的时候啥也不懂,到处找免费空间,用空间商给的免费二级玉米做做htm网页,发给考上大学的同学向他们狂吹:老子会做网站!你们上个屁大学会做吗? 直到网页美工到极点时,我才发现,...
如何发现网站瞬间流量,培养你对互联网敏感信息的扑捉。网站建立到现在差不多快2个月了,上次GG的更新,pr从0到2,我觉得很感谢我好朋友给我了两个pr6的网站做了友链,虽然不是同行业的。但是能迅速提高到2,对我来说也是个不小的鼓励。 这里继续经验分享下,如何培养对互联网的敏感信息的扑捉。每天...