日期:2014-05-20  浏览次数:20923 次

【分享】CSDN论坛究竟有多大-1楼更新第2节
本文起因来自两个月前的一个帖子,突然发现Asp.net的控件真的不敢用啊............
讨论开发大型网站时,用内置控件对系统可能造成的负载问题
因为刚好CSDN论坛也是.Net+MSSQL开发的,所以有些回复也提到了CSDN如何如何
这也促使我有了这么个念头,就是CSDN到底有多大呢,
作为全球最大的中文开发社区,是不是本身可以作为开发者的一个标杆?
本文不是为了延续之前的命题去讨论.Net控件如何如何,CSDN的页面实行了静态化,所以此处跟控件已经无关了(此处不准确,比如回帖的地方仍是用了控件的,不过这不是本文的重点,不做进一步讨论)
这里更关心的是,论坛有多少用户,有多少帖子,我们经常说,CSDN这么大的并发量如何如何,那么到底有多少并发量呢
这也是本文讨论的重点,就是CSDN论坛数据库的负载有多大。

CSDN的只读访问量远大于发帖回帖量,
因为CSDN静态化,静态页面的服务器与实际应用服务器及数据库服务器肯定不在同一台服务器上,所以这部分对数据库应用基本不造成压力。
当然,我们也知道为了分析统计,静态页面上其实也是代理访问跟踪的,但是因为走的跟论坛业务库不是同一个库,所以不在讨论之列
又比如我们知道CSDN现在有1700万用户,因为CSDN(此处不局限于论坛,还包括博客、下载、大本营等多个模块)启用了PASSPORT。
应该用的是独立的数据库,且是独立的数据库服务器,同样不影响论坛业务库。
况且1700万用户,如果有60%的用户是论坛的活跃用户,就很不错了,这当中还有很多马甲。
参考资料:

@范凯robbin:我来CSDN的这一年 - robbin的自言自语 - ITeye技术网站

本文是一共分为3篇,第一篇是一个宏观概念,第二篇是基于业务逻辑对论坛的一个探讨,第三篇做一些补遗。


本文数据均来自公开途径,其实就是大家都能看到的,就是这个位置。
可能大家注意到了,这个数字,每周日更新。
在我在微博上截图记录时,有好几位朋友问起,就这么两个数字,你能分析出什么来呢?
我说可以,关键是你怎么去分析。
当然,也很可观的说,这两个数字确实很单薄,不过我能做到的也只能如此
毕竟,CSDN自己从数据库上分析一下,比我这个更有说服力,只是,CSDN不会告诉我们对吗?呵呵。
本文仅供参考,希望能抛砖引玉,如果不对的地方,还请多多指正。


好了,开始。

我是从6月19日开始跟踪数据的,截止到昨天8月7日,共跟踪到8期数据。
基本分析如下。

发帖回帖周增幅基本稳定,不过上周发帖量算是暴增,原因暂时未知,不过发帖量的增加并没有带动回复量的同比暴增
所以这个增加量其实是有待分析的。

在我之前的一个帖子中,
MSSQL非技术区2008-2011年度活跃度分析

我们大致可以知道我们的日常论坛活动,基本上都是在工作日(5天),上班8小时这段,晚上也有一个小爆发期。

为了提升对CSDN压力的估算,我把指标都往大的方向上走。我们把每周7天,折算成每周6天(周末两天算1天),每天12小时(8小时外的16小时,折算为4小时)。
这样折算下来,我们认为,每周的有效小时数为72小时。
所以我们算下来是这样的一个数据

这里有一个垃圾帖系数,设置为了0.3,也就是将论坛的垃圾帖量估算为论坛帖子总量的30%。
这个纯属个人猜测,应该没这么多。这里仍是秉承往大处想的原则。

好了,那么现在我们得到一个一个结论是:
在1个小时的单位时间内,CSDN的发帖量为:246个,回帖量为:2303.
看上去并不多,对吧,呵呵。
这个数字,离得到CSDN论坛数据库的负载有多大,还差很远。


【未完待续】


------解决方案--------------------

------解决方案--------------------
啥都不说,先帮阿泰顶一个。
------解决方案--------------------

------解决方案--------------------
接分哦。。。
------解决方案--------------------
阿泰的分必须接。
------解决方案--------------------
只接分,不评论
------解决方案--------------------
探讨

只接分,不评论

------解决方案--------------------
探讨

只接分,不评论

------解决方案--------------------
观摩技术强帖~
------解决方案--------------------
子夜上电视了!!!大家快围观!
------解决方案--------------------
CSDN由于负载过大,正在采用各种龌龊的方式把网友逼走。
看看最近一两年主页的推荐就知道了,以前都是精品技术文章推荐上去,现在一大半都是标题党或者抛砖党,甚至喷子贴都能推荐上去。
------解决方案--------------------
探讨

哪位大侠这么勤快。。我都无语了。

转到非技术区来这个帖子不就废掉了吗?

------解决方案--------------------
观摩强帖
------解决方案--------------------

------解决方案--------------------
观摩技术强帖~

PS:CSDN要能在每个帖子的“管理菜单”中新增一项:操作历史 就好了
这就能知道是哪位“大侠”移的帖子了
------解决方案--------------------
强帖留名
------解决方案--------------------