2013年6月17日星期一

网站架构相关PPT、文章整理（更新于2009-7-15）

在这篇blog中放置了我收集的一些网站架构相关的PPT和文章，提供给大家下载，如果大家有相关的好的PPT、文章的话，也欢迎推荐给我，非常感谢，:)，这篇blog的内容也会随着我收集的东西增加而变化，同时也会增加我对于这些PPT、文章的看法和评价。

1、amazon
Amazon的分布式key-value存储系统(dynamo)的论文

2、ebay（我对于eBay这几个PPT的一些看法和评价：http://www.blogjava.net/BlueDavy/archive/2009/07/24/288055.html）
ebay架构演变历程（The eBay Architecture）
ebay架构原则（eBay architecture principles）
ebay的自动化（Teaching machines to fish）

3、facebook
facebook的缓存系统
facebook的架构
facebook百亿相片的高效存储

4、fotolog
扩展世界上最大的图片blog社区

5、google
GFS介绍
GFS论文
Mapreduce介绍
Mapreduce论文
Google在web前端方面的经验（even faster websites）
建设大型可扩展的IRS系统的挑战（challenges in building large-scale IRS）
松耦合分布式系统中的锁服务（lock service for loosly-coupled distributed system）
“滚木移石”不停机升级策略论文（modular software upgrades for distributed program）
Google wave的架构

6、linkedin
linkedin远程通讯架构

7、livejournal
livejournal架构演变历程

8、myspace
myspace架构

9、wikipedia
wikipedia架构

10、yahoo
yahoo定制的apache--yapache

11、youtube
scaling youtube

12、Twitter
Designing a Scalable Twitter

13、豆瓣
技术演变历程（QCon 2009北京）

14、freewheel
架构（QCon 2009北京）

15、优酷
架构（QCon 2009北京）

16、淘宝
技术演变历程（QCon 2009北京）

17、twitter
Improving the Performance and Scalability of Twitter

系统设计说明书(架构、概要、详细)目录结构

虽然这些文档一般来说公司都是有模板的，但我写这些文档以来基本上是每写一次就把目录结构给改一次，应该说这是因为自己对这些文档的理解开始加深，慢慢的越来越明白这些文档的作用和其中需要阐述的东西，觉得这三份文档主要阐述了一个系统的设计和实现过程，从系统分解为层次、层次内的模块以及相互的接口、模块分解为对象以及对象的接口、实现这些对象接口的方法。这次又整了一份，^_^，欢迎大家指正。

XXX架构设计说明书

(架构设计重点在于将系统分层并产生层次内的模块、阐明模块之间的关系)

一. 概述

描述本文的参考依据、资料以及大概内容。

二. 目的

描述本文编写的目的。

三. 架构设计

阐明进行架构设计的总体原则，如对问题域的分析方法。

3.1. 架构分析

对场景以及问题域进行分析，构成系统的架构级设计，阐明对于系统的分层思想。

3.2. 设计思想

阐明进行架构设计的思想，可参考一些架构设计的模式，需结合当前系统的实际情况而定。

3.3. 架构体系

根据架构分析和设计思想产生系统的架构图，并对架构图进行描述，说明分层的原因、层次的职责，并根据架构图绘制系统的物理部署图，描述系统的部署体系。

3.4. 模块划分

根据架构图进行模块的划分并阐明模块划分的理由，绘制模块物理图以及模块依赖图。

3.4.1. 模块描述

根据模块物理图描述各模块的职责，并声明其对其他模块的接口要求。。

3.4.2. 模块接口设计

对模块接口进行设计，并提供一定的伪代码。

XXX概要设计说明书

(概要设计重点在于将模块分解为对象并阐明对象之间的关系)

一. 概述

描述本文的参考依据、资料以及大概内容。

二. 目的

描述本文的编写目的。

三. 模块概要设计

引用架构设计说明书中的模块图，并阐述对于模块进行设计的大致思路。

3.1. 设计思想

阐明概要设计的思想，概要设计的思想通常是涉及设计模式的。

3.2. 模块A

3.2.1. 概要设计

根据该模块的职责对模块进行概要设计(分解模块为对象、描述对象的职责以及声明对象之间的接口)，绘制模块的对象图、对象间的依赖图以及模块主要功能的序列图，分别加以描述并相应的描述模块异常的处理方法。

3.2.2. 模块接口实现

阐明对于架构设计中定义的模块接口的实现的设计。

XXX详细设计说明书

(详细设计重点在于对模块进行实现，将模块的对象分解为属性和方法，并阐述如何实现)

一. 概述

阐述本文的参考依据、资料以及大概内容。

二. 目的

阐述本文的编写目的。

三. 模块详细设计

3.1. 设计思想

阐述对模块进行详细设计的思想。

3.2. 模块A

3.2.1. 详细设计

根据模块概要设计详细描述对于模块内对象的实现，包括对象的职责、属性、方法、对象内功能的流程图、对象关联的类、对象的异常。(需要绘制的主要为类图)

之前也有一些介绍大型网站架构演变的文章，例如LiveJournal的、ebay的，都是非常值得参考的，不过感觉他们讲的更多的是每次演变的结果，而没有很详细的讲为什么需要做这样的演变，再加上近来感觉有不少同学都很难明白为什么一个网站需要那么复杂的技术，于是有了写这篇文章的想法，在这篇文章中将阐述一个普通的网站发展成大型网站过程中的一种较为典型的架构演变历程和所需掌握的知识体系，希望能给想从事互联网行业的同学一点初步的概念，:)，文中的不对之处也请各位多给点建议，让本文真正起到抛砖引玉的效果。

架构演变第一步：物理分离webserver和数据库

最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易出问题，于是进入了第一步演变阶段：将应用和数据库从物理上分离，变成了两台机器，这个时候技术上没有什么新的要求，但你发现确实起到效果了，系统又恢复到以前的响应速度了，并且支撑住了更高的流量，并且不会因为数据库和应用形成互相的影响。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

这一步架构演变对技术上的知识体系基本没有要求。

架构演变第二步：增加页面缓存

好景不长，随着访问的人越来越多，你发现响应速度又开始变慢了，查找原因，发现是访问数据库的操作太多，导致数据连接竞争激烈，所以响应变慢，但数据库连接又不能开太多，否则数据库机器压力会很高，因此考虑采用缓存机制来减少数据库连接资源的竞争和对数据库读的压力，这个时候首先也许会选择采用squid 等类似的机制来将系统中相对静态的页面（例如一两天才会有更新的页面）进行缓存（当然，也可以采用将页面静态化的方案），这样程序上可以不做修改，就能够很好的减少对webserver的压力以及减少数据库连接资源的竞争，OK，于是开始采用squid来做相对静态的页面的缓存。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

前端页面缓存技术，例如squid，如想用好的话还得深入掌握下squid的实现方式以及缓存的失效算法等。

架构演变第三步：增加页面片段缓存

增加了squid做缓存后，整体系统的速度确实是提升了，webserver的压力也开始下降了，但随着访问量的增加，发现系统又开始变的有些慢了，在尝到了squid之类的动态缓存带来的好处后，开始想能不能让现在那些动态页面里相对静态的部分也缓存起来呢，因此考虑采用类似ESI之类的页面片段缓存策略，OK，于是开始采用ESI来做动态页面中相对静态的片段部分的缓存。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

页面片段缓存技术，例如ESI等，想用好的话同样需要掌握ESI的实现方式等；

架构演变第四步：数据缓存

在采用ESI之类的技术再次提高了系统的缓存效果后，系统的压力确实进一步降低了，但同样，随着访问量的增加，系统还是开始变慢，经过查找，可能会发现系统中存在一些重复获取数据信息的地方，像获取用户信息等，这个时候开始考虑是不是可以将这些数据信息也缓存起来呢，于是将这些数据缓存到本地内存，改变完毕后，完全符合预期，系统的响应速度又恢复了，数据库的压力也再度降低了不少。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

缓存技术，包括像Map数据结构、缓存算法、所选用的框架本身的实现机制等。

架构演变第五步：增加webserver

好景不长，发现随着系统访问量的再度增加，webserver机器的压力在高峰期会上升到比较高，这个时候开始考虑增加一台webserver，这也是为了同时解决可用性的问题，避免单台的webserver down机的话就没法使用了，在做了这些考虑后，决定增加一台webserver，增加一台webserver时，会碰到一些问题，典型的有：
1、如何让访问分配到这两台机器上，这个时候通常会考虑的方案是Apache自带的负载均衡方案，或LVS这类的软件负载均衡方案；
2、如何保持状态信息的同步，例如用户session等，这个时候会考虑的方案有写入数据库、写入存储、cookie或同步session信息等机制等；
3、如何保持数据缓存信息的同步，例如之前缓存的用户数据等，这个时候通常会考虑的机制有缓存同步或分布式缓存；
4、如何让上传文件这些类似的功能继续正常，这个时候通常会考虑的机制是使用共享文件系统或存储等；
在解决了这些问题后，终于是把webserver增加为了两台，系统终于是又恢复到了以往的速度。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

负载均衡技术（包括但不限于硬件负载均衡、软件负载均衡、负载算法、linux转发协议、所选用的技术的实现细节等）、主备技术（包括但不限于ARP欺骗、linux heart-beat等）、状态信息或缓存同步技术（包括但不限于Cookie技术、UDP协议、状态信息广播、所选用的缓存同步技术的实现细节等）、共享文件技术（包括但不限于NFS等）、存储技术（包括但不限于存储设备等）。

架构演变第六步：分库

享受了一段时间的系统访问量高速增长的幸福后，发现系统又开始变慢了，这次又是什么状况呢，经过查找，发现数据库写入、更新的这些操作的部分数据库连接的资源竞争非常激烈，导致了系统变慢，这下怎么办呢，此时可选的方案有数据库集群和分库策略，集群方面像有些数据库支持的并不是很好，因此分库会成为比较普遍的策略，分库也就意味着要对原有程序进行修改，一通修改实现分库后，不错，目标达到了，系统恢复甚至速度比以前还快了。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

这一步更多的是需要从业务上做合理的划分，以实现分库，具体技术细节上没有其他的要求；

但同时随着数据量的增大和分库的进行，在数据库的设计、调优以及维护上需要做的更好，因此对这些方面的技术还是提出了很高的要求的。

架构演变第七步：分表、DAL和分布式缓存
随着系统的不断运行，数据量开始大幅度增长，这个时候发现分库后查询仍然会有些慢，于是按照分库的思想开始做分表的工作，当然，这不可避免的会需要对程序进行一些修改，也许在这个时候就会发现应用自己要关心分库分表的规则等，还是有些复杂的，于是萌生能否增加一个通用的框架来实现分库分表的数据访问，这个在ebay的架构中对应的就是DAL，这个演变的过程相对而言需要花费较长的时间，当然，也有可能这个通用的框架会等到分表做完后才开始做，同时，在这个阶段可能会发现之前的缓存同步方案出现问题，因为数据量太大，导致现在不太可能将缓存存在本地，然后同步的方式，需要采用分布式缓存方案了，于是，又是一通考察和折磨，终于是将大量的数据缓存转移到分布式缓存上了。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

分表更多的同样是业务上的划分，技术上涉及到的会有动态hash算法、consistent hash算法等；

DAL涉及到比较多的复杂技术，例如数据库连接的管理（超时、异常）、数据库操作的控制（超时、异常）、分库分表规则的封装等；

架构演变第八步：增加更多的webserver

在做完分库分表这些工作后，数据库上的压力已经降到比较低了，又开始过着每天看着访问量暴增的幸福生活了，突然有一天，发现系统的访问又开始有变慢的趋势了，这个时候首先查看数据库，压力一切正常，之后查看webserver，发现apache阻塞了很多的请求，而应用服务器对每个请求也是比较快的，看来是请求数太高导致需要排队等待，响应速度变慢，这还好办，一般来说，这个时候也会有些钱了，于是添加一些webserver服务器，在这个添加 webserver服务器的过程，有可能会出现几种挑战：
1、Apache的软负载或LVS软负载等无法承担巨大的web访问量（请求连接数、网络流量等）的调度了，这个时候如果经费允许的话，会采取的方案是购买硬件负载，例如F5、Netsclar、Athelon之类的，如经费不允许的话，会采取的方案是将应用从逻辑上做一定的分类，然后分散到不同的软负载集群中；
2、原有的一些状态信息同步、文件共享等方案可能会出现瓶颈，需要进行改进，也许这个时候会根据情况编写符合网站业务需求的分布式文件系统等；
在做完这些工作后，开始进入一个看似完美的无限伸缩的时代，当网站流量增加时，应对的解决方案就是不断的添加webserver。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

到了这一步，随着机器数的不断增长、数据量的不断增长和对系统可用性的要求越来越高，这个时候要求对所采用的技术都要有更为深入的理解，并需要根据网站的需求来做更加定制性质的产品。

架构演变第九步：数据读写分离和廉价存储方案

突然有一天，发现这个完美的时代也要结束了，数据库的噩梦又一次出现在眼前了，由于添加的webserver太多了，导致数据库连接的资源还是不够用，而这个时候又已经分库分表了，开始分析数据库的压力状况，可能会发现数据库的读写比很高，这个时候通常会想到数据读写分离的方案，当然，这个方案要实现并不容易，另外，可能会发现一些数据存储在数据库上有些浪费，或者说过于占用数据库资源，因此在这个阶段可能会形成的架构演变是实现数据读写分离，同时编写一些更为廉价的存储方案，例如BigTable这种。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

数据读写分离要求对数据库的复制、standby等策略有深入的掌握和理解，同时会要求具备自行实现的技术；

廉价存储方案要求对OS的文件存储有深入的掌握和理解，同时要求对采用的语言在文件这块的实现有深入的掌握。

架构演变第十步：进入大型分布式应用时代和廉价服务器群梦想时代

经过上面这个漫长而痛苦的过程，终于是再度迎来了完美的时代，不断的增加webserver就可以支撑越来越高的访问量了，对于大型网站而言，人气的重要毋庸置疑，随着人气的越来越高，各种各样的功能需求也开始爆发性的增长，这个时候突然发现，原来部署在webserver上的那个web应用已经非常庞大了，当多个团队都开始对其进行改动时，可真是相当的不方便，复用性也相当糟糕，基本是每个团队都做了或多或少重复的事情，而且部署和维护也是相当的麻烦，因为庞大的应用包在N台机器上复制、启动都需要耗费不少的时间，出问题的时候也不是很好查，另外一个更糟糕的状况是很有可能会出现某个应用上的bug就导致了全站都不可用，还有其他的像调优不好操作（因为机器上部署的应用什么都要做，根本就无法进行针对性的调优）等因素，根据这样的分析，开始痛下决心，将系统根据职责进行拆分，于是一个大型的分布式应用就诞生了，通常，这个步骤需要耗费相当长的时间，因为会碰到很多的挑战：
1、拆成分布式后需要提供一个高性能、稳定的通信框架，并且需要支持多种不同的通信和远程调用方式；
2、将一个庞大的应用拆分需要耗费很长的时间，需要进行业务的整理和系统依赖关系的控制等；
3、如何运维（依赖管理、运行状况管理、错误追踪、调优、监控和报警等）好这个庞大的分布式应用。
经过这一步，差不多系统的架构进入相对稳定的阶段，同时也能开始采用大量的廉价机器来支撑着巨大的访问量和数据量，结合这套架构以及这么多次演变过程吸取的经验来采用其他各种各样的方法来支撑着越来越高的访问量。

看看这一步完成后系统的图示：

这一步涉及到了这些知识体系：

这一步涉及的知识体系非常的多，要求对通信、远程调用、消息机制等有深入的理解和掌握，要求的都是从理论、硬件级、操作系统级以及所采用的语言的实现都有清楚的理解。

运维这块涉及的知识体系也非常的多，多数情况下需要掌握分布式并行计算、报表、监控技术以及规则策略等等。

说起来确实不怎么费力，整个网站架构的经典演变过程都和上面比较的类似，当然，每步采取的方案，演变的步骤有可能有不同，另外，由于网站的业务不同，会有不同的专业技术的需求，这篇blog更多的是从架构的角度来讲解演变的过程，当然，其中还有很多的技术也未在此提及，像数据库集群、数据挖掘、搜索等，但在真实的演变过程中还会借助像提升硬件配置、网络环境、改造操作系统、CDN镜像等来支撑更大的流量，因此在真实的发展过程中还会有很多的不同，另外一个大型网站要做到的远远不仅仅上面这些，还有像安全、运维、运营、服务、存储等，要做好一个大型的网站真的很不容易，写这篇文章更多的是希望能够引出更多大型网站架构演变的介绍，:)。

ps:最后附上几篇LiveJournal架构演变的文章：
从LiveJournal后台发展看大规模网站性能优化方法
http://blog.zhangjianfeng.com/article/743
另外从这里：http://www.danga.com/words/大家可以找到更多关于现在LiveJournal网站架构的介绍。

浅谈浏览器cookie

由于HTTP协议是无状态的，无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。

此时会引用session，比如说登陆成功后，服务端会为用户开辟一块内存区域，用以存放用户这本次会话的一些内容，比如说用户名之类信息。那么就需要一个东西来标识这个内存区域是你的而不是别人的，这就是jsessionid。

然后，服务器响应时会将这个jsessionid发回给你的浏览器，放入你的浏览器的cookie中（这个cookies是内存cookies，跟一般的不一样，它会随着浏览器的关闭而消失）。
之后，只有你浏览器没有关闭，你每向服务器发请求，服务器就会从你发送过来的cookies中拿出这个session id，然后根据这个session id从内存中取出你之前存放的数据。

但是，如果你退出登陆了，服务器会清掉属于你的内存区域，所以你再登的话，会产生一个新的session了。

各浏览器对cookie也有不同的限制:

	IE6.0	IE7.0/8.0	Opera	FF	Safari	Chrome
cookie个数：	每个域为20个	每个域为50个	每个域为30个	每个域为50个	没有个数限制	每个域为53个
cookie总大小：	4095个字节	4095个字节	4096个字节	4097个字节	4097个字节	4097个字节

当cookie超过限额时，浏览器一般会使用"LRU"，最近最少使用原则，删除老的cookie。这样操作对程序本身是有很大影响的，比如获取不到需要的cookie字段，可能会引发一些意想不到的结果，比如用户访问登陆后，访问某个页面，会提示用户没有登陆，需重新登陆等等。

因此，在使用cookie时，需要按严格的标准，和父域名、子域名之间要统一，尽量保证cookie的个数不超过20个，cookie的总大小不超时4KB。

目前查看cookie的工具有很多：

如 HttpWatch，fiddle，firebugs，tamper 以及chrome自带的插件等

当然极力推荐的还是FireCookie，是Firefox的一个插件，可以为Firebug添加Cookie的查看和管理功能

1. 如果某个网站的cookie较多，可以直接利用Firebug的搜索功能对cookie列表进行筛选，这个功能是从左到右完全匹配的，不匹配的结果将被隐藏起来，只显示那些符合条件的结果。

2. 在Cookie列表视图状态下，有一些工具栏按钮可以执行一些特殊的操作，比如新建Cookie，删除当前网站的所有Cookie，以及设置网页使用Cookie的权限等。权限标签按钮显示的是当前网页的权限状态：默认、禁止、允许线程Cookie、允许所有Cookie，除了显示状态，点击这个标签还可以直接修改。而且支持实时更新。

3. 如果你想知道cookie的值是什么时候发生变化的，可以直接使用Firebug的Console功能，Firecookie会在cookie的新建、修改、删除和被禁用的时候，向Console里写日志，如果嫌这个功能多余，可以在选择菜单中禁用。列表中的cookie是可以直接修改的，直接右键点击cookie，选择edit项就可以。

4. Firecookie支持剪贴板功能，可以对cookie进行复制、粘贴和剪切操作。如果把一个cookie项复制，并粘贴到记事本中，得到的结果是一个cookie赋值语句，左边是cookie名称，右边是cookie的值列表，包含domain域和path路径等项目。

数据库并发解决方案

在如今分布式、高并发、各种负载纵横天下的时代，支持高访问量成为检验一个系统合不合格的重要标准，然而我们除了在运算过程中要求系统更加效率外，在最终的数据存储过程中也希望其能够准确。

针对如何解决多线程并发产生的脏数据问题，本文简单列举一些常见案例及应对措施。

案例一：

本地起10个线程，分别执行10次，对数据库的一条记录的sum字段（初始值为0）+1操作，中间的业务逻辑我们忽略掉，如何保证执行完毕后sum的值为100？

表结构：

字段名	字段类型	可空	字段描述	使用备注
ID	BIGINT(20)	N	主键ID	无业务含义
SUM	NUMBER(20)	N	金额	初始值为0

解决措施：乐观锁机制，利用数据库自身的事务来解决问题，update 表 set sum=sum+#increment# where id=#id#，适用于一些只更新数量、金额的场景。

尽量不要采用在后台计算一个最终的sum值，然后通过 update 表 set sum=#sum# where id=#id#，因为此时在读与写的时间间隔里，很有可能其它的线程已经读过或操作过

案例二：

买家操作一笔订单，执行确认收货，假如同一笔订单打开了两个窗口，开始时在一个窗口确认成功，后来在另一个窗口又点了一次，此时应如何解决？

解决措施：在执行“买家确认收货”操作时，我们通常会首先查出这笔订单，判断当前操作用户是否有执行权限，同时判断当前订单的状态是否是“等待买家确认收货”，。。。，如果满足这些前置条件，才允许后面的业务操作，更新数据库。

当然，存在另一种可能，如果是通过自动化脚本操作呢？两次操作几乎同时执行，也就是说，两次的前置校验都能顺利通过(因此那时，数据库记录还没来的及更新)，此时一个好的解决方案，操作时增加前置条件，比如确认收货的前置条件是“等待买家确认收货”，如果此时订单的状态变成了成功就无法操作。

update 订单表 set status="交易成功" where id=#orderId# and status="等待买家确认收货"

这样，第二次操作sq条件不满足，也就避免执行两次买家确认收货操作。

案例三：

增加前置条件是一个不错的解决方案，但是，不是每个业务都会有前置条件，或者说前置条件不明确，无规则，此时就如何解决？

字段名	字段类型	可空	字段描述	使用备注
ID	BIGINT(20)	N	主键ID	无业务含义
SUM	NUMBER(20)	N	金额	初始值为0
attribute_cc	INT(11)	N	用于为attribute加锁

解决措施：可以借助memcache用到的一种同步机制（CAS），比较并交换，在数据库表增加一个冗余字段，每次操作都会自动+1

执行业务时，首先会从数据库读取该字段信息，更新业务数据时，会自动比较attribute_cc的值是否有变化，如果有变化，表示刚才读的信息已变化过，需要重新操作。

你会做Web上的用户登录功能吗？

Web上的用户登录功能应该是最基本的功能了，可是在我看过一些站点的用户登录功能后，我觉得很有必要写一篇文章教大家怎么来做用户登录功能。下面的文章告诉大家这个功能可能并没有你所想像的那么简单，这是一个关系到用户安全的功能，希望大家能从下面的文章中能知道什么样的方法才是一个好的用户登录功能。以下内容，转载时请保持原文一致，并请注明作者和出处。

用户名和口令

首先，我们先来说说用户名和口令的事。这并不是本站第一次谈论这个事了。如何管理自己的口令让你知道怎么管理自己的口令，破解你的口令让你知道在现代这样速度的计算速度下，用穷举法破解你的口令可能会是一件很轻松的事。在这里我想告诉从开发者的角度上来做设计这个用户名和口令的事。下面一几件规则：

限制用户输入一些非常容易被破解的口令。如什么qwert，123456, password之类，就像twitter限制用户的口令一样做一个口令的黑名单。另外，你可以限制用户口令的长度，是否有大小写，是否有数字，你可以用你的程序做一下校验。当然，这可能会让用户感到很不爽，所以，现在很多网站都提供了UX让用户知道他的口令强度是什么样的（比如这个有趣的UX），这样可以让用户有一个选择，目的就是告诉用户——要想安全，先把口令设得好一点。

千万不要明文保存用户的口令。正如如何管理自己的口令所说的一样，很多时候，用户都会用相同的ID相同的口令来登录很多网站。所以，如果你的网站明文保存的话，那么，如果你的数据被你的不良员工流传出去那对用户是灾难性的。所以，用户的口令一定要加密保存，最好是用不可逆的加密，如MD5或是SHA1之类的有hash算法的不可逆的加密算法。CSDN曾明文保存过用户的口令。（另，对于国内公司的品行以及有关部门的管理方式，我不敢保证国内网站以加密的方式保存你的口令。我觉得，做为一个有良知的人，我们应该加密保存用户的口令）

是否让浏览器保存口令。我们有N多的方法可以不让浏览器保存用户名和口令。但是这可能对用户来说很不爽。因为在真实世界里谁也记得不住那么多的口令。很多用户可能会使用一些密码管理工具来保存密码，浏览器只是其中一种。是否让浏览器保存这个需要你做决定，重点是看一下你的系统的安全级别是否要求比较高，如果是的话，则不要让浏览器保存密码，并在网站明显的位置告诉用户——保存口令最安全的地方只有你的大脑。

口令在网上的传输。因为HTTP是明文协议，所以，用户名和口令在网上也是明文发送的，这个很不安全。你可以看看这篇文章你就明白了。要做到加密传输就必需使用HTTPS协议。但是，在中国还是有很多网站的Web登录方式还在使用ActiveX控件，这可能成为IE6还大量存在的原因。我通常理解为这些ActiveX控件是为了反键盘记录程序的。不过，我依然觉ActiveX控件不应该存在，因为在国外的众多安全很重要的站点上都看不到ActiveX的控件的身影。

用户登录状态

首先，我想告诉大家的是，因为HTTP是无状态的协议，也就是说，这个协议是无法记录用户访问状态的，其每次请求都是独立的无关联的，一笔是一笔。而我们的网站都是设计成多个页面的，所在页面跳转过程中我们需要知道用户的状态，尤其是用户登录的状态，这样我们在页面跳转后我们才知道是否可以让用户有权限来操作一些功能或是查看一些数据。

所以，我们每个页面都需要对用户的身份进行认证。当然，我们不可能让用户在每个页面上输入用户名和口令，这会让用户觉得我们的网站相当的SB。为了实现这一功能，用得最多的技术就是浏览器的cookie，我们会把用户登录的信息存放在客户端的cookie里，这样，我们每个页面都从这个cookie里获得用户是否登录的信息，从而达到记录状态，验证用户的目的。但是，你真的会用cookie吗？下面是使用cookie的一些原则。

千万不要在cookie中存放用户的密码。加密的密码都不行。因为这个密码可以被人获取并尝试离线穷举。所以，你一定不能把用户的密码保存在cookie中。我看到太多的站点这么干了。

正确设计“记住密码”。这个功能简直就是一个安全隐患，我觉得并不是所有的程序员都知道怎么设计这个事。一般的设计是——一时用户勾选了这个功能，系统会生成一个cookie，cookie包括用户名和一个固定的散列值，这个固定的散列值一直使用。这样，你就可以在所有的设备和客户上都可以登录，而且可以有多个用户同时登录。这个并不是很安全。下面是一些更为安全的方法供你参考：
（——更新 2011/08/26，原文中有些小错误，并且说的不清楚，重新调整了一下——）

1）在cookie中，保存三个东西——用户名，登录序列，登录token。

用户名：明文存放。
登录序列：一个被MD5散列过的随机数，仅当强制用户输入口令时更新（如：用户修改了口令）。
登录token：一个被MD5散列过的随机数，仅一个登录session内有效，新的登录session会更新它。

2）上述三个东西会存在服务器上，服务器的验证用户需要验证客户端cookie里的这三个事。

3）这样的设计会有什么样的效果，会有下面的效果，

a）登录token是单实例登录。意思就是一个用户只能有一个登录实例。

b）登录序列是用来做盗用行为检测的。如果用户的cookie被盗后，盗用者使用这个cookie访问网站时，我们的系统是以为是合法用户，然后更新“登录token”，而真正的用户回来访问时，系统发现只有“用户名”和“登录序列”相同，但是“登录token” 不对，这样的话，系统就知道，这个用户可能出现了被盗用的情况，于是，系统可以清除并更改登录序列 和 登录token，这样就可以令所有的cookie失效，并要求用户输入口令。并给警告用户系统安全。

4）当然，上述这样的设计还是会有一些问题，比如：同一用户的不同设备登录，甚至在同一个设备上使用不同的浏览器保登录。一个设备会让另一个设备的登录token和登录序列失效，从而让其它设备和浏览器需要重新登录，并会造成cookie被盗用的假象。所以，你在服务器服还需要考虑- IP 地址，

a) 如果以口令方式登录，我们无需更新服务器的“登录序列”和 “登录token”（但需要更新cookie）。因为我们认为口令只有真正的用户知道。

b) 如果 IP相同 ，那么，我们无需更新服务器的“登录序列”和 “登录token”（但需要更新cookie）。因为我们认为是同一用户有同一IP（当然，同一个局域网里也有同一IP，但我们认为这个局域网是用户可以控制的。网吧内并不推荐使用这一功能）。

c) 如果（IP不同 && 没有用口令登录），那么，“登录token” 就会在多个IP间发生变化（登录token在两个或多个ip间被来来回回的变换），当在一定时间内达到一定次数后，系统才会真正觉得被盗用的可能性很高，此时系统在后台清除“登录序列”和“登录token“，让Cookie失效，强制用户输入口令（或是要求用户更改口令），以保证多台设备上的cookie一致。

不要让cookie有权限访问所有的操作。否则就是XSS攻击，这个功能请参看新浪微博的XSS攻击。下面的这些功能一定要用户输入口令：

1）修改口令。

2）修改电子邮件。（电子邮件通常用来找回用户密码，最好通发邮件或是发手机短信的方式修改，或者干脆就不让改一一用电子邮件做帐号名）

3）用户的隐私信息。

4）用户消费功能。

权衡Cookie的过期时间。如果是永不过期，会有很不错的用户体验，但是这也会让用户很快就忘了登录密码。如果设置上过期期限，比如2周，一个月，那么可能会好一点，但是2周和一个月后，用户依然会忘了密码。尤其是用户在一些公共电脑上，如果保存了永久cookie的话，等于泄露了帐号。所以，对于cookie的过期时间我们还需要权衡。

找回口令的功能

找回口令的功能一定要提供。但是很多朋友并不知道怎么来设计这个功能。我们有很多找回口令的设计，下面我逐个点评一下。

千万不要使用安全问答。事实证明，这个环节很烦人，而且用户并不能很好的设置安全问答。什么，我的生日啊，我母亲的生日，等等。因为今天的互联网和以前不一样了，因为SNS，今天的互联比以前更真实了，我可以上facebook，开心，人人网，LinkedIn查到你的很多的真实的信息。通过这些信息我可以使用安全问答来重设你的口令。这里需要说一下 Facebook，Facebook的安全问答很强大，还要你通过照片认人，呵呵。

不要重置用户的密码。因为这有可能让用户的密码遭到恶意攻击。当然，你要发个邮件给用户让其确认，用户点击邮件中的一个链接，你再重置。我并不推荐这样的方法，因为用户一般都会用笔记下来这个很难记的口令，然后登录系统，因为登录系统时使用了“记住密码”的功能，所以导致用户不会去修改密码，从而要么导到被写下来的密码被人盗取，要么又忘记了密码。

好一点的做法——通过邮件自行重置。当用户申请找回口令功能的时候，系统生成一个MD5唯一的随机字串（可通过UID+IP+timestamp+随机数），放在数据库中，然后设置上时限（比如1小时内），给用户发一个邮件，这个连接中包含那个MD5的字串的链接，用户通过点击那个链接来自己重新设置新的口令。

更好一点的做法——多重认证。比如：通过手机+邮件的方式让用户输入验证码。手机+邮件可能还不把握，因为手机要能会丢了，而我的手机可以访问我的邮箱。所以，使用U盾，SecureID（一个会变化的6位数token），或是通过人工的方式核实用户身份。当然，这主要看你的系统的安全级别了。

口令探测防守

使用验证码。验证码是后台随机产生的一个短暂的验证码，这个验证码一般是一个计算机很难识别的图片。这样就可以防止以程序的方式来尝试用户的口令。事实证明，这是最简单也最有效的方式。当然，总是让用户输入那些肉眼都看不清的验证码的用户体验不好，所以，可以折中一下。比如Google，当他发现一个IP地址发出大量的搜索后，其会要求你输入验证码。当他发现同一个IP注册了3个以上的gmail邮箱后，他需要给你发短信方式或是电话方式的验证码。

用户口令失败次数。调置口令失败的上限，如果失败过多，则把帐号锁了，需要用户以找回口令的方式来重新激活帐号。但是，这个功能可能会被恶意人使用。最好的方法是，增加其尝试的时间成本（以前的这篇文章说过一个增加时间成本的解密算法）。如，两次口令尝试的间隔是5秒钟。三次以上错误，帐号被临时锁上30秒，5次以上帐号被锁1分钟，10次以上错误帐号被锁4小时……但是这会导致恶意用户用脚本来攻击，所以最好再加上验证码，验证码出错次数过多不禁止登录而是禁lP。

系统全局防守。上述的防守只针对某一个别用户。恶意者们深知这一点，所以，他们一般会动用“僵尸网络”轮着尝试一堆用户的口令，所以上述的那种方法可能还不够好。我们需要在系统全局域上监控所有的口令失败的次数。当然，这个需要我们平时没有受到攻击时的数据做为支持。比如你的系统，平均每天有5000次的口令错误的事件，那么你可以认为，当口令错误大幅超过这个数后，而且时间相对集中，就说明有黑客攻击。这个时候你怎么办？一般最常见使用的方法是让所有的用户输错口令后再次尝试的时间成本增加。

最后，再说一下，关于用户登录，使用第三方的 OAuth 和 OpenID 也不失为一个很不错的选择。

参考文章

（以上内容，转载时请保持原文一致，并请注明作者和出处）

（转载本站文章请注明作者和出处酷壳 – CoolShell.cn ，请勿用于任何商业用途）

——=== 访问酷壳404页面以支持公益事业 ===——

基于消息的分布式架构设计

背景：

随着社会的发展，经济的飞跃，传统的单系统模式（webApp+DB）已经很难满足业务场景的需要。企业系统开始不断演化成多个子系统并存协作的局面。大大降低了系统间的耦合性，更重要的便于子系统的扩展、升级、维护等。

谈到系统间的协作，目前常用两种方式：

1、基于Http协议

通过客户端发起的get、post请求，服务端接收request请求，处理请求，得到响应内容，通过网络传送到客户端，由浏览器解析出一个可视化的页面。

这种交互最大的优势是实时性，通过HTTP请求连接各个子系统，从而跨服务器来完成一个完整的业务流程。缺点协议请求头的信息较少，一般都是关键参数，完整数据由下一个子系统从数据库、文件系统来获取，从来保证前后的业务数据衔接。

2、基于消息的模式。

这种模式一个很重要前提是对实时性要求不高。优点可以有效降低模块的耦合性，减轻主干业务流程，将大量的业务交由后台任务来处理，有效缩短系统响应时间，提高系统TPS。

比如用户下单成功后发送邮件功能，属于非主干功能，完全可以从下单的主干业务逻辑剥离出来，从来提高下单的响应速度。而发送邮件的功能则由邮件服务器接收异步消息来跟踪处理，带有点分布式集群的感觉，

将一个任务有效拆分到多台服务器来完成。

所谓消息本质上是一种数据结构（当然，对象也可以看做是一种特殊的消息），它包含生产者与消费者双方都能识别的数据，这些数据需要在不同的服务器之间进行传递，并可能会被多个完全不同的客户端消费。

消息队列降低了生产者和消费者之间的耦合性，他们不会存在直接的代码依赖，方便各自的扩展，比如生产者因为业务下线，导致代码下线，而消费端不用同时跟进处理，只是队列不会有消息，这样方便于更加灵活的协调开发资源，而不必一方下线，所有的依赖全部受影响，产生较高维护成本。另外我们也可以随意对生产者和消费者扩展，引入多个消息队列，他们之间的依赖可以配置在XML文件中，通过JNDI来获取消息队列Queue，每次加载时，通过lookup服务首先通过读取配置文件来获取通道。

常见的消息模型分为：点对点模型；发布-订阅模型

点对点模型：Point to Point，消息被生产者放到一个队列中，消费者从消息队列中取走消息。消息一旦被一个消费者取走后，消息就从队列中移除。这意味着即使有多个消费观察一个队列，但一个消息只能被一个消费者取走。

发布-订阅模型：Publish/Subscribe，发布者发布一条消息可以发送给所有的订阅用户，所有的订阅用户都有处理某一条消息的机会。

对于订阅者而言，有两种处理消息的方式。一种是广播机制，这时消息通道中的消息在出列的同时，还需要复制消息对象，将消息传递给多个订阅者。例如，有多个子系统都需要获取从CRM系统传来的客户信息，并根据传递过来的客户信息，进行相应的处理。此时的消息通道又被称为Propagation通道。另一种方式则属于抢占机制，它遵循同步方式，在同一时间只能有一个订阅者能够处理该消息。实现Publisher-Subscriber模式的消息通道会选择当前空闲的唯一订阅者，并将消息出列，并传递给订阅者的消息处理方法。

目前使用较多的是广播机制的消息处理方式，且将topic与queue有效组合

一个生产消息的事件对应一个topic，topic下面可以挂多个queue，当然一个queue也可以挂在多个topic下面，每个queue都对应一个消息的消费端，唯一消费，保证消费的准确性。

如下图所示，当下单时，会将下单的相关信息封装到消息体中，发送到下单事件关联的那个topic1中，然后Topic会将消息复制发送到挂载在其下面的所有队列上，将Message复制到快照队列、成交记录统计队列中，消息端会监听队列，

如果有消息，则启动任务线程，来进行相关的业务处理。

在引入消息队列时重点要注意以下几点：

并发：选择的消息队列一定要很好地支持用户访问的并发性；
安全：消息队列是否提供了足够的安全机制；
性能伸缩：不能让消息队列成为整个系统的单一性能瓶颈；
部署：尽可能让消息队列的部署更为容易；
灾备：不能因为意外的错误、故障或其他因素导致处理数据的丢失，最好可以写入磁盘，持久化存储；
API易用性：处理消息的API必须足够简单、并能够很好地支持测试与扩展
容量：队列的容量一定要大，至少可以存储千万级别的消息体

目前市场上有很多成熟的消息框架：如Active MQ，IBM 的MQ，JBoss MQ，MSMQ等，各有各的优势，在使用前一定要充分衡量是否可以满足自己的业务需求

下图是napoli的client类图：

从需求出发来看关系模型与非关系模型–关系模型与非关系模型概述

自从NoSQL概念横空出世，关系数据库似乎就成了众矢之的，似乎一夜之间，关系数据库和SQL就成了低效，高成本，速度慢的数据处理模式的代名词。在很多地方都能看到类似：”我的项目初创，应该选择什么NoSQL产品才能快速的开发？” 这样的问题。

正因有人提出这样的问题，才坚定了我把这篇文章放在了第一章的决心。主要的目标是希望借助这样一个形式，让大家能够比较清晰的认识到类似NoSQL,SchemaFree,RDBMS,CAP,BASE等等概念的本源，并了解到他们面对的主要场景，从而避免乱花渐入迷人眼的尴尬，知其然而知其所以然。

其实，软件中所谓的对象，结构体，实体，关系等概念，都只是对现实生活中的一种抽象。因为人类太过渺小，渺小到无法真正的理解和模拟这个世界，所以不得不创造出一些概念，过滤掉具体的细节而只关心他们所需要关心的事情。这就产生了各种各样的抽象。

而SQL和关系模型，就是针对数据之间的“关系”而进行的一种抽象。

简单来说，他将一切事物都抽象为关系，并通过集合运算的方式规定了关系之间的运算过程，也因此更为严谨。比如，描述一辆车有四个轮子和四扇玻璃，那么就可以建立三张表格，一张存车的属性，一张存玻璃的属性，一张存轮子的属性，并且在轮子和玻璃的表格中，冗余车的唯一标示。这样就可以完成关系描述。如果要读取车A.id = 5车子的左前方轮子的出厂号码标示，做法一般是：查询轮子表，找到车子id=5的并且标有左前方属性的那行数据，读取他的出厂号码。

了解了关系模型，我们再来看看在关系模型产生之前，大家经常使用的层次模型吧。

层次模型其实也是非常简单的一类描述，还以车为例，一辆车有唯一的标示（可以是个id,也可以只是个入口引用），然后车节点有两个子节点，一个是轮子集合节点，一个是玻璃集合节点，然后，轮子集合节点有四个节点，分别表示四个轮子，而玻璃集合有四个节点，分别标示四扇玻璃。如果要读取车A.id = 5车子的左前方轮子的出厂号码标示，做法一般是：找到顶节点车A，然后查找该节点的子节点，轮子集合节点，然后遍历4个子节点，找到标有左前方属性的车轮，读取其出厂号码。

从上面简单的例子对比来看，相信大家立刻就能看出关系模型与传统的层次or表格模型的最大差别。也就是用户不再需要关注从车->轮子集合->轮子本身，这个存取路径，只需要关注于核心的查询逻辑(车子id=5 , 车轮属性是左前方），就可以立刻找到数据了。 使用关系模型，因为模型相对的比较简单，并且数学证明比较严密，所以很快被大家接受。

因此在市面上已经很少出现层次模型or网状模型了。

在互联网时代之前，数据库的研究领域更多的集中在关系模型与前端业务开发模型不匹配这个问题上，众所周知的，在面向对象的语言产生之后，继承，多态，充血模型已经成为了程序语言的标配，我们在这里不去讨论是面向对象好，还是函数式编程好这样没结论的问题，只来简单的浏览一下面向对象与关系模型的阻抗失配问题即可。

如果大家写过业务逻辑，一定也会觉得把数据库里的数据转变为程序对象是一件蛋疼无比的事情吧。将面向对象里面的继承和组合这类概念硬套到关系数据库上，需要耗费比较大的精力才能完成。

为了解决这些问题，一种思路是在程序层做这个ORMapping的转换，这类工具主要是hibernate、ibatis等工具。另外一个思路是在数据库层面做这件事，比如oracle一直宣传自己是ORDBMS。甚至甚至，连脚本语言框架比如ROR , django的核心目标之一也就是解决这个阻抗失配的问题~

因为类似java/c++/.net这样的语言是静态编译的，所以就必须要求用户要在代码中明确的定义对象的属性名字和类型，而在数据库内，也有一套对应的列名和数据库类型信息。一张表有50多个字段，每次字段变更，都必须保证用户代码内的对象内的属性和数据库中的数据准确对应。这非常消耗时间，也非常容易错。

为了解决这个问题，要么是从程序代码生成关系模型，要么是从关系模型反向生成程序代码。这两种方式都会面临程序逻辑与关系模型不匹配的问题，于是写ORMapping就成了一件蛋疼无比但又不得不做的事情。

为了自动化，有大量的工具组件出现在这里，比如hibernate，比如ibatis，他们主要作用就是将我们的对象模型转换为关系模型，不过这类工具最大的问题就是，学习工具本身的成本很高，甚至高于自己去做对象关系映射本身，而且经常会因为对ORMapping掌握的不够精深，造成很多低效的查询，拖慢了整体性能的问题。

还有一些人为了偷懒，放弃使用对象bean来表示数据库中数据。他们一般会采用Map映射来表示数据库中一行数据，使用这种方式，Map的key就是列的名字，value就是列的值，如果要表示多行数据，那么就是一个List<Map>的结构。使用这种结构，程序就可以自动的根据数据库给出的列名原信息来自动生成Map结构。但这种方式的问题是，丢失了面向对象所带来的良好的封装特性，经过多层传递与处理后，用户很难辨识哪些是数据中间过程数据，哪些是数据库原始数据。数据Map对象会膨胀的非常厉害，以至于无法管理。

脚本语言的核心目标之一也就是解决这个阻抗失配的问题，脚本语言因为是动态编译的，所以动态对一个对象增加或减少属性变得非常简单而清晰，所以对象内的数据可以直接根据数据库内的数据进行内省获得，不在需要人工维护，同时又不会出现因为Map结构所导致的代码结构不清晰的问题，所以ROR这类的工具可以直接进行对象关系映射，极大地提升了小业务系统的生产力。

可惜，对象数据库和xml数据库，都没有形成一统天下的新浪潮，一直不瘟不火的缓慢发展着。

随着互联网的爆发式发展，数据库概念领域又一次发生了摇摆，伴随着互联网的特殊需求，一批有着新鲜血液的NoSQL数据库涌现了出来，层次模型又从封印中苏醒，站在了大家面前。

这里就自然而然会有一系列的疑问产生了出来，为什么层次模型变种的NoSQL会出现并得到了一些人的认同？他满足了什么需求？关系模型在什么地方不能满足大家的需求了？

那么，我们就从应用场景出发，尝试回答一下这些问题吧。

淘宝高性能架构简介

本文只是做个简介，起抛砖引玉效果，希望能给大家一些启发（ps：作为一线码农，在工作中经常接触并使用这些框架，深深为其强大功能、设计思路所折服）

1. session框架

session大家肯定都不陌生，由于HTTP协议本身是无状态，前后两次请求通常是没有关联的，但由于一些业务需求，又必须让其有所关联（比如登录，不可能让用户每次访问一个页面都需要重新登录一次，那用户肯定会疯掉）

此时我们就需要借助session机制，将用户的一些信息存储在服务端，其主键jsessionid存储于客户端的cookie中，下一次用户发起请求时，servlet框架会根据jsessionid自动寻找关联的信息。

但随着互联网的快速发展，用户群越来越大，如何来存储、管理庞大的session信息显得越来越重要。

通常的作法是采用集群（多么熟悉的名词，ho~ho~），例如tomcat采用集群节点广播复制，jboss采用配对复制，但都严重影响系统的伸缩性，不能通过增加机器达到更好的水平伸缩，而且随着节点的增加，节点间的通信也更加频繁，势必会造成系统内耗加大。

webX框架的基于cookie的session可以有效的解决这个问题，将信息存于客户端浏览器的cookie中，而应用节点本身不保存任何状态信息。但要注意的一点是不同的浏览器对cookie的支持标准不一样，关于这块可参照之前的文章《浅谈浏览器cookie》。对于这个问题，我们的解决方案是“多值cookie”，一个组合键对应多个cookie值，可以有效将cookie的个数控制在20个以内，很大程度节省了cookie信息的存储空间，更多精彩可参考《Request context之session指南》

2. 缓存tair

缓存，主要是为了减轻对数据库的压力，使用场景非常广泛。有浏览器缓存、反向代理缓存、页面缓存、对象缓存等

tair是淘宝的一个高性能、分布式、可扩展、高可用性的key-value结构的存储系统。

非持久化：

mdb引擎: 只支持key/value，单机性能7w qps（测试条件：单条记录512字节，响应时间2ms内）

rdb引擎: 不仅支持key/value，还支持list/hashmap/set/sortedset等复杂数据结构。

持久化：

kdb引擎：采用了kyoto cabinet做为引擎，性能在2000 qps单台。

ldb引擎：采用了leveldb做为引擎，并且自带cache。服务器采用了ssd，性能在5w qps以上。

目前tair已经开源，开源地址：http://code.taobao.org/p/tair/src/

3. 服务化（HSF框架，dubbo）

服务化的核心就是解耦，将生产端和消费端有效拆分，借助于HSF来达成调用关联。使用系统的整体可用性、扩展性大大增强。

举个很形象的例子，一个业务开创之初，可能只有一个应用，但随着业务的不断膨胀，代码量也越来越大，无论后期开发还是维护带来的成本都是很高的，此时，从架构的角度会进行系统拆分，通过增加子域名的形式，借助于http请求，将不同的业务交由不同的系统来处理。

比如商品展示交由系统A处理；当用户添写一个购买数量，并选择好规格属性后，点击“购买”按钮，会将请求发送到系统B来处理，无论从业务划分、模块定位、还是代码开发，都鲜明不少。

现在回到我们服务化的内容来，在服务化推广之前，底层业务通常是这样处理，如果你想使用部门A的业务（通常要数据库操作），首先要引入相应的jar包，尤其是底层的dal层的包（sql.xml ，接口，接口实现等），然后在应用中手动配置各种bean关系，可以说相当繁琐。当然如果只是配置一次，再繁琐也忍了。互联网千变万化，电子商务更是瞬息万变，业务变更相当频繁，代码频繁改动那更是家常便饭。想象一下，如果你的dal层jar包被十几个业务线所依赖，如果你想改底层的dao接口实现，你是不是需要这十几个业务线也跟着空发布一次，只是为了打包时能加载你最新的代码。

痛苦之大难以想象。幸好有了服务化。服务化可以有效将业务收扰到服务端，对外只暴露一个接口即可，如果你想用我的业务，只需做下简单接口配置即可，调用时，HSF框架会帮你找到对应的服务端，然后服务端会进行相应的业务处理，返回给你想要的结果，是不是清晰了很多。

dubbo已开源，地址：http://code.alibabatech.com/wiki/display/dubbo/Home

4. 数据库拆分TDDL

现在是大数据时代，随便一个应用，动辄就是上千万的数据，数据库表示压力越来越大。分库分表成为业务发展的不二选择。

TDDL是淘宝开发的一套分布式数据库访问引擎。可以有效解决

a）数据访问路由：数据的读写请求发送到最合适的地方

b）数据的多向非对称复制：一次写入，多点读取

c）数据的存储自由扩展：不再受限于单台机器的容量瓶颈和速度瓶颈，平滑迁移

关于分库分表可以看看iteye上的一篇文章《淘宝下单高并发解决方案》

另外tddl也开源了，开源地址：http://code.taobao.org/p/tddl-dynamic-datasource/src/trunk/

5. 异步消息（notify）

主要是借助消息中间件，采用异步通信来达到系统的伸缩性，以最大化的对各个子系统解耦。

具体是采用同步通信还异步通信，需要结合业务来衡量，如果业务本身关联度较大，建议还是采用同步通信比较靠谱。

关于异步消息这块，之前有过简单整理《基于消息的分布式架构设计》

6. 非结构化数据存储 ( TFS,NOSQL)

并非所有的数据都是结构化的,比如一些配置文件，交易的快照等，一般不适合保存到RDBMS，更符合一种Key-value的结构；另一类数据，数据量非常大，但实时性要求不高，此时这些数据也需要通过另外的一种存储方式进行存储。
一些静态文件，比如各个商品的图片，商品描述等信息，这些信息因为比较大，放入RDBMS会引起读取性能问题，影响其它数据读取性能，也要和其它信息分开存储，一般的选择分布式文件系统。

随着互联网的发展，08年下半年开始逐渐流行了一个概念就是NOSQL。我们都知道根据CAP理论，一致性，可用性和分区容错性三者不能同时满足，最多只能同时满足两个。
传统关系数据库采用ACID事务策略，更加讲究高一致性而降低了可用性的需求；但互联网应用往往对可用性的要求要略高于一致性的需求，这时候就要避免采用数据的ACID事务策略，转而采用BASE(基本可用性，事务软状态以及最终一致性)事务策略

目前此类产品有facebook 的cassandra,apache hbase,google bigtable等，非常适合一些非结构化的数据，如key-value形式数据存储，具有很好的水平伸缩性

订阅：博文 (Atom)

关注Linux 及系统架构

页面

2013年6月17日星期一

网站架构相关PPT、文章整理（更新于2009-7-15）

系统设计说明书(架构、概要、详细)目录结构

大型网站架构演变和知识体系

浅谈浏览器cookie

数据库并发解决方案

你会做Web上的用户登录功能吗？

用户名和口令

用户登录状态

找回口令的功能

口令探测防守

参考文章

基于消息的分布式架构设计

背景：

从需求出发来看关系模型与非关系模型–关系模型与非关系模型概述

淘宝高性能架构简介

网页浏览总次数