MitBBS SysDisign

Original from post

我的面试也结束了 因为知道FLAG这类公司都会问到System Design的问题 所以这次面 试着重准备了一下 在这里分享给大家 如果有不对或者需要补充的地方 大家可以留言

这里说的System Design和OO Design不同 System Design在FLAG以及很多大公司中主要 是design scalable distributed systems 这里只讨论如何准备这种题目

== 入门 == 对于0基础的同学们 下面的资料可以按顺序开始看

  1. http://www.hiredintech.com/app#system-design 这是一个专门准备面试的网站 你只用关心system design部分 有很多的link后面会重 复提到 建议看完至少一遍

  2. https://www.youtube.com/watch?v=-W9F__D3oY4 非常非常好的入门资料 建议看3遍以上! 这是1里面提到的资料 是Harvard web app课的最后一节 讲scalability 里面会讲到很 多基础概念比如Vertical scaling, Horizontal scaling, Caching, Load balancing, Database replication, Database partitioning 还会提到很多基本思想比如avoid single point of failure 再强调一遍 非常好的资料!

  3. http://www.lecloud.net/post/7295452622/scalability-for-dummies-part-1-clones 1里面提到的 Scalability for Dummies 还算不错 可以看一遍 知道基本思想

结束语:当你结束这一部分的学习的时候 你已经比50%的candidate知道的多了(因为很 多人都不准备 或者不知道怎么准备system design) 恭喜:)

== 进阶 == 这一部分的资料更加零散 每个看的可能不一样 但是你每多看一篇文章或者一个视频 你就比别人强一点 这部分你会遇到很多新名词 我的建议是每当你遇到一个不懂的概念时 多google一下 看看这个概念或者技术是什么意思 优点和缺点各是什么 什么时候用 这些你都知道以 后 你就可以把他运用到面试中 让面试官刮目相看了

  1. http://highscalability.com/blog/2009/8/6/an-unorthodox-approach-to-database-design-the-coming-of-the.html Database Sharding是一个很重要的概念 建议看一看

  2. http://highscalability.com/all-time-favorites/ 这个里面会讲到很多非常流行的网站架构是如何实现的 比如Twitter, Youtube, Pinterest, Google等等 我的建议是看5-6个 然后你应该已经建立起了一些基本的意识 还有知道了某些技术和产品的作用和mapping 比如说到cache你会想到memcached和 Redis 说到 load balancer你会想到 Amazon ELB, F5一类的

  3. http://www.infoq.com/ 5里面很多的文章都会有链接 其中有很多会指向这个网站 这里面有很多的tech talk 很不错 可以看看

  4. https://www.facebook.com/Engineering/notes Facebook非常好的技术日志 会讲很多facebook的feature怎么实现的 比如facebook message:https://www.facebook.com/notes/facebook-engineering/the-underlying- technology-of-messages/454991608919 建议看看 尤其是准备面facebook的同学 这有一个facebook talk讲storage的https://www.youtube.com/watch?v=5RfFhMwRAic

  5. 一些国内网站上的资料 http://blog.csdn.net/sigh1988/article/details/9790337 http://blog.csdn.net/v_july_v/article/details/6279498

  6. 最后一些概念很有用 都是我再看这些资料的时候发现的 如果你没有遇到或者查过 建议查查 Distributed Hash Table Eventual Consistency vs Strong Consistency Read Heavy vs Write Heavy Consistent Hashing Sticky Sessions Structured Data(uses DynamoDB) vs Unstructured Data(uses S3)http://smartdatacollective.com/michelenemschoff/206391/quick-guide-structured-and-unstructured-data http://stackoverflow.com/questions/18678315/amazon-s3-or-dynamodb

10 给有兴趣深入研究的人看的 Mining Massive Datasets –讲很多big data和data mining的东西 Big Data: Principles and best practices of scalable realtime data systems(http://www.amazon.com/gp/product/1617290343) – twitter的前员工讲述如何处理实时数据 目前市面上讲解big data最好的一本书

10 凌乱的资料 随便看看吧 http://highscalability.com/blog/2013/10/28/design-decisions-for == 小结== 看多了以后 你的最终目标应该是心里有了一个大框架 一个基本的distributed system 是怎么搭起来的 然后心里有很多if condition 如果要是满足这个条件 我应该用什么 技术 比如如果read heavy那么用cache会提升performance之类的 同时知道应该避免什 么东西 比如避免single point of failure 再比如时间和空间的tradeoff在read heavy的时候应该倾向于时间 Write heavy的时候倾向于空间等等

你总结出来的和我总结出来的大框架和if conditions肯定不完全一样 但因为system design本来就是一个open ended question 所以不用害怕 能够自圆其说 就不会有问题

最后 本文纯属抛砖引玉 如果有大牛发现有错误或者有补充 欢迎留言 大家一起讨论

== FAQ ==

  1. New Grad需要看System Design么?

答案是it depends. 有的公司会考system design 有的公司只考到OO design 有的公司 压根不考 当然 考到的公司对new grad的期望值会稍微低一点 但是 你有这么一个机会 能让你gain leverage over other candidates why not? 为什么要让自己在面试前害怕 面试官出system design的题目呢?