- 原文地址:
- 原文作者:
- 译文出自:
- 译者:,,,,
这是?
这是我为了从 web 开发者(自学、非计算机科学学位)蜕变至 Google 软件工程师所制定的计划,其内容历时数月。
这一长列表是从 Google 的指导笔记 中萃取出来并进行扩展。因此,有些事情你必须去了解一下。我在列表的底部添加了一些额外项,用于解决面试中可能会出现的问题。这些额外项大部分是来自于 Steve Yegge 的“”。而在 Google 指导笔记的逐字间,它们有时也会被反映出来。
为何要用到它?
我一直都是遵循该计划去准备 Google 的面试。自 1997 年以来,我一直从事于 web 程序的构建、服务器的构建及创业型公司的创办。对于只有着一个经济学学位,而不是计算机科学学位(CS degree)的我来说,在职业生涯中所取得的都非常成功。然而,我想在 Google 工作,并进入大型系统中,真正地去理解计算机系统、算法效率、数据结构性能、低级别编程语言及其工作原理。可一项都不了解的我,怎么会被 Google 所应聘呢?
当我创建该项目时,我从一个堆栈到一个堆都不了解。那时的我,完全不了解 Big-O 、树,或如何去遍历一个图。如果非要我去编写一个排序算法的话,我只能说我所写的肯定是很糟糕。一直以来,我所用的任何数据结构都是内建于编程语言当中。至于它们在背后是如何运作,对此我一概不清楚。此外,以前的我并不需要对内存进行管理,最多就只是在一个正在执行的进程抛出了“内存不足”的错误后,采取一些权变措施。而在我的编程生活中,也甚少使用到多维数组,可关联数组却成千上万。而且,从一开始到现在,我都还未曾自己实现过数据结构。
就是这样的我,在经过该学习计划后,已然对被 Google 所雇佣充满信心。这是一个漫长的计划,以至于花费了我数月的时间。若您早已熟悉大部分的知识,那么也许能节省大量的时间。
如何使用它
下面所有的东西都只是一个概述。因此,你需要由上而下逐一地去处理它。
在学习过程中,我是使用 GitHub 特殊的语法特性 markdown flavor 去检查计划的进展,包括使用任务列表。
- [x] 创建一个新的分支,以使得你可以像这样去检查计划的进展。直接往方括号中填写一个字符 x 即可:[x]
拥有一名 Googler 的心态
把一个(或两个)印有“”的图案打印出来,并用你誓要成功的眼神盯着它。
我得到了工作吗?
我还没去应聘。
因为我离完成学习(完成该疯狂的计划列表)还需要数天的时间,并打算在下周开始用一整天的时间,以编程的方式去解决问题。当然,这将会持续数周的时间。然后,我才通过使用在二月份所得到的一个介绍资格,去正式应聘 Google(没错,是二月份时就得到的)。
感谢 JP 的这次介绍。
跟随着我
目前我仍在该计划的执行过程中,如果你想跟随我脚步去学习的话,可以登进我在 上所写的博客。
下面是我的联系方式:
- Twitter:
- Twitter:
- Google+:
- LinkedIn:
不要自以为自己足够聪明
- Google 的工程师都是才智过人的。但是,就算是工作在 Google 的他们,仍然会因为自己不够聪明而感到一种不安。
关于 Google
- [ ] 面向学生 ——
- [ ] Google 检索的原理:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 系列文章:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
相关视频资源
部分视频只能通过在 Coursera、Edx 或 class 上注册登录才能观看。这些视频被称为网络公开课程(MOOC)。即便是免费观看,部分课程可能会由于不在时间段内而无法获取。因此,你需要多等待几个月。
很感谢您能帮我把网络公开课程的视频链接转换成公开的视频源,以代替那些在线课程的视频。此外,一些大学的讲座视频也是我所青睐的。
面试过程 & 通用的面试准备
-
[ ] 视频:
- [ ]
- [ ]
- [ ]
-
[ ] 文章:
- [ ]
- [ ]
- 所有他所提及的事情都列在了下面
- [ ] (早已过期)
- [ ]
-
[ ] 附加的(虽然 Google 不建议,但我还是添加在此):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 震撼开发类面试 第一集:
- [ ]
- [ ]
- [ ] 如何在世界四强企业中获得一份工作:
- [ ]
- [ ]
为你的面试选择一种语言
在这,我就以下话题写一篇短文 ——
在大多数公司的面试当中,你可以在编程这一环节,使用一种自己用起来较为舒适的语言去完成编程。但在 Google,你只有三种固定的选择:
- C++
- Java
- Python
有时你也可以使用下面两种,但需要事先查阅说明。因为,说明中会有警告:
- JavaScript
- Ruby
你需要对你所选择的语言感到非常舒适且足够了解。
更多关于语言选择的阅读:
由于,我正在学习C、C++ 和 Python。因此,在下面你会看到部分关于它们的学习资料。相关书籍请看文章的底部。
在你开始之前
该列表已经持续更新了很长的一段时间,所以,我们的确很容易会对其失去控制。
这里列出了一些我所犯过的错误,希望您不要重滔覆辙。
1. 你不可能把所有的东西都记住
就算我查看了数小时的视频,并记录了大量的笔记。几个月后的我,仍然会忘却其中大部分的东西。所以,我翻阅了我的笔记,并将可回顾的东西制作成抽认卡(flashcard)(请往下看)
2. 使用抽认卡
为了解决善忘的问题,我制作了一些关于抽认卡的页面,用于添加两种抽认卡:正常的及带有代码的。每种卡都会有不同的格式设计。
而且,我还以移动设备为先去设计这些网页,以使得在任何地方的我,都能通过我的手机及平板去回顾知识。
你也可以免费制作属于你自己的抽认卡网站:
- :有一点需要记住的是,我做事有点过头,以至于把卡片都覆盖到所有的东西上。从汇编语言和 Python 的细枝末节,乃至到机器学习和统计都被覆盖到卡片上。而这种做法,对于 Google 的要求来说,却是多余。
在抽认卡上做笔记: 若你第一次发现你知道问题的答案时,先不要急着把其标注成“已懂”。你需要做的,是去查看一下是否有同样的抽认卡,并在你真正懂得如何解决问题之前,多问自己几次。重复地问答可帮助您深刻记住该知识点。
3. 回顾,回顾,回顾
我留有一组 ASCII 码表、OSI 堆栈、Big-O 记号及更多的小抄纸,以便在空余的时候可以学习。
每编程半个小时就要休息一下,并去回顾你的抽认卡。
4. 专注
在学习的过程中,往往会有许多令人分心的事占据着我们宝贵的时间。因此,专注和集中注意力是非常困难的。
你所看不到的
由于,这个巨大的列表一开始是作为我个人从 Google 面试指导笔记所形成的一个事件处理列表。因此,有一些我熟悉且普遍的技术在此都未被谈及到:
- SQL
- Javascript
- HTML、CSS 和其他前端技术
日常计划
部分问题可能会花费一天的时间去学习,而部分则会花费多天。当然,有些学习并不需要我们懂得如何实现。
因此,每一天我都会在下面所列出的列表中选择一项,并查看相关的视频。然后,使用以下的一种语言去实现:
C —— 使用结构体和函数,该函数会接受一个结构体指针 * 及其他数据作为参数。C++ —— 不使用内建的数据类型。C++ —— 使用内建的数据类型,如使用 STL 的 std::list 来作为链表。Python —— 使用内建的数据类型(为了持续练习 Python),并编写一些测试去保证自己代码的正确性。有时,只需要使用断言函数 assert() 即可。此外,你也可以使用 Java 或其他语言。以上只是我的个人偏好而已。
为何要在这些语言上分别实现一次?
因为可以练习,练习,练习,直至我厌倦它,并完美地实现出来。(若有部分边缘条件没想到时,我会用书写的形式记录下来并去记忆)因为可以在纯原生的条件下工作(不需垃圾回收机制的帮助下,分配/释放内存(除了 Python))因为可以利用上内建的数据类型,以使得我拥有在现实中使用内建工具的经验(在生产环境中,我不会去实现自己的链表)
就算我没有时间去每一项都这么做,但我也会尽我所能的。
在这里,你可以查看到我的代码:
你不需要记住每一个算法的内部原理。
在一个白板上写代码,而不要直接在计算机上编写。在测试完部分简单的输入后,到计算机上再测试一遍。
必备知识
-
[ ] 计算机是如何处理一段程序:
- [ ]
- [ ]
-
[ ] 编译器
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 浮点数是如何存储的:
- [ ] 简单的 8-bit:
- [ ] 32 bit:
算法复杂度 / Big-O / 渐进分析法
- 并不需要实现
- [ ]
- [ ]
- [ ]
- [ ] Skiena 算法:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 高级编程(包括递归关系和主定理):
-
[ ]
如果部分课程过于学术性,你可直接跳到文章底部,去查看离散数学的视频以获取相关背景知识。
数据结构
-
数组(Arrays)
- 实现一个可自动调整大小的动态数组。
- [ ] 介绍:
- [ ] 实现一个动态数组(可自动调整大小的可变数组):
- [ ] 练习使用数组和指针去编码,并且指针是通过计算去跳转而不是使用索引
- [ ] 通过分配内存来新建一个原生数据型数组
- 可以使用 int 类型的数组,但不能使用其语法特性
- 从大小为16或更大的数(使用2的倍数 —— 16、32、64、128)开始编写
- [ ] size() —— 数组元素的个数
- [ ] capacity() —— 可容纳元素的个数
- [ ] is_empty()
- [ ] at(index) —— 返回对应索引的元素,且若索引越界则愤然报错
- [ ] push(item)
- [ ] insert(index, item) —— 在指定索引中插入元素,并把后面的元素依次后移
- [ ] prepend(item) —— 可以使用上面的 insert 函数,传参 index 为 0
- [ ] pop() —— 删除在数组末端的元素,并返回其值
- [ ] delete(index) —— 删除指定索引的元素,并把后面的元素依次前移
- [ ] remove(item) —— 删除指定值的元素,并返回其索引(即使有多个元素)
- [ ] find(item) —— 寻找指定值的元素并返回其中第一个出现的元素其索引,若未找到则返回 -1
- [ ] resize(new_capacity) // 私有函数
- 若数组的大小到达其容积,则变大一倍
- 获取元素后,若数组大小为其容积的1/4,则缩小一半
- [ ] 时间复杂度
- 在数组末端增加/删除、定位、更新元素,只允许占 O(1) 的时间复杂度(平摊(amortized)去分配内存以获取更多空间)
- 在数组任何地方插入/移除元素,只允许 O(n) 的时间复杂度
- [ ] 空间复杂度
- 因为在内存中分配的空间邻近,所以有助于提高性能
- 空间需求 = (大于或等于 n 的数组容积)* 元素的大小。即便空间需求为 2n,其空间复杂度仍然是 O(n)
-
链表(Linked Lists)
- [ ] 介绍:
- [ ]
- [ ]
- [ ]
- 并非看完整个视频,只需要看关于节点结果和内存分配那一部分即可
- [ ] 链表 vs 数组:
- [ ]
- [ ] 的确:你需要关于“指向指针的指针”的相关知识:(因为当你传递一个指针到一个函数时,该函数可能会改变指针所指向的地址)该页只是为了让你了解“指向指针的指针”这一概念。但我并不推荐这种链式遍历的风格。因为,这种风格的代码,其可读性和可维护性太低。
- [ ] 实现(我实现了使用尾指针以及没有使用尾指针这两种情况):
- [ ] size() —— 返回链表中数据元素的个数
- [ ] empty() —— 若链表为空则返回一个布尔值 true
- [ ] value_at(index) —— 返回第 n 个元素的值(从0开始计算)
- [ ] push_front(value) —— 添加元素到链表的首部
- [ ] pop_front() —— 删除首部元素并返回其值
- [ ] push_back(value) —— 添加元素到链表的尾部
- [ ] pop_back() —— 删除尾部元素并返回其值
- [ ] front() —— 返回首部元素的值
- [ ] back() —— 返回尾部元素的值
- [ ] insert(index, value) —— 插入值到指定的索引,并把当前索引的元素指向到新的元素
- [ ] erase(index) —— 删除指定索引的节点
- [ ] value_n_from_end(n) —— 返回倒数第 n 个节点的值
- [ ] reverse() —— 逆序链表
- [ ] remove_value(value) —— 删除链表中指定值的第一个元素
- [ ] 双向链表
- 并不需要实现
- [ ] 介绍:
-
堆栈(Stack)
- [ ]
- [ ]
- [ ] 可以不实现,因为使用数组来实现并不重要
-
队列(Queue)
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 使用含有尾部指针的链表来实现:
- enqueue(value) —— 在尾部添加值
- dequeue() —— 删除最早添加的元素并返回其值(首部元素)
- empty()
- [ ] 使用固定大小的数组实现:
- enqueue(value) —— 在可容的情况下添加元素到尾部
- dequeue() —— 删除最早添加的元素并返回其值
- empty()
- full()
- [ ] 花销:
- 在糟糕的实现情况下,使用链表所实现的队列,其入列和出列的时间复杂度将会是 O(n)。因为,你需要找到下一个元素,以致循环整个队列
- enqueue:O(1)(平摊(amortized)、链表和数组 [探测(probing)])
- dequeue:O(1)(链表和数组)
- empty:O(1)(链表和数组)
-
哈希表(Hash table)
-
[ ] 视频:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 在线课程:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 分布式哈希表:
-
[ ] 使用线性探测的数组去实现
- hash(k, m) —— m 是哈希表的大小
- add(key, value) —— 如果 key 已存在则更新值
- exists(key)
- get(key)
- remove(key)
-
更多的知识
-
二分查找(Binary search)
- [ ]
- [ ]
- [ ]
- [ ] 实现:
- 二分查找(在一个已排序好的整型数组中查找)
- 迭代式二分查找
-
按位运算(Bitwise operations)
- [ ]
- 你需要知道大量2的幂数值(从2^1 到 2^16 及 2^32)
- [ ] 好好理解位操作符的含义:&、|、^、~、>>、<<
- [ ] )
- [ ] 好的介绍:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 一补数和补码
- [ ] 计算置位(Set Bits)
- [ ] 四舍五入2的幂数:
- [ ] 交换值:
- [ ] 绝对值:
- [ ]
树(Trees)
-
树 —— 笔记 & 背景
- [ ]
- [ ]
- 基本的树形结构
- 遍历
- 操作算法
- BFS(广度优先检索,breadth-first search)
- 层序遍历(使用队列的 BFS 算法)
- 时间复杂度: O(n)
- 空间复杂度:
- 最好情况: O(1)
- 最坏情况:O(n/2)=O(n)
- 层序遍历(使用队列的 BFS 算法)
- DFS(深度优先检索,depth-first search)
- 笔记:
- 时间复杂度:O(n)
- 空间复杂度:
- 最好情况:O(log n) - 树的平均高度
- 最坏情况:O(n)
- 中序遍历(DFS:左、节点本身、右)
- 后序遍历(DFS:左、右、节点本身)
- 先序遍历(DFS:节点本身、左、右)
- 笔记:
-
二叉查找树(Binary search trees):BSTs
- [ ]
- [ ]
- 从符号表开始到 BST 程序
- [ ]
- [ ]
- C/C++:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 实现:
- [ ] insert // 往树上插值
- [ ] get_node_count // 查找树上的节点数
- [ ] print_values // 从小到大打印树中节点的值
- [ ] delete_tree
- [ ] is_in_tree // 如果值存在于树中则返回 true
- [ ] get_height // 返回节点所在的高度(如果只有一个节点,那么高度则为1)
- [ ] get_min // 返回树上的最小值
- [ ] get_max // 返回树上的最大值
- [ ] is_binary_search_tree
- [ ] delete_value
- [ ] get_successor // 返回给定值的后继者,若没有则返回-1
-
堆(Heap) / 优先级队列(Priority Queue) / 二叉堆(Binary Heap)
- 可视化是一棵树,但通常是以线性的形式存储(数组、链表)
- [ ] )
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 实现一个大顶堆:
- [ ] insert
- [ ] sift_up —— 用于插入元素
- [ ] get_max —— 返回最大值但不移除元素
- [ ] get_size() —— 返回存储的元素数量
- [ ] is_empty() —— 若堆为空则返回 true
- [ ] extract_max —— 返回最大值并移除
- [ ] sift_down —— 用于获取最大值元素
- [ ] remove(i) —— 删除指定索引的元素
- [ ] heapify —— 构建堆,用于堆排序
- [ ] heap_sort() —— 拿到一个未排序的数组,然后使用大顶堆进行就地排序
- 注意:若用小顶堆可节省操作,但导致空间复杂度加倍。(无法做到就地)
-
字典树(Tries)
- 需要注意的是,字典树各式各样。有些有前缀,而有些则没有。有些使用字符串而不使用比特位来追踪路径。
- 阅读代码,但不实现。
- [ ]
- [ ] 短课程视频:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
平衡查找树(Balanced search trees)
- 掌握至少一种平衡查找树(并懂得如何实现):
- “在各种平衡查找树当中,AVL 树和2-3树已经成为了过去,而红黑树(red-black trees)看似变得越来越受人青睐。这种令人特别感兴趣的数据结构,亦称伸展树(splay tree)。它可以自我管理,且会使用轮换来移除任何访问过根节点的 key。” —— Skiena
- 因此,在各种各样的平衡查找树当中,我选择了伸展树来实现。虽然,通过我的阅读,我发现在 Google 的面试中并不会被要求实现一棵平衡查找树。但是,为了胜人一筹,我们还是应该看看如何去实现。在阅读了大量关于红黑树的代码后,我才发现伸展树的实现确实会使得各方面更为高效。
- 伸展树:插入、查找、删除函数的实现,而如果你最终实现了红黑树,那么请尝试一下:
- 跳过删除函数,直接实现搜索和插入功能
- 我希望能阅读到更多关于 B 树的资料,因为它也被广泛地应用到大型的数据库当中。
-
[ ]
-
[ ] AVL 树
- 实际中:我能告诉你的是,该种树并无太多的用途,但我能看到有用的地方在哪里:AVL 树是另一种平衡查找树结构。其可支持时间复杂度为 O(log n) 的查询、插入及删除。它比红黑树严格意义上更为平衡,从而导致插入和删除更慢,但遍历却更快。正因如此,才彰显其结构的魅力。只需要构建一次,就可以在不重新构造的情况下读取,适合于实现诸如语言字典(或程序字典,如一个汇编程序或解释程序的操作码)。
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 伸展树
- 实际中:伸展树一般用于缓存、内存分配者、路由器、垃圾回收者、数据压缩、ropes(字符串的一种替代品,用于存储长串的文本字符)、Windows NT(虚拟内存、网络及文件系统)等的实现。
- [ ]
- [ ] MIT 教程:伸展树(Splay trees):
- 该教程会过于学术,但请观看到最后的10分钟以确保掌握。
-
[ ] 2-3查找树
- 实际中:2-3树的元素插入非常快速,但却有着查询慢的代价(因为相比较 AVL 树来说,其高度更高)。
- 你会很少用到2-3树。这是因为,其实现过程中涉及到不同类型的节点。因此,人们更多地会选择红黑树。
- [ ]
- [ ]
- [ ]
-
[ ] 2-3-4树 (亦称2-4树)
- 实际中:对于每一棵2-4树,都有着对应的红黑树来存储同样顺序的数据元素。在2-4树上进行插入及删除操作等同于在红黑树上进行颜色翻转及轮换。这使得2-4树成为一种用于掌握红黑树背后逻辑的重要工具。这就是为什么许多算法引导文章都会在介绍红黑树之前,先介绍2-4树,尽管2-4树在实际中并不经常使用。
- [ ]
- [ ]
- [ ]
-
[ ] B 树
- 有趣的是:为啥叫 B 仍然是一个神秘。因为 B 可代表波音(Boeing)、平衡(Balanced)或 Bayer(联合创造者)
- 实际中:B 树会被广泛适用于数据库中,而现代大多数的文件系统都会使用到这种树(或变种)。除了运用在数据库中,B 树也会被用于文件系统以快速访问一个文件的任意块。但存在着一个基本的问题,那就是如何将文件块 i 转换成一个硬盘块(或一个柱面-磁头-扇区)上的地址。
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- 覆盖有高速缓存参数无关型(cache-oblivious)B 树和非常有趣的数据结构
- 头37分钟讲述的很专业,或许可以跳过(B 指块的大小、即缓存行的大小)
-
[ ] 红黑树
- 实际中:红黑树提供了在最坏情况下插入操作、删除操作和查找操作的时间保证。这些时间值的保障不仅对时间敏感型应用有用,例如实时应用,还对在其他数据结构中块的构建非常有用,而这些数据结构都提供了最坏情况下的保障;例如,许多用于计算几何学的数据结构都可以基于红黑树,而目前 Linux 系统所采用的完全公平调度器(the Completely Fair Scheduler)也使用到了该种树。在 Java 8中,红黑树也被用于存储哈希列表集合中相同的数据,而不是使用链表及哈希码。
- [ ]
- [ ]
- [ ]
- [ ]
-
N 叉树(K 叉树、M 叉树)
- 注意:N 或 K 指的是分支系数(即树的最大分支数):
- 二叉树是一种分支系数为2的树
- 2-3树是一种分支系数为3的树
- [ ]
- 注意:N 或 K 指的是分支系数(即树的最大分支数):
排序(Sorting)
-
[ ] 笔记:
- 实现各种排序 & 知道每种排序的最坏、最好和平均的复杂度分别是什么场景:
- 不要用冒泡排序 - 大多数情况下效率感人 - 时间复杂度 O(n^2), 除非 n <= 16
- [ ] 排序算法的稳定性 (“快排是稳定的么?”)
- [ ] 哪种排序算法可以用链表?哪种用数组?哪种两者都可?
- 并不推荐对一个链表排序,但归并排序是可行的.
- 实现各种排序 & 知道每种排序的最坏、最好和平均的复杂度分别是什么场景:
-
关于堆排序,请查看前文堆的数据结构部分。堆排序很强大,不过是非稳定排序。
-
[ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ]
-
[ ] 斯坦福大学关于排序算法的视频:
- [ ]
- [ ]
-
[ ] Shai Simonson 视频, :
- [ ]
- [ ]
-
[ ] Steven Skiena 关于排序的视频:
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 加州大学伯克利分校(UC Berkeley) 大学课程:
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] - 归并排序:
- [ ]
- [ ]
-
[ ] - 快速排序:
- [ ]
- [ ]
-
[ ] 实现:
- [ ] 归并:平均和最差情况的时间复杂度为 O(n log n)。
- [ ] 快排:平均时间复杂度为 O(n log n)。
- 选择排序和插入排序的最坏、平均时间复杂度都是 O(n^2)。
- 关于堆排序,请查看前文堆的数据结构部分。
-
[ ] 有兴趣的话,还有一些补充 - 但并不是必须的:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
图(Graphs)
图论能解决计算机科学里的很多问题,所以这一节会比较长,像树和排序的部分一样。
-
Yegge 的笔记:
- 有 3 种基本方式在内存里表示一个图:
- 对象和指针
- 矩阵
- 邻接表
- 熟悉以上每一种图的表示法,并了解各自的优缺点
- 宽度优先搜索和深度优先搜索 - 知道它们的计算复杂度和设计上的权衡以及如何用代码实现它们
- 遇到一个问题时,首先尝试基于图的解决方案,如果没有再去尝试其他的。
- 有 3 种基本方式在内存里表示一个图:
-
[ ] Skiena 教授的课程 - 很不错的介绍:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 图 (复习和其他):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
完整的 Coursera 课程:
- [ ]
-
Yegge: 如果有机会,可以试试研究更酷炫的算法:
- [ ] Dijkstra 算法 - 上文 - 6.006
- [ ] A* 算法
- [ ]
- [ ]
- [ ]
-
我会实现:
- [ ] DFS 邻接表 (递归)
- [ ] DFS 邻接表 (栈迭代)
- [ ] DFS 邻接矩阵 (递归)
- [ ] DFS 邻接矩阵 (栈迭代)
- [ ] BFS 邻接表
- [ ] BFS 邻接矩阵
- [ ] 单源最短路径问题 (Dijkstra)
- [ ] 最小生成树
- 基于 DFS 的算法 (根据上文 Aduni 的视频):
- [ ] 检查环 (我们会先检查是否有环存在以便做拓扑排序)
- [ ] 拓扑排序
- [ ] 计算图中的连通分支
- [ ] 列出强连通分量
- [ ] 检查双向图
可以从 Skiena 的书(参考下面的书推荐小节)和面试书籍中学习更多关于图的实践。
更多知识
-
递归(Recursion)
- [ ] Stanford 大学关于递归 & 回溯的课程:
- [ ]
- [ ]
- [ ]
- [ ]
- 什么时候适合使用
- 尾递归会更好么?
- [ ]
- [ ]
- [ ] Stanford 大学关于递归 & 回溯的课程:
-
动态规划(Dynamic Programming)
- This subject can be pretty difficult, as each DP soluble problem must be defined as a recursion relation, and coming up with it can be tricky.
- 这一部分会有点困难,每个可以用动态规划解决的问题都必须先定义出递推关系,要推导出来可能会有点棘手。
-
我建议先阅读和学习足够多的动态规划的例子,以便对解决 DP 问题的一般模式有个扎实的理解。
-
[ ] 视频:
- Skiena 的视频可能会有点难跟上,有时候他用白板写的字会比较小,难看清楚。
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 单独的 DP 问题 (每一个视频都很短):
- [ ] Yale 课程笔记:
- [ ]
- [ ] Coursera 课程:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
组合(Combinatorics) (n 中选 k 个) & 概率(Probability)
- [ ]
- [ ]
- [ ]
- [ ] 可汗学院:
- 课程设置:
- [ ]
- 视频 - 41 (每一个都短小精悍):
- [ ]
- 课程设置:
-
NP, NP-完全和近似算法
- 知道最经典的一些 NP 完全问题,比如旅行商问题和背包问题, 而且能在面试官试图忽悠你的时候识别出他们。
- 知道 NP 完全是什么意思.
- [ ]
- [ ] Simonson:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] Skiena:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- Peter Norvik 讨论旅行商问题的近似最优解:
- 《算法导论》的第 1048 - 1140 页。
-
缓存(Cache)
- [ ] LRU 缓存:
- [ ]
- [ ]
- [ ]
- [ ] CPU 缓存:
- [ ]
- [ ]
- [ ] LRU 缓存:
-
进程(Processe)和线程(Thread)
- [ ] 计算机科学 162 - 操作系统 (25 个视频):
- 视频 1-11 是关于进程和线程
- 涵盖了:
- 进程、线程、协程
- 进程和线程的区别
- 进程
- 线程
- 锁
- 互斥
- 信号量
- 监控
- 他们是如何工作的
- 死锁
- 活锁
- CPU 活动, 中断, 上下文切换
- 现代多核处理器的并发式结构
- 进程资源需要(内存:代码、静态存储器、栈、堆、文件描述符、I/O)
- 线程资源需要(在同一个进程内和其他线程共享以上的资源,但是每个线程都有独立的程序计数器、栈计数器、寄存器和栈)
- Fork 操作是真正的写时复制(只读),直到新的进程写到内存中,才会生成一份新的拷贝。
- 上下文切换
- 操作系统和底层硬件是如何初始化上下文切换的。
- 进程、线程、协程
- [ ]
-
[ ] Python 的协程 (视频):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
系统设计以及可伸缩性,要把软硬件的伸缩性设计的足够好有很多的东西要考虑,所以这是个包含非常多内容和资源的大主题。需要花费相当多的时间在这个主题上。
- [ ] 计算机科学 162 - 操作系统 (25 个视频):
-
系统设计、可伸缩性、数据处理
- Yegge 的注意事项:
- 伸缩性
- 把大数据集提取为单一值
- 大数据集转换
- 处理大量的数据集
- 系统
- 特征集
- 接口
- 类层次结构
- 在特定的约束下设计系统
- 轻量和健壮性
- 权衡和折衷
- 性能分析和优化
- 伸缩性
- [ ] 从这里开始:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] - 这一部分有很多的资源,浏览一下我放在下面的文章和例子。
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] Paxos 一致性算法:
- [ ]
- [ ]
- [ ]
- [ ] OOSE: 使用 UML 和 Java 开发软件 (21 videos):
- 如果你对 OO 都深刻的理解和实践,可以跳过这部分。
- [ ] 面向对象编程的 SOLID 原则:
- [ ]
- [ ]
- [ ]
- [ ] S - |
- [ ] O - |
- [ ] L - |
- [ ] I - | 客户端被迫实现用不到的接口
- [ ] D - | 减少对象里的依赖。
- [ ] 可伸缩性:
- [ ]
- [ ] 简短系列:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 下面 『消息、序列化和消息系统』部分的内容会提到什么样的技术能把各种服务整合到一起
- [ ] Twitter:
- 更多内容可以查看视频部分的『大规模数据挖掘』视频系列。
- [ ] 系统设计问题练习:下面有一些指导原则,每一个都有相关文档以及在现实中该如何处理。
- 复习:
- 流程:
- 理解问题和范围:
- 在面试官的帮助下定义用例
- 提出附加功能的建议
- 去掉面试官认定范围以外的内容
- 假定高可用是必须的,而且要作为一个用例
- 考虑约束:
- 问一下每月请求量
- 问一下每秒请求量 (他们可能会主动提到或者让你算一下)
- 评估读写所占的百分比
- 评估的时候牢记 2/8 原则
- 每秒写多少数据
- 总的数据存储量要考虑超过 5 年的情况
- 每秒读多少数据
- 抽象设计:
- 分层 (服务, 数据, 缓存)
- 基础设施: 负载均衡, 消息
- 粗略的概括任何驱动整个服务的关键算法
- 考虑瓶颈并指出解决方案
- 理解问题和范围:
- 练习:
- Yegge 的注意事项:
-
论文
- 有 Google 的论文和一些知名的论文.
- 你很可能实在没时间一篇篇完整的读完他们。我建议可以有选择的读其中一些论文里的核心部分。
- [ ]
- [ ]
- 2012 年被 Colossus 取代了
- [ ]
- 大多被云数据流取代了?
- [ ]
- [ ]
- 没有论文
- [ ] 2012: AddressSanitizer: 快速的内存访问检查器:
- [ ] 2013: Spanner: Google 的分布式数据库:
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
测试
- 涵盖了:
- 单元测试是如何工作的
- 什么是模拟对象
- 什么是集成测试
- 什么是依赖注入
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ] 依赖注入:
- [ ]
- [ ]
- [ ]
- 涵盖了:
-
调度
- 在操作系统中是如何运作的
- 在操作系统部分的视频里有很多资料
-
实现系统例程
- 理解你使用的系统 API 底层有什么
- 你能自己实现它们么?
-
字符串搜索和操作
- [ ]
- [ ] Rabin-Karp (videos):
- [ ] Knuth-Morris-Pratt (KMP) 算法:
- [ ] Boyer–Moore 字符串搜索算法
- [ ]
终面
这一部分有一些短视频,你可以快速的观看和复习大多数重要概念。这对经常性的巩固很有帮助。
综述:
- [ ] 2-3 分钟的短视频系列 (23 个)
- [ ] 2-5 分钟的短视频系列 - Michael Sambol (18 个):
排序:
- [ ] 归并排序:
书籍
Google Coaching 里提到的
阅读并做练习:
-
[ ] 算法设计手册 (Skiena)
- 书 (Kindle 上可以租到):
- 是一个资源丰富且性价比很高的在线书店.
- 答案:
- )
-
read and do exercises from the books below. Then move to coding challenges (further down below)
一旦你理解了每日计划里的所有内容,就去读上面所列的书并完成练习,然后开始读下面所列的书并做练习,之后就可以开始实战写代码了(本文再往后的部分)
- 书 (Kindle 上可以租到):
首先阅读:
- [ ]
然后阅读 (这本获得了很多推荐, 但是不在 Google coaching 的文档里):
- [ ]
- 如果你看到有人在看 “The Google Resume”, 实际上它和 “Cracking the Coding Interview” 是同一个作者写的,而且后者是升级版。
附加书单
这些没有被 Google 推荐阅读,不过我因为需要这些背景知识所以也把它们列在了这里。
-
[ ] C Programming Language, Vol 2
-
[ ] C++ Primer Plus, 6th Edition
-
[ ]
-
[ ]
-
[ ]
如果你有时间
-
[ ]
-
[ ]
- 如果你希望在面试里用 C++ 写代码,这本书的代码全都是 C++ 写的
- 通常情况下能找到解决方案的好书.
编码练习和挑战
一旦你学会了理论基础,就应该把它们拿出来练练。
尽量坚持每天做编码练习,越多越好。编程问题预备:
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ]
编码练习平台:
当你临近面试时
- [ ] 搞定代码面试 (videos):
你的简历
- 这是搞定面试的第一个关键步骤
当面试来临的时候
随着下面列举的问题思考下你可能会遇到的 20 个面试问题每个问题准备 2-3 种回答准备点故事,不要只是摆一些你完成的事情的数据,相信我,人人都喜欢听故事
- 你为什么想得到这份工作?
- 你解决过的最有难度的问题是什么?
- 面对过的最大挑战是什么?
- 见过的最好或者最坏的设计是怎么样的?
- 对某项 Google 产品提出改进建议。
- 你作为一个个体同时也是团队的一员,如何达到最好的工作状态?
- 你的什么技能或者经验是你的角色中不可或缺的?为什么?
- 你在某份工作或某个项目中最享受的是什么?
- 你在某份工作或某个项目中面临过的最大挑战是什么?
- 你在某份工作或某个项目中遇到过的最蛋疼的 Bug 是什么样的?
- 你在某份工作或某个项目中学到了什么?
- 你在某份工作或某个项目中哪些地方还可以做的更好?
问面试官的问题
我会问的一些:(可能我已经知道了答案但我想听听面试官的看法或者了解团队的前景):
- 团队多大规模?
- 开发周期是怎样的? 会使用瀑布流/极限编程/敏捷开发么?
- 经常会为 deadline 加班么? 或者是有弹性的?
- 团队里怎么做技术选型?
- 每周平均开多少次会?
- 你觉得工作环境有助于员工集中精力吗?
- 目前正在做什么工作?
- 喜欢这些事情吗?
- 工作期限是怎么样的?
当你获得了梦想的职位
我还能说些什么呢,恭喜你!
坚持继续学习。
得到这份工作只是一个开始。
**********************************************************************************************************************************************************************************************************Everything below this point is optional. These are my recommendations, not Google's. By studying these, you'll get greater exposure to more CS concepts, and will be better prepared for any software engineering job.**********************************************************************************************************************************************************************************************************
Additional Learning
-
Unicode
- [ ]
- [ ]
-
Endianness
- [ ]
- [ ]
- [ ]
- Very technical talk for kernel devs. Don’t worry if most is over your head.
- The first half is enough.
-
Emacs and vi(m)
- suggested by Yegge, from an old Amazon recruiting post: Familiarize yourself with a unix-based code editor
- vi(m):
- set of 4 videos:
- set of 4 videos:
- emacs:
- set of 3 (videos):
- set of 3 (videos):
-
Unix 命令行工具
- 下列内容中的优秀工具由的 Yegge 推荐,Yegge 目前致力于 Amazon 人事招聘处。
- [ ] bash
- [ ] cat
- [ ] grep
- [ ] sed
- [ ] awk
- [ ] curl or wget
- [ ] sort
- [ ] tr
- [ ] uniq
- [ ]
- [ ]
-
信息资源 (视频)
- [ ]
- [ ] 更多有关马尔可夫的内容:
- [ ]
- [ ]
- [ ]
- 关于更多信息,请参照下方 MIT 6.050J 信息和系统复杂度的内容.
-
奇偶校验位 & 汉明码 (视频)
- [ ]
- [ ]
- [ ] 汉明码(Hamming Code):
- [ ]
-
系统熵值(系统复杂度)
- 请参考下方视频
- 观看之前,请先确定观看了信息论的视频
- [ ]
-
密码学
- 请参考下方视频
- 观看之前,请先确定观看了信息论的视频
- [ ]
- [ ]
- [ ]
-
压缩
- 观看之前,请先确定观看了信息论的视频
- [ ] 压缩 (视频):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
网络 (视频)
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
计算机安全
-
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
-
释放缓存
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
平行化(多线程)编程
- [ ]
- [ ]
-
设计模式
- [ ]
- [ ] 主要有如下的设计模式:
- [ ] s(strategy)
- [ ] singleton
- [ ] adapter
- [ ] prototype
- [ ] decorator
- [ ] visitor
- [ ] factory, abstract factory
- [ ] facade
- [ ] observer
- [ ] proxy
- [ ] delegate
- [ ] command
- [ ] state
- [ ] memento
- [ ] iterator
- [ ] composite
- [ ] flyweight
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- 尽管这本书叫做设计模式:重复使用模块,但是我还是认为Head First是对于新手来说很不错的书。
- [ ]
-
信息传输, 序列化,和队列化的系统
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
快速傅里叶变换
- [ ]
- [ ]
- [ ]
- [ ]
-
布隆过滤器
- 给一个布隆过滤器m比特和k个哈希函数,所有的注入和相关测试都会是通过。
-
van Emde Boas 树
- [ ]
- [ ]
-
更深入的数据结构
- [ ]
-
跳表
- “有一种非常迷幻的数据类型” - Skiena
- [ ]
- [ ]
-
网络流
- [ ]
- [ ]
- [ ]
-
不相交集 & 联合查找
- [ ]
- [ ]
- [ ] Coursera (not needed since the above video explains it great):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
Math for Fast Processing
- [ ]
- [ ]
-
Treap
- Combination of a binary search tree and a heap
- [ ]
- [ ]
- [ ]
-
线性规划(Linear Programming)(视频)
- [ ]
- [ ]
- [ ]
-
几何:凸包(Geometry, Convex hull)(视频)
- [ ]
- [ ]
- [ ]
-
离散数学
- 查看下面的视频:(这里没看到视频= =)
-
机器学习(Machine Learning)
- [ ] 为什么学习机器学习?
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- 课程:
- [ ]
- [视频教程](https://www.youtube.com/playlist?list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW)- 看第 12-18 集复习线性代数(第 14 集和第 15 集是重复的)
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- 资源:
- 书籍: Data Science from Scratch: First Principles with Python:
- 网站: Data School:
- [ ] 为什么学习机器学习?
-
Go 语言
- [ ] 视频:
- [ ]
- [ ]
- [ ]
- [ ] 书籍:
- [ ]
- [ ]
- [ ]
- [ ] 视频:
—
一些主题的额外内容
我为前面提到的某些主题增加了一些额外的内容,之所以没有直接添加到前面,是因为这样很容易导致某个主题内容过多。毕竟你想在本世纪找到一份工作,对吧?
-
[ ] 动态规划的更多内容 (视频)
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ] 图形处理进阶 (视频)
- [ ]
- [ ]
-
[ ] MIT 概率论 (mathy, and go slowly, which is good for mathy things) (视频):
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
- [ ]
-
[ ]
视频系列
坐下来享受一下吧。”netflix and skill” :P
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ] CSE373 - 算法分析 (25 个视频)
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ]
-
[ ] 斯坦福: 编程范例 (17 个视频)
-
[ ]
-
[ ]
计算机科学课程
-
·
稀土掘金,挖掘最优质的互联网技术。
- “哇。这么厚一本武功秘籍,没个十年八年练不完吧。” “这只是目录而已!”5 天前 111 赞写下你的评论评论 取消
- 为什么一个没有入职google的人能开课指导别人面试google?神奇的世界!5 天前 33 赞写下你的评论评论 取消
- 很想看看他最后有没有进去google5 天前 11 赞写下你的评论评论 取消
- 弟高值(滑稽.jpg)5 天前 4 赞写下你的评论评论 取消
- 其实拿个北美不错学校的计算机硕士学位然后刷leetcode不就是了么。扯这么多。。。5 天前 6 赞写下你的评论评论 取消
- 万万没想到,我的工作需要这么多知识……4 天前 6 赞写下你的评论评论 取消
- 不不不……好像今年Google中国校招,管你什么途径,过了APAC Test再谈?4 天前 6 赞写下你的评论评论 取消
- 其实不是指导别人面试google,而是有个小伙想进google就给自己定了个目标,然后弄了个仓库来监督勉励自己,类似的有 这个repo具体也没什么东西