CS170 Efficient Algorithms and Intractable Problems Section12
课程主页:
https://inst.eecs.berkeley.edu/~cs170/fa18/
课程视频:
https://www.bilibili.com/video/BV1wK411g7ck
这次回顾Section 12。
1. 2-Universal Hashing
(a)
(b)
(i)
参考了习题解答。
考虑下表:
$x$ | $y$ | $z$ | |
---|---|---|---|
$h_1$ | $0$ | $0$ | $1$ |
$h_2$ | $1$ | $0$ | $1$ |
假设$x,y,z$选择$h_1,h_2$的概率为$\frac 1 2$,那么显然该函数族为Universal Hashing。
另一方面,假设选择了$x$,那么
此时取$y=y$即可。
否则
此时取$y=z$即可。
所以概率可能大于$\frac 1 m$。
备注:
这里的区别在于$h$是固定的,而Universal Hashing中$h$是变动的。
(ii)
即概率不可能大于$\frac 1 m$。
2. Markov Bound Review
3. Document Comparison with Streams
使用流算法统计不同元素数量即可,空间复杂度为$O(\log(|A|+|B|))$,具体做法如下(利用三个计数器即可):
- 统计$A$的不同元素数量$a_1$;
- 统计$B$的不同元素数量$a_2$;
- 统计$A\cup B$的不同元素数量$a_3$。
那么结果为
假设真实值分别为$b_1,b_2,b_3$,那么真实的比例为
注意到$a_i\in [(1-\epsilon)b_i, (1+\epsilon)b_i]$,$\epsilon $为任意小的正数,所以
由于$\epsilon$可以任意小,从而$p$可以和$p’$任意逼近。
4. Lower Bounds for Streaming
感觉这一题有点问题,略过。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Doraemonzzz!
评论
ValineLivere