t-SNE是一种降维算法,在可视化中经常使用,这里介绍其基本概念。

参考资料如下:

视频地址:

https://www.youtube.com/watch?v=4GBgqmq0XAY

介绍t-SNE之前,先介绍SNE

SNE

SNE的全称为Stochastic Neighbor Embedding,输入输出分别为:

一般来说,$p<d$,SNE算法将$X$映射到$Y$,起到了降维的作用,下面介绍具体算法:

有了SNE,就可以介绍t-SNE了

t-SNE

t-SNE的全称为t-Distributed Stochastic Neighbor Embedding, 和SNE有两个不同点:

1.让SNE对称,不定义条件概率,定义联合概率,并且使每个$\sigma_i$都相同:

2.对$Y$不使用正态分布,而是使用t分布:

其余部分都相同。

延伸阅读:https://lvdmaaten.github.io/tsne/