2021/05/01

UMAP とは

自分の勉強のためのメモ


UMAP and t-SNE 

高次元データを二次元データに落とし込むアルゴリズム。可視化ツールと言っても良いのか。

UMAPのほうが処理の効率がよく、情報量が増えても処理力が落ちない。


高次元データ

SingleCell RNA Sequenceで得られる情報にはそれぞれの細胞毎のそれぞれのmRNAの情報

含まれている。例えば2000個の細胞それぞれにおいて、5000個のmRNAの発現量の情報がある

最終的に知りたいことは、この2000個の細胞にどのような特性があるのか、

特性毎にカテゴリーに分けたい。この5000個のmRNAの発現量の情報を使って。

その際に使うのがこのUMAPとt-SNEである。

最終的な成果物はX-Y、もしくは3次元のマッピング情報でそれぞれの細胞が似通っている

ものは近くに、にていないものは遠くに配置される。

ただしこの距離は相対的なものである。 


https://pair-code.github.io/understanding-umap/


https://qiita.com/odanny/items/06ab88353bcee7bf6aa7