自分の勉強のためのメモ
UMAP and t-SNE
高次元データを二次元データに落とし込むアルゴリズム。可視化ツールと言っても良いのか。
UMAPのほうが処理の効率がよく、情報量が増えても処理力が落ちない。
高次元データ
SingleCell RNA Sequenceで得られる情報にはそれぞれの細胞毎のそれぞれのmRNAの情報
含まれている。例えば2000個の細胞それぞれにおいて、5000個のmRNAの発現量の情報がある
最終的に知りたいことは、この2000個の細胞にどのような特性があるのか、
特性毎にカテゴリーに分けたい。この5000個のmRNAの発現量の情報を使って。
その際に使うのがこのUMAPとt-SNEである。
最終的な成果物はX-Y、もしくは3次元のマッピング情報でそれぞれの細胞が似通っている
ものは近くに、にていないものは遠くに配置される。
ただしこの距離は相対的なものである。
https://pair-code.github.io/understanding-umap/
https://qiita.com/odanny/items/06ab88353bcee7bf6aa7