NISHIO Hirokazu[Translate]
DBSCANにおけるクラスタの定義
gpt
DBSCANでは、以下のようにクラスタを定義します:
コア点(Core Point):ある点を中心とした半径ε以内に、少なくともminPts個の点が存在する場合、その点をコア点とします。
直接到達可能性(Directly Reachable):点pがコア点であり、点qがpから距離ε以内にある場合、qはpから直接到達可能とされます。
到達可能性(Reachable):点pから点qまで、連続する直接到達可能な点の列が存在する場合、qはpから到達可能とされます。
密度連結性(Density-Connected):点pと点qが、ある点oを介して互いに到達可能である場合、pとqは密度連結とされます。

これらの概念に基づき、DBSCANは以下のようにクラスタを定義します:
クラスタ:すべての点が互いに密度連結であり、クラスタ内の任意の点から他の点へ到達可能である最大の集合。
ノイズ点:どのクラスタにも属さない点。

このように、DBSCANはデータの密度に基づいてクラスタを定義し、ノイズ点を識別します。


"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]