Это термины в основном для описания данных и их отношений между собой. Начнем с Cluster.
Cluster
- набор точек данных наблюдений, которые могут иметь схожие характеристики в некотором смысле. Кластеризация - это в основном метод неконтролируемого обучения. Чтобы легко представить - карта представляет собой совокупность кластеров, группируя людей по национальности, но, как и в ML, люди могут быть рассеяны в других странах, что является нормальным до определенного уровня.
, если мы возьмем distance
как расстояние между clusters
, этот термин относится к тому, насколько удален центр тяжести кластера1 из центра тяжести кластера2. Кроме того, термин может относиться к данной точке, измеряя расстояние от точки до всех центроидов кластеров, где точка будет принадлежать кластеру с минимальным расстоянием.
Кроме того, dissimilarity
описывает очень то же значение, что и расстояние, оно рассказывает, как данные не похожи на исходный центроид. Это означает, что, как только расстояние велико, - на мой взгляд, не очень много различий. На мой взгляд, не уверен в этом.
надеюсь, что это поможет.
Если вы не загружаете jQuery на своей странице, как вы можете выполнить код javascript, связанный с jQuery. Это будет напрямую выдавать ошибку. Эту ошибку можно легко устранить, просто открыв консоль браузера.