본문 바로가기
반응형

데이터마이닝및분석4

[데이터마이닝및분석] CH7 Cluster Analysis: Basic Concepts and Algorithms (2) 출처: 이기용 교수님, 데이터마이닝및분석 수업 7장에서는 클러스터링이 무엇인지와 대표적인 클러스터링인 (1) K-means, (2) Agglomerative Hierarchical Clustering, (3) DBScan에 대해서 배웠다. 이번에 정리한 내용은 K-means 에 대한 내용이다. 순서대로 전반적으로 정리하자면, - The Basic K-means Algorithm: 핵심은 각 점을 가장 가까운 centroid에 할당하여 K cluster를 형성하는 단계와 각 cluster의 centroid를 다시 계산하는 단계이다. 전자는 centroid 이 고정된 상황에서 나머지 점의 cluster를 찾는 것이고, 후자는 cluster 내 점들이 고정된 상황에서 centroid 값을 계산한다는 것이다. .. 2023. 8. 11.
[데이터마이닝및분석] CH7 Cluster Analysis: Basic Concepts and Algorithms (4) 출처: 이기용 교수님, 데이터마이닝및분석 수업 7장에서는 클러스터링이 무엇인지와 대표적인 클러스터링인 (1) K-means, (2) Agglomerative Hierarchical Clustering, (3) DBScan에 대해서 배웠다. 이번에 정리한 내용은 DBSCAN에 대한 내용이다. 순서대로 전반적으로 정리하자면, 큰 주제는 DBSCAN이기에 첫 부분은 DBSCAN에 대한 전반적인 설명이다. - Defining Density: '밀도'를 정의하기 위해 여러 방법이 있는데 여기서는 center-based approach 에 대해 설명한다. 핵심은 Eps 안에 있는 점의 수를 세어 측정하는 것이다. - Classification of Points: DBScan에서 모든 점은 Core Points, B.. 2023. 8. 9.
[데이터마이닝및분석] CH7 Cluster Analysis: Basic Concepts and Algorithms (3) 출처: 이기용 교수님, 데이터마이닝및분석 수업 7장에서는 클러스터링이 무엇인지와 대표적인 클러스터링인 (1) K-means, (2) Agglomerative Hierarchical Clustering, (3) DBScan에 대해서 배웠다. 이번에 정리한 내용은 Agglomerative Hierarchical Clustering에 대한 내용이다. 순서대로 전반적으로 정리하자면, - Agglomerative Hierarchical Clustering이 무엇인지 - Hierarchical Clustering(계층형 클러스터링)이 무엇인지 : singleton cluster가 가장 가까운 클러스터로 뭉치는 과정을 반복하는 것을 말한다 - Hierarchical Clustering의 두 종류: agglomerat.. 2023. 8. 8.
[데이터마이닝및분석] CH7 Cluster Analysis: Basic Concepts and Algorithms (1) 출처: 이기용 교수님, 데이터마이닝및분석 수업 7장에서는 클러스터링이 무엇인지와 대표적인 클러스터링인 (1) K-means, (2) Agglomerative Hierarchical Clustering, (3) DBScan에 대해서 배웠다. 이번에 정리한 내용은 클러스터링이 무엇인지에 대한 내용이다. 순서대로 전반적으로 정리하자면, - 클러스터링이 무엇인지: 유사한 값끼리 그룹이 나뉘어지는 것. 하지만 이 '유사함'에 있어 사용자가 직접 정의해야하고, 어떻게 유사도를 정의할 것인지가 중요한 이슈. - 클러스터링의 목적은 무엇인지: Understandig, Utility - 좋은 클러스터링이란? 같은 그룹내에서는 유사하고, 다른 그룹과는 차이가 최대화 되어야한다. - Classification, Segmen.. 2023. 8. 7.
반응형