这是“产品经理识算法”系列的第五篇,拖得有点久了…
产品经理识算法(四):数据挖掘之距离计算算法
在数据挖掘和分析的过程中,我们经常需要知道某两个或多个分析对象之间的差异性,从而判别分析对象之间的相似性和所属类别。在数据分析和挖掘领域,用得最多的就是“分类”和“聚类”算法,如:KNN 和 K-Means。今天将主流的一些距离计算算法做一个归纳。
在数据挖掘和分析的过程中,我们经常需要知道某两个或多个分析对象之间的差异性,从而判别分析对象之间的相似性和所属类别。在数据分析和挖掘领域,用得最多的就是“分类”和“聚类”算法,如:KNN 和 K-Means。今天将主流的一些距离计算算法做一个归纳。