亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > JavaScript > 正文

以Python代碼實例展示kNN算法的實際運用

2019-11-20 11:24:02
字體:
來源:轉載
供稿:網友

鄰近算法,或者說K最近鄰(kNN,k-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一。所謂K最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。
kNN算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。 kNN方法在類別決策時,只與極少量的相鄰樣本有關。由于kNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,kNN方法較其他方法更為適合。
20151026152507282.jpg (190×171)

上圖中,綠色圓要被決定賦予哪個類,是紅色三角形還是藍色四方形?如果K=3,由于紅色三角形所占比例為2/3,綠色圓將被賦予紅色三角形那個類,如果K=5,由于藍色四方形比例為3/5,因此綠色圓被賦予藍色四方形類。
K最近鄰(k-Nearest Neighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。該方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經正確分類的對象。該方法在定類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。 KNN方法雖然從原理上也依賴于極限定理,但在類別決策時,只與極少量的相鄰樣本有關。由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。
KNN算法不僅可以用于分類,還可以用于回歸。通過找出一個樣本的k個最近鄰居,將這些鄰居的屬性的平均值賦給該樣本,就可以得到該樣本的屬性。更有用的方法是將不同距離的鄰居對該樣本產生的影響給予不同的權值(weight),如權值與距離成反比。

用 kNN 算法預測豆瓣電影用戶的性別
摘要

本文認為不同性別的人偏好的電影類型會有所不同,因此進行了此實驗。利用較為活躍的274位豆瓣用戶最近觀看的100部電影,對其類型進行統計,以得到的37種電影類型作為屬性特征,以用戶性別作為標簽構建樣本集。使用kNN算法構建豆瓣電影用戶性別分類器,使用樣本中的90%作為訓練樣本,10%作為測試樣本,準確率可以達到81.48%。

實驗數據

本次實驗所用數據為豆瓣用戶標記的看過的電影,選取了274位豆瓣用戶最近看過的100部電影。對每個用戶的電影類型進行統計。本次實驗所用數據中共有37個電影類型,因此將這37個類型作為用戶的屬性特征,各特征的值即為用戶100部電影中該類型電影的數量。用戶的標簽為其性別,由于豆瓣沒有用戶性別信息,因此均為人工標注。

數據格式如下所示:

X1,1,X1,2,X1,3,X1,4……X1,36,X1,37,Y1X2,1,X2,2,X2,3,X2,4……X2,36,X2,37,Y2…………X274,1,X274,2,X274,3,X274,4……X274,36,X274,37,Y274

示例:

0,0,0,3,1,34,5,0,0,0,11,31,0,0,38,40,0,0,15,8,3,9,14,2,3,0,4,1,1,15,0,0,1,13,0,0,1,1 0,1,0,2,2,24,8,0,0,0,10,37,0,0,44,34,0,0,3,0,4,10,15,5,3,0,0,7,2,13,0,0,2,12,0,0,0,0

像這樣的數據一共有274行,表示274個樣本。每一個的前37個數據是該樣本的37個特征值,最后一個數據為標簽,即性別:0表示男性,1表示女性。

在此次試驗中取樣本的前10%作為測試樣本,其余作為訓練樣本。

首先對所有數據歸一化。對矩陣中的每一列求取最大值(max_j)、最小值(min_j),對矩陣中的數據X_j,
X_j=(X_j-min_j)/(max_j-min_j) 。

然后對于每一條測試樣本,計算其與所有訓練樣本的歐氏距離。測試樣本i與訓練樣本j之間的距離為:
distance_i_j=sqrt((Xi,1-Xj,1)^2+(Xi,2-Xj,2)^2+……+(Xi,37-Xj,37)^2) ,
對樣本i的所有距離從小到大排序,在前k個中選擇出現次數最多的標簽,即為樣本i的預測值。

實驗結果

首先選擇一個合適的k值。 對于k=1,3,5,7,均使用同一個測試樣本和訓練樣本,測試其正確率,結果如下表所示。

選取不同k值的正確率表

20151026152634517.png (635×190)

由上述結果可知,在k=3時,測試的平均正確率最高,為74.07%,最高可以達到81.48%。

上述不同的測試集均來自同一樣本集中,為隨機選取所得。

Python代碼

這段代碼并非原創,來自《機器學習實戰》(Peter Harrington,2013),并有所改動。

#coding:utf-8from numpy import *import operatordef classify0(inX, dataSet, labels, k):  dataSetSize = dataSet.shape[0]  diffMat = tile(inX, (dataSetSize,1)) - dataSet  sqDiffMat = diffMat**2  sqDistances = sqDiffMat.sum(axis=1)  distances = sqDistances**0.5  sortedDistIndicies = distances.argsort()     classCount={}       for i in range(k):    voteIlabel = labels[sortedDistIndicies[i]]    classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1  sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)  return sortedClassCount[0][0]def autoNorm(dataSet):  minVals = dataSet.min(0)  maxVals = dataSet.max(0)  ranges = maxVals - minVals  normDataSet = zeros(shape(dataSet))  m = dataSet.shape[0]  normDataSet = dataSet - tile(minVals, (m,1))  normDataSet = normDataSet/tile(ranges, (m,1))  #element wise divide  return normDataSet, ranges, minValsdef file2matrix(filename):  fr = open(filename)  numberOfLines = len(fr.readlines())     #get the number of lines in the file  returnMat = zeros((numberOfLines,37))    #prepare matrix to return  classLabelVector = []            #prepare labels return    fr = open(filename)  index = 0  for line in fr.readlines():    line = line.strip()    listFromLine = line.split(',')    returnMat[index,:] = listFromLine[0:37]    classLabelVector.append(int(listFromLine[-1]))    index += 1  fr.close()  return returnMat,classLabelVectordef genderClassTest():  hoRatio = 0.10   #hold out 10%  datingDataMat,datingLabels = file2matrix('doubanMovieDataSet.txt')    #load data setfrom file  normMat,ranges,minVals=autoNorm(datingDataMat)  m = normMat.shape[0]  numTestVecs = int(m*hoRatio)  testMat=normMat[0:numTestVecs,:]  trainMat=normMat[numTestVecs:m,:]  trainLabels=datingLabels[numTestVecs:m]  k=3  errorCount = 0.0  for i in range(numTestVecs):    classifierResult = classify0(testMat[i,:],trainMat,trainLabels,k)    print "the classifier came back with: %d, the real answer is: %d" % (classifierResult, datingLabels[i])    if (classifierResult != datingLabels[i]):      errorCount += 1.0  print "Total errors:%d" %errorCount  print "The total accuracy rate is %f" %(1.0-errorCount/float(numTestVecs))

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲天堂男人的天堂| 精品久久香蕉国产线看观看gif| 欧美日韩免费在线观看| 久久影视三级福利片| 日韩在线视频导航| 国产亚洲欧洲高清| 亚洲xxx自由成熟| 国产精品视频一区国模私拍| 美女少妇精品视频| 国产精品国产三级国产aⅴ浪潮| 亚洲三级黄色在线观看| 欧美久久久精品| 久久国产精品久久久| 青青草原成人在线视频| 亚洲一区第一页| 中文字幕日本欧美| 国产成人97精品免费看片| 亚洲国产精品久久久久秋霞不卡| 91久久在线观看| 欧美人交a欧美精品| 日韩高清电影免费观看完整版| 久久久噜噜噜久久| 亚洲欧美日韩一区二区三区在线| 热久久美女精品天天吊色| 国产视频一区在线| 国产精品旅馆在线| 亚洲国产精品成人va在线观看| 中文字幕欧美日韩精品| 亚洲成av人片在线观看香蕉| 亚洲免费一级电影| 欧美午夜视频在线观看| 成人欧美一区二区三区黑人孕妇| 国产精品一区二区电影| 亚洲黄色成人网| 久久精品青青大伊人av| 欧美日韩加勒比精品一区| 国产欧美精品在线| 韩国v欧美v日本v亚洲| 久久人91精品久久久久久不卡| 精品国产老师黑色丝袜高跟鞋| 国产精品欧美日韩久久| 亚洲精品电影在线| 欧美大胆在线视频| 欧美午夜精品久久久久久久| 午夜精品福利电影| 欧美贵妇videos办公室| 亚洲成**性毛茸茸| 久久综合色影院| 国产精品永久免费| 国产美女扒开尿口久久久| 亚洲成**性毛茸茸| 亚洲激情第一页| 久久九九热免费视频| 91在线播放国产| 国产成人精品免费久久久久| 欧美成人在线免费视频| 日韩欧美有码在线| 午夜精品久久久久久久久久久久久| 91视频88av| 亚洲视频在线观看视频| 在线播放日韩精品| 92福利视频午夜1000合集在线观看| 91精品久久久久久久久久久| 97香蕉久久夜色精品国产| 欧美一级淫片播放口| 97精品一区二区视频在线观看| 亚洲字幕一区二区| 国产精品久久久久久久久久久久久久| 26uuu亚洲伊人春色| 日韩免费av在线| 不卡av电影在线观看| 久久久久久久影视| 成人激情视频小说免费下载| 尤物yw午夜国产精品视频| 亚洲午夜女主播在线直播| 亚洲精品日韩在线| 欧美成人全部免费| 欧美精品videosex牲欧美| 亚洲精品电影网站| 久久的精品视频| 8090成年在线看片午夜| 亚洲视频在线观看网站| 欧美性xxxx在线播放| 亚洲精品福利免费在线观看| 欧美日韩一区二区三区在线免费观看| 亚洲美女在线看| 日韩中文视频免费在线观看| 国产suv精品一区二区三区88区| 这里只有精品在线观看| 国产精品va在线播放| 国产欧美日韩丝袜精品一区| 亚洲欧洲在线观看| 日本欧美精品在线| 国产免费观看久久黄| 在线观看91久久久久久| 91精品国产91久久久久| 永久555www成人免费| 亚洲第一精品福利| 欧美怡春院一区二区三区| 蜜臀久久99精品久久久久久宅男| 亚洲人在线视频| 美女少妇精品视频| 亚洲成人中文字幕| 欧美日韩第一页| 日韩欧美高清在线视频| 亚洲色图15p| 中文字幕在线成人| 中文欧美在线视频| 一区国产精品视频| 国产精品极品在线| 国产丝袜一区二区三区| 5566日本婷婷色中文字幕97| 亚洲精品中文字| 色香阁99久久精品久久久| 久久久久久久电影一区| 国产99久久精品一区二区 夜夜躁日日躁| 国产一区二区三区日韩欧美| 97久久超碰福利国产精品…| 成人免费视频网| 久久综合色影院| 久久国产精彩视频| 国产成人短视频| 久久精品国产亚洲7777| 国产精品亚洲自拍| 国产成人一区二区在线| 亚洲偷欧美偷国内偷| 国产日产欧美精品| 国产精品亚洲自拍| 亚洲人成在线播放| 国产69精品久久久| 精品偷拍一区二区三区在线看| 欧美日韩免费观看中文| 一区二区日韩精品| 午夜精品国产精品大乳美女| 91久久国产精品91久久性色| 国产亚洲激情在线| 亚洲区一区二区| 日本久久亚洲电影| 日韩av在线天堂网| 国产成人av网| 国产精品aaaa| 成人a在线观看| 国产精自产拍久久久久久蜜| 亚洲最大的成人网| 国产成人精品电影| 亚洲天堂av图片| 色婷婷av一区二区三区在线观看| 日韩女在线观看| 丝袜亚洲欧美日韩综合| 欧美日韩免费网站| 欧美午夜久久久| 久久久这里只有精品视频| 精品久久久久久国产91| 自拍偷拍免费精品| 欧美精品videosex极品1| 国产精品中文久久久久久久| 精品日本高清在线播放| 欧美日韩成人精品| 亚洲自拍偷拍区| 欧美日产国产成人免费图片| 国产成人精品av| 亚洲自拍偷拍在线| 成人a免费视频| 欧美日韩国产成人在线观看|