亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

python基于物品協同過濾算法實現代碼

2020-02-15 21:36:27
字體:
來源:轉載
供稿:網友

本次測試基于MovieLens數據集實現的基于物品的協同過濾,目前只是在小樣本上實現,主要問題是計算太耗內存,后期代碼繼續優化與完善。

數據集說明:movies.dat中數據是用戶對電影的評分。數據格式:UserID::MovieID::Rating::Timestamp。

代碼

import pandas as pdimport numpy as npimport math import osimport timeimport datetimeos.chdir(r'f:/zxx/pthon_work/CF')def loadData(): #讀入movies.dat, rating.dat,tags.dat #mnames=['movie_id','title','genres'] #movies=pd.read_table(r'./data/movies.dat',sep='::',header=None,names=mnames) rnames=['UserID','MovieID','Rating','Timestamp'] all_ratings=pd.read_table(r'./data/ratings.dat',sep='::',header=None,names=rnames,nrows=300000) #tnames=['UserID','MovieID','Tag','Timestamp'] #tags=pd.read_table(r'./data/tags.dat',sep='::',header=None,names=tnames) return all_ratings#數據探索:ratingdef data_alay(ratings): """rating nums10000054, 3,  示例 : 1  122  5 838985046 col:'UserID','MovieID','Rating','Timestamp'  """ #一個用戶只對一個電影打分一次 UR=ratings.groupby([ratings['UserID'],ratings['MovieID']]) len(UR.size)#計算每部電影的平均打分,電影數10677def avgRating(ratings): movies_mean=ratings['Rating'].groupby(ratings['MovieID']).mean()#計算所有用戶對電影X的平均打分 movies_id=movies_mean.index movies_avg_rating=movies_mean.values return movies_id,movies_avg_rating,movies_mean#計算電影相似度矩陣相,即建立10677*10677矩陣def calculatePC(ratings): movies_id,movies_avg_rating,movies_mean=avgRating(ratings) #pc_mat=np.eye(3)#建立電影相似度單位矩陣 pc_dic={} top_movie=len(movies_id) for i in range(0,top_movie):  for j in range(i+1,top_movie):   movieAID=movies_id[i]   movieBID=movies_id[j]   see_moviesA_user=ratings['UserID'][ratings['MovieID']==movieAID]   see_moviesB_user=ratings['UserID'][ratings['MovieID']==movieBID]   join_user=np.intersect1d(see_moviesA_user.values,see_moviesB_user.values)#同時給電影A、B評分的用戶   movieA_avg=movies_mean[movieAID]   movieB_avg=movies_mean[movieBID]   key1=str(movieAID)+':'+str(movieBID)   key2=str(movieBID)+':'+str(movieAID)   value=twoMoviesPC(join_user,movieAID,movieBID,movieA_avg,movieB_avg,ratings)   pc_dic[key1]=value      pc_dic[key2]=value         #pc_mat[i][i+1]=twoMoviesPC(join_user,movieAID,movieBID,movieA_avg,movieB_avg,ratings)   #print ('---the %s, %d,%d:--movie %s--%s--pc is %f' % (key1,movieAID,movieBID,movieAID,movieBID,pc_dic[key1])) return pc_dic#計算電影A與電影B的相似度,皮爾森相似度=sum(A-A^)*sum(B-B^)/sqrt(sum[(A-A^)*(A-A^)]*sum[(B-B^)*(B-B^)])def twoMoviesPC(join_user,movieAID,movieBID,movieA_avg,movieB_avg,ratings): cent_AB_sum=0.0#相似度分子 centA_sum=0.0#分母 centB_sum=0.0#分母 movieAB_pc=0.0#電影A,B的相似度 count=0 for u in range(len(join_user)):  #print '---------',u  count=count+1  ratA=ratings['Rating'][ratings['UserID']==join_user[u]][ratings['MovieID']==movieAID].values[0]#用戶給電影A評分  ratB=ratings['Rating'][ratings['UserID']==join_user[u]][ratings['MovieID']==movieBID].values[0]#用戶給電影B評分  cent_AB=(ratA-movieA_avg)*(ratB-movieB_avg) #去均值中心化  centA_square=(ratA-movieA_avg)*(ratA-movieA_avg) #去均值平方  centB_square=(ratB-movieB_avg)*(ratB-movieB_avg)#去均值平方  cent_AB_sum=cent_AB_sum+cent_AB  centA_sum=centA_sum+centA_square  centB_sum=centB_sum+centB_square if(centA_sum>0 and centB_sum>0 ):  movieAB_pc=cent_AB_sum/math.sqrt(centA_sum*centB_sum) return movieAB_pc"""預測用戶U對那些電影感興趣。分三步, 1)用戶U過去X天看過的電影。 2)提出用戶U已看過的電影,根據用戶U過去看過的電影,計算用戶U對其他電影的打分. 3) 拉去打分最高的的電影給用戶推薦。預測用戶U對電影C的打分。分三步:(先只做這個) 1)用戶U過去X天看過的電影。 2)利用加權去中心化公式預測用戶U對電影C的打分."""#日期處理: -3天,然后轉換為uinxtimedef timePro(last_rat_time,UserU): lastDate= datetime.datetime.fromtimestamp(last_rat_time[UserU]) #unix轉為日期 date_sub3=lastDate+datetime.timedelta(days=-3)#減去3天 unix_sub3=time.mktime(date_sub3.timetuple())#日期轉為unix return unix_sub3#取用戶最后一次評分前3天評估的電影進行預測def getHisRat(ratings,last_rat_time,UserUID): unix_sub3= timePro(last_rat_time,UserUID) UserU_info=ratings[ratings['UserID']==UserUID][ratings['Timestamp']>unix_sub3] return UserU_info#預測用戶U對電影C的打分def hadSeenMovieByUser(UserUID,MovieA,ratings,pc_dic,movies_mean): pre_rating=0.0  last_rat_time=ratings['Timestamp'].groupby([ratings['UserID']]).max()#獲取用戶U最近一次評分日期 UserU_info= getHisRat(ratings,last_rat_time,UserUID)#獲取用戶U過去看過的電影 flag=0#表示新電影,用戶U是否給電影A打過分 wmv=0.0#相似度*mv平均打分去均值后之和 w=0.0#相似度之和 movie_userU=UserU_info['MovieID'].values#當前用戶看過的電影 if MovieA in movie_userU:  flag=1  pre_rating=UserU_info['Rating'][UserU_info['MovieID']==MovieA].values else:  for mv in movie_userU:   key=str(mv)+':'+str(MovieA)   rat_U_mv=UserU_info['Rating'][UserU_info['MovieID']==mv][UserU_info['UserID']==UserUID].values#用戶U對看過電影mv的打分   wmv=(wmv+pc_dic[key]*(rat_U_mv-movies_mean[mv]))#相似度*mv平均打分去均值后之和   w=(w+pc_dic[key])#看過電影與新電影相似度之和   #print ('---have seen mv %d with new mv %d,%f,%f'%(mv,MovieA,wmv,w))     pre_rating=(movies_mean[MovieA]+wmv/w) print ('-flag:%d---User:%d rating movie:%d with %f score----' %(flag,UserUID,MovieA,pre_rating)) return pre_rating,flagif __name__=='__main__': all_ratings=loadData() movie_num=100#控制電影數,只針對電影ID在該范圍的數據進行計算,否則數據量太大  ratings=all_ratings[all_ratings['MovieID']<=movie_num] movies_id,movies_avg_rating,movies_mean=avgRating(ratings) pc_dic=calculatePC(ratings)#電影相似度矩陣 #預測 UserUID=10#當前數據集只看過電影4,7, MovieA=6  pre_rating,flag=hadSeenMovieByUser(UserUID,MovieA,ratings,pc_dic,movies_mean) "-----------------測試ID提取------------------" #選取UserUID ratings.head(10)#從前10行中隨機選取一個用戶ID,例如:UserID=10 #查看該用戶在當前數據集中看過那些電影,方便選取新電影(防止選擇的是用戶已經看過的電影) ratings[ratings['UserID']==10]#該用戶在當前數據集中,只看過電影MovieID in(4,7),則可選擇不是4,7的電影ID進行預測,例如6.            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产精品电影一区| 国产欧美一区二区三区四区| 国产亚洲aⅴaaaaaa毛片| 国内外成人免费激情在线视频| 亚洲a∨日韩av高清在线观看| 日韩免费观看视频| 国产一区二区在线免费| 国产精品天天狠天天看| 亚洲黄在线观看| 久久这里只有精品99| 欧美老女人在线视频| 欧美猛交ⅹxxx乱大交视频| 国产美女久久精品| 欧美成人一二三| 国产精品日韩欧美| 欧美激情久久久久久| 91沈先生作品| 亚洲成人久久久| 日韩av一区二区在线观看| 亚洲另类欧美自拍| 91精品国产精品| 欧美黄网免费在线观看| 成人h视频在线| 亚洲人精品午夜在线观看| 欧美xxxx14xxxxx性爽| 亚洲欧美制服综合另类| 日韩中文字幕网| 欧美日韩免费在线| 久久在线免费视频| 理论片在线不卡免费观看| 亚洲女人天堂av| 国产69精品99久久久久久宅男| 国产一区二区三区久久精品| 亚洲视频综合网| 91色在线观看| 精品久久久久久久久中文字幕| 欧美视频13p| 91精品国产免费久久久久久| 久久久人成影片一区二区三区观看| 国产视频丨精品|在线观看| 视频一区视频二区国产精品| 欧美性猛交丰臀xxxxx网站| 亚洲最大福利视频网站| 日韩成人激情在线| 中文字幕日韩精品有码视频| 国产精品手机播放| 亚洲欧美日韩第一区| 91久久国产精品91久久性色| 综合国产在线观看| 欧美电影免费在线观看| 欧美激情视频免费观看| 国产成人jvid在线播放| 欧美日韩黄色大片| 欧美精品福利视频| 久久视频精品在线| 91免费看片网站| 日韩欧美a级成人黄色| 啪一啪鲁一鲁2019在线视频| 国产精品视频久久| 日韩精品中文字幕在线观看| 日韩av在线免费观看| 亚洲欧美在线免费观看| 亚洲精品91美女久久久久久久| 国产精品女人久久久久久| 岛国视频午夜一区免费在线观看| 亚洲一区二区三| 亚洲欧美中文字幕| 一本一本久久a久久精品综合小说| 一本色道久久88亚洲综合88| 久久69精品久久久久久久电影好| 欧美巨大黑人极品精男| 成人精品在线观看| 国产精品久久一区| 国产主播喷水一区二区| 亚洲91精品在线| 国产成人福利夜色影视| 欧美成人激情视频| 久久成人人人人精品欧| 午夜精品久久久久久久99热| 亚洲精品电影在线| 欧美成aaa人片免费看| 欧美成人剧情片在线观看| 亚洲精品国产福利| 欧美精品18videos性欧美| 亚洲人成77777在线观看网| 日韩精品高清视频| 亚洲精品97久久| 日韩av在线网址| 国产+成+人+亚洲欧洲| 国产美女精品免费电影| 亚洲天堂网站在线观看视频| 久久国产精品免费视频| 欧美在线视频播放| 国产精品一区二区三区免费视频| 久久香蕉精品香蕉| 亚洲高清一二三区| 麻豆国产精品va在线观看不卡| 国产精品一区二区3区| 4438全国亚洲精品在线观看视频| 亚洲第一国产精品| 国产日韩欧美中文| 亚洲精品www久久久久久广东| 日韩国产激情在线| 欧美性xxxxxxxxx| 91精品国产自产在线观看永久| 欧美日韩国产一区二区三区| 亚洲综合国产精品| 国产91在线视频| 亚洲伊人成综合成人网| 社区色欧美激情 | 亚洲精品久久视频| 欧美成人精品一区二区| 国产91色在线免费| 正在播放欧美一区| 国产精品ⅴa在线观看h| 日韩av在线一区二区| 91精品国产综合久久香蕉的用户体验| 亚洲风情亚aⅴ在线发布| 国产人妖伪娘一区91| 久久精品亚洲94久久精品| 一区国产精品视频| 亚洲美女又黄又爽在线观看| 久久久久久久久久久亚洲| 欧美交受高潮1| 亚洲福利视频久久| 国产精品免费网站| 亚洲xxxxx电影| 亚洲美女视频网站| x99av成人免费| 日本欧美在线视频| 久久免费高清视频| 91精品国产高清久久久久久91| 欧美性猛交xxxx乱大交3| 日韩一区视频在线| 国产精品igao视频| 亚洲精品日韩欧美| 国产精品中文在线| 欧美激情精品久久久久久大尺度| 欧美精品www在线观看| 国产九九精品视频| 久久亚洲一区二区三区四区五区高| 夜夜嗨av一区二区三区免费区| 黑人巨大精品欧美一区二区一视频| 欧洲精品在线视频| 精品人伦一区二区三区蜜桃网站| 成人自拍性视频| 国产一区二区丝袜| 69精品小视频| 欧美成人免费播放| 88国产精品欧美一区二区三区| 亚洲精品国产精品自产a区红杏吧| 91沈先生在线观看| 亚洲在线免费观看| 日本91av在线播放| 国产日韩欧美自拍| 久久久噜噜噜久噜久久| 久久精品最新地址| 国产99久久久欧美黑人| 欧美猛少妇色xxxxx| 欧美成人免费播放| 91免费精品视频| 91国内免费在线视频| 精品无人区太爽高潮在线播放| 中文字幕亚洲欧美一区二区三区|