电影推荐系统 | Python Django框架 双数据库 协同过滤 requests bootstrap3 大数据 毕业设计源码
博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌
> 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅点击查看作者主页,了解更多项目!
🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。🍅
1、毕业设计:2026年计算机专业毕业设计选题汇总(建议收藏)✅
2、最全计算机专业毕业设计选题大全(建议收藏)✅
1、项目介绍
技术栈
以Python作为核心开发语言,基于Django框架构建后端架构,适配MySQL/SQLite双数据库存储数据,整合协同过滤推荐算法、requests爬虫技术,前端采用bootstrap3、js、jquery搭建交互界面,借助django-rest-framework拓展接口功能。
功能模块
- 数据采集
- 电影信息展示与管理
- 用户交互(登录、注册、评分、收藏等)
- 电影推荐
- 后台数据管理
项目介绍
本电影推荐系统采用分层模型设计思路,前端基于bootstrap3、js、jquery实现页面交互与展示效果,后端以Python+Django框架搭建核心架构,将协同过滤推荐算法作为核心推荐引擎。系统通过requests爬虫抓取豆瓣3000条电影数据并存储至数据库,支持电影多维度展示、分类排序与搜索操作;用户可完成登录、注册、评分、收藏等交互操作,后台可统一管控各类数据。针对推荐冷启动问题优化算法逻辑,能依据用户行为精准推荐电影,推荐准确率约75%,全面达成了预设的核心功能目标。
2、项目界面
(1)电影信息详情页面
展示电影的名称、海报、导演、主演等基础信息及剧情介绍,支持用户对电影进行评分、收藏,还设有 “前往观看”“点击收藏” 等操作按钮,同时呈现基于物品和用户的电影推荐内容,右侧还有最近更新的电影列表。

(2)系统首页,电影信息排序
支持按电影标签筛选及热度排序展示电影列表,呈现电影海报、名称与上映时间等信息,同时设有最近更新的电影列表区域,还提供基于用户的电影推荐板块及 “换一批” 功能,辅助用户快速浏览不同分类的电影内容。

(3)我的收藏电影
展示用户收藏的电影列表,呈现电影名、导演、对应标签等信息,同时页面右侧设有最近更新的电影列表及基于用户的电影推荐板块,还支持 “换一批” 推荐功能,方便用户管理收藏内容与获取新推荐。

(4)后台数据管理
提供快捷操作入口,可对偏好、前台用户、标签、电影、评分信息等内容进行管理,还能处理权限、用户组相关设置,同时展示最近操作记录,辅助管理员统一管控系统内的各类数据与功能模块。

(5)电影信息管理
支持通过电影名称、导演、上映日期等条件搜索电影,可对电影信息执行增加、删除操作,同时展示电影的封面、名称、导演、国家、上映日期等详情内容,辅助管理员管理系统内的电影数据。

(6)数据采集页面
通过 Python 脚本配置请求头与目标 URL,设置多页链接范围后启动爬虫,抓取电影相关数据,过程中会显示数据抓取状态及电影信息,同时将采集到的内容同步记录,为系统提供数据支撑。

3、项目说明
一、技术栈
本项目以Python为核心开发语言,基于Django框架构建后端架构,适配MySQL/SQLite双数据库进行数据存储,整合协同过滤推荐算法、requests爬虫技术,前端采用bootstrap3、js、jquery搭建交互界面,借助django-rest-framework拓展接口功能。
二、功能模块详细介绍
- 数据采集:通过Python脚本配置请求头与目标URL,设置多页链接范围后启动爬虫抓取电影相关数据,过程中展示数据抓取状态及电影信息,同时同步记录采集内容,为系统运行提供充足的数据支撑。
- 电影信息展示与管理:前台可展示电影名称、海报、导演等基础信息及剧情介绍,支持按标签筛选、热度排序浏览电影;后台支持按名称、导演等条件搜索电影,可对电影信息执行增删操作,全面管理系统内电影数据。
- 用户交互(登录、注册、评分、收藏等):用户可完成登录、注册操作,在电影详情页对影片进行评分、收藏,还能查看个人收藏电影列表,系统同时提供推荐影片“换一批”功能,提升用户交互体验。
- 电影推荐:作为核心功能,系统基于协同过滤推荐算法,针对推荐冷启动问题优化逻辑,在首页、电影详情页、收藏页等板块呈现基于物品和用户的电影推荐内容,推荐准确率约75%。
- 后台数据管理:提供偏好、前台用户、标签、评分信息等多类数据的快捷管理入口,可处理权限、用户组相关设置,展示最近操作记录,辅助管理员统一管控系统内各类数据与功能模块。
三、项目总结
本电影推荐系统采用分层模型设计,前端基于bootstrap3、js、jquery实现交互展示,后端依托Python+Django框架搭建核心架构,以协同过滤推荐算法为核心引擎。系统通过requests爬虫抓取豆瓣3000条电影数据存储至双数据库,实现了电影多维度展示、用户交互、精准推荐及后台数据管控等功能,针对推荐冷启动问题优化算法后,推荐准确率达75%,全面达成预设的核心功能目标,为用户提供了便捷的电影浏览与个性化推荐体验。
4、核心代码
# -*-coding:utf-8-*-
import os
os.environ["DJANGO_SETTINGS_MODULE"] = "movie.settings"
import django
django.setup()
from movie.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery,Q,Count
# from django.shortcuts import render,render_to_response
class UserCf:
# 获得初始化数据
def __init__(self, all_user):
self.all_user = all_user
# 通过用户名获得列表,仅调试使用
def getItems(self, username1, username2):
return self.all_user[username1], self.all_user[username2]
# 计算两个用户的皮尔逊相关系数
def pearson(self, user1, user2): # 数据格式为:物品id,浏览
sum_xy = 0.0 # user1,user2 每项打分的的累加
n = 0 # 公共浏览次数
sum_x = 0.0 # user1 的打分总和
sum_y = 0.0 # user2 的打分总和
sumX2 = 0.0 # user1每项打分平方的累加
sumY2 = 0.0 # user2每项打分平方的累加
for movie1, score1 in user1.items():
if movie1 in user2.keys(): # 计算公共的浏览次数
n += 1
sum_xy += score1 * user2[movie1]
sum_x += score1
sum_y += user2[movie1]
sumX2 += pow(score1, 2)
sumY2 += pow(user2[movie1], 2)
if n == 0:
# print("p氏距离为0")
return 0
molecule = sum_xy - (sum_x * sum_y) / n # 分子
denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n)) # 分母
if denominator == 0:
return 0
r = molecule / denominator
return r
# 计算与当前用户的距离,获得最临近的用户
def nearest_user(self, current_user, n=1):
distances = {}
# 用户,相似度
# 遍历整个数据集
for user, rate_set in self.all_user.items():
# 非当前的用户
if user != current_user:
distance = self.pearson(self.all_user[current_user], self.all_user[user])
# 计算两个用户的相似度
distances[user] = distance
closest_distance = sorted(
distances.items(), key=operator.itemgetter(1), reverse=True
)
# 最相似的N个用户
print("closest user:", closest_distance[:n])
return closest_distance[:n]
# 给用户推荐电影
def recommend(self, username, n=3):
recommend = {}
nearest_user = self.nearest_user(username, n)
for user, score in dict(nearest_user).items(): # 最相近的n个用户
for movies, scores in self.all_user[user].items(): # 推荐的用户的电影列表
if movies not in self.all_user[username].keys(): # 当前username没有看过
if movies not in recommend.keys(): # 添加到推荐列表中
recommend[movies] = scores*score
# 对推荐的结果按照电影
# 浏览次数排序
return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)
# 基于用户的推荐
def recommend_by_user_id(user_id):
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
movie_list = Movie.objects.filter(tags__in=user_prefer)[:15]
else:
movie_list = Movie.objects.order_by("-num")[:15]
return movie_list
# 选取评分最多的10个用户
users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
user_ids = [user_rate['user'] for user_rate in users_rate]
user_ids.append(user_id)
users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
all_user = {}
for user in users:
rates = user.rate_set.all()#查出10名用户的数据
rate = {}
# 用户有给电影打分 在rate和all_user中进行设置
if rates:
for i in rates:
rate.setdefault(str(i.movie.id), i.mark)#填充电影数据
all_user.setdefault(user.username, rate)
else:
# 用户没有为电影打过分,设为0
all_user.setdefault(user.username, {})
user_cf = UserCf(all_user=all_user)
recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
movie_list = list(Movie.objects.filter(id__in=recommend_list).order_by("-num")[:15])
other_length = 15 - len(movie_list)
if other_length > 0:
fix_list = Movie.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
for fix in fix_list:
if fix not in movie_list:
movie_list.append(fix)
if len(movie_list) >= 15:
break
return movie_list
# 计算相似度
def similarity(movie1_id, movie2_id):
movie1_set = Rate.objects.filter(movie_id=movie1_id)
# movie1的打分用户数
movie1_sum = movie1_set.count()
# movie_2的打分用户数
movie2_sum = Rate.objects.filter(movie_id=movie2_id).count()
# 两者的交集
common = Rate.objects.filter(user_id__in=Subquery(movie1_set.values('user_id')), movie=movie2_id).values('user_id').count()
# 没有人给当前电影打分
if movie1_sum == 0 or movie2_sum == 0:
return 0
similar_value = common / sqrt(movie1_sum * movie2_sum)#余弦计算相似度
return similar_value
#基于物品
def recommend_by_item_id(user_id, k=15):
# 前三的tag,用户评分前三的电影
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
user_prefer = list(user_prefer)[:3]
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
movie_list = Movie.objects.filter(tags__in=user_prefer)[:15]
else:
movie_list = Movie.objects.order_by("-num")[:15]
print('from here')
return movie_list
# most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(movie__rate__user_id=user_id).order_by('-tags_sum')
# 选用户最喜欢的标签中的电影,用户没看过的30部,对这30部电影,计算距离最近
un_watched = Movie.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30] # 看过的电影
watched = Rate.objects.filter(user_id=user_id).values_list('movie_id', 'mark')
distances = []
names = []
# 在未看过的电影中找到
for un_watched_movie in un_watched:
for watched_movie in watched:
if un_watched_movie not in names:
names.append(un_watched_movie)
distances.append((similarity(un_watched_movie.id, watched_movie[0]) * watched_movie[1], un_watched_movie))#加入相似的电影
distances.sort(key=lambda x: x[0], reverse=True)
print('this is distances', distances[:15])
recommend_list = []
for mark, movie in distances:
if len(recommend_list) >= k:
break
if movie not in recommend_list:
recommend_list.append(movie)
# print('this is recommend list', recommend_list)
# 如果得不到有效数量的推荐 按照未看过的电影中的热度进行填充
print('recommend list', recommend_list)
return recommend_list
if __name__ == '__main__':
similarity(2003, 2008)
recommend_by_item_id(1)
5、源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅
点赞、收藏、关注,不迷路,下方查看👇🏻获取联系方式👇🏻