(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

基于Hive的民宿数据分析系统设计与实现

摘 要

本文旨在设计并实现一个基于Hive的民宿数据分析系统,以应对民宿行业日益增长的数据处理与分析需求。系统利用Hive作为数据仓库,结合大数据处理技术,对民宿数据进行高效存储与深度挖掘。通过对民宿价格、用户行为、市场需求等多维度数据的分析,系统能够为民宿经营者和投资者提供精准的市场洞察和决策支持。研究结果显示,该系统在技术上具备高效、稳定的特点,经济上能够显著提升民宿的经营效率和市场竞争力,社会上符合民宿行业数字化转型和创新发展的趋势。本文还探讨了系统的操作可行性,确保了用户能够轻松上手并快速掌握系统的使用方法。展望未来,该系统有望在民宿行业中发挥更大的作用,推动行业的可持续发展。

关键词:民宿数据分析系统;Hive框架;MySQL数据库

Abstract

This article aims to design and implement a Hive based homestay data analysis system to meet the growing data processing and analysis needs of the homestay industry. The system utilizes Hive as a data warehouse and combines big data processing technology to efficiently store and deeply mine homestay data. By analyzing multidimensional data such as homestay prices, user behavior, and market demand, the system can provide accurate market insights and decision support for homestay operators and investors. The research results show that the system has the characteristics of high efficiency and stability in technology, and can significantly improve the operational efficiency and market competitiveness of homestays economically. It is in line with the trend of digital transformation and innovative development of the homestay industry in society. This article also explores the operational feasibility of the system, ensuring that users can easily get started and quickly master the usage of the system. Looking ahead, this system is expected to play a greater role in the homestay industry and promote sustainable development.

Keywords: homestay data analysis system; Hive framework; MySQL database

目  录

一、 绪论

(一) 研究背景与意义

(二) 国内外研究现状和发展趋势

(三) 本文的组织结构

二、 开发工具及相关技术介绍

(一)hive主要功能

(二)MySQL数据库

(三)B/S体系工作原理

三、 系统分析

(一) 可行性分析

1. 经济可行性

2. 技术可行性

3. 操作可行性

(二) 功能性需求分析

(三) 非功能性需求分析

四、 系统设计

(一) 功能模块设计

(二) 数据库设计

1. 概念模型设计

2. 数据库表设计

五、 系统实现

(一)用户端功能实现

1.首页的实现

2.用户注册的实现

3. 用户登录的实现

4. 民宿信息管理的实现

5. 房源分析管理的实现

(二)后端管理员主要功能实现

1. 系统用户的实现

2. 后台首页的实现

3. 民宿信息管理的实现

4. 价格分析管理的实现

5. 评分分析管理的实现

六、 系统测试

(一) 系统可靠性测试

(二) 系统功能性测试

(三) 系统合格性测试

(四) 测试结果

七、 总结与展望

参考文献

致谢

  • 绪论
  • 研究背景与意义

随着旅游业的蓬勃发展,民宿作为一种新兴的住宿方式,已经逐渐成为旅行者们的重要选择。它不仅为旅行者提供了更加贴近当地文化和生活的住宿体验,同时也为民宿经营者带来了可观的收益。然而,随着民宿市场的不断扩大,竞争也日益激烈。如何在激烈的市场竞争中脱颖而出,制定合理的定价策略,优化服务品质,成为了民宿经营者亟需解决的问题。与此同时,大数据技术的飞速发展,为民宿行业的数据分析提供了强有力的支持。Hive作为一种分布式数据仓库,具有高扩展性、高容错性和强大的数据处理能力,能够高效地存储和分析大规模数据。因此,利用Hive技术对民宿数据进行分析,挖掘出有价值的信息,为民宿经营者提供决策支持,成为了当前研究的重要方向。

满足市场需求:随着民宿市场的不断扩大,民宿经营者对于数据分析的需求也越来越迫切。基于Hive的民宿数据分析系统能够实时抓取和分析各大民宿平台的价格数据,为民宿经营者提供全面准确的市场信息,帮助他们更好地了解市场动态,制定合理的定价策略。

提升经营效率:通过对民宿数据的深入分析,系统能够挖掘出潜在的用户需求和消费趋势,为民宿经营者提供有针对性的服务优化建议。这不仅能够提升用户体验,还能够提高民宿的经营效率和市场竞争力。

推动行业发展:基于Hive的民宿数据分析系统的研究和应用,不仅能够促进民宿行业的数字化转型,还能够推动整个旅游行业的创新发展。通过数据分析,可以发现行业的新趋势和新机遇,为行业的可持续发展提供有力支持。

提供学术支持:该研究还能够为相关领域的学术研究提供数据支持和分析工具。通过实际案例的分析和验证,可以进一步丰富和完善大数据技术在民宿行业应用的理论体系和实践经验。

  • 国内外研究现状和发展趋势

随着国家旅游业的发展和人们旅游消费观念的改变,民宿行业在过去几年取得了快速发展,其服务赢得了更多年轻游客的喜爱。以下是国内民宿研究的主要发现:据统计,2019年中国民宿市场规模已经达到500亿元人民币,并预计到2025年将达到1500亿元人民币,年复合增长率将达到25%以上。民宿行业逐渐呈现出多元化、高端化、特色化的趋势,吸引了大量投资和创业者的关注。然而,随着市场的逐渐成熟,民宿行业的增长速度将放缓,市场规模稳定增长。我国民宿行业主要集中在乡村旅游、城市周边和风景名胜区等区域。乡村旅游民宿以其独特的地域文化、生态环境和民俗风情吸引了大量游客,而城市周边民宿则以便捷的交通、舒适的环境和丰富的配套设施吸引了众多都市游客。民宿行业的快速发展离不开政府的支持。近年来,国家层面出台了一系列政策,鼓励民宿行业发展,例如《关于促进乡村旅游发展的指导意见》明确提出要发展特色民宿,提高乡村旅游品质。地方政府也纷纷出台政策,给予民宿行业在土地、税收、融资等方面的支持。民宿行业在快速发展过程中也面临着一些挑战,如同质化竞争、服务质量参差不齐、安全隐患等问题。这些问题需要行业内外共同努力解决,以实现民宿行业的健康有序发展。随着大数据技术的不断发展,其在民宿行业的应用也日益广泛。例如,基于Hive的民宿价格分析系统可以帮助民宿经营者和投资者更好地了解民宿市场价格趋势,提供数据支持和决策参考。此外,大数据还可以用于民宿的精准营销、用户画像构建等方面。

国外民宿行业相较于中国起步较早,并很早就进行了民宿行业的相关研究,以下是对国外民宿研究的主要归纳:民宿起源于欧美乡村,并在全球范围内逐渐发展壮大。国外民宿行业在发展过程中积累了丰富的经验,形成了较为完善的行业规范和监管机制。国外学者对民宿的影响因素进行了深入研究。例如,民宿周围环境、经营者管理的情况和经营管理者与消费者之间的关系会影响消费者对民宿的选择倾向。此外,房主的头像和声誉得分等也会对消费者的选择产生显著影响。国外民宿行业注重提升服务质量和用户体验。通过提供个性化的服务、优质的住宿环境和丰富的文化体验,吸引了大量游客前来入住。同时,国外民宿还注重与周边产业的融合,如与农业、文化、旅游等产业结合,打造特色旅游目的地。与国外许多其他行业一样,大数据和智能化技术在民宿行业也得到了广泛应用。例如,利用大数据技术对民宿价格进行预测和分析,帮助民宿经营者和投资者制定合理的定价策略和市场竞争策略。此外,智能化技术还可以用于民宿的预订管理、客户服务等方面,提高运营效率和服务质量。

  • 本文的组织结构

第一章是绪论,本文章的开头部分,对本题目的研究背景和研究意义等一些做文字性的描述。

第二章研究了基于Hive的民宿数据分析系统的所采用的开发技术和开发工具。

第三章是系统分析部分,包括系统总体需求描述、功能性角度分析系统需求、非功能性等各个方面分析系统是否可以实现。

第四章是系统设计部分,本文章的重要部分,提供了系统架构的详细设计和一些主要功能模块的设计说明。

第五章是系统的具体实现,介绍系统的各个模块的具体实现。

第六章在前几章的基础上对系统进行测试和运行。

最后对系统进行了认真的总结,以此对未来有一个新的展望。

  • 开发工具及相关技术介绍

(一)hive主要功能

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。

hive 是一种底层封装了Hadoop 的数据仓库处理工具,使用类SQL 的hiveSQL 语言实现数据查询,所有hive 的数据都存储在Hadoop 兼容的文件系统(例如,Amazon S3、HDFS)中。hive 在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDFS 中hive 设定的目录下,因此,hive 不支持对数据的改写和添加,所有的数据都是在加载的时候确定的。hive 的设计特点如下。

支持创建索引,优化数据查询。

不同的存储类型,例如,纯文本文件、HBase 中的文件。

将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间。

可以直接使用存储在Hadoop 文件系统中的数据。

内置大量用户函数UDF 来操作时间、字符串和其他的数据挖掘工具,支持用户扩展UDF 函数来完成内置函数无法实现的操作。

类SQL 的查询方式,将SQL 查询转换为MapReduce 的job 在Hadoop集群上执行。

(二)MySQL数据库

Mysql的语言是非结构化的,用户可以在数据上进行工作。MySQL因为其速度、可靠性和适应性而备受关注。大多数人都认为在不需要事务化处理的情况下,MySQL是管理内容最好的选择。并且因为Mysql的语言和结构比较简单,但是功能和存储信息量很强大,所以得到了普遍的应用。

Mysql数据库在编程过程中的作用是很广泛的,为用户进行数据查询带来了方便。Mysql数据库的应用因其灵活性强,功能强大,所以在实现某功能时只需要一小段代码,而不像其他程序需要编写大段代码。总体来说,Mysql数据库的语言相对要简洁很多。

数据流程分析主要就是数据存储的储藏室,它是在计算机上进行的,而不是现实中的储藏室。数据的存放是按固定格式,而不是无序的,其定义就是:长期有固定格式,可以共享的存储在计算机存储器上。数据库管理主要是数据存储、修改和增加以及数据表的建立。为了保证系统数据的正常运行,一些有能力的处理者可以进行管理而不需要专业的人来处理。数据表的建立,可以对数据表中的数据进行调整,数据的重新组合及重新构造,保证数据的安全性。介于数据库的功能强大等特点,本系统的开发主要应用了Mysql进行对数据的管理。

(三)B/S体系工作原理

B/S架构采取浏览器请求,服务器响应的工作模式。

用户可以通过浏览器去访问Internet上由Web服务器产生的文本、数据、图片、动画、视频点播和声音等信息;

而每一个Web服务器又可以通过各种方式与数据库服务器连接,大量的数据实际存放在数据库服务器中;

从Web服务器上下载程序到本地来执行,在下载过程中若遇到与数据库有关的指令,由Web服务器交给数据库服务器来解释执行,并返回给Web服务器,Web服务器又返回给用户。在这种结构中,将许许多多的网连接到一块,形成一个巨大的网,即全球网。而各个企业可以在此结构的基础上建立自己的Internet。

在 B/S 模式中,用户是通过浏览器针对许多分布于网络上的服务器进行请求访问的,浏览器的请求通过服务器进行处理,并将处理结果以及相应的信息返回给浏览器,其他的数据加工、请求全部都是由Web Server完成的。通过该框架结构以及植入于操作系统内部的浏览器,该结构已经成为了当今软件应用的主流结构模式。

  • 系统分析
  • 可行性分析

本系统将在经济、技术、操作这三个角度上进行可行性分析。

  1. 经济可行性

经济可行性主要分析系统开发和运营所需的成本以及可能带来的经济效益。基于Hive的民宿数据分析系统的开发成本主要包括硬件设备的购置、软件系统的开发、数据采集和处理的费用等。然而,考虑到系统能够为民宿经营者和投资者提供精准的市场洞察和决策支持,帮助他们制定合理的定价策略和优化服务品质,从而带来更高的经济收益,因此系统的经济收益将远大于开发成本。此外,随着民宿市场的不断扩大和大数据技术的广泛应用,系统的市场潜力和经济价值将进一步凸显。

  1. 技术可行性

技术可行性主要关注系统实现所需的技术资源、技术难度以及技术发展趋势。基于Hive的民宿数据分析系统,在技术上具备较高的可行性。Hive作为一种分布式数据仓库,能够高效地存储和分析大规模数据,非常适合用于民宿数据的处理和分析。此外,系统可以集成多种数据处理和分析工具,如Python、Spark等,形成完整的数据处理和分析链条。随着大数据技术的不断发展和完善,相关技术资源的获取和技术难度的降低,使得系统的技术实现更加可行。

  1. 操作可行性

操作可行性主要关注系统的易用性、稳定性和可维护性等方面。基于Hive的民宿数据分析系统,在操作层面也具备较高的可行性。系统采用直观易用的用户界面和操作流程,使得用户能够轻松上手并快速掌握系统的使用方法。同时,系统具备较高的稳定性和可靠性,能够确保数据的准确性和安全性。此外,系统还提供了完善的技术支持和售后服务,能够及时解决用户在使用过程中遇到的问题和困难。

  • 功能性需求分析

普通用户需求:

  1. 后台首页:用户可以查看房源分析、价格分析、评分分析统计图,不可以修改添加。
  2. 民宿信息管理:用户可以查看民宿信息列表,点击“详情”可以查看民宿地点、价格信息、评论数量等信息。
  3. 房源分析管理:用户可以查看房源分析列表。
  4. 价格分析管理:用户可以查看价格分析列表。
  5. 评分分析管理:用户可以查看评分分析列表。

后台管理员需求:

  1. 后台首页:管理员可以查看房源分析、价格分析、评分分析统计图,可以修改添加。
  2. 系统用户:管理员可以管理、编辑系统中用户的信息和自己的信息。
  3. 民宿信息管理:管理员可以查看民宿信息列表,点击“详情”可以查看民宿地点、价格信息、评论数量等信息,也可以添加新的民宿信息。
  4. 房源分析管理:管理员可以查看民宿信息列表,也可以添加新的房源分析信息。
  5. 价格分析管理:管理员可以查看价格分析列表,也可以添加价格分析信息。
  6. 评分分析管理:管理员可以查看评分分析列表,也可以添加评分分析信息。

用户用例图如下所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图1 普通用户用例图

管理员用例图如下所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图2 管理员用例图

民宿信息添加用例描述如下表所示。

表1民宿信息添加用例描述

用例名称

添加新民宿信息

参与者

管理员

用例概述

本用例用于管理员进行添加新民宿信息操作

前置条件

管理员添加新民宿信息前必须登录系统

后置条件

系统中添加一个新民宿信息

基本事件流

参与者动作

系统响应

  1. 管理员在后台主界面选择“民宿信息”。

4、管理员填写新民宿信息信息,点击“添加”按钮。

2、系统打开添加民宿信息界面。

3、系统检查管理员输入的民宿信息信息是正确有效的。

5、系统将民宿信息添加到数据库中。

6、系统提示“操作成功”。

7、系统跳转到民宿信息管理界面。

其他事件流

1、系统验证管理员输入的标签名为空,则提示“*请填写完善!”

房源分析添加用例描述如下表所示。

表2房源分析添加用例描述

用例名称

添加房源分析

参与者

管理员

用例概述

本用例用于管理员进行添加房源分析操作

前置条件

管理员添加房源分析前必须登录系统

后置条件

系统中添加一个房源分析

基本事件流

参与者动作

系统响应

1、管理员在后台主界面选择“房源分析管理”。

4、管理员选择一个房源分析,点击“添加”按钮。

6、管理员点击“确定”按钮。

2、系统从数据库中获取房源分析信息列表

3、系统打开房源分析列表界面。

5、系统提示“你确定要添加吗?”。

7、系统将房源分析从数据库中添加。

8、系统提示“添加成功”。

9、系统跳转到房源分析管理界面。

其他事件流

用户编辑用例描述如下表所示。

表3用户编辑用例描述

用例名称

修改用户

参与者

管理员

用例概述

本用例用于管理员进行修改用户信息操作

前置条件

管理员已经登录系统

后置条件

系统中更新一条用户记录

基本事件流

参与者动作

系统响应

1、管理员在后台主界面选择“用户管理”。

4、管理员在用户列表中选择一个用户,点击“编辑”按钮。

6、管理员填写用户信息,点击“保存修改”按钮。

2、系统从数据库中获取用户信息。

3、系统打开用户列表界面。

5、系统打开修改用户信息界面。

7、系统将更改后的添加到数据库中。

8、系统提示“操作成功”。

9、系统跳转到用户管理界面。

其他事件流

  • 非功能性需求分析 

随着用户量的增加,系统可能会需要同时服务上千、上万个页面,服务器需要同时响应大量用户的操作,这就要求系统需要有良好的可扩展性,否则系统会出现延迟,卡顿甚至服务器崩溃的问题。高扩展性可以使软件保持旺盛的生命力,同时也能够使系统更好的适应用户增加、提高性能需求、增加应用功能等改变。

系统中保存了大量用户和管理员的个人信息,因此,保证系统服务器和数据安全是在开发过程中需要考虑的重要问题。安全性包括服务器安全、操作系统安全、数据库安全、程序代码安全以及用户个人信息和支付安全等,系统可以通过采用防火墙技术、加密技术、认证技术等来增强其安全性,只有一个健壮安全的系统才能具有长久的生命力。

  • 系统设计
  • 功能模块设计

通过软件的需求分析已经获得了系统的基本功能需求。根据各大功能模块的不同,将系统分为各种功能大块。系统功能结构如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图4系统功能结构图

  • 数据库设计
  1. 概念模型设计

概念设计包括实体和联系两部分,如该系统中,用户是一个实体,其属性包括用户 ID 标识、用户名、密码、电话、地址等属性。联系是指实体之间有意义的关联,包括一对一、一对多、多对多三种类型。

系统E-R图如下所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5系统E-R图

  1. 数据库表设计

数据库表是设计和实现系统的一个重要基础。以下列出了基于Hive的民宿数据分析系统几个重要的数据库表。

表access_token (登陆访问时长)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

token_id

int

10

0

N

Y

临时访问牌ID

2

token

varchar

64

0

Y

N

临时访问牌

3

info

text

65535

0

Y

N

4

maxage

int

10

0

N

N

2

最大寿命:默认2小时

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

7

user_id

int

10

0

N

N

0

用户编号:

表auth (用户权限管理)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

auth_id

int

10

0

N

Y

授权ID:

2

user_group

varchar

64

0

Y

N

用户组:

3

mod_name

varchar

64

0

Y

N

模块名:

4

table_name

varchar

64

0

Y

N

表名:

5

page_title

varchar

255

0

Y

N

页面标题:

6

path

varchar

255

0

Y

N

路由路径:

7

parent

varchar

64

0

Y

N

父级菜单

8

parent_sort

int

10

0

N

N

0

父级菜单排序

9

position

varchar

32

0

Y

N

位置:

10

mode

varchar

32

0

N

N

_blank

跳转方式:

11

add

tinyint

3

0

N

N

1

是否可增加:

12

del

tinyint

3

0

N

N

1

是否可删除:

13

set

tinyint

3

0

N

N

1

是否可修改:

14

get

tinyint

3

0

N

N

1

是否可查看:

15

field_add

text

65535

0

Y

N

添加字段:

16

field_set

text

65535

0

Y

N

修改字段:

17

field_get

text

65535

0

Y

N

查询字段:

18

table_nav_name

varchar

500

0

Y

N

跨表导航名称:

19

table_nav

varchar

500

0

Y

N

跨表导航:

20

option

text

65535

0

Y

N

配置:

21

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

22

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表code_token

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

code_token_id

int

10

0

N

Y

2

token

varchar

255

0

Y

N

3

code

varchar

255

0

Y

N

验证码

4

expire_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

失效时间

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表famous_lodging_information (名宿信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

famous_lodging_information_id

int

10

0

N

Y

名宿信息ID

2

location_information

varchar

64

0

Y

N

地点信息

3

details_page_link

text

65535

0

Y

N

详情页链接

4

price_information

varchar

64

0

Y

N

价格信息

5

average_rating

varchar

64

0

Y

N

平均评分

6

title_information

text

65535

0

Y

N

标题信息

7

number_of_comments

varchar

64

0

Y

N

评论数量

8

property_analysis_limit_times

int

10

0

N

N

0

房源分析限制次数

9

functional_analysis_limit_times

int

10

0

N

N

0

价格分析限制次数

10

score_analysis_limit_times

int

10

0

N

N

0

评分分析限制次数

11

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

12

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表functional_analysis (价格分析)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

functional_analysis_id

int

10

0

N

Y

价格分析ID

2

location_information

varchar

64

0

Y

N

地点信息

3

details_page_link

text

65535

0

Y

N

详情页链接

4

price_information

varchar

64

0

Y

N

价格信息

5

average_rating

varchar

64

0

Y

N

平均评分

6

title_information

text

65535

0

Y

N

标题信息

7

number_of_comments

varchar

64

0

Y

N

评论数量

8

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

10

source_table

varchar

255

0

Y

N

来源表

11

source_id

int

10

0

Y

N

来源ID

12

source_user_id

int

10

0

Y

N

来源用户

表hits (用户点击)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

hits_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

表ordinary_users (普通用户)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

ordinary_users_id

int

10

0

N

Y

普通用户ID

2

user_name

varchar

64

0

Y

N

用户姓名

3

user_gender

varchar

64

0

Y

N

用户性别

4

users_mobile_phone

varchar

16

0

Y

N

用户手机

5

examine_state

varchar

16

0

N

N

已通过

审核状态

6

user_id

int

10

0

N

N

0

用户ID

7

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表property_analysis (房源分析)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

property_analysis_id

int

10

0

N

Y

房源分析ID

2

location_information

varchar

64

0

Y

N

地点信息

3

details_page_link

text

65535

0

Y

N

详情页链接

4

price_information

varchar

64

0

Y

N

价格信息

5

average_rating

varchar

64

0

Y

N

平均评分

6

title_information

text

65535

0

Y

N

标题信息

7

number_of_comments

varchar

64

0

Y

N

评论数量

8

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

10

source_table

varchar

255

0

Y

N

来源表

11

source_id

int

10

0

Y

N

来源ID

12

source_user_id

int

10

0

Y

N

来源用户

表schedule (日程管理)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

schedule_id

smallint

5

0

N

Y

日程ID:[0,32767]

2

content

varchar

255

0

Y

N

日程内容

3

scheduled_time

datetime

19

0

Y

N

计划时间

4

user_id

int

10

0

N

N

用户id

5

create_time

datetime

19

0

Y

N

创建时间

6

update_time

datetime

19

0

Y

N

更新时间

表score (评分)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

score_id

int

10

0

N

Y

评分ID:

2

user_id

int

10

0

N

N

0

评分人:

3

nickname

varchar

64

0

Y

N

昵称:

4

score_num

double

5

2

N

N

0.00

评分:

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

7

source_table

varchar

255

0

Y

N

来源表:

8

source_field

varchar

255

0

Y

N

来源字段:

9

source_id

int

10

0

N

N

0

来源ID:

表score_analysis (评分分析)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

score_analysis_id

int

10

0

N

Y

评分分析ID

2

location_information

varchar

64

0

Y

N

地点信息

3

details_page_link

text

65535

0

Y

N

详情页链接

4

price_information

varchar

64

0

Y

N

价格信息

5

average_rating

varchar

64

0

Y

N

平均评分

6

title_information

text

65535

0

Y

N

标题信息

7

number_of_comments

varchar

64

0

Y

N

评论数量

8

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

10

source_table

varchar

255

0

Y

N

来源表

11

source_id

int

10

0

Y

N

来源ID

12

source_user_id

int

10

0

Y

N

来源用户

表upload (文件上传)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

upload_id

int

10

0

N

Y

上传ID

2

name

varchar

64

0

Y

N

文件名

3

path

varchar

255

0

Y

N

访问路径

4

file

varchar

255

0

Y

N

文件路径

5

display

varchar

255

0

Y

N

显示顺序

6

father_id

int

10

0

Y

N

0

父级ID

7

dir

varchar

255

0

Y

N

文件夹

8

type

varchar

32

0

Y

N

文件类型

表user (用户账户:用于保存用户登录信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

user_id

int

10

0

N

Y

用户ID:[0,8388607]用户获取其他与用户相关的数据

2

state

smallint

5

0

N

N

1

账户状态:[0,10](1可用|2异常|3已冻结|4已注销)

3

user_group

varchar

32

0

Y

N

所在用户组:[0,32767]决定用户身份和权限

4

login_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

上次登录时间:

5

phone

varchar

11

0

Y

N

手机号码:[0,11]用户的手机号码,用于找回密码时或登录时

6

phone_state

smallint

5

0

N

N

0

手机认证:[0,1](0未认证|1审核中|2已认证)

7

username

varchar

16

0

N

N

用户名:[0,16]用户登录时所用的账户名称

8

nickname

varchar

16

0

Y

N

昵称:[0,16]

9

password

varchar

64

0

N

N

密码:[0,32]用户登录所需的密码,由6-16位数字或英文组成

10

email

varchar

64

0

Y

N

邮箱:[0,64]用户的邮箱,用于找回密码时或登录时

11

email_state

smallint

5

0

N

N

0

邮箱认证:[0,1](0未认证|1审核中|2已认证)

12

avatar

varchar

255

0

Y

N

头像地址:[0,255]

13

open_id

varchar

255

0

Y

N

针对获取用户信息字段

14

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

表user_group (用户组:用于用户前端身份和鉴权)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

group_id

mediumint

8

0

N

Y

用户组ID:[0,8388607]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]

3

name

varchar

16

0

N

N

名称:[0,16]

4

description

varchar

255

0

Y

N

描述:[0,255]描述该用户组的特点或权限范围

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

register

smallint

5

0

Y

N

0

注册位置:

9

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

  • 系统实现

(一)用户端功能实现

1.首页的实现

用户界面要尽量简洁大方,使用户能够方便找到需要的功能入口,浏览民宿信息、房源分析、价格分析、评分分析信息,且要易于修改和维护,同时还要保证用户合法和系统安全。

首页界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-1首页界面

2.用户注册的实现

用户进入系统首页后,点击“注册”链接进入到注册页面,按照页面提示输入用户名、密码,页面进行表单验证,验证输入的用户名是否合法,表单验证通过后,点击“立即注册”按钮,检测数据库中是否已经存在该用户名,若数据库中不存在,则注册成功,注册成功后,自动跳转到登录页面。

用户注册页面,如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-2用户注册页面

  1. 用户登录的实现

用户注册完成后,点击“登陆”进入到登陆页面,输入用户名和密码,点击“登陆”按钮,对用户名和密码进行验证,根据传入的用户名和密码在数据库中是否能查询到一条用户信息,若不能返回用户信息则登陆失败,页面提示用户名或密码错误。

登录界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-3登录界面

  1. 民宿信息管理的实现

民宿信息管理:用户可以查看民宿信息列表,点击“详情”可以查看民宿地点、价格信息、评论数量等信息。民宿信息管理界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-4民宿信息管理界面

  1. 房源分析管理的实现

房源分析管理:用户可以查看房源分析列表。房源分析管理息界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-5房源分析管理界面

(二)后端管理员主要功能实现 

  1. 系统用户的实现

管理员对系统用户的管理,在管理员管理实现管理员用户的管理,包括录入、删除、修改,修改密码通过,然后输入新密码,使用sql命令更新密码。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-6系统用户界面

  1. 后台首页的实现

后台首页:管理员可以查看房源分析、价格分析、评分分析统计图,可以进行修改添加。后台首页界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-7后台首页界面

  1. 民宿信息管理的实现

民宿信息管理:管理员可以查看民宿信息列表,点击“详情”可以查看民宿地点、价格信息、评论数量等信息,也可以添加新的民宿信息。民宿信息管理界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-8民宿信息管理界面

  1. 价格分析管理的实现

价格分析管理:管理员可以查看价格分析列表,也可以添加价格分析信息。价格分析管理界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-9价格分析管理界面

  1. 评分分析管理的实现

评分分析管理:管理员可以查看评分分析列表,也可以添加评分分析信息。评分分析管理界面如下图所示。

(附源码)基于Hive的民宿数据分析系统设计与实现-计算机毕设 00817

图5-10评分分析管理界面

  • 系统测试
  • 系统可靠性测试

以进入系统首页的访问速度为例展示系统的性能测试;需要完成页面的菜单栏、首页轮播图片以及各功能模块入口等元素的显示。

  • 系统功能性测试

功能性测试是指执行指定的工作流程,通过对一个系统的所有特性和功能都进行测试确保符合需求和规范。

系统功能性测试表如下表所示。

11系统功能性测试表

编号

测试功能

测试内容

测试结果

1

用户登录

1.验证用户名与密码的正确性。

2.验证密码是否可见。

通过

2

首页展示

1.首页数据是否成功加载。

2.验证搜索功能的准确性。

3.验证是否可以异步加载。

4.验证导航栏按钮。

通过

3

个人信息修改

1.验证登录名是否可以正常更改。

2.验证联系方式是否可以更改。

3.验证收货地址可以正常修改。

4.验证密码是否可以修改。

通过

4

民宿信息管理

1.验证标签新增是否可以成功。

2.验证标签删除是否可以成功。

通过

5

添加民宿信息

1.上传民宿信息是否添加验证。

2.内容是否成功上传。

3.验证表单是否提交成功。

通过

6

用户管理

1.验证用户录入功能。

2.验证用户违规清理功能。

通过

  • 系统合格性测试

集成测试后,所有的模块已经全部连接完毕,形成了一个完整的系统。合格性测试是在集成测试完毕后,进一步对系统进行综合性的检测。经过合格性测试,可以检查出系统是否符合系统的设计,能够完成需求的所有功能。本系统经过最后的测试,所有模块功能都能按预定要求工作。

  • 测试结果

在实际测试中,经过一系列系统性的测试,使我们能够及时发现一些系统在设计中出现的疏忽和漏洞。经过严密的测试,不仅发现了模块内部的错误,也查找到模块连接后产生的错误。经过测试,对系统产生错误的地方进行优化、修改和完善,使得系统能够实现最初设计的基本功能。

  • 总结与展望

本文探讨了基于Hive的民宿数据分析系统的设计与实现,从研究背景、意义到国内外研究现状,再到可行性分析,全面剖析了这一系统的潜在价值和实施条件。总结而言,该系统旨在利用大数据技术,特别是Hive的强大处理能力,为民宿行业提供深度的市场洞察和决策支持。在技术层面,Hive作为分布式数据仓库,其高效的数据存储和分析能力为系统提供了坚实的基础。通过整合多种数据处理和分析工具,系统能够实现对民宿数据的全面挖掘和利用,为民宿经营者和投资者提供精准的市场趋势预测和用户行为分析。经济层面,系统的开发和运营成本相对较低,但其带来的经济效益却十分显著。通过为民宿行业提供数据支持,系统有助于提升经营效率、优化服务品质,从而增加民宿的收益和市场竞争力。社会层面,系统的推广和应用将促进民宿行业的数字化转型和创新发展,推动整个旅游行业的可持续发展。同时,系统还能够满足民宿经营者和投资者的实际需求,提高行业的整体服务水平。

展望未来,基于Hive的民宿数据分析系统有着广阔的发展前景。随着大数据技术的不断发展和完善,系统的数据处理和分析能力将进一步提升。同时,随着民宿市场的不断扩大和竞争的加剧,系统将为民宿行业提供更加精准和全面的数据支持,帮助民宿经营者和投资者在激烈的市场竞争中脱颖而出。此外,我们还将持续优化系统的用户界面和操作流程,提高系统的易用性和稳定性,为用户提供更加优质的服务体验。

参考文献

[1]王生霞,窦煉美,王登翠.乡村民宿的时空演进及其影响因素研究——以浙江省为例[J].中国商论,2025,34(03):82-86.

[2]周坤,王进.场景舒适物:乡村民宿吸引力建构研究[J/OL].开发研究,1-19[2025-02-11].http://kns.cnki.net/kcms/detail/62.1005.C.20250120.1909.004.html.

[3]覃煜.基于地域特质的乡村民宿设计策略研究——以绩溪尚村宋代文化体验区为例[J].城市建筑,2025,22(02):151-155.

[4]朱宁克,李泽晨.新媒体视域下民宿品牌形象设计创新思路研究[J].艺术与设计(理论),2024,2(11):49-52.

[5]欧炫佑.乡村振兴背景下乡村民宿高质量发展路径研究:以湛江市乡村民宿为例[J].山西农经,2024,(21):123-126.

[6]于天成,杜尚林,李蔓彤,等.基于在线评论的乡村民宿服务质量评价研究[J].科技资讯,2024,22(21):249-252.

[7]於嘉乐,王海亮.基于KJ-AHP法的乡村旅居康养民宿设计研究[J].设计,2024,37(20):147-150.

[8]李燕琴,段婕.民宿促进各民族交往交流交融的价值协同路径研究——以新疆伊宁市六星街和喀赞其民宿为例[J].云南民族大学学报(哲学社会科学版),2024,41(06):41-50.DOI:10.13727/j.cnki.53-1191/c.20241025.001.

[9]Li F ,Dong Y .Research on the Development Strategy of Rural Homestays: A Case Study of Changchun City[J].Tourism Management and Technology Economy,2024,7(3):

[10]汤瑞,蔡建刚.张家界乡村民宿空间分布特征分析[J].合作经济与科技,2024,(24):56-58.

[11]李小曼,张艳,侯露.基于大数据的智慧民宿云平台设计与应用[J].通信与信息技术,2024,(05):122-127.

[12]余正勇,何情税,施雄天,等.新质生产力赋能民宿产业高质量发展的机制及路径研究[J].河北旅游职业学院学报,2024,29(03):1-9.

[13]雷艳,秦启超.基于游客视角的从化区民宿旅游发展研究[J].河北旅游职业学院学报,2024,29(03):27-33.

[14]赵子东,赵丹琳.人工智能视角下太行山民宿空间设计研究[J].山西建筑,2024,50(19):6-9+15.

[15]董慧慧.基于XGBoost的协同过滤算法在民宿推荐系统中的应用[J].电脑知识与技术,2024,20(24):67-69.DOI:10.14004/j.cnki.ckt.2024.1240.

[16]朱金春,杨贻婷,罗馨蕊.当代“锅庄”:藏彝走廊民宿空间内的主客互动与族际交往[J].广西民族研究,2024,(04):97-109.

[17]袁辰辉,崔敏敏,乔秀花.信阳市鸡笼山景区民宿发展特点与对策探究[J].广东蚕业,2024,58(08):97-99.

[18]Zihui Z ,Zhengnan W ,Sicen L , et al.Research on the Development Strategy of Panxi Sunshine Health and Wellness Homestays and Hotels Based on Traditional Chinese Medicine Health Preservation[J].Proceedings of Business and Economic Studies,2024,7(3):114-119.

[19]陈健平,何永达.地域特征视角下的山区民宿发展研究——以浙江省丽水市为例[J].企业经济,2021,40(01):102-109.DOI:10.13529/j.cnki.enterprise.economy.2021.01.012.

[20]王楠.民宿治安风险分析及治理对策——基于民宿平台、经营者、消费者的研究[J].辽宁警察学院学报,2021,23(01):1-8.

致谢

时光飞逝,转眼间我在学校的这些年生活即将结束,回顾这几年的学习生活,收获良多,既有幸福也有难过,学校生活的结束对于我来说也是一个新的开始。论文即将完成,在此,我心中有许多想要感谢的人。首先感谢我的导师,不仅在学习研究方面加以指导,也在生活和为人处世上给予帮助。还要感谢授课老师,你们严谨的学术精神和积极向上的工作态度都在激励我的成长和进步。感谢多年来一直生活在一起的室友,谢谢你们多年来的陪伴和照顾。最后,要感谢各位论文评审老师,感谢您们在百忙之中抽空评阅本论文并给出宝贵的意见和建议。

请关注点赞+私信博主,免费领取项目源码

© 版权声明

相关文章