摘要:随着我国流动人口不断增多以及国家出台的各项买房政策的灵活性,使得买房这件关系民生的大事越来越少的受到地区政策的限制,促使了各地的房产交易的火热。也使得二手房市场逐步走上正轨,越来越成熟。该论文针对该情况,利用Node.js实现了房产的中介信息管理系统,并利用Python爬虫技术爬取各大房产中介网站(搜房、链家)的二手房价成交记录,并对价格做了大数据的可视化分析,最后利用机器学习算法对未来的二手房价格走势进行了预测。
关键词:大数据;管理系统;Node.js;Python
本文首先对大数据环境下的房产中介信息管理系统做了需求分析,并定义了系统需要实现的功能,之后介绍了系统的总体设计,分别阐述了其功能模块的设计、系统流程图以及具体的数据库设计,然后利用Node.js实现了房产的中介信息管理系统,并利用Python爬虫技术爬取各大房产中介网站(搜房、链家)的二手房价成交记录,对北京市的房产价格做了大数据的可视化分析,最后利用机器学习算法对北京市的二手房价格进行了预测。
1系统功能需求
本系统的用户身份主要分为两种:中介管理员、普通用户。相对于中介管理员而言,其需求为:(1)管理员的登陆:中介公司的管理人员管理房源信息需要先登录;(2)房源的管理:操作员可以对房源信息的公布、修正、查看以及删除等进行操作;(3)交易的管理:可以增加、删除、修改和查询房子的交易情况;普通用户的功能需求如下:(1)用户注册功能:新用户可以在中介房产网站上注册个人信息;(2)用户登录功能:新用户在注册个人信息后可以进入中介房产网站;(3)房源浏览和搜索功能:所有用户都可以查看中介发布的房源,并且可以根据关键字来搜索感兴趣的房屋;(4)房源的留言:进入软件的用户对房源的信息进行了解后,可以留言给房源。同时在中介系统中,后台利用大数据方法,首先对各大中介房源网站进行爬虫,分析统计出房价的成交量的变化趋势,同时可以用机器通过学习算法对以后的房价趋势进行预测。此时在前端页面上用户可以看到该留言。
2系统的具体实现
2.1注册模块设计
普通用户注册成功后才可以登陆系统,在进行注册的页面中有3个输入框:手机号输入、密码输入框、再次密码进行确认输入框。一开始用户要输入手机号以及密码,然后点击注册命令按钮,系统前端的javascript先进行判断手机号的格式是否正确,如果输入的数据格式的长度不是11位,那么会给出提示手机号格式错误的信息,然后javascript进行密码验证,成功以后用户号和hash密码被一并存进数据库中且将“注册成功”信息返回给前端。
2.2登录模块设计
在主界面登录中,有两个文本输入框,分别为登录账号输入框和密码输入框,以及登录的button按钮。在首页中当用户输入的手机号和密码“登录”按钮,如果验证手机号和密码都没有错,便可进入系统中,但是如若用户输入的手机号或者密码有任何一个验证不通过的话,那么登陆不会成功,系统将自动跳转回原页面。登录系统的流程如下:用户输入完手机号和密码后,点击buttton,此时账号和密码通过ajax发送到后端服务器,后端服务器收到HTTP请求后,筛选出HTTP的请求体,查询数据库,对账号和密码进行检验。如果登陆的账号之前未存在,那么服务器将直接返回“用户名不存在”错误,之后服务器对登录密码做hash处理,将hash密码与数据库中用户的密码对比,如果两者一致,那么服务器将传回“登录成功”,否则传回“登录密码错误”。由于系统中有一般用户和中介管理工作人员用户,如果是管理人员用户进入系统的话,那么前端界面将跳转到中介管理界面,否则的话将进入到普通用户查看房源的界面。
2.3房源管理模块
普通用户打开网页后,能够查看中介公布的一切的房源的信息。用户在房源浏览界面中可以看到全部房源信息,并可以按照房源的要求搜寻房源。对中介管理人员身份来讲,登陆之后进入的界面是房源管理,在该页面中,登陆者有权添加、删除、修改房源信息。在房源的添加界面,中介管理员首先需要输入房源的业主姓名以及联系方式,同时要完善房源的相关信息,比如输入房源所在小区名称、房子在多少层、有多少个房间、几个客厅、几个卫生间等等,同时还需要输入房间的售租单价或总价等信息。在输入完后,点击“提交按钮”,服务器将读取到房源的添加信息,然后将更新到数据库中。
2.4用户留言功能
用户可以给在网站中看到的房源信息留言。在房源具体页面点击“留言”按钮就进入留言窗口。
2.5基于大数据库的房价预测
本文将对链家网以及安居客网站进行爬虫,获取到所有的北京市房产成交记录,并保存到csv文件中。然后经由Python对数据进行剖析,从数据分析观察中得出住房的特点及规律,运用机器学习模型来进行一个简单的猜测。
3基于大数据库的房价预测的现实意义
对未来房价的预测,既是了解消费者购买房屋的需求和不同房屋所受青睐的消费群体是哪些,同时也能为监管单位自身需要完成的事情提供一种便捷的数据。尤其是近几年,全国各地的二手房生意市场日渐繁华,因此怎样从众多过往的房地产生意的记载的数据中,通过数据发掘方法的探究,进而找寻房价与购买时各属性间的联系成为一个迫切需要处置的问题。房价是高是低,涨幅怎么样,是购房者迫切想知道的问题,同时也是房产中介必须了解熟悉的东西,这样才能有效的把握房产的动态,并采取一些措施。在政府方面,也可以针对现有趋势及预测可以采取一些行之有效的措施,不至于没有任何相对全面的可以作为分析的东西。
参考文献:
[1]王益民(导师:徐谡;罗宁).中职实训基地管理系统的设计与实现.电子科技大学硕士论文,2013-09-25.
作者:陆士侠单位:淮南师范学院计算机学院