当前位置: 首页 > 编程日记 > 正文

tensorflow基于csv数据集实现多元线性回归并预测

#coding:utf8
import tensorflow as tf
from sklearn import linear_model
from sklearn import preprocessing
import numpy as npdef read_data(file_queue):'''the function is to get features and label (即样本特征和样本的标签)数据来源是csv的文件,采用tensorflow 自带的对csv文件的处理方式:param file_queue::return: features,label'''# 读取的时候需要跳过第一行reader = tf.TextLineReader(skip_header_lines=1)key, value = reader.read(file_queue)# 对于数据源中空的值设置默认值record_defaults = [[''], [''], [''], [''], [0.], [0.], [0.], [0.], [''],[0], [''], [0.], [''], [''], [0]]# 定义decoder,每次读取的执行都从文件中读取一行。然后,decode_csv 操作将结果解析为张量列表province, city, address, postCode, longitude,latitude, price, buildingTypeId, buildingTypeName, tradeTypeId, tradeTypeName, expectedDealPrice, listingDate, delislingDate, daysOnMarket = tf.decode_csv(value, record_defaults)#对非数值数据进行编码:buildingTypeNamepreprocess_buildingTypeName_op = tf.case({tf.equal(buildingTypeName, tf.constant('Residential')): lambda: tf.constant(0.00),tf.equal(buildingTypeName, tf.constant('Condo')): lambda: tf.constant(1.00),tf.equal(buildingTypeName, tf.constant('Mobile Home')): lambda: tf.constant(2.00),tf.equal(buildingTypeName, tf.constant('No Building')): lambda: tf.constant(3.00),tf.equal(buildingTypeName, tf.constant('Row / Townhouse')): lambda: tf.constant(4.00),tf.equal(buildingTypeName, tf.constant('Duplex')): lambda: tf.constant(5.00),tf.equal(buildingTypeName, tf.constant('Manufactured Home')): lambda: tf.constant(6.00),tf.equal(buildingTypeName, tf.constant('Commercial')): lambda: tf.constant(7.00),tf.equal(buildingTypeName, tf.constant('Other')): lambda: tf.constant(8.00),}, lambda: tf.constant(-1.00), exclusive=True)# 对tradeTypeName 进行编码 Sale,Leasepreprocess_tradeTypeName_op = tf.case({tf.equal(tradeTypeName, tf.constant('Sale')): lambda: tf.constant(0.00),tf.equal(tradeTypeName, tf.constant('Lease')): lambda: tf.constant(1.00),}, lambda: tf.constant(-1.00), exclusive=True)features = tf.stack([latitude,longitude,price, preprocess_buildingTypeName_op, preprocess_tradeTypeName_op,expectedDealPrice])return features, daysOnMarketdef create_pipeline(filename,batch_size,num_epochs=None):'''the function is to get every batch example and label此处使用的是tf.train.batch,即顺序获取,非随机获取,随机获取采用的方法是:tf.train.shuffle_batch:param filename::param batch_size::param num_epochs::return:example_batch,label_batch'''file_queue = tf.train.string_input_producer([filename],num_epochs=num_epochs)# example,label 样本和样本标签,batch_size 返回一个样本batch样本集的样本个数example,dayOnMarket = read_data(file_queue)# 出队后队列至少剩下的数据个数,小于capacity(队列的长度)否则会报错,min_after_dequeue = 1000#队列的长度capacity = min_after_dequeue+batch_size# 顺序获取每一批数据example_batch,daysOnMarket_batch= tf.train.batch([example,dayOnMarket],batch_size=batch_size,capacity=capacity)#顺序读取return example_batch,daysOnMarket_batchdef train(batch_size, feature_num,learn_rate,filename):'''the function is to train to get w and b:param batch_size: 批量大小:param feature_num: 特征个数:param learn_rate: 学习率:param filename:csv文件名称:return: w,b'''# 预处理输入的样本和标签,后面用获取的数据进行喂养x_data = tf.placeholder(tf.float32, [batch_size, feature_num])y_data = tf.placeholder(tf.float32, [batch_size])# 创建参数 w ,bw = tf.Variable(tf.random_uniform((feature_num, 1), -1.0, 1.0))b = tf.Variable(tf.random_uniform((1, 1), -1.0, 1.0))# 定义预测的yy = tf.add(tf.matmul(x_data, w), b)#定义损失函数loss = tf.reduce_mean(tf.square(y - y_data)) / 2#定义优化器,这里采用梯度下降的方法optimizer = tf.train.GradientDescentOptimizer(learn_rate)# 训练train = optimizer.minimize(loss)# 获取 样本和标签example_batch, daysOnMarket_batch = create_pipeline(filename, batch_size)# 初始化全局和局部变量init_op = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())print('.........................>>>>开始会话')# 创建会话,采用上下文管理器的方式,无需手动关闭会话with tf.Session() as sess:sess.run(init_op)# 创建一个队列coord = tf.train.Coordinator()threads = tf.train.start_queue_runners(coord=coord)for step in range(100):#获取正真的样本和标签example, label = sess.run([example_batch, daysOnMarket_batch])print('第%d批数据'%(step))print(example, label)print('.......这一批数据的直接参数')reg = linear_model.LinearRegression()reg.fit(example, label)print("Coefficients of sklearn: W=%s, b=%f" % (reg.coef_, reg.intercept_))# 数据归一化处理scaler = preprocessing.StandardScaler().fit(example)print(scaler.mean_, scaler.scale_)x_data_standard = scaler.transform(example)sess.run(train, feed_dict={x_data: x_data_standard, y_data: label})# 每十步获取一次w和bif step % 10 == 0:print('当前w值和b值')print(sess.run(w, feed_dict={x_data: x_data_standard, y_data: label}),sess.run(b, feed_dict={x_data: x_data_standard, y_data: label}))print('。。。。。。。》》》训练后得到w和b')theta = sess.run(w).flatten()intercept = sess.run(b).flatten()print('W:%s' % theta)print('b:%f' % intercept)coord.request_stop()coord.join(threads)return theta, interceptdef predict(data, theta,intercept, feature_num):'''the function is to predict label(daysOnMarket):param data: 待预测数据:param theta: 训练得到的参数:param intercept: 截距:param feature_num: 特征个数(自变量个数):return: result(label:预测结果)'''theta1 = tf.placeholder(tf.float32, [feature_num, 1])intercept1 = tf.placeholder(tf.float32, [1, 1])x_data = tf.placeholder(tf.float32, [1, feature_num])y = tf.add(tf.matmul(x_data, theta1), intercept1)init = tf.global_variables_initializer()with tf.Session() as sess:sess.run(init)result = sess.run(y, feed_dict={x_data: data, theta1: theta, intercept1: intercept})print(result)return resultdef data_type_conversion(data,theta,intercept,feature_num):'''the function is to do data_type_conversion(数据类型和形状转换):param data::param theta::param intercept::return:'''real_data1 = data.astype(np.float32)real_data2 = data.reshape(1,feature_num)theta_tra = theta.astype(np.float32)theta_real = theta.reshape(feature_num, 1)intercept_tran = intercept.astype(np.float32)intercept_real = intercept.reshape(1, 1)return real_data2,theta_real,intercept_realif __name__ == '__main__':input_longitude =int(input('请输入经度'))input_latitude = int(input('请输入纬度'))input_price = int(input('请输入价格'))input_buildingtype = input('请输入房源类型名称:只有9种类型:Residential:0 ,Condo:1 Mobile Home:3,No Building:4 , Row / Townhouse:5 ,Duplex:6 ,Manufactured Home:7 ,Commercial:8 ,Other:9')input_tradetype = input('请输入交易形式:只有两种Sale:0,Lease:1')input_expected_deal_price = int(input('请输入期望的交易价格'))data = np.array([input_longitude,input_latitude,input_price,input_buildingtype,input_tradetype,input_expected_deal_price])theta, intercept = train(10, 6, 0.3, 'house_info.csv')data_real, theta_real, intercept_real = data_type_conversion(data, theta, intercept,6)daysOnmarket = predict(data_real, theta_real, intercept_real, 6)print('预测的天数:%d'%int(daysOnmarket))

转载于:https://www.cnblogs.com/bluesl/p/9215749.html

相关文章:

ab测试nginx Nginx性能优化

转自:https://www.cnblogs.com/nulige/p/9369700.html 1.性能优化概述 在做性能优化前, 我们需要对如下进行考虑 1.当前系统结构瓶颈 观察指标压力测试2.了解业务模式 接口业务类型系统层次化结构3.性能与安全 性能好安全弱安全好性能低2.压力测试工具 1.安装压力测…

jedis使用_网易架构师心得:Springboot下使用redis踩过的坑

点击?蓝色“ 深入原理”,关注并“设为星标”技术干货,第一时间推送首先总结了redis服务端单线程工作模型,redis四种部署方式及使用场景,然后从源码的角度上,分析springboot在jedis和lettuce客户端下使用redis的一些坑…

【URAL】1091 Tmutarakan Exams

题意&#xff1a;取k个不同的数&#xff0c;每个数不超过s&#xff0c;问种数。 若kx1,kx2,...,kx3满足条件&#xff0c;则x1,x2,...,x3必然满足条件。 因此枚举素数容斥&#xff0c;2*3*5*7>50&#xff0c;所以枚举之多三层。 1 #include<cstdio>2 #include<cstri…

怎样将无线路由做成无线AP

什么是无线AP&#xff1f; 无线AP&#xff0c;即Access Point&#xff0c;也就是无线接入点。简单来说就是无线网络中的无线交换机&#xff0c;它是移动终端用户进入有线网络的接入点&#xff0c;主要用于家庭宽带、企业内部网络部署等&#xff0c;无线覆盖距离为几十米至上…

Java实现网页截屏功能(基于phantomJs)

公司最近有个需求&#xff1a;把用户第一次的测量身体信息和最近一次测量信息进行对比&#xff0c;并且需要把对比的数据截成图片可以发给用户&#xff08;需要在不打开网页的情况下实时对网页进行截图然后保存到服务器上&#xff0c;返回图片地址&#xff09;&#xff0c;通过…

CPU性能指标

1&#xff0c;主频 主频 时钟频率&#xff0c;它是指CPU内部晶振的频率&#xff0c;常用单位为MHz&#xff0c;它反映了CPU的基本工作节拍; 时钟频率又称主频&#xff0c;它是指CPU内部晶振的频率&#xff0c;常用单位为MHz&#xff0c;它反映了CPU的基本工作节拍; 2&#xff…

canvas 文字颜色_Canvas技术概述

Canvas简介在学习一项新技术之前&#xff0c;先了解这项技术的历史发展及成因会帮助我们更深刻的理解这项技术。历史上&#xff0c;canvas最早是由Apple Inc. 提出的&#xff0c;在Mac OS X webkit中创建控制板组件使用&#xff0c;而在canvas称为HTML草案及标准之前&#xff0…

sql server 2008学习10 存储过程

输入输出参数: 给存储过程传参数,叫做输入参数,用户告诉存储过程需要 利用这个参数干些什么. 输出参数: 从存储过程得到那些数据. 创建一个可选参数的存储过程: create proc pa1 name varchar(50)NULL as if(name is not null)select * from a where name like name%; elsesele…

C#_关于静态类和静态方法(转)

静态类是不能实例化的&#xff0c;即不能new 我们直接使用它的属性与方法&#xff0c;静态类最大的特点就是共享。 静态类中的所有成员必须是静态的。 静态类可以有静态构造函数&#xff0c;静态构造函数不可继承。 静态构造函数可以用于静态类&#xff0c;也可用于非静态类。 …

Struts2和SpringMVC简单配置以及区别总结

Struts2: struts 2 是一个基于MVC(mode-view-con)设计模式的Web应用框架&#xff0c;是由Struts1和WebWork两个经典框架发展而来的。 工作流程&#xff1a; 1客户端浏览器发出HTTP请求 2根据web.xml配置&#xff0c;该请求被FilterDispatcher(过滤器调度员)接收 3根据struts.xm…

python数字类型及运算_Python基础之(基本数据类型及运算)

一、运算 1.1、算数运算1.2、比较运算&#xff1a;1.3、赋值运算&#xff1a;1.4、逻辑运算&#xff1a;1.5、成员运算&#xff1a;针对逻辑运算的进一步研究&#xff1a; 1、在没有()的情况下not 优先级高于 and&#xff0c;and优先级高于or&#xff0c;即优先级关系为( )>…

AJAX跨域访问解决方案

Case I. Web代理的方式 (on Server A) 即用户访问A网站时所产生的对B网站的跨域访问请求均提交到A网站的指定页面&#xff0c;由该页面代替用户页面完成交互&#xff0c;从而返回合适的结果。此方案可以解决现阶段所能够想到的多数跨域访问问题&#xff0c;但要求A网站提供Web…

什么是生成器?

在python中&#xff0c; 要产生一个列表&#xff0c;可以这样写&#xff1a; a[] for i in range(10): a.append(i*2) 但是&#xff0c;这样挺麻烦的&#xff0c;产生一个列表&#xff0c;需要三行语句。所以&#xff0c;有人就想到能不能一行代码来表示呢&#xff1f;其实&a…

一项横断面人群研究中比较放射学阴性的中轴脊柱关节炎患者与强制性脊柱炎患者之间的差别...

原文 译文 Patients with Non-Radiographic Axial Spondyloarthritis Differ From Patients with Ankylosing Spondylitis in Several aspects– Results of a Cross-Sectional Cohort Study Uta Kiltz 1, Xenofon Baraliakos2, Pantelis Karakostas2, Manfred Igelmann…

day12-事务

day12总结[c1] 今日内容 l 事务 l 连接池 事务 事务概述 为了方便演示事务&#xff0c;我们需要创建一个account表&#xff1a; CREATE TABLE account( id INT PRIMARY KEY AUTO_INCREMENT, NAME VARCHAR(30), balance NUMERIC(10.2) ); INSERT INTO…

ThinkPHP基础概念

OOP 面向对象编程&#xff08;Object Oriented Programming&#xff0c;OOP&#xff0c;面向对象程序设计&#xff09;是一种计算机编程架构。OOP 的一条基本原则是计算机程序是由单个能够起到子程序作用的单元或对象组合而成。OOP 达到了软件工程的三个主要目标&#xff1a;重…

008本周总结报告

这周主要做了下PTA的编程题目的练习和学习和了解了java的多线程&#xff0c;了解了进程和线程的定义&#xff0c;区别&#xff0c;联系等&#xff0c;并知道了多线程的利与弊&#xff0c;并了解了JVM下的多运行机制&#xff08;本质是CPU 对应用程序的快速换&#xff09;&#…

python3.8.5是python3吗_Python 升级到3.8.5

mac osx 安装最新版本的3.8.5 将/usr/local/bin目录下的python3.8和pip3.8复制一份并修改为python和pip。 修改python的路径&#xff0c;之后source文件。 输出requirements.txt到桌面 安装新版本的第三方库&#xff0c;我使用的第三方库很多&#xff0c;更新很慢。头大啊。 验…

不看后悔 如何删除WIN7的100M隐藏分区

http://notebook.it168.com/a2010/1101/1120/000001120453_2.shtml

tomcat下面web应用发布路径配置 ( 即虚拟目录配置 )

https://blog.csdn.net/AnQ17/article/details/52122236转载于:https://www.cnblogs.com/gangpao/p/9223504.html

strcpy +memcpy实现循环右移

#include<stdio.h>#include<assert.h>#include<string.h>char *strcpy(char*strDest,const char*strSrc){assert(strDest!NULL&&strSrc!NULL);char * addr strDest;while( *strSrc!\0)*strDest *strSrc;*strDest \0;return addr;}//循环移动steps…

python查看目录下的文件_Python——查看目录下所有的目录和文件

原博文 2019-05-06 19:31 − 写程序我们经常会遇到需要遍历某一个目录下的所有文件这个操作&#xff0c;然而python有现成的库&#xff0c;只需要2个循环就可以搞定。 1 import os 2 3 def all_path(dirname): 4 5 result []#所有的文件 6 7 for ma... 相关推荐 2019-12-10 14…

负载均衡策略深入剖析

在实际应用中&#xff0c;我们可能不想仅仅是把客户端的服务请求平均地分配给内部服务器&#xff0c;而不管服务器是否宕机。而是想使Pentium III服务器比Pentium II能接受更多的服务请求&#xff0c;一台处理服务请求较少的服务器能分配到更多的服务请求&#xff0c;出现故障的…

js 验证数据类型的4中方法

1.typeof 可以检验基本数据类型 但是引用数据类型&#xff08;复杂数据类型&#xff09;无用&#xff1b; 总结 &#xff1a; typeof 无法识别引用数据类型 包括 bull; 2.instanceof是一个二元运算符&#xff0c;左操作数是一个对象&#xff0c;右操作数是一个构造函数。如…

有关 ecshop 属性 {$goods.goods_attr|nl2br} 标签的赋值问题

1、nl2br() 函数在字符串中的每个新行 (\n) 之前插入 HTML 换行符 (<br />)。 2、 如果要向{$goods.goods_attr|nl2br}赋新值&#xff0c;这个值是保存在数据库中的&#xff0c;用户在商品页(goods.php)选择了商品属性(goods.attr)之后&#xff0c;点击"购买"就…

linux cp 强制覆盖_Linux基本操作教程

Linux基本操作教程点击蓝字关注我们01.Linux系统简介Linux&#xff0c;全称GNU/Linux&#xff0c;是一套免费使用和自由传播的类UNIX操作系统&#xff0c;其内核由林纳斯本纳第克特托瓦兹于1991年第一次释出&#xff0c;它主要受到Minix和Unix思想的启发&#xff0c;是一个基于…

火焰图(Flame Graphs)的安装和基本用法

火焰图&#xff08;Flame Graphs&#xff09; 一、概述&#xff1a; 火焰图&#xff08;flame graph&#xff09;是性能分析的利器&#xff0c;通过它可以快速定位性能瓶颈点。 perf 命令&#xff08;performance 的缩写&#xff09;是 Linux 系统原生提供的性能分析工具&#…

用TCP/IP进行网际互联一

地址解析协议ARP主机知道某个目的主机的IP就可以知道该目的主机的物理地址。改进ARP每个ARP广播分组中都包含有发送方自身的IP和物理地址的绑定&#xff0c;接收方在处理ARP分组时&#xff0c;先在自己的缓存中更新发送方IP到物理地址的绑定信息。ARP是一个隐藏底层网络物理编址…

【learning】矩阵树定理

问题描述 给你一个图&#xff08;有向无向都ok&#xff09;&#xff0c;求这个图的生成树个数    一些概念 度数矩阵&#xff1a;\(a[i][i]degree[i]\)&#xff0c;其他等于\(0\) 入度矩阵&#xff1a;\(a[i][i]in\_degree[i]\)&#xff0c;其他等于\(0\) 出度矩阵&#xff1…

各大知名企业的Research展示

大公司為了要拉開彼此的差距, 除了專注於目前的產品外, 都會為了未來做準備, 而這些研究通常都會做一個 Research 的專區來呈現成果, 如下述列表: Google ResearchYahoo! ResearchThe Facebook ProjectMicrosoft Research - Turning Ideas into Reality微軟亞洲研究院IBM Resea…