Python打造最强表白程序
作者 | 痴海
转载自公众号痴海(ID:ch726612)
情人节刚过,朋友圈又是刷屏的节奏。但热闹总是别人的,我们好像只有吃狗粮的份。时间总是飞快流逝,很多事情早已改变,但仿佛只有你的单身状态从未改变。
单身久的我们,好像觉得一个人过也没什么的。但即使非常享受单身生活,大家也要保持“可勾搭”的待机状态,因为促进荷尔蒙分沁有益身心健康。
在这个人人都在秀的时候,做为程序员我们也要操作起来!散发你们的荷尔蒙!今天就大家奉献上最强表白程序!此程序结合数据抓取 + 微信自动发消息 + 定时任务,实现一个能每天自动定时给你心爱的 ta 发送:你们相识相恋天数 + 情话 + 我爱你的图片。具体的消息如下。
每天发送的消息格式如下:
message = """
亲爱的{}:
早上好,今天是你和 Koc 相恋的第 {} 天~
今天他想对你说的话是:
{}
最后也是最重要的!
""".format("你的好友名称", str(inLoveDays), love_word)
这里需要填写的第一个字段是 ta 的称呼,inLoveDays 为你们相识相恋的天数。
love_word 是每天为 ta 精心准备情话内容,当然如果你的文笔好也可以自己写。
当然最后也是最重要的!每天不尽相同的「我爱你」图片!
程序思路
本次程序运行的环境是 windows10 + Python 3.6,此次主要用到的库有 selenium、itchat、request。程序主要分为两部分第一数据的抓取,一些情话信息和图片信息。另一部就是利用 itchat 自动发送消息给你的好友。
情话信息
如果对你的文笔有信心,那你可以自己写些情话。当然大部分人的文笔跟我一样是比较差的,所以这时候我们就可以利用网上的资源,比如下面的情话网站。
http://www.binzz.com/yulu2/3588.html
在抓取这个网站的情话时,如果你利用普通的爬取思路,即利用 request 进行请求,你会发现网页获取的数据是乱码并且不完整。所以在这块为了操作方便,我利用了 selenium 的 PhantomJS 无头浏览器,来获取网站的信息。
通过 selenium + xpath 我们就可以很轻松的获取到网页情话,最后把获取到的数据保存到当前目录下的「love_word.txt」方便之后的读取。
表白图片资源
为了配合此次表白程序,我专门去找了些带有「我爱你」的图片资源。通过下面的贴吧贴子,我们就可以获取到大量的这样资源。
http://tieba.baidu.com/p/3108805355
此贴并没有很强的反爬措施,所以我简单的利用 request + re 来获取到图片资源,并保存到当前目录的下「img」文件里。
在保存图片资源之前,我会先检查当前目录下是否有「img」文件夹,如果没有则会自动创建。
表白程序源码
此次表白程序主要有 5 个函数
crawl_Love_words()
此函数通过 selenium + xpath 来抓取情话网站的资源,并存入到当前目录下的「love_word.txt」文件。
def crawl_Love_words():
print("正在抓取情话...")
browser = webdriver.PhantomJS()
url = "http://www.binzz.com/yulu2/3588.html"
browser.get(url)
html = browser.page_source
Selector = etree.HTML(html)
love_words_xpath_str = "//div[@id='content']/p/text()"
love_words = Selector.xpath(love_words_xpath_str)
for i in love_words:
word = i.strip("\n\t\u3000\u3000").strip()
with open(love_word_path, "a") as file:
file.write(word + "\n")
print("情话抓取完成")
crawl_love_image()
此函数用来爬取贴吧带有「我爱你」的图片资源,通过 request + re 来实现。代码并不复杂,在正则表达式那也简单的写了一个,用来匹配当前也所有的图片资源。
def crawl_love_image():
print("正在抓取我爱你图片...")
for i in range(1, 22):
url = "http://tieba.baidu.com/p/3108805355?pn={}".format(i)
response = requests.get(url)
html = response.text
pattern = re.compile(r'<div.*?class="d_post_content j_d_post_content.*?">.*?<img class="BDE_Image" src="(.*?)".*?>.*?</div>', re.S)
image_url = re.findall(pattern, html)
for j, data in enumerate(image_url):
pics = requests.get(data)
mkdir(pic_path)
fq = open(pic_path + '\\' + str(i) + "_" + str(j) + '.jpg', 'wb') # 下载图片,并保存和命名
fq.write(pics.content)
fq.close()
print("图片抓取完成")
mkdir(path)
此函数用来在当前目录下创建一个新的文件夹,以便存储相应的数据。
def mkdir(path):
folder = os.path.exists(path)
if not folder: # 判断是否存在文件夹如果不存在则创建为文件夹
os.makedirs(path) # makedirs 创建文件时如果路径不存在会创建这个路径
print("--- new folder... ---")
print("--- OK ---")
else:
print("正在保存图片中...")
send_new()
此函数通过利用 itchat 库,实现给你的微信好友自动发送消息。在这个函数中我利用 datetime 来计算你们之间相识相恋的时间。并且在登录的时候添加了一个「hotReload=True」,这样你就可以不用每次运行程序的时候都要登录。关于 itchat 更多的操作,大家可以去网上查找相应的资料。
def send_news():
# 计算相恋天数
inLoveDate = datetime.datetime(2018, 8, 15) # 相恋的时间
todayDate = datetime.datetime.today()
inLoveDays = (todayDate - inLoveDate).days
# 获取情话
file_path = os.getcwd() + '\\' + love_word_path
with open(file_path) as file:
love_word = file.readlines()[inLoveDays].split(':')[1]
itchat.auto_login(hotReload=True) # 热启动,不需要多次扫码登录
my_friend = itchat.search_friends(name=u'你的好友名称')
girlfriend = my_friend[0]["UserName"]
print(girlfriend)
message = """
亲爱的{}:
早上好,今天是你和 Koc 相恋的第 {} 天~
今天他想对你说的话是:
{}
最后也是最重要的!
""".format("你的好友名称", str(inLoveDays), love_word)
itchat.send(message, toUserName=girlfriend)
files = os.listdir(pic_path)
file = files[inLoveDays]
love_image_file = "D:\\img\\" + file
try:
itchat.send_image(love_image_file, toUserName=girlfriend)
except Exception as e:
print(e)
main()
main() 函数就是我们主逻辑函数,程序运行的逻辑顺序就是在这个函数里规定的。在 main() 里我首先判断下当前路径下是否有「love_word.txt」文件,如果有则提示相应的信息,没有的话才去执 crawl_Love_words() 函数,去网上抓取一些情话数据。
其次再判断下当前目录下是否有「img」文件夹,用来判断我们是否有图片资源,没有则执行 crawl_love_image() 来抓取贴吧上的图片资源。
最后我们所需的数据都已准备完善,则调用 send_news() 函数,整理下要发送的数据格式,然后自动给你的 ta 发送消息。
定时任务
每天定时发送我主要是用 while True 简单的实现,通过判断当前的时间是否是你所需要发送的时间,来达到每天定时发送。
表白程序使用教程
首先你把相应的源码下载下来,后台回复「表白」即可获取。其次把相应的库先事先安装好,随后运行程序则会显示一个微信网页登录的二维码,扫描登录即可。
因为我在登录时添加了「hotReload=True」,所以程序在下次运行时就无需再重新登录。
总结
文章标题写着「最强表白程序」,虽然有点夸张了,但此次的程序还有很多可以继续添加的地方。比如对于发送的消息字段,我们还可以继续添加天气信息、星座信息、娱乐新闻、最近的趣事、最近好看的电影等等。只要你能想到的内容,都可以添加上去。
这些信息在网上都可以获取的到,我们只要通过同样的思路,先抓取到本地,然后进行读取。当然如果你觉得存储本地会有被删的风险,那么你也可以保存到云端,在云端上进行存储。
(本文为AI科技大本营原创文章,转载请微信联系 1092722531)
精彩推荐推荐阅读:
深圳一AI公司人脸数据泄露,超256万用户敏感信息在“裸奔”!
成长路线图:如何成为一名Python开发者?
5行代码就能入门爬虫?
Python助你抢红包
干了一年区块链,工作没了,负债累累
讲讲亿级PV的负载均衡架构!
35 岁程序员,年后第一天被辞退
手机辐射排行榜:小米、一加远超 iPhone;阿里开工彩票最高奖金 1000 万;苹果再遭集体诉讼 | 极客头条
2月报告:Python逆袭成功?踢馆Java,碾压C++!
点击“阅读原文”,打开CSDN APP 阅读更贴心。
相关文章:

怎样加强你的意志力
每个人都有惰性,而且每天都在惰性进行斗争,而这个斗争在你死之前,是不会停止的。实际每个人都知道,每天应该坚持学习,早起早睡,可是到时候总是因为各种原因放弃。能坚持下来的人,离目标就更近一…

解除微信回调的Activity必须在包名.wxapi下的限制
很久以前写过一篇文章:Android打包之多版本、多环境、多渠道。里面主要提到了将测试环境和正式环境的包分成不同的包名,同时安装在手机上,以便我们调试。同时,通过manifest的占位符,动态替换icon和label,让…

FreeBSD 6.0架设管理与应用-第三章 UNIX 系统入门
在开始进阶的 FreeBSD 设定之前,我们先来了解一下 UNIX 系统的架构及基本知识。这些知识对于我们之后管理、使用 FreeBSD 十分重要。如果您是 UNIX 新手,请务必详读本章。本章将介绍下列主题:如何登入注销系统。 UNIX 的指令用法。 UNIX 中常…

京东金融App收集用户敏感信息?致歉来了
整理 | 琥珀出品 | AI科技大本营(ID:rgznai100)京东金融 App 收集用户信息大家看到的是安全隐患,而我们看到的是一个大企业的原罪。日前,就京东金融 App 疑似收集信息事件引起了网络上的轩然大波。就该起事件,京东金融…

安装Python的wx库
2019独角兽企业重金招聘Python工程师标准>>> 遇到问题1:pip不是内部或外部命令,也不是可运行的程序 解决办法:修改环境变量:变量值改为:C:\Python27\;C:\Python27\Scripts; 遇到问题2:wxPython.…

【linux驱动】嵌入式 Linux 对内存的直接读写(devmem)
devmem工具源码 #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <errno.h> #include <signal.h> #include <fcntl.h> #include <ctype.h> #include <termios.h> #include …

【视频】V4L2之ioctl
常见的ioctl命令 VIDIOC_QUERYCAP /* 获取设备支持的操作 */ VIDIOC_G_FMT /* 获取设置支持的视频格式 */ VIDIOC_S_FMT /* 设置捕获视频的格式 */ VIDIOC_REQBUFS /* 向驱动提出申请内存的请求 */ VIDIOC_QUERYBUF /* 向驱动查询申请到的内…

我们期待的TensorFlow 2.0还有哪些变化?
来源 | Google TensorFlow 团队为提高 TensorFlow 的工作效率,TensorFlow 2.0 进行了多项更改,包括删除了多余的 API,使API 更加一致统一,例如统一的 RNNs (循环神经网络),统一的优化器,并且Pyt…

多线程概念与编程
一、多线程的生命周期:新建(New)、就绪(Runnable)、运行(Running)、阻塞(Blocked)和死亡(Dead) 1、新建状态:程序初始化一个Thread时,线程处于新建状态 2、就绪状态:线程Thread调用s…

C技巧:结构体参数转成不定参数
下面这段程序是一个C语言的小技巧,其展示了如何把一个参数为结构体的函数转成一个可变参数的函数,其中用到了宏和内建宏“__VA_ARGS__”,下面这段程序可以在GCC下正常编译通过: #include <stdio.h> #define func(...) myfun…

Arbitrage--POJ 2240
1、题目类型:图论、最短路径、Floyd算法。 2、解题思路:Floyd算法的简单应用;STL中map的简单应用。 3、注意事项:避免map报警告,文件开始调用#pragma warning(disable:4786)。 4、实现方法: #pragmawarning(disable:47…

【视频】V4L2之应用流程
####打开设备文件 int fd = open(Devicename,mode); Devicename:/dev/video0、/dev/video1 …… Mode:O_RDWR [| O_NONBLOCK] 如果使用非阻塞模式调用视频设备,则当没有可用的视频数据时,不会阻塞,而立刻返回。 ####取得设备的capability struct v4l2_capability capabil…

Android NDK开发之旅29 云服务器Ubuntu下搭建NDK环境,并编译FFmpeg
###前言 因为在Linux环境下编译FFmpeg生成库和头文件下比较方便,所以接下来主要操作在Linux环境下进行。但是对于Android NDK 开发新手来说,自己电脑配置Ubuntu Linux环境过程比较繁琐。而采用云服务器极大的方便了此过程,服务器对客户端远程…

一个App卖了4亿美元,这家听声识曲公司为何得到Apple的青睐?
作者 | 琥珀 出品 | AI科技大本营(ID:rgznai100) 是否可以将 Shazam 称为有听歌识曲功能应用的鼻祖? 2018 年 9 月,苹果最终以 4 亿美金完成对 Shazam 公司的收购,让不少人为之振奋,在当时对外公布的一份声…

Product Orders(生产订单)状态相关函数BAPI
[相关表] JEST-对象的系统状态(I****)和用户状态(E****) JSTO-状态对象信息 TJ02T-系统状态文本 -用户状态文本 【锁对象】:生产订单锁对象 ESORDER 函数: ENQUEUE_ESORDER, DEQUEUE_ESORDER [函数1]:检…

5行代码就能入门爬虫?
作者 | 苏克1900来源 | 第2大脑(ID:Mocun6)责编 | swallow不少读者是刚刚入门Python或者想学习Python的,今天就来谈谈如何用快速入门爬虫。先说结论:入门爬虫很容易,几行代码就可以,可以说是学习…

【云周刊】第146期:史上最大规模人机协同的双11,12位技术大V揭秘背后黑科技...
摘要:史上最大规模人机协同的双11,12位技术大V揭秘背后黑科技,INTERSPEECH 2017系列 | 语音识别之语言模型技术,机器学习初学者必须知道的十大算法,云数据库SQL Server 2016和新技术应用...更多精彩内容,尽…

【驱动】GNSS驱动基础
GNSS:Global Navigation Satellite System(全球卫星导航系统) GPS:Global Positioning System(全球定位系统) GPS是美国的卫星导航系统。 还有,俄罗斯的GLONASS;欧盟的Galileo;中国的北斗。 这几大导航系统统称为GNSS GLONASS、Galileo、…

ibaits插入即获取主键(mssql,mysql,oracle)
oracle主键需预先生成,通过sequence;mysql和mssql是插入后生成。 mysql: <insert id"insertStu_mysql" parameterClass"stu"> insert into stu(name) values (#name#) <selectKey resultClass"int" keyProper…

【驱动】GNSS驱动:gpsOneXTRA 援助技术
什么是 “gpsOneXTRA 援助技术”? 高通 gpsOneXTRA 的援助技术在公司的改进中扩展了 gps 芯片组, 允许通过互联网连接下载辅助 gps。芯片组为更精确的位置发现提供了更高的灵敏度, 尤其是在通常难以找到 GPS 信号的位置。 gpsOneXTRA:帮助提高了独立的性能&#x…

2017年书单整理
android书籍: Android进阶之光 刘望舒 点评一下,这本书呢,涉猎很广,涉及的技术,开源库挺多的,适合广度面上的知识增长,对于深度上的提高价值不大,我觉得对我没啥太大价值额 Android安全技术揭秘…

华南理工大学院长涉嫌篡改8名研究生成绩,4人已停职
整理 | 一一出品 | AI科技大本营(ID:rgznai100)2 月 11 日,网友平凡的世界overlooker 在新浪微博上报料,称华南理工大学计算机科学与工程学院的院领导于 2018 年研究生复试结束后,篡改 8 位考生的考试成绩,…

我心中的最佳阵容
世界杯的激情还在心中涤荡,但新赛季的各大联赛却已悄然开打,这里给出我心中的几项最佳,期待他们本赛季的完美表现。 最佳球队:切尔西(上赛季切尔西在安帅执掌球队的首个赛季便夺得英超冠军,欧冠虽惜败于曾经…

如何让AI教机器自己玩俄罗斯方块?
作者 | Ahab转载自公众号Ahab杂货铺(ID:PythonLearningCamp)人工智能大火的今天,如果还是自己玩俄罗斯方块未免显得太 LOW,为什么不对游戏升级,让机器自己去玩俄罗斯方块呢?有了这个想法之后,我…

【驱动】内核打印级别设置
在uboot中设置 setenv loglevel loglevel8 setenv loglevel debug setenv loglevel quiet setenv loglevel setenv mmcargs run set_disp; setenv bootargs console${console},${baudrate} ${loglevel} ${smp} root${mmcroot} ${disp_args}内核对应代码 main.c (init) 467 s…

vue基本标签
2019独角兽企业重金招聘Python工程师标准>>> vue基本是数据驱动,数据双向绑定,组件化,常用标签v-modal,v-html,v-if,v-else,v-show,v-for,v-on(简写),v-bind(简写 :) vue.js 兼具 angular.js 和 react.js 的优点&#…

C#操作域用户
using System;using System.DirectoryServices;namespace SystemFrameworks.Helper{ /// ///活动目录辅助类。封装一系列活动目录操作相关的方法。 /// public sealed class ADHelper { /// ///域名 /// private static s…

Redis进阶实践之三如何在Windows系统上安装安装Redis
一、Redis的简介 Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/po…

31页PPT概述:图神经网络表达能力有多强?
整理 | 一一出品 | AI科技大本营近年来,图神经网络的研究成为深度学习领域的热点。图是一种数据结构,它对一组对象(节点)及其关系(边)进行建模,由于图结构的强大表现力,用机器学习方…

【linux】Linux kernel uapi header file(用户态头文件)
uapi目录的创建原因 Linux在3.7以后把很多header file移到 include/uapi或是arch/xxxx/include/uapi下,为了解决include recursive(循环包含头文件)的问题。 英文参考文档:https://lwn.net/Articles/507794/ 解决include recur…