当前位置: 首页 > 编程日记 > 正文

python爬虫 智联招聘 工作地点

需求:智联上找工作的时候,工作地点在搜索页面只能看到城市-区。看不到具体的地址。(离家近的工作肯定优先考虑)
思路:爬取搜索页面(页面一)然后进去其中一个内页,再爬工作地点(页面二),【废话】
利用的库:re,csv,bs4,requests

基本功能已实现。
下一步方向,调取地图api 计算离家距离。
运算速度方面的话,可以考虑多线程处理。



以下代码拿来就用哈!

import requests
from bs4 import BeautifulSoup
import re
import csv

location = "广州"
search = "网络工程师"
fileName = location + "-" + search + ".csv"

with open(fileName, "w", newline="") as datacsv:
csvwriter = csv.writer(datacsv, dialect=("excel"))

# res = requests.get("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E4%BD%9B%E5%B1%B1&kw=%E7%BD%91%E7%BB%9C%E5%B7%A5%E7%A8%8B%E5%B8%88&sm=0&p=1")
Url = ("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=%s&kw=%s&sm=0&p=1" % (location, search))
res = requests.get(Url)
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text,'html.parser')
all_work = []

for link in soup.find_all('a'):
if re.search("com/[0-9]*.htm",str(link.get('href'))):
all_work.append(link.get('href'))
for i in all_work:
work = []
res2 = requests.get(i)
res2.encoding = 'utf-8'
soup2 = BeautifulSoup(res2.text,'html.parser')
for z in soup2.find_all("h2"):
work.append((z.get_text()).split()[0])
work_list = str(soup2.get_text()).split()
work_list2 = []
count_y = 0
for y in work_list:
count_y +=1
if "职位月薪" in y:
work_list2 = work_list[count_y-1:count_y+6]
for xx in work_list2:
work.append(xx)
csvwriter.writerow(work)
break
datacsv.close()



转载于:https://www.cnblogs.com/dblpl/p/8676141.html

相关文章:

2021-2022-1 线性代数知识点总结的视频

01 线性方程组02 矩阵及其运算03 向量空间(上)03 向量空间(下)04 特征值与特征向量05 实对称矩阵与二次型2021 线性代数 第三章 习题课2021 线性代数 第四章 习题课2021-2022-1 线性代数考试要点2021-2022-1 线性代数知识点总结 …

win使用linux共享打印机,Ubuntu 12.04以及 Window 下使用共享打印机

目前针对各个办公室里面都已经配置打印机了,为了节约资源,该打印机想必已经被网管设置成了共享,然而我们应该如何进行使用呢?笔者目前常用的系统是Ubuntu 12.04,偶尔想打印东西的不想切换到XP系统下,就此简单介绍下如何…

poj3280Cheapest Palindrome(记忆化)

链接 真的1A了。。 一开始想复杂了 想着补全再删 没想好 后来想到递归 大的回文串是由小的推过来的 一直递归下去 对于当前的i&#xff0c;j可以选择保留或者删除 选个最小的 1 #include <iostream>2 #include<cstring>3 #include<algorithm>4 #include<…

【组队学习】【32期】推荐系统-新闻推荐系统实践

推荐系统-新闻推荐系统实践 航路开辟者&#xff1a;罗如意领航员&#xff1a;肖桐航海士&#xff1a;汪志鸿、吴忠强、赖敏材、王辰玥、毛伟、宋禹成、陈雨龙、管柯琴 基本信息 开源内容&#xff1a;https://github.com/datawhalechina/fun-rec内容属性&#xff1a;公测课程…

Redis配置到本地以及可视化工具的安装运用

配置到本地出错&#xff1a; 解决方法&#xff1a; 1、先把原来的服务删除了 2、在重新配置服务。 真的&#xff0c;我就是这样的。。 转载于:https://www.cnblogs.com/stujike/p/8672165.html

linux消息通信无法接收,进程间通信:消息队列有关问题:进程1接收不到进程2的消息...

进程间通信&#xff1a;消息队列有关问题&#xff1a;进程1接收不到进程2的消息进程间通信&#xff1a;消息队列有关问题&#xff1a;进程1接收不到进程2的消息日期&#xff1a;2014-05-16  浏览次数&#xff1a;20365 次进程间通信&#xff1a;消息队列问题&#xff1a;进程1…

java听课笔记(四)

程序流程控制 分支 顺序 循环 if switch&case 1 2 3 调整 break 1.6 前 switch(byte、short、char、int) 1.7 可放String 循环 while&#xff08;次数不确定&#xff09; do while for&#xff08;确定次数&#xff09; break&#xff08;跳出本层循环&#xff09; continu…

【组队学习】【32期】scikit-learn教程

scikit-learn教程 航路开辟者&#xff1a;江季领航员&#xff1a;李牧轩航海士&#xff1a;武帅、陈宇 基本信息 开源内容&#xff1a;&#xff1a;https://github.com/datawhalechina/machine-learning-toy-code/tree/main/ml-with-sklearn内容属性&#xff1a;公测课程内容…

css一个很好用的hover显示

之前一直想在样式实现&#xff0c;hover时显示其他div&#xff0c;今天终于找到了&#xff0c;(*^▽^*).a悬停时显示.b.a:hover .b {display: block;}转载于:https://www.cnblogs.com/HCXiao/p/8677713.html

c语言输入函数有什么作用,c语言的输入函数有哪些

c语言的输入函数有&#xff1a;1、scanf()函数、从标准输入stdin读取格式化输入&#xff1b;2、getchar()函数&#xff0c;从标准输入stdin获取一个字符&#xff1b;3、gets()函数&#xff0c;从标准输入stdin读取一行&#xff1b;4、getch()函数。【相关学习推荐&#xff1a;C…

dubbo学习过程、使用经验分享及实现原理简单介绍

一、前言部门去年年中开始各种改造&#xff0c;第一步是模块服务化&#xff0c;这边初选dubbo试用在一些非重要模块上&#xff0c;慢慢引入到一些稍微重要的功能上&#xff0c;半年时间&#xff0c;学习过程及线上使用遇到的些问题在此总结下。整理这篇文章差不多花了两天半时间…

AutoIt脚本在做自动化操作的时候,如何进行错误捕获?

我的自动化脚本在运行的时候&#xff0c;会生成一个界面&#xff0c;点击该页面上的按钮能够进行自动化操作。 经常遇到的一个问题是&#xff1a; 脚本运行一半&#xff0c;GUI程序出现了异常情况&#xff0c;这个时候&#xff0c;再次点击生成的界面上的按钮&#xff0c;不会有…

中国电子学会青少年编程能力等级测试图形化四级编程题:计算生肖

「青少年编程竞赛交流群」已成立&#xff08;适合6至18周岁的青少年&#xff09;&#xff0c;公众号后台回复【Scratch】或【Python】&#xff0c;即可进入。如果加入了之前的社群不需要重复加入。 我们将有关编程题目的教学视频已经发布到抖音号21252972100&#xff0c;小马老…

用c语言写一个两线程程序,如何用C语言实现多线程

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼Windows操作系统&#xff0c;C语言实现多线程&#xff1a;#include #include DWORD APIENTRY ThreadOne ( LPVOID threadArg ){printf ( "线程开始啦&#xff0c;参数是&#xff1a;%s\n" , (char *)threadArg );return …

中国电子学会青少年编程能力等级测试图形化四级编程题:抽奖

「青少年编程竞赛交流群」已成立&#xff08;适合6至18周岁的青少年&#xff09;&#xff0c;公众号后台回复【Scratch】或【Python】&#xff0c;即可进入。如果加入了之前的社群不需要重复加入。 我们将有关编程题目的教学视频已经发布到抖音号21252972100&#xff0c;小马老…

github README.md教程

github README.md教程 总结 github中README.md通过特殊字符标记和缩进来达到格式控制&#xff0c;也可以用HTML标签来实现格式控制。 教程一&#xff1a; Markdown 的目标是实现「易读易写」&#xff0c;兼容HTML。 但是&#xff0c;在 HTML 区块标签间的 Markdown 格式语法将不…

this.options[selectedIndex]的使用

<select id"sel" οnchange"javascript:getSelect();"> <option value"a">选择</option> <option value"bdd">be</option> <option value"c">ce</option> <option value"…

c语言怎么创建一个h文件,求助C语言大佬 , 只会写到一个.c文件里 ,不会用.h头文件...

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼简答题】实验任务&#xff1a;学生成绩统计从键盘输入一个班(全班最多不超过30人)学生某门课的成绩&#xff0c;当输入成绩为负值时&#xff0c;输入结束&#xff0c;分别实现下列功能&#xff1a;(1)统计不及格人数并打印不及格学…

Makefile所有内嵌函数

一、文本处理函数以下是GNU make内嵌的文本&#xff08;字符串&#xff09;处理函数。1 $(subst FROM,TO,TEXT)函数名称&#xff1a;字符串替换函数—subst。函数功能&#xff1a;把字串“TEXT”中的“FROM”字符替换为“TO”。返回值&#xff1a;替换后的新字符串。示例…

青少年编程竞赛交流群周报(第041周)

2021年12月12日&#xff08;周日&#xff09;晚20:00我们在青少年编程竞赛交流群开展了第四十一期直播活动。 一、直播内容 我们直播活动的主要内容如下&#xff1a; 讲解了上次测试中小朋友们做错的题目 Scratch青少年编程能力等级测试模拟题&#xff08;四级&#xff09;。…

docker的用法

Docker是开发人员和系统管理员构建&#xff0c;发布和运行分布式应用程序的开放平台&#xff0c;可以在笔记本电脑、数据中心、虚拟机还有云服务器上运行。 使用Docker工具来提高生产率的方法&#xff1a;本地依赖&#xff1a;你需要在本地系统上快速试用 magento 吗&#xff1…

android 背景切换动画效果代码,关于Android shape gradient背景渐变

百度后&#xff0c;发现渐变色不仅可以根据xml来实现&#xff0c;也可以用java代码来实现&#xff0c;由于目前没有那么多时间&#xff0c;只记录xml实现的方法&#xff1b;以后在记录Java实现的代码。通过Shape gradient标签来实现首先来看gradient标签所有的渐变属性&#xf…

Linux Ubuntu 自动登录

我一直在用Ubuntu发型版本的Linux系统&#xff0c;很喜欢把它做得更加的方便易用&#xff0c;特别是Ubuntu的Server版本&#xff0c;因为没有Desktop的 GUI界面&#xff0c;也没有自动登录设置&#xff0c;无法通过简单的点击鼠标方式来设置自动登录&#xff0c;在查阅了一些资…

Win10 下 RabbitMQ 的 安装 配置

记录下本人在win10环境下安装RabbitMQ的步骤&#xff0c;以作备忘。 第一步&#xff1a;下载并安装erlang 原因&#xff1a;RabbitMQ服务端代码是使用并发式语言Erlang编写的&#xff0c;安装Rabbit MQ的前提是安装Erlang。下载地址&#xff1a;http://www.erlang.org/download…

【组队学习】【32期】算法的应用

算法的应用 航路开辟者&#xff1a;肖然领航员&#xff1a;李铭哲航海士&#xff1a;伊雪、左凯文 基本信息 开源内容&#xff1a;https://github.com/datawhalechina/team-learning-program/tree/master/AlgorithmRunning内容属性&#xff1a;公测课程内容说明&#xff1a;…

android百度地图轨迹实现,android 获取GPS经纬度在百度地图上绘制轨迹

实现将一组GPS模块获取的经纬度数据在百度地图上绘制轨迹1.将经纬度转换成百度地图坐标/*** 标准的GPS经纬度坐标直接在地图上绘制会有偏移&#xff0c;这是测绘局和地图商设置的加密&#xff0c;要转换成百度地图坐标** return 百度地图坐标*/public GeoPoint gpsToBaidu(Stri…

设计模式笔记之十四 (命令模式)

命令模式 命令模式是一种比较容易理解的设计模式&#xff0c;顾名思义&#xff0c;就是调用者发一个命令&#xff0c;有人给做完就行了&#xff0c;无关乎怎么做&#xff0c;也无关乎谁做。 我们继续我们以往的方式&#xff1a;理论联系实践的方式来理解命令模式。 最近我们实验…

2021 线性代数 第五章 习题课

第5章 实对称矩阵与二次型 5.1 实对称矩阵的对角化&#xff08;基础部分&#xff09;5.1 实对称矩阵的对角化&#xff08;提高部分&#xff09;5.2 二次型及标准形&#xff08;基础部分&#xff09;5.2 二次型及标准形&#xff08;提高部分&#xff09;5.3 正定二次型与正定矩…

galaxy android 8,三星终于正式升级安卓8.0!Galaxy S8尝鲜

原标题&#xff1a;三星终于正式升级安卓8.0&#xff01;Galaxy S8尝鲜经过长时间的测试&#xff0c;在友商陆续吃上奥利奥之后&#xff0c;三星终于开始向Galaxy S8/S8正式推送安卓8.0&#xff0c;也带来了新的Experience UX 9.0用户界面和诸多新功能。不过注意&#xff0c;首…

仿美团外卖的全栈项目(vue+node+mongodb)带支付-大三求实习

关于 2019届大三学生&#xff0c;前段时间一直想一个人单独开发一个较为完整的项目&#xff0c;在众多应用中&#xff0c;考虑之后选择了美团外卖来模仿&#xff0c;这段时间就利用课余时间进行开发&#xff0c;前端用vuevuexvue-routeraxios&#xff0c;因为需要用到定位和支付…