当前位置: 首页 > 编程日记 > 正文

盛夏海边,用Python分析青岛哪些景点性价比高

作者 | 志斌

来源 | 志斌的python笔记

头图 | 付费下载于 IC Photo

在经过几年的热潮之后,人工智能AI算法已经在各行各业广泛使用了。例如在工业制造中,利用人工智能监测仪器仪表、人员的违规与高危行为;利用图形AI算法进行材料质检;在能源、交通、农业等行业利用AI做智能可视化巡检;在金融领域基于人工智能的金融风控建模等等。

毕业了就肯定要计划毕业旅行的事情了,于是,志斌用Python爬取了去哪儿网上青岛景点的相关数据,包括景点名称、城区、热度、价格、月销量等数据,对数据进行可视化并作简单分析,用以找到性价比较高的景点。

数据采集

在之前的文章,我们已经详细的介绍了如何采集去哪儿网上的景点数据,不会的小伙伴可以看看这篇文章用Python分析西安景点,告诉你哪些景点性价比高。我们这里就不在详细介绍了,直接展示爬虫的核心代码:

import requests
from bs4 import BeautifulSoup
import openpyxlfor page in range(1,50):try:params = (('from', 'mps_search_suggest_h'),('keyword', '\u897F\u5B89'),('page', str(page)),)response = requests.get('https://piao.qunar.com/ticket/list_%E8%A5%BF%E5%AE%89.html', headers=headers, params=params)soup = BeautifulSoup(response.text,'html.parser')zongs = soup.find_all('div',class_='sight_item')for i in zongs:name = i.find('h3').textdiqu = i.find(class_='area').find('a').textredu = round(float(i.find(class_='product_star_level').text.split()[-1][:4]) * 5, 2)dizhi = re.findall('地址:(.*?)地图', i.find(class_='address color999').text)[0]jiage = float(i.find(class_='sight_item_price').find('em').text)yuexiao = int(i.find(class_='sight_item_sold-num').find('span').text)xingji = i.find(class_='level')jingweidu = i['data-point']

数据清洗

1、导入景点数据

用pandas读取爬取的景点数据并预览。

df = pd.read_excel('青岛景区数据.xlsx',names=['景点名称','城区','热度','地址','价格','月销量','月销额','星级','经度','纬度'])
print(df.head())


2、删除重复数据

网站中有一定的重复数据,需要将其删除。

df = df.drop_duplicates()

3、查看数据类型

查看字段类型和缺失值情况,符合分析需要,无需另做处理。

df.info()

可视化分析

我们来对这165个景点数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。

1、景点介绍

通过对青岛景点介绍进行词云图绘制,我们很容易看出青岛的特点。建筑、度假、博物馆、帆船、休闲、世界等词的大量提及,说明青岛是一座非常适合度假的海滨城市,同时现代化也很强。

2、热度Top10景点

从景点评分来看,栈桥评分最高,5分满分。其次是崂山,是4.1分。怪不得一搜索青岛的旅游攻略,每一个里面都有这几个景点。

3、价格Top10景点

从景点价格来看,价格都在能接受的范围之内,大家可以根据自己的喜好去选择体验一下。

五月的风是五四广场的标志性建筑,我在百度上搜的是不收费的,但是不知道为什么在去哪儿网上给标注的收费。。。

4、月销量Top20景点

从门票月销量来看,极地海洋公园排第一,月销量2463,其次是海底世界和野生动物世界,分别是2372和2066。方特和啤酒博物馆也分别有1500+的销量。

看来青岛的海洋景点很受欢迎,同时青岛啤酒也是不可不尝的美食。

5、月销额Top20景点

从下图可以看出、月销额前四的分别是方特,307314;海底世界,284640;野生动物世界,169205;极地海洋公园,147780。

其他景点的月销额也基本上跟月销量排序差不多,看来月销额受到月销量和价格的影响相差不大。

6、景点分布

从图中我们可以看出景点主要集中在市南区和黄岛区,我们住宿的时候可以尽量选择住在这两个区,这样出行游玩会比较方便。

7、景点等级分布

从北京景点等级分布来看,3A以上等级的景点为29个,其中3A级景点13个,4A级景点15个,5A级景点1个。

总结

通过上面简单的分析,我们大致可以获得以下几点发现:

1. 青岛是一座现代化海滨城市。

2. 青岛的景点主要集中在市南区和黄岛区,我们住宿的时候可以尽量选择住在这两个区,这样出行游玩会比较方便。

3. 月销量最高的四个景点一定要去看看,毕竟大多数人的选择,质量肯定有保证。

4. 青岛的啤酒很好喝,身体条件允许的朋友,一定要来一杯尝尝。

温馨提示:疫情还未结束,外出旅行做好个人防护。尽量避免到中高风险地区游玩。

更多精彩推荐
赠书 | 读懂生成对抗神经网络 GAN,看这文就够了搏一搏,单车变摩托!华为天才少年耗时四月将自行车强势升级为自动驾驶基于微软开源深度学习算法,用 Python 实现图像和视频修复点分享点收藏点点赞点在看

相关文章:

EnterLib PIAB又一个BUG?

在《这是EnterLib PIAB的BUG吗?》一文中我们讨论了PIAB关于抽象基类的BUG,今天又发现了一个新的问题。问题的起因源于《IoCAOP的简单实现》这篇文章,因为文中给出的解决方案仅仅支持构造器注入(Constructor Injection)…

【SQL Server】系统学习之一:表表达式

本节讨论的相关内容包括:视图、派生表、CTE、内联表值函数 场景:如果要查询一组数据(例如聚合数据,也就是几个表聚合在一起的数据),这些数据并未在数据库中以表的形式存在。 1、视图:通常用来分…

C语言中字符数组和字符串指针分析

写下面的测试程序&#xff1a;#include <stdio.h> int main(int argc, char *argv[]){char day[15] "abcdefghijklmn"; char* strTmp "opqrstuvwxyz";printf("&day is %x\n",&day); printf("&day[0] is %x\n",&…

这篇论文,透露谷歌团队构想的“未来搜索”

作者 | 青苹果来源 | 数据实战派头图 | 付费下载于 IC Photo传统的信息检索&#xff08;IR, Information Retrieval&#xff09;系统&#xff0c;并不直接回应信息需求&#xff0c;而仅提供对内容的参考。排序&#xff08;Ranking&#xff09;是该范式的关键组成部分。这样的检…

selenium+python自动化81-html报告优化(饼图+失败重跑+兼容python23)

优化html报告 为了满足小伙伴的各种变态需求&#xff0c;为了装逼提升逼格&#xff0c;为了让报告更加高大上&#xff0c;测试报告做了以下优化&#xff1a; 测试报告中文显示&#xff0c;优化一些断言失败正文乱码问题新增错误和失败截图&#xff0c;展示到html报告里优化点击…

C#的多线程机制

一.多线程的概念 Windows是一个多任务的系统&#xff0c;如果你使用的是windows 2000及其以上版本&#xff0c;你可以通过任务管理器查看当前系统运行的程序和进程。什么是进程呢&#xff1f;当一个程序开始运行时&#xff0c;它就是一个进程&#xff0c;进程所指包括运行中…

知乎 CTO 李大海:创业公司如何拥抱开源

由计算机学会主办的 CCF C 活动近日走进知乎。知乎合伙人兼 CTO 李大海、搜狗 CEO 王小川、华东师范大学教授王伟在内的企业界、学界技术代表齐聚&#xff0c;带来一场精彩的技术分享盛宴。 围绕「创业公司如何拥抱开源」的分享主题&#xff0c;知乎合伙人兼 CTO 李大海首次披…

如何居中一个浮动元素?

2019独角兽企业重金招聘Python工程师标准>>> 1.<!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title>center</title> <style type"text/css"> .p{ position:relative; float:left; left:50…

javascript promise编程

在loop中使用promise: https://stackoverflow.com/questions/17217736/while-loop-with-promises 转载于:https://www.cnblogs.com/kidsitcn/p/7745973.html

bzoj1295

考虑到这道题n&#xff0c;m都很小&#xff0c;我们考虑先穷举起点i 下面我们要做的是找出移走k个障碍后&#xff0c;点i所能到的最大距离 我们可以把这个问题转化为判定性问题 对于一对点i,j,如果他们之间存在一条路径&#xff0c;障碍数&#xff08;包括起点终点&#xff09;…

C#程序可将文本文件藏于位图中,也可导出

//使用方法&#xff1a; // BmpSafe.exe /file2bmp (input BMP) (input file to hide) [output file] //BmpSafe.exe /bmp2file (data BMP) [output file] using System; using System.IO; using System.Drawing; public class Bitmap24Writer { protected Bitmap bmp; …

溢价 5 倍欲将 SiFive 收入麾下,英特尔的绝地反击战

作者 | 马超责编 | 张红月出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;受任于败军之际&#xff0c;奉命于危难之间。近几年硅谷史上的传奇、英特尔几位掌门葛洛夫与欧德宁相继离世&#xff0c;虽然他们早已脱离一线多年&#xff0c;但是他们的离去可能还是让英特…

教你用Vue渐进式搭建聊天室,从JavaScript=TypeScript

前言 VueSocket.io这个轮子已经有很多人造过了&#xff0c;为了不重复造轮子&#xff0c;我将本项目以三阶段实现&#xff08;大家可以在github中的Releases查看&#xff09;&#xff1a; 纯前端&#xff08;Vuex&#xff09;后端前端&#xff08;JavaScript&#xff09;后端前…

如何学习linux编程

如果想学习UNIX/LINUX的编程&#xff0c;《APUE》绝对经典的教材&#xff0c;加深一下功底&#xff0c;学习《UNP》的第二卷。这样基本上系统方面的就可以掌握了。如果继续网络编程&#xff0c;建议看《TCP/IP进行网际互连》的第三卷&#xff0c;里面有很多关于应用协议telnet、…

HTML中的form表单有一个关键属性 enctype

HTML中的form表单有一个关键属性 enctype&#xff1d;application/x-www-form-urlencoded 或multipart/form-data。 1、enctype"application/x-www-form-urlencoded"是默认的编码方式&#xff0c;当以这种方式提交数据时&#xff0c;HTTP报文中的内容是&#xff1a; …

赠书 | JavaScript 武力值飙升!用 TensorFlow.js 轻松在浏览器里搞深度学习

近年来&#xff0c;AI 与人类的生活越来越紧密&#xff0c;慢慢变得无处不在。那么提到 AI &#xff0c;我们会想到什么&#xff1f;小编最先想到的是机器人。早在小学作文中&#xff0c;我就写到 2021 年到处都是机器人&#xff0c;机器人汽车到处飞。结果 2021 年到来&#x…

[译] JWT 与 Spring Cloud 微服务

keyholesoftware.com/2016/06/20/…作者&#xff1a;THOMAS KENDALL译者&#xff1a;oopsguy.com 微服务安全是架构的一个重要部分。具体来说&#xff0c;就是认证和授权模式。 微服务认证和授权处理方式有几种选择&#xff0c;但本文只介绍 JSON Web Token 的使用。 JSON Web …

20步打造最安全的Nginx Web服务器

Nginx是一个轻量级的&#xff0c;高性能的Web服务器以及反向代理和邮箱(IMAP/POP3)代理服务器。它运行在UNIX,GNU/Linux,BSD各种版本&#xff0c;Mac OS X,Solaris和Windows。根据调查统计&#xff0c;6%的网站使用Nginx Web服务器。Nginx是少数能处理C10K问题的服务器之一。跟…

C#创建和调用DLL

一、写在前面 C# 语言是一种简单但功能强大的编程语言&#xff0c;用于编写企业应用程序。 C# 语言从C和 C语言演化而来&#xff0c;在语句、表达式和运算符方面使用了许多 C 功能。 C# 语言在类型安全性、版本转换、事件和垃圾回收等方面进行了相当大的改进和创新。 C# 语言提…

死磕算法!35 篇算法设计实例+6 本必读书打包送你

算法为什么难学&#xff1f;算法在程序中扮演着非常重要的角色&#xff0c;有人将数据结构比喻为程序的骨架&#xff0c;将算法比喻为程序的灵魂&#xff0c;这一点也不为过&#xff0c;正是因为这一点&#xff0c;很多朋友都立志要学好算法&#xff0c;但是我常常看到各种抱怨…

EXCHANGE证书

证书&#xff1a; CA&#xff08;证书颁发机构&#xff09;和证书有什么区别&#xff1f; CA&#xff1a;是服务器中的一个服务&#xff0c;主要是用来为计算机&#xff08;用户&#xff09;来颁发证书&#xff0c;安装CA的服务器称为证书服务器&#xff0c; 证书&#xff1a;从…

C#2.0模拟List和内置算法

C#中的范型对于很多从C转过来的程序员来说&#xff0c;可以说是一个天大的喜讯。hehe&#xff0c;至少笔者对于这个新特性是充满了敬仰之情。 在C#2.0中&#xff0c;匿名方法、IEnumerable接口和匿名方法的合作&#xff0c;使很多的编程任务变得非常的简单&#xff0c;而且写出…

​横扫六大权威榜单后,达摩院开源深度语言模型体系 AliceMind

整理 | AI 科技大本营&#xff08;ID:rgznai100&#xff09;自然语言处理&#xff08;NLP&#xff09;被誉为 AI 皇冠上的明珠&#xff0c;传统 NLP 模型制作复杂&#xff0c;耗时耗力&#xff0c;且用途单一&#xff0c;难以复用。预训练语言模型是 NLP 领域的研究热点之一&am…

WP8:Unity3D之间的值传递

原地址&#xff1a;http://www.cnblogs.com/zhxilin/p/3799210.html 在前面的讨论中&#xff0c;我们介绍了如何在Unity3D for WP8中使用高于.Net 3.5的第三方库&#xff0c;传送门:http://www.cnblogs.com/zhxilin/p/3311240.html 在Unity3D和WP8的交互当中&#xff0c;如果要…

未来的程序员面临着怎样的职业变化

作为程序员&#xff0c;我们总是身处于如万花筒般变化无常的技术世界里。我们可能也是那群能够最早感知到科技变化所带来巨大影响的人。然而&#xff0c;面对这一波又一波向我们袭来的技术变革&#xff0c;我们是否也能从中窥见一丝规律&#xff0c;从而使自己更好地应对未来呢…

C#中使用Win32和其他库

C# 用户经常提出两个问题&#xff1a;“我为什么要另外编写代码来使用内置于 Windows 中的功能&#xff1f;在框架中为什么没有相应的内容可以为我完成这一任务&#xff1f;”当框架小组构建他们的 .NET 部分时&#xff0c;他们评估了为使 .NET 程序员可以使用 Win32 而需要完成…

神经网络的学习方式网络传播和图卷积,两者到底什么关系?

作者 | Remy Lau本文转载自CSDN博主「deephub」你可能听说过图卷积&#xff0c;因为它在当时是一个非常热门的话题。虽然不太为人所知&#xff0c;但网络传播是计算生物学中用于网络学习的主要方法。在这篇文章中&#xff0c;我们将深入研究网络传播背后的理论和直觉&#xff0…

string与数值之间的转换

9.50 编写程序处理一个vector<string>,其元素都表示整数型。计算vector中所有元素之和。修改程序&#xff0c;使之计算表示浮点值的string之和。 程序如下&#xff1a; #include<string> #include<vector> #include<iostream> using namespace std;int…

一个完整的大作业

1.选一个自己感兴趣的主题。网址为http://news.gzcc.cn/html/xiaoyuanxinwen/ 2.网络上爬取相关的数据 import requests import re from bs4 import BeautifulSoup urlhttp://news.gzcc.cn/html/xiaoyuanxinwen/ resrequests.get(url) res.encodingutf-8 soupBeautifulSoup(res…

剖析C#的多态

一、什么是多态 面向对象程序设计中的另外一个重要概念是多态性。在运行时&#xff0c;可以通过指向基类的指针&#xff0c;来调用实现派生类中的方法。可以把一组对象放到一个数组中&#xff0c;然后调用它们的方法&#xff0c;在这种场合下&#xff0c;多态性作用就体现出来了…