如何利用 C# 爬取Gate.io交易所的公告!
对于大部分程序员来说,都希望自己或多或少拥有一些比特币(BTC)。获取 BTC 的途径除了挖矿计算 Hash 值之外,就是去交易所购买了。
由于 BTC 的价格波动非常剧烈,入手 BTC 的时机就显得尤为关键。在交易所搞活动时入手,往往可以降低自己的交易成本。而程序员那里有时间看交易所的公告呢,做个爬虫来盯交易所的公告倒是一个不错的办法。
今天,我就带着大家用 C# 来爬取Gate.io交易所的公告。
首先,我们查看一下所要爬取数据的网页。
公告第1页的网址为:
https://gateio.news/articlelist/ann/0
公告第2页的网址为:
https://gateio.news/articlelist/ann/1
公告第3页的网址为:
https://gateio.news/articlelist/ann/2
可见所要爬取数据的网页地址,其变换的部分只有最后的页码数字。只要我们把这个数字作为参数传入到爬取函数中,即可爬取对应页面的数据。
其次,我们来看一下网页的源码,以第1页为例,其它的以此类推就好。
从该源码中我们发现,虽然页面显示为中文,但源码部分为英文。如果要获取中文的HTML DOM TREE
需要在网络请求头的 Cookie
中加入相应的说明 lang=cn
,具体可见后面的 GetHtmlDocument
方法。
查看公告部分的源码,我们发现所有的公告数据全部存储在 latnewslist
类中,在该类中找到 a
标签的 href
属性,可以得到该公告的网页地址。从上面的源码中,我们可以得到对应公告的网址为:
https://gateio.news/article/16805
其源码如下所示,通过查找 new-dtl-info
类,我们就可得到该公告发布的时间。
最后,我们确定获取 HTML DOM TREE
的工具为 Jumony,可以在 Github 上下载。下载地址为:
https://github.com/Ivony/Jumony
这里对 Jumony 就不做过多介绍了,要是大家感兴趣,可以在图文下方留言,我后面再写几篇图文来介绍这个工具。
上面我们对爬取的网页进行了分析,确定了技术路线,接下来,我们写代码实现爬取 Gateio 交易所公告的任务。
1. 创建“交易所公告”的结构 Announcement
public class Announcement
{// 交易所名称public string ExchangeName;// 公告时间public string Time;// 公告标题public string Title;// 公告网址public string Url;// 格式化 Announcement 输出public override string ToString(){if (string.IsNullOrEmpty(Time))return base.ToString();DateTime dt = DateTime.Parse(Time);string result = "[" + dt.Year + "/" + dt.Month + "/" + dt.Day+ " " + Title.Trim() + "](" + Url + ")";return result;}
}
2. 获取“交易所公告”的 HTML DOM TREE
public static IHtmlDocument GetHtmlDocument(string url)
{IHtmlDocument document;try{document = new JumonyParser().LoadDocument(url);}catch{document = null;}return document;
}
// 方法重载,得到给定页码的公告
public static IHtmlDocument GetHtmlDocument(int page)
{string url = "https://gateio.news/articlelist/ann/" + page;HttpWebRequest request = WebRequest.Create(url) as HttpWebRequest;if (request == null)return null;// 添加Cookie 中文显示request.Headers.Add("Cookie", "lang=cn");IHtmlDocument document = new JumonyParser().LoadDocument(request.GetResponse());return document;
}
3. 获取“交易所公告”的列表 List<Announcement>
public static List<Announcement> GetGateioAnnouncement(int page)
{List<Announcement> result = new List<Announcement>();IHtmlDocument doc = GetHtmlDocument(page);if (doc == null)return result;List<IHtmlElement> lists = doc.Find(".latnewslist").ToList();for (int i = 0; i < lists.Count; i++){IHtmlElement infor = lists[i].Find("a").ToList()[0];Announcement announcement = new Announcement();announcement.ExchangeName = "Gate.io";announcement.Title = infor.Find("H3").ToList()[0].InnerHtml();string url = "https://gateio.news" + infor.Attribute("href").AttributeValue;announcement.Url = url;IHtmlDocument temp = GetHtmlDocument(url);List<IHtmlElement> t = temp.Find(".new-dtl-info").ToList();announcement.Time = t.Find("span").ToList()[0].InnerHtml();result.Add(announcement);}return result;
}
4. Markdwon
格式化输出
private string GetReport(List<Announcement> lst)
{if (lst == null || lst.Count == 0)throw new ArgumentNullException();string result = "**" + lst[0].ExchangeName + "**" + Environment.NewLine;for (int i = _lstGateio.Count - 1; i >= 0; i--){result += "- " + lst[i] + Environment.NewLine;}return result;
}
5. HTML
渲染格式化输出的结果
到此为止,利用 C# 爬取Gate.io交易所的公告就介绍完了。希望本篇图文对大家有所帮助。今天就到这里吧!See You!
相关阅读
- 如何利用 C# 开发「桌面版百度翻译」软件!
- 如何利用 C# 爬取「猫眼电影专业版:票房」数据!
- 如何利用 C# 爬取「京东 - 计算机与互联网图书销量榜」!
相关文章:

人的原罪、本我和超我
摘自:https://www.zhihu.com/question/31362451/answer/51606300人的原罪的存在,因为人人皆有,所以在潜意识中,形成了对本我的接纳,而神爱世人与宽恕的存在,形成了本我与超我的良性互动。 在这样的关系中&a…

软件测试的准入准出是什么?标准是什么?
测试的准入准出是指什么情况下可以开始当前版本的测试工作,什么情况下可以结束当前版本的测试工作。不同项目、不同公司的测试准入准出标准都会有所不同。下面介绍一些通用的测试准入准出标准。 测试准入标准如下: (1)开发编码结束,开发人员在…

如何利用 C# 爬取 One 持有者返利数据!
去年,10月份写过一篇图文 「One」的投资价值分析,多半年过去了,回头看看当时的判断还是合理的。 投资这种事情需要有自己的策略,更需要理性。任何决策都需要以数据作为判断的基础,哪么是否还继续持有 ONE呢?…

04.微博消息的语言检测
04.微博消息的语言检测 郑昀 201010 隶属于《02.数据解析》小节 大意是,封装Google语言检测ajax web service的接口,输入一段话,输出语言种类。这个方法是从RssMeme.com看来的,经测试效果还不错,可用于检测微博客消息的…

CIO时代学院院长姚乐:传统行业遇上大数据 拥抱智能化未来
近几年,互联网行业发展突飞猛进,“大数据”技术瞬间变得炙手可热,当然,对于发展中的大数据技术而言,很多行业都不会错失良机。近日,CIO时代学院院长、中国新一代IT产业推进联盟秘书长姚乐在“2016CIO时代中…

自动化测试的优势和局限性有哪些
自动化测试只是众多测试中的一种,并不比人工测试更高级更先进。和人工测试相比自动化测试有一定的优势和劣势,具体如下。 1.优势 (1)自动化测试具有一致性和重复性的特点,而且测试更客观,提高了软件测试的准确度、精确度和可信任度…

也分享一个存储过程代码生成器 开源
可以通过 FILE>OPTION 修改前缀,作者等信息。。。。。 完全傻瓜式应用,开源,方便进行个性化开发。。。 工具地址:http://spgen.codeplex.com/ Stored Procedure Generator (for SQL Server 2000/2005) 虽然这样写,但…

如何利用 C# 爬取BigOne交易所的公告!
在当今这个时代,投资可以说是每个人都应该学会的一项技能。拥有一些数字货币是程序员的信仰!交易所是进入数字货币世界最方便的一扇门,今天我就带着大家爬取 Bigone 交易所的公告数据。 首先,我们来看一下要爬取的页面以及对应的…

如何提升自己的Web前端技术
如何提升自己的Web前端技术?问这个问题的一般都是有一些web基础的同学,还有一部分是自学的web前端技术,对自己目前的能力还比较模糊,下面小编就这个问题为大家做下详细的介绍。 如何提升自己的Web前端技术?在IT行业,任何一种专业…

tomcat 性能设置
Tomcat性能调优: 找到Tomcat根目录下的conf目录,修改server.xml文件的内容。对于这部分的调优,我所了解到的就是无非设置一下Tomcat服务器的最大并发数和Tomcat初始化时创建的线程数的设置,当然还有其他一些性能调优的设置&#x…

SAP的安装后基本设定
SAPLogon登录时候是乱码,设定登陆配置的代码页属性,勾选Unicode off SAP英文系统下中文显示乱码 设定字符集为GB2312 RZ10常用的配置参数rz10 编辑系统参数文件 rdisp/gui_auto_logout & rdisp/keepalive 用于控制闲置时间(秒) login/system_client 用于控制默认…

如何通过 Scratch 教小朋友编程思维?
寒假的时候,我带着自己的小孩学 Scratch,希望通过这种图形化的语言来训练他的编程思维。开学之后,很多事情需要处理,所以拖到现在才写总结。希望对大家有所启发。 在介绍如何做这件事情之前,先介绍一个学习方面的基本…

零基础怎么学习UI设计?有哪些简单的学习方法?
UI设计近几年的就业前景是非常好的,所以很多人都想要学习UI设计,那么零基础怎么学习UI设计?有哪些简单的学习方法?下面小编就给大家做下详细的介绍。 零基础怎么学习UI设计?有哪些简单的学习方法? UI设计行业是很注重技术的,零基础如果直…

让资源管理器不显示最近常用文件夹
右键点任务栏,点“属性”->Startmenu->在Privacy框中,把第二个√ 去掉,如下图所示:

C# 写Windows服务
服务是一个运行在后台的程序,他没有界面,不能交互,只能孤独的独自运行。 在开始->运行->输入services.msc可以打开服务管理器,这里可以查看和管理服务 很多时候都会用到服务,因为服务简化了我们的操作&#…

技术图文:如何利用 C# 爬取 ONE 的交易数据?
投资一个金融产品,最基本的就是拿到这个金融产品的交易数据,对这些数据进行可视化来判断趋势。去年,我在听 李笑来 讲区块链的课程上知道了 BigOne 这个由 INB 投资的交易所,而 ONE 是 BigOne 的平台币,持有 ONE 可享受…

java程序猿必读的学习书籍,良心推荐!
每年都有很多人想要学习java技术,有的是自学,有的是报班学习,但是都免不了要看书籍学习,书籍学习带来的知识更加牢记,也可以随时做笔记,下面小编就为大家推荐java程序猿必读的学习书籍,希望能帮…

Autools学习总结(一)
一、Makefile 简介 在编写C/C程序的时候,我们经常需要编译并运行代码。在程序规模较小的情况下,可以简单地直接调用编译器来完成这项工作。然而,在很多情况下程序往往包括大量的代码文件,手动调用编译器变得麻烦无比。尤其要命的是…

简单的实现IOCP服务器模型
其实已经有很多大佬将原理讲的十分详细了,所以就不花费时间将原理再一次重复讲一遍,有需要的可以自行去查看。 http://blog.csdn.net/beyond_cn/article/details/9336043 这篇文章是我看的,原理介绍十分详细。不过有一些操作感觉比较复杂因此…

资料分享:送你一本《数据结构与算法JavaScript描述》电子书!
数据结构 是掌握计算机编程必须具备的技能。通常情况下,我想掌握一门编程语言所用的方法就是利用这门语言把数据结构中线性表、栈、队列、字符串、动态数字、整数集合、树、图、搜索、排序等涉及的算法全部写一遍。写完之后,基本上就把这门语言搞定了。 …

Python中爬虫框架或模块的区别
Python中爬虫框架或模块的区别,我们在Python的学习过程中,需要不断的总结知识点,这样我们才能进步的更快一些。 (1)爬虫框架或模块 Python自带爬虫模块:urllib、urllib2; 第三方爬虫模块:requests,aiohttp;…

SQL SERVER 2000写存储过程出现列名无效的解决方法
举一个Northwind的例子。DECLARE m_LastName nvarchar(20) DECLARE Sql varchar(256)SET m_LastName Fuller SET Sql SELECT * FROM Employees WHERE LastName char(39) m_LastName char(39) EXEC(Sql) 注意,要加上char(39)就可以了。转载于:https://www.cnblo…

如何利用 C# + Python 破解猫眼电影的反爬虫机制?
在 如何利用 C# 爬取「猫眼电影:最受期待榜」及对应影片信息! 这篇图文中可以看到猫眼电影对“本月新增想看人数” 和 “总想看人数”进行了字符集加密。 在 如何利用 C# 爬取「猫眼电影:国内票房榜」及对应影片信息! 这篇图文中也…
ZooKeeper学习笔记1-----------安装启动
ZooKeeper是一套协作服务,主要用来构建分布式架构的应用,通过ZooKeeper我们可以安全的处理分布式应用下的局部故障问题。我们知道ZooKeeper就是Hadoop中的分布式协作服务组件。下面我们进入ZooKeeper的安装部署。 安装Zookeeper https://zookeeper.apach…

软件测试培训完就业方向怎么选择
软件测试技术在近几年的发展前景是非常好的,越来越多的人都想要学习软件测试技术,报班是大多数人的选择,但是大家对于“软件测试培训完就业方向怎么选择”这个问题比较迷茫,我们来看看下面的详细介绍。 软件测试培训完就业方向怎么…

LeetCode实战:合并两个有序链表
题目英文: Merge two sorted linked lists and return it as a new list. The new list should be made by splicing together the nodes of the first two lists. Example: Input: 1->2->4, 1->3->4 Output: 1->1->2->3->4->4 题目中…

Apache反向代理设置【转载】
编译Apache时要进行的设置./configure --enable-mods-shared"all proxy"1>修改 httpd.conf 文件中:LoadModule proxy_module modules/mod_proxy.soLoadModule proxy_connect_module modules/mod_proxy_connect.soLoadModule proxy_http_module modules…

Suricata的输出
不多说,直接上干货! 见官网 https://suricata.readthedocs.io/en/latest/output/index.html 总的来说,Suricata采集下来的数据输出分为:EVE 、 Lua Output 、 Syslog Alerting Compatibility 、 Custom http logging 、 Custo…

快速提高你的UI设计水平的一些小技巧
UI设计师这个岗位在最近几年的缺口是比较大的,很多企业都在招UI设计人员,想要学习UI设计或者提升UI设计技术的同学,可以看看小编分享的以下内容,善用这些UI设计小技巧,快速提高你的设计水平! 快速提高你的UI设计水平的…

hibernate join fetch
那天去了达内,试听了2个小时的课,刚好讲的他们的当当网项目,讲hibernate表关系映射这段来了,不过也够呛,投影仪看的眼睛点都不舒服,当时讲的也没认真听,听了个大概,就记住那个老师一…