当前位置：首页 > 编程日记 > 正文

讲解selenium 获取href find_element_by_xpath

编程日记 2023-12-19 09:30:08

讲解selenium获取href - find_element_by_xpath

什么是XPath？

使用find_element_by_xpath获取href

讲解selenium获取href - find_element_by_xpath

Selenium是一个常用的自动化测试工具，可用于模拟用户操作浏览器。在Web开发和爬虫中，经常需要从网页中获取链接地址（href），而Selenium提供了各种方式来实现这个目标。在本篇文章中，我将主要讲解使用Selenium的find_element_by_xpath方法来获取网页中的href属性值。

什么是XPath？

XPath（XML Path Language）是一种用于在XML和HTML文档中定位元素的语言。在Selenium中，我们可以使用XPath来定位网页中的元素，包括链接。 XPath表达式通过路径和表达式来选择元素，常用的表达式包括//（选取节点）、@（选取属性）等。

使用find_element_by_xpath获取href

以下是使用Selenium的find_element_by_xpath方法获取链接地址的示例代码：

pythonCopy code
from selenium import webdriver
# 创建浏览器驱动
driver = webdriver.Chrome()
# 打开网页
driver.get("https://example.com")
# 使用XPath定位链接
element = driver.find_element_by_xpath("//a[@href]")
href = element.get_attribute("href")
print(href)
# 关闭浏览器
driver.quit()

代码解释：

首先，我们导入webdriver模块并创建一个浏览器驱动。
然后，使用driver.get方法打开目标网页。
接下来，使用XPath表达式//a[@href]定位所有包含href属性的链接元素。这个表达式指定了选择所有a标签（链接），并且这些标签包含href属性。
接着，通过element.get_attribute("href")方法获取链接的地址，并将其保存在href变量中。
最后，我们可以打印出得到的链接地址，并可以根据需求进行后续处理。
最后，调用driver.quit()方法关闭浏览器。

当使用Selenium进行网页爬取或者测试时，常常需要获取网页中的链接地址。以下是一个示例代码，展示了如何使用Selenium的find_element_by_xpath方法获取网页中特定元素的链接地址。

pythonCopy code
from selenium import webdriver
# 创建浏览器驱动
driver = webdriver.Chrome()
# 打开目标网页
driver.get("https://www.example.com") 
# 使用XPath定位链接
link_element = driver.find_element_by_xpath("//a[@class='link']") 
link_href = link_element.get_attribute("href") 
# 输出链接地址
print("链接地址为:", link_href)
# 关闭浏览器
driver.quit()

在上述示例中，我们打开了一个网页(https://www.example.com)，然后使用XPath表达式//a[@class='link']定位到具有class属性为"link"的链接元素。然后通过get_attribute方法获取链接元素的href属性值，最后将链接地址打印出来。实际应用场景中，可以根据需要修改XPath表达式来定位到不同的元素。例如，如果要获取所有链接的地址，可以使用find_elements_by_xpath方法，并在循环中逐个获取每个链接的地址。

pythonCopy code
link_elements = driver.find_elements_by_xpath("//a[@href]") 
for link_element in link_elements:
    link_href = link_element.get_attribute("href")
    print("链接地址为:", link_href)

这样，就可以获取到网页中所有链接的地址，并进行后续处理。请根据具体的需求和网页结构来调整代码，以获取你所需要的链接地址。

Selenium是一个广泛使用的自动化测试工具，主要用于模拟用户在网页上的交互操作。它支持多种编程语言，并且可以在多种浏览器上运行，包括Chrome、Firefox、Safari等。Selenium的目标是提供一个简单而又直观的方式来执行浏览器行为自动化，从而加快Web应用程序的测试和开发过程。

Selenium的特点和优势

真实性： Selenium模拟用户通过真实浏览器与网页进行交互，能够准确地模拟用户的行为操作，包括点击、输入文本、提交表单等。
跨浏览器： Selenium支持多款主流浏览器，方便运行测试用例或进行爬虫开发。
灵活性： Selenium提供了多种定位元素的方法，包括XPath、CSS selector、ID等，可以根据网页的具体结构和需求进行灵活定位。
可扩展性： Selenium支持使用不同的编程语言进行测试编写，如Python、Java、C#等，方便根据项目要求进行扩展和集成。
可视化界面： Selenium还提供了可视化界面工具Selenium IDE，通过录制和回放的方式帮助用户快速生成测试脚本。

Selenium的应用场景

自动化测试： Selenium可以模拟用户在网页上的各种操作，如点击、输入文本、选择下拉框等，可以用于编写自动化测试用例，加速测试过程，提高测试覆盖率。
网页爬虫： Selenium可以模拟浏览器的行为操作，对于一些需要JavaScript渲染的网页，可以使用Selenium来获取完整的页面数据，对于一些需要登录或者频繁交互的网站，也可以用Selenium来模拟用户操作。
数据挖掘和捕捉： 使用Selenium，可以方便地获取网页中的特定数据或截取网页的截图，用于数据挖掘和数据分析。
UI自动化： Selenium可以用于自动化验证Web应用程序的用户界面，对于一些重复、频繁的操作，可以编写脚本来自动执行，节省时间和人力成本。

Selenium的核心组件

Selenium由三个核心组件组成：

Selenium WebDriver： WebDriver是Selenium的主要组件，它以编程语言API的形式提供了一系列方法和功能，用于控制浏览器并模拟用户操作。
Selenium Grid： Selenium Grid是一个分布式测试工具，可以同时在多台机器上运行测试脚本，并可跨浏览器和操作系统进行并行测试。
Selenium IDE： Selenium IDE是一款用于录制和回放测试脚本的可视化工具，它提供了简单的界面，方便用户快速生成和执行测试脚本。

Selenium是一个功能强大的自动化测试工具，通过模拟用户行为操作网页，可以加快测试和开发过程，提高测试覆盖率和效率。它具有跨浏览器、灵活性、可扩展性和可视化界面等特点和优势。除了自动化测试之外，Selenium还可以应用于网页爬虫、数据挖掘、UI自动化等各种场景。通过Selenium的不同组件，我们可以灵活地控制和操作浏览器，实现各种自动化需求。

总结

使用Selenium的find_element_by_xpath方法可以轻松地获取网页中的链接地址。通过提供XPath表达式，我们可以定位到具有特定属性的元素，并获取对应的链接地址。

selenium测试工具

https://www.dkcj.cn/info/418.html

讲解darknet: ./src/cuda.c:36: check_error: Assertion `0‘ failed.

以上是解决darknet中出现0' failed.`错误的一些建议。通过确认CUDA安装、GPU驱动程序、CUDA环境变量的正确性，并重新编译darknet，您应该能够解决这个问题。如果问题仍然存在，您可能需要进行更深入的故障排除，例如检查源代码或硬件相关问题。

编程日记2023/12/19 09:30:08

利用systemd设置springboot微服务服务在linux重启后自启动

要使 Spring Boot 服务的 JAR 包在 Linux 重启后自启动，您可以使用systemd。

编程日记2023/12/19 00:30:02

Linux配置nginx开机自启

1.先创建开机自启脚本。3.启动nginx服务。

编程日记2023/12/19 00:30:02

PowerShell实战：Get-Content命令使用详解

当值为0时一次发送所有文件内容。它的作用时影响显示内容所需要的时间，值越大第一行显示时间会变长，但合计的时间会减少，主要是针对哪些比较大的文件来说的。Get-Content 主要作用是获取路径指定位置的项（文本类文件）的内容，例如文件中的文本或函数的内容。-TotalCount：设置文件读取的行数（从文件头开始）也可以使用 head、first 等价替代，参数值为负数会读取整个文件内容。-Path:设置获取文件的路径，可以使用通配符，因此Get-Content 可以一次性读取多个文件或者多个目录的内容。

编程日记2023/12/18 23:22:35

如何在本地Docker中部署MinIO服务并实现远程访问管理界面

MinIO是一个开源的对象存储服务器，可以在各种环境中运行，例如本地、Docker容器、Kubernetes集群等。它兼容Amazon S3 API，因此可以与现有的S3工具和库无缝集成。MinIO的设计目标是高性能、高可用性和可扩展性。它可以在分布式模式下运行，以满足不同规模的存储需求。MinIO是一个开源的软件，可以免费使用，还可以在普通硬件上运行，降低了存储成本,下面介绍在本地Docker中部署 MinIO 服务,并实现远程访问管理界面,节约云服务器运行成本.

编程日记2023/12/18 22:28:49

hive常用SQL函数及案例

Hive会将常用的逻辑封装成函数给用户进行使用，类似于Java中的函数。好处：避免用户反复写逻辑，可以直接拿来使用。重点：用户需要知道函数叫什么，能做什么。Hive提供了大量的内置函数，按照其特点可大致分为如下几类：单行函数、聚合函数、炸裂函数、窗口函数。以下命令可用于查询所有内置函数的相关信息。

编程日记2023/12/18 17:56:34

解决 Hbuilder打包 Apk pad 无法横屏以及 H5 直接打包成Apk

下面是创建app 项目 wap站首页地址可以配置你H5的登录页也可以是你的index 页面然后会有一些配置你可以去百度 manifest.json 这个配置文件配置一下就可以了很方便打包后直接可以安装到手机上。如果你有自己的H5 也可以自己去创建一个空壳只需要加上你 H5的请求地址就可以了。当然你的 H5前提是做了自适应不然样式会很丑的。下面是manifest.json 配置文件。

编程日记2023/12/18 16:00:03

算法模板之双链表图文详解

本文主要讲解双链表模板，文中带有超详细的图文讲解，希望对你的算法学习有一定的帮助。

编程日记2023/12/18 11:30:05

Windows下配置最新ChromeDriver

选择与操作系统相对应的版本进行下载，并且与谷歌安装目录安装在同一位置，注意http status要为200才是正常可用。本例中，我的Chrome版本是120.0.6099.110，下载版本120.0.6099.71，可以正常使用。可以看到，当前chrome是最新版本：120.0.6099.110（正式版本）（64 位）。意思就是说：你的Chrome版本是118，但你的ChromeDriver版本是114。点击系统变量中的path，点击新增，并将chrome的安装目复制填入后，点击确定。

编程日记2023/12/18 11:02:13

讲解torch扩展维度

本文讲解了通过和两个函数来扩展张量的维度。这对于深度学习中的形状变换和维度操作非常有用。函数在指定位置插入一个新维度，返回一个新的张量；而函数是一个原地操作，直接修改原始张量。在使用时，需要根据具体需求选择适合的函数，并小心处理原地操作带来的影响。希望本文能够帮助你理解和使用和函数，并在深度学习中能够灵活应用。更多关于PyTorch的形状变换和张量操作，请参考PyTorch官方文档。

编程日记2023/12/18 10:00:17

讲解nginx.pid“ failed (2: The system cannot find the file specified

该脚本首先检查Nginx进程是否在运行，如果未运行则尝试重新生成"nginx.pid"文件，并启动Nginx服务。然后，脚本会启动Nginx服务。通过使用该脚本，你可以自动处理"nginx.pid" failed 错误，并重新生成所需的"nginx.pid"文件。nginx.pid 文件是Nginx Web服务器在运行过程中生成的一个文件，用于存储Nginx主进程的进程ID（PID）。它表明Nginx无法找到指定的"nginx.pid"文件，这个文件用于存储Nginx主进程的进程ID（PID）。

编程日记2023/12/18 10:00:17

讲解pytho作线性拟合、多项式拟合、对数拟合

综上所述，Matplotlib 是一个功能强大且灵活的可视化库，可以帮助我们轻松创建各种类型的图形，并对其进行定制和调整，以满足不同的需求。通过使用Python的numpy和matplotlib库，我们可以轻松实现线性拟合、多项式拟合和对数拟合。拟合（Fitting）是数据分析中常用的一种方法，它可以根据已有的数据，找到最适合这些数据的函数模型。Python提供了丰富的库和工具，可用于进行线性拟合、多项式拟合和对数拟合。假设我们有一组测量的物理实验数据，我们希望通过多项式拟合来拟合出一个近似的曲线。

编程日记2023/12/18 10:00:17

讲解nvcc fatal : A single input file is required for a non-link phase when an outputfile is specified

在使用nvcc编译和链接CUDA代码的过程中，要避免"nvcc fatal: A single input file is required for a non-link phase when an output file is specified"错误，你需要明确指定编译阶段和链接阶段的输入文件，并将它们分别与相关选项放在一起。这样做可以确保nvcc命令正确处理你的代码，并生成所需的输出文件。希望本文能够帮助你解决这个常见的错误，并更顺利地进行CUDA开发和GPU加速编程。

编程日记2023/12/18 10:00:17

讲解device:GPU:0 but available devices are [ /job:localhost/replica:0/task:0/dev

这个错误通常由于 GPU 驱动程序、CUDA 库、环境变量配置或访问权限问题导致。通过检查安装、配置和访问权限，并尝试适当的解决方法，您应该能够解决此问题，使代码能够在 GPU 上正常运行。深度学习框架的 GPU 加速是提高模型训练和推断效率的重要手段，因此解决这些配置问题对于实现更快的深度学习任务至关重要。希望本文对您解决此类问题时能够提供指导和帮助。

编程日记2023/12/18 10:00:17

Mybatis概述和快速入门

（1）Mybatis是一个半ORM（对象关系映射）框架，它内部封装了JDBC，开发时只需要关注SQL语句本身，不需要花费精力去处理加载驱动、创建连接、创建statement等繁杂的过程。程序员直接编写原生态sql，可以严格控制sql执行性能，灵活度高。（2）MyBatis 可以使用 XML 或注解来配置和映射原生信息，将 POJO映射成数据库中的记录，避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集。

编程日记2023/12/18 00:30:02

讲解异常: cv::Exception，位于内存位置 0x00000059E67CE590 处

在使用OpenCV进行图像处理和计算机视觉任务时，异常是一种常见的异常情况，通常由于内存分配失败引起。在解决该异常时，我们应该考虑增加系统可用内存、优化算法和数据集，以及检查代码中的内存管理问题。通过这些方法，我们可以更好地处理异常，提高系统的稳定性和性能。希望本文能够帮助您理解和解决异常，并顺利进行OpenCV图像处理和计算机视觉任务。

编程日记2023/12/17 23:30:08

讲解PyTorch 多分类损失函数

交叉熵损失函数和负对数似然损失函数是常用的多分类损失函数，根据具体的问题和需求选择合适的损失函数对模型进行训练和优化。然后，我们使用预训练的ResNet模型作为基础模型，将最后一层的全连接层替换为一个具有10个输出节点的线性层，以适应我们的分类任务。在实际应用中，您可以根据具体的场景和需求，选择适合的模型和损失函数，并根据需要进行相应的调整和优化。通过不断尝试和实践，您将能够选择最适合您的多分类问题的损失函数。为了对多分类问题进行有效的训练，我们需要使用适当的损失函数来度量模型预测与真实标签之间的差异。

编程日记2023/12/17 23:30:08

讲解selenium 获取href find_element_by_xpath

讲解selenium获取href - find_element_by_xpath

什么是XPath？

使用find_element_by_xpath获取href

Selenium的特点和优势

Selenium的应用场景

Selenium的核心组件

总结

相关文章：

讲解darknet: ./src/cuda.c:36: check_error: Assertion `0‘ failed.

利用systemd设置springboot微服务服务在linux重启后自启动

Linux配置nginx开机自启

PowerShell实战：Get-Content命令使用详解

如何在本地Docker中部署MinIO服务并实现远程访问管理界面

hive常用SQL函数及案例

解决 Hbuilder打包 Apk pad 无法横屏以及 H5 直接打包成Apk

算法模板之双链表图文详解

Windows下配置最新ChromeDriver

讲解torch扩展维度

讲解nginx.pid“ failed (2: The system cannot find the file specified

讲解pytho作线性拟合、多项式拟合、对数拟合

讲解nvcc fatal : A single input file is required for a non-link phase when an outputfile is specified

讲解device:GPU:0 but available devices are [ /job:localhost/replica:0/task:0/dev

Mybatis概述和快速入门

讲解异常: cv::Exception，位于内存位置 0x00000059E67CE590 处

讲解PyTorch 多分类损失函数

讲解OpenCV对图像的光照归一化处理

【Flink】官宣｜Apache Flink 1.17 发布公告

【Flink】字节跳动 Flink 基于 Slot 的资源管理实践

BigDecimal与Double的区别和使用场景

【Flink】如何在 Flink 中规划 RocksDB 内存容量？

【redis】redis的哨兵Sentinel高可用架构

spring 笔记九 Spring AOP

spring 笔记十 Spring事务管理

C++会搜索的二叉树（BSTree)

C++继承后的多态 | 抽象类

算法模板之单链表图文讲解

Java运算符及运算符的优先级【超详细】

Java中Jar包部署nohup后台启动定时按日期分割日志