Python+Selenium自动化-安装模块和浏览器驱动操作方法
1.安装模块文件
pip install selenium
2.安装浏览器驱动
我们主要用的浏览器驱动有chrome浏览器、firefox浏览器、还有就是无界面的chrome浏览器。
2.1.ChromeDriver驱动
首先,下载安装Chrome浏览器,这个很简单,就不在说明了。
安装ChromeDriver驱动,只有安装ChromeDriver,才能驱动Chrome浏览器完成相应的操作。
2.1.1.相关链接
官方网站:https://sites.google.com/a/chromium.org/chromedriver
下载地址:https://chromedriver.storage.googleapis.com/index.html
2.1.2.查看Chrome版本
点击Chrome菜单“帮助”→“关于Google Chrome”,即可查看Chrome的版本号.
2.1.3.下载ChromeDriver
打开ChromeDriver的官方网站,根据我们Chrome浏览器的版本号,下载对应的ChromeDriver驱动。
2.1.4.环境变量配置
在Windows下,下载完成后,将ChromeDriver的可执行文件chromedriver.exe文件拖到Python的Scripts目录下。
2.2.GeckoDriver驱动
对于Firefox浏览器来说,我们需要安装另一个驱动GeckoDriver。
2.2.1.相关链接
GitHub:https://github.com/mozilla/geckodriver
下载地址:https://github.com/mozilla/geckodriver/releases
2.2.2.下载GeckoDriver
在GitHub上找到GeckoDriver的发行版本,然后根据自己的系统和位数选择对应的驱动下载。
2.2.3.环境变量配置
在Windows下,直接将geckodriver.exe文件拖到Python的Scripts目录下。
3.实例
检查准备工作是否完善,简单进行下测试。使用selenium和Chrome驱动打开指定url网页。
# 1-导入模块文件
from selenium import webdriver
# 2-初始化浏览器为chrome浏览器
brower = webdriver.Chrome()
# 3-这里我们打开的是百度首页
brower.get('https://www.baidu.com/')
# 4-打印下网页标题
print(brower.title)
# 5-关闭浏览器
brower.quit()
完成后,程序会在控制台输出:百度一下,你就知道
4.浏览器操作方法
Chrome浏览器驱动、Firefox浏览器驱动、无界面的chrome浏览器操作方法
# 1.初始化浏览器为chrome浏览器
browser = webdriver.Chrome()
# 2. 初始化浏览器为firefox浏览器
browser = webdriver.Firefox()
# 3. 初始化浏览器为无界面的chrome浏览器
option = webdriver.ChromeOptions()
option.add_argument("headless")
driver = webdriver.Chrome(chrome_options=option)
推荐参考:
2.1 [Python3网络爬虫开发实战] 1.2.3-ChromeDriver的安装
2.2 [Python3网络爬虫开发实战] 1.2.4-GeckoDriver的安装
2.3 小白学爬虫-设置Selenium+Chrome代理