Python爬取六国家（地区）最流行的股票并保存到excel的不同的工作表中

问题

爬取“英为财情”网站中最活跃股票数据。
网站url：https://cn.investing.com/equities/most-active-stocks
爬取括号内指定6个热门数据（中国、中国香港、新加坡、美国、英国和德国），保存在excel的一个工作簿中，但要对不同的国家保存为不同的工作表。

打开网站后页面显示如下

网页分析

查看网页的源代码后发现股票名都在class为left bold plusIconTd elp的td下的a标签的text文本中

当我们选择新加坡的时候，URL变为https://cn.investing.com/equities/most-active-stocks?country=singapore

所以只需要修改?后面country的值既可以获得其它国家（地区）的股票数据。

步骤

一、获得请求头

使用审查元素功能可以简单的获得host和user-agent

headers={
    'Host': 'cn.investing.com',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 Edg/84.0.522.40'

二、导入需要的库

#!/usr/bin/env python
# coding: utf-8

import pandas as pd
import time
import requests
import openpyxl
from bs4 import BeautifulSoup

三、定义获取页面的函数

def get_page(url,params=None,headers=None,proxies=None,timeout=None):

    response = requests.get(url, headers=headers, params=params, proxies=proxies, timeout=timeout)
    print("解析网址：",response.url)
    page = BeautifulSoup(response.text, 'lxml')
    print("响应状态码：", response.status_code)
    return page

四、循环获得每个国家（地区）的股票

先将国家（地区）传入的参数放入列表中

countrys = [
    'china',
    'hong-kong',
    'singapore',
    'uk',
    'usa',
    'germany'
]

因为防止工作表覆盖，所以先定义一个writer对象

writer = pd.ExcelWriter('stocks.xlsx')

根据之前的分析获取股票数据并将其保存到stocks.xlsx文件中。
每个国家（地区）对应一个工作表。
time.sleep(1)防止爬取太快导致被反爬

for country in countrys:
    url = 'https://cn.investing.com/equities/most-active-stocks'

    headers={
        'Host': 'cn.investing.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 Edg/84.0.522.40'
    }

    params={
        'country' : country
    }
    page = get_page(url,headers=headers,params=params)
    
    stocks = []
    stocks_list = page.find_all('td','left bold plusIconTd elp')
    for stock in stocks_list:
        stocks.append(stock.a.text)
        
    dataframe = pd.DataFrame({'股票':stocks})
    dataframe.to_excel(writer, sheet_name=country, header=None, index=False)
    
    time.sleep(1)
    
writer.close()

完整代码

#!/usr/bin/env python
# coding: utf-8

import pandas as pd
import time
import requests
import openpyxl
from bs4 import BeautifulSoup


def get_page(url,params=None,headers=None,proxies=None,timeout=None):

    response = requests.get(url, headers=headers, params=params, proxies=proxies, timeout=timeout)
    print("解析网址：",response.url)
    page = BeautifulSoup(response.text, 'lxml')
    print("响应状态码：", response.status_code)
    return page

countrys = [
    'china',
    'hong-kong',
    'singapore',
    'uk',
    'usa',
    'germany'
]

writer = pd.ExcelWriter('stocks.xlsx')

for country in countrys:
    url = 'https://cn.investing.com/equities/most-active-stocks'

    headers={
        'Host': 'cn.investing.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 Edg/84.0.522.40'
    }

    params={
        'country' : country
    }
    page = get_page(url,headers=headers,params=params)
    
    stocks = []
    stocks_list = page.find_all('td','left bold plusIconTd elp')
    for stock in stocks_list:
        stocks.append(stock.a.text)
        
    dataframe = pd.DataFrame({'股票':stocks})
    dataframe.to_excel(writer, sheet_name=country, header=None, index=False)
    
    time.sleep(1)
    
writer.close()

本文地址：https://blog.csdn.net/weixin_44547562/article/details/107433815

《Python爬取六国家（地区）最流行的股票并保存到excel的不同的工作表中.doc》

下载本文的Word格式文档，以方便收藏与打印。

Python爬取六国家（地区）最流行的股票并保存到excel的不同的工作表中

问题

网页分析

步骤

一、获得请求头

二、导入需要的库

三、定义获取页面的函数

四、循环获得每个国家（地区）的股票

完整代码

相关推荐

最流行的AI绘图工具Midjourney，你不得不知道的使用技巧

2021-07-06：股票问题3。给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成两笔交易。注意：你不能同时参与多笔交易（

中国省市区--地区SQL表

2021-07-05：股票问题2。给定一个数组 prices ，其中 prices[i] 是一支给定股票第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易（多次买卖

在量化金融中15个最流行的Python数据分析库

使用哈工大LTP进行文本命名实体识别并保存到txt

2021-07-07：股票问题4。给定一个整数数组 prices ，它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成

免费股票数据API接口

Python爬取六国家（地区）最流行的股票并保存到excel的不同的工作表中

问题

网页分析

步骤

一、获得请求头

二、导入需要的库

三、定义获取页面的函数

四、循环获得每个国家（地区）的股票

完整代码

相关推荐

最流行的AI绘图工具Midjourney，你不得不知道的使用技巧

2021-07-06：股票问题3。给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。注意：你不能同时参与多笔交易（

中国省市区--地区SQL表

2021-07-05：股票问题2。给定一个数组 prices ，其中 prices[i] 是一支给定股票第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易（多次买卖

在量化金融中15个最流行的Python数据分析库

使用哈工大LTP进行文本命名实体识别并保存到txt

2021-07-07：股票问题4。给定一个整数数组 prices ，它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成

免费股票数据API接口

2021-07-06：股票问题3。给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成两笔交易。注意：你不能同时参与多笔交易（