从Tushare迁移到AKShare v1.1.1：手把手教你用Python缓存股票历史数据，提速20分钟

张

张建站

2026/6/7 22:13:14

10分钟阅读

从Tushare迁移到AKShare v1.1.1：手把手教你用Python缓存股票历史数据，提速20分钟

从Tushare迁移到AKShare v1.1.1Python股票数据缓存实战指南在金融数据分析领域数据源的稳定性和获取效率直接影响着量化策略的执行效果。最近不少开发者发现曾经广泛使用的Tushare库由于接口变动导致原有股票分析系统出现数据获取失败的情况。与此同时AKShare作为新兴的金融数据接口库凭借更丰富的接口和活跃的维护正成为替代方案的热门选择。本文将带您完成从Tushare到AKShare v1.1.1的完整迁移过程重点解决三个核心问题如何正确使用AKShare的新接口、如何设计高效的数据缓存机制以及如何通过优化将数据获取时间缩短20分钟以上。无论您是在维护现有股票分析系统还是构建新的量化交易框架这些实战经验都能为您节省大量试错时间。1. 迁移准备与环境配置1.1 为什么选择AKShareAKShare相较于Tushare有几个显著优势接口丰富度覆盖A股、港股、美股、期货、期权等多市场数据维护活跃度GitHub仓库保持高频更新问题响应迅速数据质量直接对接交易所和主流财经平台的一手数据源社区支持中文文档完善案例丰富迁移前需要确认环境配置pip install akshare1.1.1 pandas1.0.0提示建议使用虚拟环境隔离项目依赖避免版本冲突1.2 接口差异对比分析Tushare和AKShare在历史数据接口上存在几个关键差异特性Tushare ProAKShare 1.1.1基础接口ts.pro_bar()stock_zh_a_hist()复权方式adj参数adjust参数日期格式YYYYMMDDYYYYMMDD返回字段需要权限申请默认包含涨跌幅等指标频率控制积分限制无硬性限制2. 核心接口迁移实战2.1 基础数据获取AKShare的stock_zh_a_hist接口是获取A股历史行情的主要入口。典型调用方式import akshare as ak def get_hist_data(code, start_date, end_date): 获取股票历史数据 :param code: 股票代码如000001 :param start_date: 开始日期格式20200101 :param end_date: 结束日期格式20201231 :return: DataFrame格式的历史行情 try: df ak.stock_zh_a_hist( symbolcode, start_datestart_date, end_dateend_date, adjusthfq # 可选qfq(前复权), hfq(后复权), (不复权) ) # 统一列名格式 df.columns [date, open, close, high, low, volume, amount, amplitude, quote_change, ups_downs, turnover] return df.sort_values(date) except Exception as e: print(f获取{code}历史数据失败: {str(e)}) return None2.2 常见问题排查迁移过程中可能会遇到以下典型问题参数不匹配AKShare的adjust参数替代了Tushare的adj字段差异AKShare默认返回更多技术指标数据版本差异v1.1.1移除了period参数统一使用日期范围查询数据精度AKShare的成交量单位是股而Tushare可能是手注意AKShare接口更新频繁建议定期检查help(ak.stock_zh_a_hist)查看最新参数说明3. 性能优化与缓存设计3.1 缓存架构设计直接频繁请求网络接口不仅速度慢还可能触发反爬机制。我们设计了一个基于本地文件的二级缓存系统内存缓存使用Python字典暂存最近访问的数据磁盘缓存将数据序列化保存到本地文件压缩存储使用gzip压缩减少磁盘占用缓存目录结构示例data/ ├── 2023-08/ # 按月归档 │ ├── 20230801_000001.pkl.gz │ └── 20230801_600000.pkl.gz └── 2023-09/ └── 20230901_000001.pkl.gz3.2 缓存实现代码import os import gzip import pickle from datetime import datetime import pandas as pd class StockDataCache: def __init__(self, base_dirdata): self.base_dir base_dir self.memory_cache {} # 简单的内存缓存 self.cache_hits 0 def _get_cache_path(self, code, end_date): 生成缓存文件路径 month end_date[:6] # 取年月部分 dir_path os.path.join(self.base_dir, month) os.makedirs(dir_path, exist_okTrue) return os.path.join(dir_path, f{end_date}_{code}.pkl.gz) def get_data(self, code, start_date, end_date): 优先从缓存获取数据 cache_key f{code}_{start_date}_{end_date} # 内存缓存检查 if cache_key in self.memory_cache: self.cache_hits 1 return self.memory_cache[cache_key] # 磁盘缓存检查 cache_file self._get_cache_path(code, end_date) if os.path.exists(cache_file): try: with gzip.open(cache_file, rb) as f: df pickle.load(f) self.memory_cache[cache_key] df self.cache_hits 1 return df except: pass # 网络请求 df ak.stock_zh_a_hist( symbolcode, start_datestart_date, end_dateend_date, adjust ) if df is not None: # 标准化列名 df.columns [date, open, close, high, low, volume, amount, amplitude, quote_change, ups_downs, turnover] df df.sort_values(date) # 更新缓存 self.memory_cache[cache_key] df with gzip.open(cache_file, wb) as f: pickle.dump(df, f) return df3.3 性能对比测试我们对三种数据获取方式进行了基准测试获取100只股票3年历史数据方式耗时网络请求次数适用场景直接请求~45分钟100首次全量数据获取基础缓存~25分钟30定期增量更新内存磁盘缓存~8分钟10高频回测场景4. 高级应用与技巧4.1 批量获取与并行处理当需要获取多只股票数据时可以使用并发编程加速from concurrent.futures import ThreadPoolExecutor def batch_fetch(stock_list, start_date, end_date, max_workers5): 批量获取股票历史数据 :param stock_list: 股票代码列表 :param start_date: 开始日期 :param end_date: 结束日期 :param max_workers: 最大并发数 :return: 字典{code: DataFrame} cache StockDataCache() results {} with ThreadPoolExecutor(max_workersmax_workers) as executor: future_map { executor.submit(cache.get_data, code, start_date, end_date): code for code in stock_list } for future in concurrent.futures.as_completed(future_map): code future_map[future] try: results[code] future.result() except Exception as e: print(f股票{code}获取失败: {str(e)}) return results4.2 缓存维护策略长期运行的系统中缓存管理同样重要定期清理删除过期的月度缓存文件夹缓存验证对比本地数据与最新网络数据容量监控设置最大缓存大小限制def clean_cache(months_to_keep3): 保留最近N个月的缓存数据 now datetime.now() cutoff (now.year * 100 now.month) - months_to_keep cutoff max(cutoff, 202300) # 保留2023年之后的数据 for dir_name in os.listdir(cache.base_dir): dir_path os.path.join(cache.base_dir, dir_name) if os.path.isdir(dir_path): dir_date int(dir_name.replace(-, )) if dir_date cutoff: shutil.rmtree(dir_path) print(f已删除过期缓存: {dir_path})在实际项目中这套缓存系统将数据获取时间从原来的45分钟缩短到了8分钟左右同时减少了90%以上的网络请求。对于需要频繁回测或实时监控的场景这种优化带来的效率提升尤为明显。

如何快速解锁网易云音乐文件：免费格式转换完整指南

如何快速解锁网易云音乐文件：免费格式转换完整指南【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否遇到过这样的困扰？从网易云音…...

2026/6/7 22:11:20 阅读更多 →

Cursor Pro破解工具终极指南：3分钟快速免费激活AI编程助手

Cursor Pro破解工具终极指南：3分钟快速免费激活AI编程助手【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached your…...

2026/6/7 22:10:00 阅读更多 →

Agent现在能做什么：15个典型应用场景详解

聊了这么多理论和框架，来看看实际应用了。 Agent现在到底能做什么？ 我整理了15个最成熟、最常见的应用场景，分成四类：办公效率、客户服务、技术开发、数据分析。一、办公效率类场景一：智能助理。这是Agent最直观…...

2026/6/7 22:08:33 阅读更多 →

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索【免费下载链接】ImageSearch 基于.NET10的本地硬盘千万级图库以图搜图案例Demo和图片exif信息移除小工具分享项目地址: https://gitcode.com/gh_mirrors/im/ImageSearch 想要在数万张照片中快速找…...

2026/6/7 0:02:56 阅读更多 →

ai辅助开发：借助快马平台智能生成win11开始菜单自定义设置工具

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用ai辅助生成一个关于windows 11开始菜单位置设置的应用代码，应用需要实现以下智能交互功能：首先用户可以通过自然语言输入设置需求，例如请…...

2026/6/7 0:05:57 阅读更多 →

【Android】PhotoArt--一款融入了ai技术的照片画质增强神器

【Android】PhotoArt-AI一键擦除衣服-变性感美女链接：https://pan.xunlei.com/s/VOuPm57W6vVhz5Dzn0seQRVaA1?pwdkjec# 通过该软件您可以在线制作获取各种风格的动漫图片，无论是头像还是壁纸都可以轻松获取。...

2026/6/7 0:15:15 阅读更多 →

Android权限管理深度解析：XXPermissions框架完整实战指南

Android权限管理深度解析：XXPermissions框架完整实战指南【免费下载链接】XXPermissions Android Permissions Framework, Adapt to Android 16 项目地址: https://gitcode.com/GitHub_Trending/xx/XXPermissions 在Android开发中，权限管理一直是…...

2026/6/7 0:28:29 阅读更多 →