采用python获取股票数据的开源库

吴宇 2020-06-22 6℃ 0条

Python是一门比较全面与平衡的语言,既能满足包括web在内的系统应用的开发,又能满足数据统计分析等数学领域的计算需求,同时也能作为胶水语言跟其它开发语言互通融合。在数据分析方面,没有其他语言能像Python这样既能精于计算又能保持性能,对于时间序列数据的处理展现了简单便捷的优势。

Tushare: 获取金融数据开源平台

为什么是Python?

       就跟javascript在web领域无可撼动的地位一样,Python也已经在金融量化投资领域占据了重要位置,从各个业务链条都能找到相应的框架实现。

       在量化投资(证券和比特币)开源项目里,全球star数排名前10位里面,有7个是Python实现的。从数据获取到策略回测再到交易,覆盖了整个业务链。

      而全球注册用户数最多的商业量化平台Uqer优矿,也同样是基于Python实现和提供服务的。国内后来的其他量化平台,例如ricequant和joinquant,也主推Python环境。可见Python在量化平台应用的绝对占有程度。

      Python是一门比较全面与平衡的语言,既能满足包括web在内的系统应用的开发,又能满足数据统计分析等数学领域的计算需求,同时也能作为胶水语言跟其它开发语言互通融合。

      在数据分析方面,没有其他语言能像Python这样既能精于计算又能保持性能,对于时间序列数据的处理展现了简单便捷的优势。而如此适用的特点,主要得益于有如下框架和工具的支持:

  • Numpy:底层基于C实现的科学计算包

  1. 具有强大的N维数组对象Array
  2. 具有数据广播功能的函数库
  3. 具有完整的线性代数和随机数生成函数
  • SciPy:开源算法和数学工具包

  1. 最优化线性代数、积分、插值、特殊函数
  2. 快速傅里叶变换
  3. 信号处理和图像处理
  4. 常微分方程求解
  5. 其他科学与工程中常用的计算

       其功能与Matlab和Scilab等类似

  • Pandas:起源于AQR的数据处理包,具有金融数据分析基因

  1. 基于Series、DataFrame和Pannel多维表结构数据
  2. 数据自动对齐功能
  3. 数据清洗和计算功能
  4. 时间序列数据快速处理功能
  • Matplotlib:基于Python的数据绘图包,能够绘制出各类丰富的图形和报表

      另外,Python在机器学习领域的应用也越来越多,其中的开源的项目包括了scikit-learn、Theano、Orange等。

      金融领域主要的Python书籍:

      《Python for Data Analysis》

      《Python for Finance》

      《Mastering Python for Finance》

      《Maching Learning in Action》

标签: python

非特殊说明,本博所有文章均为博主原创。