当前仓库属于关闭状态,部分功能使用受限,详情请查阅 仓库状态说明
1 Star 0 Fork 0

庵中十三居士 / chi-square-statistic-python
关闭

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
MIT

股票价格变化前后相关性分析工具

目前,此仓库已经停止更新很久了。新的分析工具:https://gitee.com/az13js/satool,可以做到更好的前后相关性分析。

使用方法

准备文件data_stocks.csv,格式(至少每个股票需要100个样本数据):

时间,股票A,股票B
"2020-01-01",120.01,98.12
"2020-01-02",126.01,98.01
"2020-01-03",124.5,100.12

在终端执行

$ python data_process.py

效果

以下是我运行时输出的部分结果

文件 "data_stocks.csv" 一共有 502 列。
分析第 2 列的数据
卡方检验的表格:
3394 3416 6810
3255 3236 6491
6649 6652 13301
连续增加的概率是 25.516878 %
先减少后增加 25.682280 %
先增加后减少 24.471844 %
连续减少的概率是 24.328998 %
卡方统计量是:0.12601078613703862
有百分之 0.000 的把握认为第 2 列的数据前后变化存在关联关系
--------------------完成--------------------
分析第 3 列的数据
卡方检验的表格:
2691 2840 5531
2836 2656 5492
5527 5496 11023
连续增加的概率是 24.412592 %
先减少后增加 25.764311 %
先增加后减少 25.728023 %
连续减少的概率是 24.095074 %
卡方统计量是:9.826308069266396
有百分之 99.500 的把握认为第 3 列的数据前后变化存在关联关系
--------------------完成--------------------

原理

data_stocks.csv是包含待分析数据的csv格式文件,包含表头,表头是第一行且其它行都是数字组成的数据,且不存在空的内容。每一行的列数都是一样的。这些数据就是股票的价格,每一列就是一个股票,每一列的行从上到下按时间从早到晚顺序排列。其中第一列是时间,时间不会被分析。

data_stocks.csv的数据进行提取分析,过程如下:每一列单独分析一次,如果有k列就分析k次。第一列是时间,第一列不会被分析,也就是分析的列k>1k<KK是数据总列数。其中每一列的第一行是表头,表头也不会被分析,也就是如果一共有I行,那么第i=1行不会被处理。表格的K>1I>100,使得至少有一个股票被处理,被处理的数据大于99个,因为比较大的数据量可以使统计结果相对合理。

处理过程是:每次分析按顺序取三行数据出来(数据不重复使用,最后不够三个的丢弃),第ii+1i+2行,那么存在事件Ai+1行的值大于i行,事件Bi+2行的值大于i+1行(暂时不考虑存在不增不减的样本)。如果股票的价格的变化与先前的价格变化无关,对事件AB进行独立性检验的结果应该是AB彼此没有联系,相反如果股票价格变化前后有关系,那么事件AB就不是独立的。这里用来分析独立性的依据是卡方统计量。

The MIT License (MIT) Copyright © 2020 az13js Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the “Software”), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED “AS IS”, WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

简介

卡方统计量的股票价格变化前后相关性分析工具 展开 收起
Python
MIT
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/az13js/chi-square-statistic-python.git
git@gitee.com:az13js/chi-square-statistic-python.git
az13js
chi-square-statistic-python
chi-square-statistic-python
main

搜索帮助