统计剑侠
看见 COS论坛 -> 其他统计应用领域 -> COS论坛八月份到访IP时间序列数据 。
1.第一步简化:
本来有31期数值,我主观只选择了11期拐点数值。
选择了下面11期数值,分别是第1,2,4,6,9,13,17,19,23,27,31期。
2.第二步简化:
11期数值又区别成为两部分,6个顶点,5个底点。那么原图可简单转化成为6个顶点5个底点的锯齿折线图:
6个顶点坐标数值分别是(1,403),(4,482),(9,541),(17,580),(23,688),(31,647)。
5个底点数值分别是(2,343),(6,280),(13,377),(19,389),(27,384)。
3.使用最小二乘方法就可以计算出来顶点和底点坐标四个数值规律。
当然用(季节交乘趋向模型,ARIMA模型)描述原图也可以,就是复杂了些。
我不知道我的想法和做法可以吗?
统计剑侠
原来折线图如何简化成为锯齿折线图的呢?
锯齿折线图由两部分特殊点构成,一类是顶点,另外一类是底点。
要根据一条判断准则:叫延后判断准则,目的是消除“虚假底点”和“虚假顶点”。
1.第一个点如果纵坐标数值比第二个低,那么就确定它是第一个底点。
2.第二个点如果纵坐标数值比第三个高,那么就确定它是第一个顶点。
3.那么第三个如果和第四个纵坐标数值相等的时候,我们要确定哪一个是底点呢?分2种情况判断:
1)如果第四点继续下降,那么第三个和第四个点就叫“虚假底点”,省略不考虑,考察后面一个点的情况。
2)如果第五点比第四点上升,那么确定第三个和第四个点的中间点是“真实底点”。作为第二个底点。
4.同样道理,对“虚假顶点”也可以作两种处理,要么淹没,要么选择它们的中间点。
现在只能主观这么选择,以后可以由电脑程序来这么选择确定。
时间序列分析中间的许多曲线图,都是由间隔观察数值构成,都是由小折线段连接起来的。
那么经过“延后判断准则”的处理,许多曲线图可以转化成为锯齿折线图。比如上面,本来有31期数值,就可以只选择11期拐点数值。
局部误差容许它存在,只是折线的整体特征没有大的改变,以方便进行宏观简便分析,顶点和底点坐标四个数值规律不难掌握了。