In [1]:
%matplotlib inline
import numpy 
import pandas
import matplotlib.pyplot as plt
import seaborn as sns
import re

In [79]:
accounting_neeq = pandas.read_csv("../data/NEEQAccountingData.csv", parse_dates=[2, 6, 29, 30])

In [6]:
items =  ["资产总计", "营业收入", "归属母公司股东的净利润", "经营活动产生的现金流量净额", "固定资产"]
index_drops = accounting_neeq[accounting_neeq[items].isnull().all(axis=1)].index

In [14]:
accounting_neeq.loc[index_drops, :].to_csv("../data/accountingtmp.csv", index=False)

In [80]:
accounting_neeq.loc[accounting_neeq["relativeYear"] == 0, "挂牌前后"] = "挂牌后"

In [91]:
accounting_group = accounting_neeq.groupby(["证券代码"])

In [77]:
x = accounting_neeq[accounting_neeq["证券代码"] == "430699.OC"]

In [100]:
def relative_years_correction(data):
    year = data.loc[data["relativeYear"] == 0, "年度"]
    if len(year) != 0:
        relativeYears = numpy.array(data.loc[:, "年度"] - int(year))
    else:
        year = data.loc[data["relativeYear"] == -1, "年度"]
        relativeYears = numpy.array(data.loc[:, "年度"] - int(year) - 1)
        
    data.loc[:, "relativeYear"] = relativeYears
    return data

In [101]:
accounting_neeq = accounting_group.apply(relative_years_correction)

In [103]:
accounting_neeq.to_csv("../data/NEEQAccountingData.csv", index=False)

In [2]:
accounting_neeq = pandas.read_csv("../data/NEEQAccountingData.csv", parse_dates=[2, 6, 29, 30])

In [8]:
TooManyYears = ["832715.OC", "834019.OC"]
RevenueOnly = ["833318.OC", "834178.OC", "834906.OC", "835024.OC", "835433.OC", "834090.OC", "835919.OC", ]


Out[8]:
证券代码                       430001.OC
年度                              2003
挂牌日期             2006-01-18 00:00:00
主办券商                    申银万国证券股份有限公司
所属园区                中关村科技园区非上市股份有限公司
所属证监会行业                        软件与服务
摘牌日期             2010-12-06 00:00:00
挂牌年度                            2006
挂牌月份                               1
证券简称                        世纪瑞尔(退市)
资产总计                     1.03696e+08
归属母公司股东的权益               7.06015e+07
营业收入                     4.02414e+07
营业成本                     1.35694e+07
销售费用                     7.71494e+06
管理费用                     9.77092e+06
财务费用                          235899
归属母公司股东的净利润               1.0645e+07
非经常性损益                           NaN
扣除非经常性损益后的净利                     NaN
经营活动产生的现金流量净额            1.08433e+07
应收账款                     2.71217e+07
固定资产                     2.93955e+07
ROA                              NaN
折旧                            943428
长期待摊费用摊销                      610643
存货的减少                   -2.69231e+06
经营性应收项目的减少              -1.38316e+07
经营性应付项目的增加               1.34407e+07
实际披露日期                           NaT
报告期                              NaT
挂牌前后                             挂牌前
relativeYear                      -2
Name: 0, dtype: object

特例

Wind数据库中有些无法确认来源的信息,比如金田铜业(834178)的营业收入可以追溯到2003年以前,但是公司是2015年挂牌的公司,所以,这一部分专门列出来无法有同花顺等其他数据库相互确认的公司财务信息。部分公司由于转板之类的原因导致数据历史记录很长,这包括了

  • 新三板内转板上市,大自然(834019)。
  • 申请IPOs但是被证监会否决,2008年申请IPO被证监会否决的华信股份(832715),2012年提出IPO申请的西部超导(831628.OC),2011年提出IPO被否决的盛瑞传动(833283.OC)

In [2]:


In [ ]:


In [ ]: