随机变量是把样本空间映射到实数空间,通常样本空间中的样本点和随机事件都与实际问题联系比较紧密,如:抛硬币正反面,产品合格不合格,电视机寿命是多少年,炮弹打多远等等,这些问题在样本空间的范畴不能反应问题的本质。通过引入随机变量,把这些具体问题的随机事件用实数轴上的点来表示,这样既能方便的描述问题的本质,也能把微积分理论引入到随机现象的研究中来。
若随机变量X取至多可列个值,则称X为离散型随机变量
设随机变量X可能的取值为$x_{k}(k=1,2,3,...)$记$$P\{X=x_{k}\} = p_{k}(k=1,2,3,...)$$为离散型随机变量的分布律。
若随机变量的取值充满了一个连续的实数区间,如:产品使用寿命、设计弹着点的坐标、一个地区的年平均气温及年平均降水量等随机变量,这种取值无法通过离散型随机变量逐点描述的方式来表述概率特性,因此引入连续性随机变量。
对于随机变量X,如果存在非负可积函数$f(x)$,使得对于任意实数$a,b(a<b)$有$$P\{a\lt X \le b\}=\int_{a}^{b}f(x)d_{x}$$则称X为连续型随机变量,称$f(x)$为概率密度函数(简称密度函数或密度).
其中t是逆序数,$p1,p2,...,pn$为1到n的全排列.
一共六个性质,两个推论
1. 余子式,代数余子式
2. 行列式展开法则:行列式等于它的任意一行(列)的个元素与其代数余子式之和,即:
$$D=\sum_{j=1}^{n}a_{ij}A_{ij} $$其中i代表任一行标 或: $$D=\sum_{i=1}^{n}a_{ij}A_{ij}$$ 其中j代表任一列标.
1. 线性方程组、矩阵定义
2. 线性变换、对角矩阵、单位矩阵、恒等变换
1. 矩阵加法
2. 数与矩阵相乘
3. 矩阵与矩阵相乘
4. 矩阵转置
5. 方阵的行列式
In [15]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 一维数据
s = pd.Series([1, 3, 5, np.nan, 6, 8])
s
Out[15]:
In [16]:
# 二维数据
dates = pd.date_range('2016-12-09', periods=6)
df1 = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
df1
Out[16]:
In [17]:
# Creating a DataFrame by passing a dict of objects that can be converted to series-like.
dic = {
'A': 1,
'B': pd.Timestamp('20161219'),
'C': pd.Series(1, index=list(range(4)), dtype='float32'),
'D': np.array([3]*4, dtype='int32'),
'E': pd.Categorical(['test', 'train', 'test', 'train']),
'F': 'foo'
}
dic
Out[17]:
In [18]:
df2 = pd.DataFrame(dic)
In [19]:
df2.dtypes
Out[19]:
In [20]:
df1.head()
Out[20]:
In [21]:
df1.tail(3)
Out[21]:
In [22]:
df1.index
Out[22]:
In [24]:
df1.describe()
Out[24]:
In [25]:
df1.T
Out[25]:
In [26]:
df1.sort_values(by='B')
Out[26]:
In [28]:
df1['A']
Out[28]:
In [31]:
df1[1:3]
Out[31]:
In [34]:
df1['2016-12-10':'2016-12-13']
Out[34]:
In [37]:
df1.loc(dates[0])
Out[37]:
In [39]:
df1.at[dates[0],'A']
Out[39]:
In [40]:
df1.iloc[3]
Out[40]:
In [ ]: