计算机组织结构(九) RAID 磁盘冗余阵列
📚 文档目录合集-数的二进制表示-定点运算-BCD 码-浮点数四则运算-内置存储器-Cache-外存-纠错-RAID-内存管理-总线-指令集: 特征- 指令集:寻址方式和指令格式
RAID基本思想使用多个磁盘, 分散的 I/O 请求, 以至于单一的 I/O 请求可以被并行处理, 只要请求的数据分散在不同的磁盘上.
特点
RAID 是被视为一块逻辑磁盘的一组物理磁盘.
数据交叉分布在物理磁盘上.
冗余的磁盘可用于存储奇偶校验信息, 以保证再磁盘故障的情况下的数据可恢复性.
RAID 0数据在可用的磁盘上条带 (strip) 状排列, 如果数据跨物理磁盘, 则同时读写
不含冗余盘
用途:
高速率数据传输
高速 I/O 请求
与单个的大容量磁盘相比:
优点: 若两个不同的 I/O 请求等待不同的两块数据, 如果这两块数据位于不同的物理磁盘, 就能加速.
缺点: 若数据跨盘, 只要其中的一块硬盘坏了, 所有的都不能读取.
RAID 1所有的数据都按 RAID 0 的方式存取, 只是每个数据都存两份 ( 镜像 ).
优点: 恢复很简单, 可以加速读取 ( 若两 ...
计算机组织结构(十一) 总线
📚 文档目录合集-数的二进制表示-定点运算-BCD 码-浮点数四则运算-内置存储器-Cache-外存-纠错-RAID-内存管理-总线-指令集: 特征- 指令集:寻址方式和指令格式
总线芯片内部总线连接芯片的各个部分
例如连接寄存器, ALU和 CPU 的其他部分
通信总线连接主机和 I/O 设备或者连接不同的计算机系统
系统总线连接 CPU, 主存, I/O 控制器和其他的功能设备
内容总线可以分为三种功能组
数据线: 在系统模块之间移动数据. 数据线的数量决定了一次能能够传送的数据的最大容量
地址线: 指定数据线上的数据的来源或者去向. 地址线也用于 I/O 端口的寻址. 地址线的数量决定了寻址空间的大小
控制线: 控制对数据和地址线路的访问和使用.
各种控制信号:
时钟: 用于总线同步
总线请求(Bus Request): 表示模块需要获得对总线的控制
总线允许(Bus Grant): 表示发出请求的模块已经被允许控制总线
中断请求: 表示某个中断尚未被处理
中断响应: 未决的中断请求被响应
存储器写: 引起总线上的数据写入被寻址的单元
存储器读: 使所寻址的单元的数 ...
计算机组织结构(十) 内存管理
📚 文档目录合集-数的二进制表示-定点运算-BCD 码-浮点数四则运算-内置存储器-Cache-外存-纠错-RAID-内存管理-总线-指令集: 特征- 指令集:寻址方式和指令格式
过去, 只有操作系统和一个程序在内存中.
现在, 操作系统和多个程序都在内存中. 程序等待 I/O 时, 为了避免处理器等待, 需要进行优化, 使得更多的程序可以加载入内存.
内存管理: 在多程序设计系统中, 内存的 “用户部分” 应该被进一步划分以适应多个程序, 这是由系统动态决定的.
加载更多程序的途径
增大内存
使用交换和重叠技术
当没有程序就绪的时候, 系统载入程序
分区和分页
虚拟内存
请求分页
虚拟地址
分区固定大小分区系统: 固定的大小
用户程序: 固定的大小, 但各不相同. 当加载一个程序的时候, 将其载入刚好能够容纳下这个程序的最小的区中.
缺点: 产生大量内部碎片.
可变大小分区系统: 固定的大小
用户程序: 按需分配
缺点: 产生大量外部碎片
分页基本思想:
将内存分为固定大小的块, 称为页框(页帧), 将程序分为固定大小的块, 称为页
将页加载入 ...
数据科学基础(一) 随机事件及其概率
📚 文档目录随机事件及其概率随机变量及其分布期望和方差大数定律与中心极限定理数理统计的基本概念参数估计假设检验多维回归分析和方差分析降维
1.1 随机试验与随机事件
随机试验:
相同条件可重复
结果不止一个
无法预测
事件:每种结果,随机事件A、B、C.
基本事件: 相对于实验目的不可再分.
复合事件: 由基本事件复合.
1.2 样本空间
样本空间: 所有基本事件复合, 记作 $\Omega$.
样本点: $\Omega$ 中的元素 $\omega$.
以下两种是非随机/极端:
必然事件: 一定会发生的事件.
不可能事件: 一定不发生的事件.
无限可列个: 按某种规律排成一个序列.
1.3 事件间的关系
包含
交( 积 )
并( 和 )
差: $A - B = A - AB$
互不相容事件: $A$ 与 $B$不同时发生
对立事件: $A + B = \Omega$ 且 $AB = \phi$与互不相容事件的不同:
互不相容事件可以有多个, 对立事件只有两个.
互不相容事件可以均不发生, 对立事件必定发生一个.相关公式: $A-B=A - AB=A\overline ...
计算机组织结构(十二) 指令集: 特征
📚 文档目录合集-数的二进制表示-定点运算-BCD 码-浮点数四则运算-内置存储器-Cache-外存-纠错-RAID-内存管理-总线-指令集: 特征- 指令集:寻址方式和指令格式
机器指令特征CPU 的操作由它所执行的指令确定, 这些指令被称为机器指令. CPU 能执行的各种不同指令的集合称为 CPU 的指令集
指令周期指令周期: 指单条指令所需的处理过程
取指令: 每次从内存中取一条指令
执行指令: 执行每条指令
只有关机时, 程序执行才会停止, 或者遇到致命错误或者停止计算机的指令.
指令周期状态图:
带有中断的指令周期带有中断的指令周期:
带有中断的指令周期状态图:
机器指令要素
操作码:指定要执行的操作
源操作数引用:操作会涉及一个或多个源操作数, 这是操作所需的输入
结果操作数引用:该操作可能产生一个结果
下一指令引用:它告诉处理器这条指令执行完成后到哪儿去取下一条指令
指令表示
每条指令都由一个位序列表示
指令格式:指令被划分为字段,对应于指令的要素
对于大多数指令集,使用一种以上的格式
符号表示:帮助程序员和教科书的读者处理指令
操作码用 ...
计算机组织结构(十三) 指令集:寻址方式和指令格式
📚 文档目录合集-数的二进制表示-定点运算BCD 码-浮点数四则运算-内置存储器-Cache-外存-纠错-RAID-内存管理-总线-指令集: 特征- 指令集:寻址方式和指令格式
表示:
A: 指令中地址字段的内容
R: 指向寄存器的指令字段的内容
EA: 被访问未知的实际(有效)地址
(X): 存储器位置 X 或者寄存器 X 的内容
立即寻址 (Immediate Addressing)操作数存在于指令中:
操作数 = A
应用: 定义和使用常数, 或者设置变量的初始值.
优点: 获取操作书不需要访问存储器, 只获取指令
缺点: 数字的大小被限制为地址字段的大小
.jpg)
直接寻址 (Direct Addressing)地址字段包含着操作数的有效地址, 早期计算机常见
EA = A
优点: 只有一次存储器访问, 不需要进行专门计算
缺点: 只能提供有限的地址空间
间接寻址(Indirect Addressing)指令中地址字段只是一个存储器字地址, 而这个地址保存着操作数的全长度地址
EA = (A)
优点: 扩大了寻址空间
缺点: 需要访问 ...
数据科学基础(五) 数理统计的基本概念
📚 文档目录随机事件及其概率随机变量及其分布期望和方差大数定律与中心极限定理数理统计的基本概念参数估计假设检验多维回归分析和方差分析降维
5.1. 总体与样本5.2. 常用统计量定义
样本均值: $\overline{X}=\displaystyle\frac{1}{n}\displaystyle\sum_{i=1}^{n}X_i$
修正后的样本方差: $\begin{aligned}S^{2}=\frac{1}{n-1} \sum{i=1}^{n}\left(X{i}-\bar{X}\right)^{2}\end{aligned}$
样本均值和样本方差的性质
定理: 设总体$X$的均值为$EX=\mu$,方差为$DX=\sigma^2$,样本{$X_1,X_2,\ldots ,X_n$} 来自总体$X$ ,则:
$E\overline{X}=\mu$
$\displaystyle D\overline{X} = \frac{1}{n}\sigma^2$
$ES^2=\sigma^2$
前两者证明略. $ES^2=\sigma^2$ 的证明:
\begin ...
数据科学基础(二) 随机变量及其分布
📚 文档目录随机事件及其概率随机变量及其分布期望和方差大数定律与中心极限定理数理统计的基本概念参数估计假设检验多维回归分析和方差分析降维
2.1 随机变量将样本空间 $\Omega$ 中的每个元素 e 与实数对应起来.
定义:设随机试验的样本空间为 $S = {e}.\space X = X(e)$ 是定义在样本空间的实值单值函数. 称 $X = X(e)$ 为随机变量.
2.3 离散型随机变量及其分布律
离散型随机变量定义:
有限个
无限可列个
满足条件:
$p_k\geq0,k=1,2…$
$\sum^n_{k=1}p_k=1$
分布律:
P\{X = x_k\}=p_k,k=1,2...也可以用表格:
\begin{array}{|c|c|c|c|c|c|}
\hline X & x_{1} & x_{2} & \ldots & x_{n} & \ldots \\
\hline p_{k} & p_{1} & p_{2} & \ldots & p_{n} & \ldots \\
\hline
\end{array}
2.4 连续型随机变量及 ...
数据科学基础(三) 期望和方差
📚 文档目录随机事件及其概率随机变量及其分布期望和方差大数定律与中心极限定理数理统计的基本概念参数估计假设检验多维回归分析和方差分析降维
3.1 数学期望3.1.1 离散型数据的数学期望
$P(X=xk)= p_k,$ 若 $\sum^\infty{k=1}xkp_k$ 绝对收敛,则 $E(X)=\sum^\infty{k=1}x_kp_k$.注意:数学期望不一定均存在.
3.1.2 连续型数据的数学期望
$X$ 的密度函数为 $f(x),\int{-\infty}^{\infty}xf(x)dx$ 绝对收敛,则$Ex = \int{-\infty}^{\infty}xf(x)dx$
3.1.3 随机变量函数的期望$Y=g(X)$
离散 $E(X)=\sum x_i p_i,Y=g(X)$则$E(Y)=\sum g(x_i)p_i$
3.1.4 期望的性质
$EC=C$
$E(C_1X+C_2)=C_1EX+C_2$
若$X,Y$ 独立,则 $E(XY)=E(X)E(Y)$
$E(X \pm Y)=EX \pm EY$
3.2 方差3.2.1 方差的 ...
数据科学基础(四) 大数定律与中心极限定理
📚 文档目录随机事件及其概率随机变量及其分布期望和方差大数定律与中心极限定理数理统计的基本概念参数估计假设检验多维回归分析和方差分析降维
4.1 大数定律
大量重复实验的平均结果的稳定性.
4.1.1. 马尔可夫不等式
$P\left{X\geq a\right}\leq\displaystyle\frac{EX}{a}$
证明:$EX=\displaystyle\int_0^{\infty}xf(x)dx=\int_a^{\infty}xf(x)dx+\int_0^{a}xf(x)dx\geq\int_a^{\infty}xf(x)dx\geq\int_a^{\infty}af(x)dx=a P\left{X\geq a\right}$
4.1.2. 切比雪夫不等式
定理: 若 $EX$ 和 $DX$ 均存在, $\forall \epsilon >0$,均有 ${|X-EX|\geq \epsilon } \leq \frac{DX}{\epsilon ^2}$
证明:
\begin{aligned}\{|X-EX|\geq \epsilon \}&=\int_ ...
