• rationales:基本原理
  • discourse:语篇
  • anticlimax: 虎头蛇尾
  • prevail: 流行
  • hedging: 模糊的
  • bjectivity: 客观的

1 Overview

1-1 Register

register 语域:写作、演讲风格,代表了语言正式的程度

5 Registers

  • Static (frozen) 套话
  • Formal (regulated)
  • Consultative (professional/ academic) 商议的
  • Casual (group)
  • Personal (intimate)

1-2 Title

S.C.I:

  1. specific
  2. concise
  3. informative

HOW:

  1. Choose a topic: interesting
  2. Narrow down: specific
  3. Paraphrase: noun phrase

1-3 Nominalization 名词化

Why

  1. increase information density and facilitate efficiency and accuracy of communication.
  2. express abstract concepts (e.g., revolution, possibility) 描述抽象概念
  3. hide the agent behind an action
  4. improve flow of writing , maintain connections between ideas
  5. make writing more “written” and professional

How:

  1. a simple sentence
  2. nominalized subject
  3. second verb
  4. finisher idea

1-4 Personal Pronouns

并非完全不能用第一人称

Avoid first and second person pronouns to be impersonal and scientific

Use gender-fair language

  • Use "he or she" or "a person" instead of "he"

1-5 Word Choice and Sentence Variety

1-5-1 Word choice

Abstract and concrete words

  • Abstract: loyal, love
  • Concrete: battle, horse

Generral and specific words

  • general: tree
  • specific: southern red oak

Denotation and connotation

指示词(客观)和内涵词(带感情色彩的词)

denotationconnotation
primary or literal meaningsecondary or implied meanings
exact or surfacebaggage or associations
tip of icebergimpart the most meaning
e.g. "house"e.g. "home"

Figurative speech

生动性

employs figures of speech

  1. simile,明喻
  2. metaphor,隐喻
  3. personification,拟人

Choose appropriate vocabulary

  1. Avoid using unfamiliar synonyms 避免使用生僻的同义词,不要装逼
  2. Avoid slang 避免俚语
  3. Avoid wordiness 避免冗长

1-5-2 Sentence variety

四种基础句式:

  1. 简单句
  2. 并列句
  3. 复合句
  4. 并列复合句

2 Literature Review

  1. Information prominent citation:作者待在括号里
  2. Author prominent citation:作者是主语
  3. Weak author prominent citation:authors 是主语,一群作者待在括号里

2-1 Reviewing Literature

A literature review is a careful examination of a body of literature pointing toward the answer to your research question.

Include a critical analysis of various opinions from credible sources

2-2 Writing Literature Review

简单文献综述模型:

  • 研究兴趣
  • 研究话题
  • 文献综述
  • 研究论文

复杂文献综述模型:在简单模型的基础上增加

  • 研究问题
  • 研究项目

顺序:

  • Chronological(时间) - Trace the development of the topic over time
  • Thematic(主题) - Address different aspects of the topic in subsections
  • Methodological(方法) - Compare the results & conclusions from different approaches
  • Theoretical(理论) - Discuss various theories, models, and definitions of key concepts.

技巧:

  1. introduction to topic
  2. support from the literature
  3. mini summary
  4. introduction to next topic.

2-3 Avoiding Plagiarism(剽窃)

方法:

  1. Quoting(引用)
  2. Paraphrasing(转写)
  3. Summarizing(概括)

2-4 Reporting Verbs

Function and strengthExample verbs
NEUTRAL: verbs used to say what the writer describes in factual terms, demonstrates, refers to, and discusses, and verbs used to explain his/her methodology.describe, show, reveal, study, demonstrate, note, point out, indicate, report, observe, assume, take into consideration, examine, go on to say that, state, believe (unless this is a strong belief), mention, etc.
TENTATIVE: verbs used to say what the writer suggests or speculates on (without being absolutely certain).suggest, speculate, intimate, hypothesize, moot, imply, propose, recommend, posit the view that, question the view that, postulate, etc.
STRONG: verbs used to say what the writer makes strong arguments and claims for.argue, claim, emphasize, contend, maintain, assert, theorize, support the view that, deny, negate, refute, reject, challenge, strongly believe that, counter the view/argument that, etc.

2-5 Tenses in Literature review

常用一般现在时、现在完成时

一般现在时:陈述事实或者真理的东西

只有在以下情况可以用一般过去时:

  1. 主句出现年份、时间(不是括号)
  2. 提到废弃研究

3 Methods and Results

“限制条件”预防了数据失效

3-1 The Structure of the Method Section

==Different titles of the method section==

  • Materials and Methods
  • Theory and Methods
  • Theoretical Framework and Methods

The major elements in the method section

  • The method section
    • Methodology
    • The rationales
    • The fundamental reasons or principles of doing things
  • Steps
  • Materials

避免抄袭:

  • 感谢作者
  • 熟悉实验设计和实施
  • 好好引用

3-2 The Structure of the Results Section

Major elements

  • The statement showing where the results can be found
  • The statement presenting the most important findings
  • The statement commenting on the results

The order of the results

  • Research questions
  • Research methods

The language focuses

  • Sequential markers
  • Graphic descriptions
  • Comparison and contrast

3-3 Sequential Markers

Importance of sequential markers

  • Building up connections between ideas
  • Ensuring that sentences and paragraphs flow together smoothly

3-4 Graphic Description

Description of Graphs

  1. Introduce the graphic information briefly and indicate the main trend. Normally it includes the place, time, content and purpose of the graph;
  2. Describe the relevant and most important or signi ficant data and make some comparison if necessary;
  3. Summarize the data/trends

Expressions for highlighting significant data in a table/chart

  • some adjectives such as “apparent”, “clear”, “interesting”, “obvious”, “revealing” and “significant”

3-5 Comparison and Contrast

  • 比较:相同点
  • 对比:不同点

Two major ways of organization:

  1. Block comparison or block contrast(分块对比)
    1. To examine one thing thoroughly and then examine the other
  2. Alternating comparison or alternating contrast(交替对比)
    1. To examine two things at the same time, discussing them point by point

Tips for making comparison or contrast

  • Not all the information has to be compared or contrasted with each other.
  • It is not necessary to lay equal emphasis on every change.
  • The comparison/contrast should be supported by concrete and relevant facts or data.

4 Discussion & Conclusion

4-1 Structure of Discussion Section

7 elements the Discussion section typically contains:

  1. An overview ...
  2. A consideration ...
  3. Implications ...
  4. A careful examination ...
  5. Limitations ...
  6. Recommendations ...
  7. Implications ...

4-1-2 Strategies and steps to structure the Discussion

How to begin the Discussion

  1. Remind readers
  2. Refer back to the questions
  3. ==Refer back to papers==
  4. Briefly restate ... from your Results

How to compare my work with those of others

4-2 Structure of Conclusion Section

Key elements of Conclusions section:

  1. a very brief revisit of the most important findings ...
  2. a final judgment on the importance and significance of those findings ...
  3. an indication of the limitations ...
  4. suggestions for ...
  5. recommendations for ...

Typical issues in structuring the Conclusion

  1. Redundancy: repetition of
  2. Raising a Totally New Point: introducing less ...
  3. Overstatement (夸大): making immoderate...
  4. Anticlimax(虎头蛇尾):failure to ...

Discussion sections which also have a Conclusion may end:

  • Tell your readers ... But you must ... If you repeated
  • Suggest ways that
  • Say if and / or why you ignored
  • Admit ...
  • Reiterate your reasons for ...

4-3 Language Focus 1: Cause and Effect

  • Identifying causes and effects
  • Drafting thesis statements for causes or effects
  • Tips on planning causes and effects
    1. Distinguish direct and indirect causes and effects.
    2. Group different causes and effects
    3. Avoid mistaking coincidence (two unrelated things happening together) for cause or effect
    4. Avoid oversimplification
      1. 因为许多问题非常复杂

4-4 Language Focus 2: Paraphrasing

Why

  • Plagiarism detection system
  • A case of unintentional plagiarism

How

  • Lexical(词汇)
    • 同义词
    • 改词性
  • Syntactic(句法)
    • 双重否定
    • 主语换位
    • 主被转换
    • 语序转换
  • Combined

4-5 Language Focus 3: Strong Restatement of the Research Objective

  • Two features of a strong thesis statement
    • It makes a claim that requires ...
    • It makes a claim that offers ...
  • Five kinds of weak thesis statements
    • Statements that make no claim
    • Statements that are obviously true or a statement of fact
    • Statements that restate conventional wisdom
    • Statements that offer personal conviction as the basis for the claim
    • Statements that make an overly broad claim

5 Publication

5-1 Abstract

Essential elements:

  • the background
  • the problem
  • the methods
  • the results
  • the implications
ActionTense
Giving background details一般现在时
Describing the research activity一般过去时 或 现在完成时
Describing the methods一般过去时(主动或被动)
Reporting results一般过去时
Stating conclusions一般现在时
  • 背景/目标:一般现在时
  • 过程/方法:一般过去时
  • 结果

The Types of abstracts

  1. Informative abstract
  2. Structured abstract
    1. 分段,每段开头为粗体的 Aim, Methods, Results, Research limitations/implications 或 Conclusion

5-2 Keywords

Definition of keywords:

  • standout within the Abstract
  • important words in the abstract
  • emphasize the key information for readers

Purpose of keywords:

  • increase the probability that a paper will be read and retrieved
  • potentially improve citation counts and journal impacts
  • know what words reflect the key information of the paper
  • read more carefully when meeting these words in the paper

Categories:

  • Discipline
  • Topic
  • Location
  • Methods
  • Data source

Number of keywords

  • can’t be too few or many
  • 3~5 in journals
  • trade-off between the keywords to meet the limitation requirements for keywords
  • choose the keywords from recent or often-cited titles close to their contribution

5-3 Reference

  • IEEE: [编号]. 作者名缩写. 作者姓, “文章题目,” 斜体期刊名称, 城市, 洲, 国家, 月日, 年, 页码
  • MLA: 作者姓, 作者名. “文章题目.” 斜体期刊名称, vol. 期刊号, no. 发行号, 发行年份, pp. 页码

Functions

  • used to avoid plagiarism
  • tell editors and readers what sources have been cited in the paper
  • help readers to use the materials to refer to when they write papers

Standard of a good reference:

  1. Authoritative
  2. Up-to-date
  3. Journal-targeted

5-4 Acknowledgement

Two main types of acknowledgements

  • One is in a paper, and expresses the thanks to the organizations or projects or funds.
  • The other is in a dissertation(大论文) as mentioned in the first part.

5 Submitting: writing the journal submission cover letter

Why a convincing cover letter?

  • Highlighting the merit and significance
  • Interesting the editor

What is included in the cover letter ?

  • Follow the author guide.
  • include essential information
  • claim the originality of the paper

What should be avoided in the cover letter?

  • Don't use too much jargon and acronyms.
  • Don’t exaggerate.
  • Don't make it lengthy.
  • Don't try to be entertaining.

20 分钟做完客观题

  • empty introductory phrases:空的介绍性短语,客观

  • hedging language:模糊语,客观,避免过于绝对

  • trivial:琐碎的

  • current study

  • this study set out to tackle ...

  • The project undertaken

  • aimed to

  • show our gratitude

  • manuscript:稿子

  • Please find the attached manuscript

  • subject to:受...影响,屈服于

  • bring about:引起

  • syntax:句法

  • plunge:骤降

  • prevalent:普遍的

  • By contrast

  • proportion:比例

  • expenditure:开支

  • bead:珠子

  • reaffirm:重申

  • diffuse

  • quantitative/qualitative analysis

  • graduate student:研究生

Basic Research or otherwise called as pure or fundamental research, is one that focuses on advancing scientific knowledge for the complete understanding of a topic or certain natural phenomenon

基础研究是扩展科学知识

注意事项

改写句子不一定就是被动句,也可以加名词让句子复杂化

用 including 而不是 etc.

少用否定:not much(选择题里看见就排除)

句子不要太短

选项多于空的要考虑多选题

highlight adj.:不是结论本身的性质的形容词,只是强调、突出

有疑问的选项就尝试带进去理解,说不定是整个句子理解错了

conclusion 不能引用了

作文素材

形容词

  • considerable:可观的
  • numerous
  • uncertain
  • principal:主要的

动词

  • obtain
  • fluctuate:起伏
  • encounter
  • concur with:与...一致认为
  • perform
  • accord with:与... 一致

名词

  • consequence

  • administer/complete questionnaire

易错

名词化

  • increase
  • eliminate
  • specificity
  • specialization
  • speciality
  • sufficiency
  • inequality

课程内容和要求

  • 教材:《信息论与编码》,参考书:《信息论——基础理论与应用》
  • 开卷考试,卷面占总成绩 60%,可以带计算器

简答题就简答,不要太多

信息度量和三大定理

主要计算题:信源编码和信道编码

的最大值就是信道容量

平均功率

平均交流功率就是方差,就是自相关函数的峰值

熵和信道容量要写单位

导数和积分表

  • 给定方差情况下,高斯信源的信息率失真函数最大,即最难压缩;
  • 给定方差情况下,噪声服从高斯分布时的信道容量最小

设函数求导比大小

高斯:

切比雪夫不等式:

第二章

Jensen 不等式(凹函数定义):

消息中平均每个符号携带的信息量有别于离散平均无记忆信源平均每个符号携带的信息量,后者是信息熵

若信源熵居然大于等概分布的信源熵,则一定是 信源空间不满足概率空间的完备集,譬如概率之和不为1

  • bit
  • bit/符号
  • K 重扩展信源的熵:
  • 平均符号熵
  • 互信息量,没有负号!
  • 平均互信息量

第三章

联合熵与条件熵的关系:

  • 信源的冗余度:

第四章

平均码长是加权的,且 K 重扩展的平均码长单位为 码元/K个符号,往往要再除以 K

:乘公比错位相减

单义可译码:

  1. 等长码,且各消息对应码字不同
  2. 变长码,且不能用不同的多个码字拼出相同的一串序列,譬如
  3. 也可以直接算单义可译码和即时码的必要条件: 为各码长,D 为符号种数
    • 满足 Kraft 不等式只是表明这种码长分布可以构造单义可译码和即时码
    • 即时码仅是单义可译码的一种排布,没有更严格的要求

最佳编码:具有最短的代码组平均长度或编码效率接近于 1 的信源编码

  • 二元霍夫曼编码

:N 个信源符号的平均编码符号长度

  • 编码效率:

先试扩展倍数小的,不够再加

第五章

信道矩阵:(给出信道特性)

对称离散信道: 信道矩阵的所有行由相同元素组成,所有列也由相同元素组成

二进制对称信道容量 bit/符号

离散准对称信道

  • 定义:信道矩阵可以按列分解为若干互不相交的子集,每个子集构成的矩阵都对应对称信道
  • 设信源符号个数和信宿符号个数分别为 r 和 s, 当信源符号消息等概分布时,达到信道容量 C,且 比特/符号, 其中 是信道矩阵每一行的元素,n 表示子矩阵个数, 表示第k个子矩阵行元素之和,表示第k个子矩阵列元素之和。

译码准则:规定把 什么 y 判成 什么 x

  • 先画香农线图
  • 最小错误概率:对每个 ,取最大的 (其实也就是最大
    1. 列出发送码字到接收码字的转移概率矩阵
    2. 每列求和得到 ,每列除以它
    3. 每列取最大的
  • 最大似然:对每个 ,取最大的
  • 错误概率:先求正确概率

码率: 比特/码元,M 为码字种数

第六章

  • 相对熵:

将随机变量 的变换关系记作 ,则有,其中 是反的导数!f是Y到X!

,则平均互信息量为 0

相对熵积分要复习一下

熵功率:达到指定熵所需的最小功率

6.3 需要仔细看(特别是6.3.2)

第八章

  • :选一列取得最小失真度
  • :取得最小失真度
  • 二元离散信源的率失真函数:
  • 等概离散信源的率失真函数:
    • 通常为 1
    • 为失真矩阵中的非零元

是比特 / 信源符号, 是比特 / 秒

第十章

陪集首不能属于对应子群,且汉明重应最小

  • 线性分组码的最小距离等于非零码字的最小重量
  • 设C是 线性分组码,其纠错能力为t。如果用且只用不大于t个错误的全部错误图样作陪集首就能构成标准阵,那么就称这个码为完备码

第十一章

有可能满足循环性但不是线性码!线性:两个码字相加也是码字

第一章 信息科学及其发展

1-1 通信系统的基本概念

信源:消息的提供者

  • 可分为离散和连续

信道:传递消息的通道

  • 可分为同轴电缆、光纤、波导等
  • 也可分为 有/无干扰信道,离散/连续信道,单用户/多用户信道 等

信宿:信息的接收者

通信系统传输的是信号,信号是消息的载体,消息中的未知成分是信息

1-2 信息科学的有关概念

信息的特征:

  • 未知性(不确定性)
  • 由未知到知,等效为不确定性集合元素的减少
  • 可以度量

1-3 信息理论的研究内容

  • 狭义信息论:信息量、信道容量、熵、香农三定理
  • 广义信息论:包含主观因素

微弱信号检测(最佳接收)

1-4 香农信息论梗概

围绕 有效性和可靠性

  1. 信息的度量
  2. 有效性:信源编码
    1. 香农第一、第三定理
  3. 可靠性:信道编码
    1. 香农第二定理
  4. 网络信息理论
  5. 保密信息理论

第二章 信息的度量

2-1 度量信息的基本思路

定义 2.1:若信源发出的消息是离散的、有限或无限可数的符号或数字,且一个符号代表一条完整的消息,则为单符号离散信源

定义 2.2: 若信源的输出是随机事件 X,其出现概率为 ,则它们所构成的集合称为 信源的概率空间信源空间

信源空间的描述:

信源输出的事件的概率越小,信息量越大,即信息量是概率的减函数

自信息量 表示 发生所带来的信息量

定义 2.3 自信息量

信息量的单位:

  • 以 2 为底:比特 bit
  • 以 e 为底;奈特 nat
  • 以 10 为底:哈特 Hart

自信息量和不确定度的关系

  • 联系:
    • 两者都是事件概率的函数,数值和量纲一致
  • 区别:
    • 不确定度是一个统计量,静态状态下也存在;
    • 自信息量只有该随机事件发生时才给出,是动态的概念

2-2 信源熵和条件熵

定义 2.4 信源熵 其中定义

  • 信源熵只与信源符号概率分布有关,是一种先验熵
  • 对给定概率分布的信源,信源熵是定值,代表信源每发出一个符号给出的平均信息量,其量纲为 信息量单位 / 信源符号

性质

  1. 对称性:交换变量顺序不改变熵的值
  2. 确定性:若有一个事件必然发生,则熵为 0
  3. 非负性
  4. 可加性:对于统计独立的信源 X 和 Y,
  5. 强可加性对于任意两个信源 X 和 Y,(对数相乘,显然)
  6. 极值性:等概分布的信源的熵最大,
  7. 递增性:信源中一个符号划分为 m 个符号,且这 m 个符号的概率和等于原符号概率,则新信源的熵增加,
    • 多元信源的熵可以表达为若干二元信源的熵的线性组合
  8. 严格上凸特性

Jensen 不等式(凹函数定义):

二进制熵函数 ,有

定义 2.5 条件自信息量

条件概率仅由信道特性决定,看作信道给出的信息量。信源信宿对调也可得到条件自信息量

====

定义 2.6 条件熵:对于联合符号集 XY,在给定 Y 的条件下,用联合概率 对 X 集合的条件自信息量进行加权的统计平均值。

条件熵表示信道所给出的平均信息量

2-3 互信息量和平均互信息量

定义 2.7 互信息量:对两个离散随机事件集合 X 和 Y,事件 的出现给出关于事件 的信息量

  1. 信道没有干扰:
  2. 信道存在干扰: x的不确定度-收到y后对x尚存的不确定度=收到y对x所消除的不确定度 即互信息量 时,没有信息的流通

性质:

  1. 对称性:
  2. 值域为实数:可正可负可零,为负即后验概率小于先验概率,表示收到 y 后对信源是否发送 x 的正确概率小于 x 在信源集合中的概率
  3. 不大于其中任一事件的自信息量
    • 互信息量描述信息流通特性的物理量,流通量的数值不可能大于被流通量的数值

条件互信息量 ,其中 即为条件互信息量

,助记:把 看作后缀,则简化为互信息量的公式

定义 2.8 平均互信息量

  1. 为互信息量 的联合概率加权的统计平均值
  2. 在条件概率空间中的统计平均为

性质:

  1. 对称性:
  2. 与各种熵的关系:共熵,或称联合熵
  3. 非负性,当且仅当 独立时取零
  4. 上界:
  5. 平均互信息量仅和信源概率分布 和信道传递概率 有关
  • 给定信道传递概率 时, 的上凸函数
  • 给定信源概率分布 时, 的下凸函数

最大平均互信息量:信道容量

平均互信息量的物理意义

  • 平均互信息量为 信源熵减掉一个条件熵
  • 表示以信源为参考,在接收端平均每收到一个符号所获得的信息量
  • 条件熵 表示了干扰或噪声,又称疑义度

  • 平均互信息量为 信源熵减掉一个条件熵
  • 表示以信源为参考,在接收端平均每收到一个符号所获得的信息量
  • 条件熵 唯一确定信道噪声和干扰所需的平均互信息量,又称噪声熵、散布度

信源空间题:TODO

  1. 先求各联合概率
  2. 再求
  3. 最后求题目要求的

定义 2.9 若对应于 x 有两种分布 ,则 称为这两种分布的相对熵,又称 熵差

定义 2.10 平均互信息量用相对熵定义:

平均条件互信息量:条件互信息量在概率空间 的统计平均

有:(去掉就超简单)

2-4 多维随机变量的熵

二维随机变量的共熵(对数相乘)

多维随机变量的共熵,又称熵的链接准则:

熵的条件似乎可以直接“忽略”

多维信源的平均互信息量,又称信息链接准则:

定理 2.1 n 维随机变量的共熵不大于其各自熵之和,即 ,称为熵的界

同分布时,上界变为

常用:

定理 2.2 数据处理定理(马氏链,有 ),则有数据处理不等式

当消息通过级联处理时,其输入和输出消息之间的平均互信息量,不会超过输入消息与中间消息之间的平均互信息量,也不会超过中间消息与输出消息之间平均互信息量;即 级联只会使得输入与输出间的平均互信息量变小

数据处理只是变换形态,不会创造新的信息

第三章 离散信源

3-1 离散信源的分类及其描述

根据时域:

  • 单符号信源:信源每次只输出一个符号,可用随机变量描述信源输出的消息
  • 符号序列信源:信源每次输出一个时域离散的符号序列,可用随机向量描述信源输出的消息
  • 波形信源:信源每次输出时域连续的消息,可用随机过程描述信源输出的消息,采样后即为符号序列信源

根据时间和取值分布:

  • 离散信源:在时间和取值上均离散,可用离散随机变量/随机向量/随机过程描述
  • 连续信源:在时间或取值上连续,可用连续随机变量/随机向量/随机过程描述,采样后为信号、脉冲信号

根据平稳特性:

  • 平稳:信源概率分布/密度不随时间改变
  • 非平稳

根据记忆特性:

  • 无记忆:信源在不同时刻发出的消息统计独立
  • 有记忆(记忆长度有限的信源为马尔可夫信源)

信源编码:尽可能少的码元符号或尽可能低的数据速率来描述信源输出的消息

3-2 离散信源的熵

信息熵

定义 3.5 若信源发出 N 个不同符号 分别代表 N 种不同消息,各符号概率为 且相互统计独立,则为单符号离散无记忆信源

其信息熵为

定义 3.6 若信源发出的消息是由 K 个离散符号构成的符号序列,且各消息相互统计独立,则为发出符号序列消息的离散无记忆信源

K 重符号序列信源:每次发送都在 N 个符号里随机选 K 个(可重复)

定义 3.7 若单符号离散无记忆信源的信源空间为 ,对其 K 重扩展得到符号序列 ,则称扩展后的信源为离散无记忆信源 的 K 重扩展信源,扩展得到的符号序列记为

彼此统计独立,则定义 3.7 与 3.6 等价,也是发出符号序列消息的离散无记忆信源

发出符号序列消息的离散无记忆信源的熵为

定义 3.8 若信源发出的消息是由 K 个离散符号构成的符号序列,且各消息相互统计相关,则为发出符号序列消息的离散有记忆信源

有记忆信源的符号序列之间的关联程度可以用转移概率描述

符号间非独立(有关联)会使得信源输出的信息量减少

马尔可夫信源熵:是一般信源熵的特例

时间熵

时间熵 单位时间内发出的平均信息量 ,单位 b/s 或 bps

定义 3.9 若信源为具有 N 个单个符号消息的离散信源,第 i 个符号消息占用的时间为 秒,概率为 ,则称 的统计平均值为该信源符号消息的平均时间长度 或 平均长度,单位为秒/符号 秒/符号

若信源平均每秒发送 n 个符号,则 秒/符号

对于单符号离散无记忆信源:

K 重扩展的符号序列的时间熵

K 重扩展的离散无记忆信源的符号消息平均长度

仍有

若信源平均每秒发送 n 个 K 重符号序列消息,则 秒/符号, 有

若为有记忆信源,有 , 其时间熵小于无记忆信源的

消息之间的关联性体现在信源熵而非平均长度

3-3 信源的冗余度

3-3-1 最大信源熵

定理3.1 最大熵定理 设信源 X 中包含 M 个不同符号,其信源熵为 ,有 当且仅当 X 中各个符号的概率全相等时取等,此时得到最大熵 即熵的极值性,第二章证过

定理 3.2 两个集合 X、Y 的共熵 与这两个集合的信源熵 之间有 当且仅当两个集合相互独立时取等,此时取得最大熵

定理 3.3 对于初始信源 X 经过 K 重扩展的信源,若初始信源熵为 ,扩展后为 ,有 当且仅当 K 重符号序列消息的各个符号间相互独立时取等,此时取得最大熵

符号不等概或符号间有相关性都会损失信源熵

  • 信源编码中要压缩冗余度来提高传输的有效性
  • 信道编码中要注入冗余度来提高传输的可靠性

定义 3.10 设信源实际的熵为 H,该种信源可能的最大熵为 ,则信源的冗余度为 即信源在发出消息时无用信息量的百分比

3-4 信源符号序列分组定理

设离散无记忆信源的信源空间为

K 重扩展后,各符号序列为 ,这样的符号序列有 个。

当 K 足够大时,一个序列中任一符号 出现的次数都会趋近于 ,即扩展后很多序列的概率组成相同,是等概的

具有上述结构的序列称为 典型序列 ,其余的序列为 非典型序列

典型序列的自信息量也相等,为

自信息量的期望,即信息熵,为

当典型序列的概率之和很大时,就可以用典型序列来代表扩展信源(这正是数据压缩的本质)

信源符号序列分组定理说明上述分组是存在的,且可以估算其典型序列的数目

定理 3.4 信源符号序列分组定理 AEP(渐进均分特性) 设离散无记忆信源的信源符号为 ,各符号概率为 ,将该信源进行 K 重扩展得到 K 重符号序列 ,则任意给定 ,总有对应整数 ,使得 时,有 即信息熵与自信息量的差趋近于0

所谓渐近等分性:序列的越长,典型序列的总概率越接近于1,它的各个序列的出现概率越趋于相等

  • 每个典型序列的概率
    • 对于任意小的正数 ,当 K 足够大时,,可近似于
  • 典型序列个数
    • 对于任意小的正数 ,当 K 足够大时,,可近似于
  • 典型序列占的比例
    • 根据最大熵定理,一般有
    • 随着 K 增大,典型序列占的比例逐渐趋于 0,典型序列出现概率高不等于典型序列种类多

表示 里的元素个数

信源符号序列分组定理表明,对于 K 重扩展信源,只考虑少量典型符号序列对信源特性带来的损失可以忽略,这给出了信源压缩编码的理论依据

3-5 平稳离散信源及其性质

平稳:概率分布不随时间变化

大部分实际信源在较短的一段时间都可以看作平稳信源

定义 3.10 若一个离散信源发出的符号序列 其出现概率与另一符号序列 的出现概率相等,则为平稳离散信源

  • 改变其符号序列的起始位置,其概率和条件概率均不变,即平稳离散信源对应的随机过程是严平稳的

平稳离散信源的极限熵

有记忆离散信源每发一个符号所提供的平均信息量为

平均符号熵 为平稳离散有记忆信源的极限熵,又称熵率

平稳离散信源熵的性质

定理 3.5 若信源 X 是平稳离散信源,则有 是 X 中起始时刻随机变量 的熵与各阶条件熵之和。也即熵的链接准则。

定理 3.6 平稳离散信源的条件熵随 K 的增加是非递增的,即

特别的,由于平稳性,,故

推论 1:给定 K 时,平稳离散信源的条件熵小于等于平均符号熵,即

推论 2:平稳离散信源的平均符号熵随 K 的增加是非递增的,即

定理 3.7 极限熵的第二种形式 对于平稳离散信源,令 ,若 ,则 的极限值存在且有

  • 一般离散平稳有记忆信源每发一个符号所提供的平均信息量等于极限熵
  • 较难计算,但当 K 不是很大时,其平均符号熵 或条件熵 就非常接近于 ,可用作极限熵的近似值

第四章 离散信源的信源编码

4-1 信源编码的模型

信源编码

  • 含义:将信源产生的消息变换为数字序列的过程
  • 主要任务:把消息信号数字化为由信道基本符号构成的代码组(码字),并压缩冗余度,提高编码效率

编码是否会损失信源消息的信息量:

  • 不损失信息量:无失真信源编码 -> 香农第一定理
  • 会损失信息量:限失真信源编码 -> 香农第三定理
  1. 选择合适的信道基本符号(码元),使映射后的代码适应信道
  2. 用编码将信源发出的消息转换为代码组,即码字,其长度称为码长
  3. 编码应使消息集合与代码组集合中的元素一一对应

称上述一一映射的信源编码器为正规编码器,编出来的码为非奇异码

可以把信源和正规编码器合称等效信源,编码器的输入为初始信源

正规编码器的一一对应确保了编码不损失信息量,因此等效信源的熵必定等于初始信源的熵

研究信源编码时将信道编译码看作信道的一部分

  • 若码字长度相等,称为等长码,反之为变长码
  • 若信源符号与编码码字一一对应,称为非奇异码,反之为奇异码
  • 若每个码元所占时间相同,称为同价码,反之为非同价码(例如莫尔斯电码)
  • N 重扩展码:针对 N 重扩展信源编码得到的码字序列集合
  • 若任意一串码字序列只能唯一的译为对应的信源符号序列,称为单义可译码,反之称为非单义可译码
    • 不但要求信源符号与编码码字一一对应,即为非奇异码,还要求任意长的信源符号序列对应的码字序列一一对应,即任意 N 重扩展码均为非奇异码
    • 非单义可译码会发生译码错误,导致失真

4-2 信息传输速率和编码效率

4-2-1 信息传输率

定义4.1 对于信源编码器的输出序列,其每个码元所包含的信息量称为 信源编码器的信息传输率,简称 码率 R

  • R 的单位为 bit/码元
  • 若每个码元时间为 t 秒,则可以定义信息传输速率

等长码

  • 单符号离散信源:设信源熵为 ,对其等长编码,每码字 b 个码元,则其信息传输率为
  • K 重扩展信源:设信源熵为 ,对其等长编码,每码字 B 个码元,则其信息传输率为

变长码

  • 先求其代码组的平均长度
  • 单符号离散信源:设信源有 N 个单符号消息 ,变长码编码器输出的代码组长度对应为 ,其出现概率分别为 ,则该变长码的平均长度为 ,信息传输率为 bit/码元
  • K 重扩展信源:设信源有 N 个 K 重扩展的符号序列消息 ,变长码编码器输出的代码组长度对应为 ,其出现概率分别为 ,则该变长码的平均长度为 ,信息传输率为 bit/码元

4-2-2 编码效率

信道容量:信道的极限传输能力(平均互信息量的最大值)。根据平均互信息量的定义,在不失真传输的条件下,信道容量等于信源熵的最大值,

对于含有 D 个元素的信道基本符号集合,等效信源的最大熵等于 bit/码元,因此 bit/码元

定义 4.3 信源编码器输出代码组的信息传输率与信道容量之比,称为信源编码器的编码效率,即

  • R = C 时,信源编码能充分利用信道
  • R > C 时,信源编码输出信息的速率超过了信道传输能力,必然失真
  • R < C 时,未充分利用信道

编码效率

要提高编码效率可以减小代码组的平均长度

通常称具有最短的代码组平均长度或编码效率接近于 1 的信源编码为最佳信源编码,亦简称为最佳编码

要达到最佳编码,通常需遵循下面两个原则:

  1. 对信源中出现概率大的消息(或符号),尽可能用短的代码组(码字)来表示,简称短码;反之用长码
  2. 不使用间隔即可区分码字
    • 要求单义可译性

原则一可以描述为:

定理4.1 设信源有 N 个消息分别为 ,出现概率分别为 ,信源编码器输出的 N 个代码组分别为 ,对应长度分别为 ,若信源消息的概率分布满足 ,而信源编码器输出的代码组长度满足 ,则该代码组的平均长度为最短。

最佳编码应满足 ,即可满足单义可译

4-3 单义可译定理

定义 4.4 对任何一个有限长度的信源消息序列,如果编码得到的码字序列不与其他任何信源消息序列所对应的码字序列相同,则称这样的码为单义可译码。

即时码:译码时不需要考察后续码元,一定为单义可译码

定理 4.2 是码 S 中的任一码字,码 S 为即时码的充要条件是:对于任意的 m<k ,任意码字 都不是码字 的前缀。

等长码都是即时码

即时码 ⊆ 单义可译码 ⊆ 非奇异码 ⊆ 所有码

定理 4.3 单义可译定理 即时码存在定理 设信源消息集合为 ,信道基本符号的种类为 D,码字集合为 ,对应的码长集合为 ,则存在即时码的充分必要条件是:D、N 和码长应满足如下不等式: 上式称为 Kraft 不等式。

任何一个结构为 的即时码一定满足 Kraft 不等式;而满足 Kraft 不等式的 又至少可构成一种结构为 的即时码

定理 4.4 平均码长界定定理 若一个离散无记忆信源 X,具有熵 ,对其编码用 D 种基本符号,则总可以找到一种无失真信源编码,构成单义可译码,使其平均码长满足

平均码长界定定理的物理意义

  • 下界证明是充要性证明,因此单义可译前提下平均码长的下界值为
  • 也可以从信息传输率的角度理解下界,即 ,信息传输率不能超过信道容量,否则无法实现单义可译,从而造成译码错误
  • 由于上界证明仅仅是充分性证明,因此平均码长大于定理中的上界也可能是单义可译码
  • 给定信源空间 的离散信源,其熵 是确定值,如果信道基本符号数 D 也给定,则 也就定了。为此,需要改变信源本身统计特性,例如进行扩展
    • 扩展后,可能使得每个消息的长度 ,这样平均长度也应减小

4-4 无失真信源编码定理

二进制编码和无记忆信源条件下香农第一定理

  • 对于二进制编码,D=2。根据平均码长界定定理有
  • 类似地,对初始信源进行 K 重扩展,有
  • 对于无记忆信源, 成立,因此
  • ,有
  • 上式即是二进制编码和无记忆信源条件下香农第一定理的数学表示式

定理 4.5 香农第一定理 无失真信源编码定理 变长码信源编码定理: 设离散无记忆信源 X 包含 N 个符号 ,信源发出 K 重符号序列, 则此信源可发出 个不同的符号序列消息,其中第 j 个符号序列消息的出现概率为 , 其信源编码后所得的 D 进制代码组长度为 ,代码组的平均长度为 , 总可以找到一种编码构成单义可译码,使得 满足 当K趋于无限大时,

定理指出

  • 要做到无失真的信源编码,每个信源符号平均所需要最少的 D 进制码元数,就是信源的熵值(熵定义中的log底数为D),或记为
  • 扩展信源可以减少平均码元数,但有极限
  • 此外,减少平均码元数是以增加编码的复杂性(存储复杂度)为代价的
  • 从编码效率角度理解,不等式取到下界时,编码效率为 100%,可见无失真信源编码的实质就是对离散信源进行适当的变换,使变换后新的符号序列信源尽可能为等概率分布,以使新信源的每个码符号平均所含的信息量达到最大,进而使信息传输率R达到信道容量C,实现信源和信道理想的统计匹配

4-5-1 香农编码方法

  1. 先将信源消息的概率按 降序排列,然后计算 ,即 为前 i–1 个概率的累加
  2. 再把 变为二进制小数,取小数点后的 位数作为第 i 消息的码字,其中 满足

二进制小数:将小数部分一直乘 2,积的整数部分顺序取出

特点

  • 先得到码长,再得到码字
  • 码字集合唯一
  • 并非一定最优

4-5-2 费诺编码方法

又称子集分解法

  1. 将信源消息符号按其出现的概率大小依次排列
  2. 将依次排列的信源符号按概率值分为两大组,使两个组的概率之和接近相同,并对各组赋予一个二进制码元“0”和“1”
  3. 将每一大组的信源符号进一步再分成两个组,使分解后的两个组的概率之和接近于相同,并又赋予两个组一个二进制符号“0”和“1”
  4. 如此重复,直至每个组只剩下一个信源符号为止

特点

  • 先得到码字,再得到码长
  • 码字集合唯一

4-5-3 霍夫曼编码

本科数字通信笔记第四页,这里使用 as low as possible 或者 as high as possible 都可以

特点

  • 码字集合不唯一

  • 二元霍夫曼编码是最佳编码

  • r 元霍夫曼编码可能需要扩展原信源,使得霍夫曼最后一步的信源有 r 个符号,故需扩展到 个信源符号

4-5-4 Lempel-Ziv 编码

与本科数字通信所学不一样

12345
子列abaaaabaaba
编码0a0b1a3b4a

未出现过的子列用 0 开头

特点

  • 独立于信源的统计特性,是一种变长到定长的编码方案
  • 利用了已编码信息来进行当前的编码,是等长码,编码的过程就是建立码地址和将待编码消息序列分段的过程,所有的码段内容都是不同的
  • 对于长的消息序列,压缩比较明显
  • 地址会不断变长,可以用相对地址解决
    • 将编码结果表示为3部分内容:<相对地址,可利用的已编码信息长度,本次编码新增加字符>,称之为编码包
    • 可利用的只要是已经编码过的信息就行,不需要是一整个包什么的
    • 第一部分:利用的已编码信息在当前信息之前多少 ,是按序列数的,不是按包
    • 第二部分:利用的已编码信息长度
    • 两个相当于是 数组首地址(相对) 和 数组长度
    • 如果下一个要编码的刚好是上一个已编码符号 x 的 n次重复,则写为 <1,n x>

4-5-5 等长码的信源编码定理

设等长码的信源的消息符号集合为,进行 K 重扩展后,符号序列消息的总数为 ;设信道有 D 种基本符号,每个码字有 B 个码元,故最多有 种码字,要满足单义可译性,应满足 ,即

但实际可以只对典型序列编码,即 典型序列个数

定理 4.6 设 K 重扩展的符号序列消息集合中,对于任意小的 ,当 时,只要 K 足够大,译码错误概率 就可以任意小。若 ,则当 时, 可以任意地接近于 1

等长码的信源编码定理的物理意义 时,更有效的信源编码存在

对于等长码,K需要非常大(上千)才能获得低译码错误概率和高编码效率

传输所造成的错误会产生所谓“扩展效应”,简称为译码的错误扩展。例如,传输过程1-bit的错误可能导致信宿端多个消息的译码错误。这需要信道编码来保证传输正确

第五章 离散信源及其信道编码

5-1 信道的分类及其描述

(1) 信道按输入/输出符号空间的性质来划分,根据幅度和时间上的取值是离散或连续,分为四类:

  • 离散信道:输入和输出的随机序列取值均为离散的信道,也称为数字信道
  • 连续信道:输入和输出的随机序列取值均为连续的信道
  • 半离散或半连续信道:输入序列是离散型但相应输出序列是连续的信道,或者相反
  • 波形信道:输入和输出都是时间上连续的随机信号,也称为模拟信道

(2)按信道的输入消息集合和输出消息集合的个数来划分:

  • 两端信道:信道的输入消息集合只有一个X集合,同时信道的输出消息集合也只有一个Y集合,又称为单向单路信道
  • 多端信道:信道的输入端和输出端中,至少有一端具有一个以上的消息集合,又称为多用户信道

(3) 信道按输入/输出信号间的关系是否确定来划分,

  • 无扰信道:信道输入/输出之间是一种确定的关系,这是一种理想化的信道,信道上不存在噪声及干扰。可以作为衡量其他信道特性的参考
  • 有扰信道:信道输入/输出之间是一种统计依存的关系,信道上存在干扰和(或)噪声。实际的通信信道几乎都是有扰信道

(4) 信道按其输入/输出之间关系的记忆性来划分,

  • 无记忆信道:在某一时刻信道的输出消息仅与当时的信道输入消息有关,而与前面时刻的信道输入或输出消息无关。信道的统计特性可以用信道传输概率的集合{P(y|x)}来描述
  • 有记忆信道:在任意时刻信道的输出消息不仅与当时的信道输入消息有关,还与以前时刻的信道输入和(或)输出消息有关。实际信道一般都是有记忆的

(5)信道按其统计特性来划分,

  • 恒参信道:信道的统计特性不随时间变化,又称为平稳信道
  • 变参信道:信道的统计特性随时间变化

5-2 无扰离散信道的传输特性

定义 5.1 单位时间内所传输的信息量,称为消息在信道中的信息传输速率,简称为信息率 R

  • 量纲为比特/码元或比特/符号、比特/符号序列等时,用 R 表示
  • 量纲为 bit/s 或 bps,用 表示

平均互信息量 代表收到 Y 后获得关于 X 的平均信息量,因此实质上就是量纲为比特/码元(或比特/符号、比特/符号序列等)的信息传输速率,即 bit/码元;如果改变其时间单位,则有 bit/s

  • 无扰离散信道下信息传输速率等于信源熵,即 bit/码元; bit/s

信道容量: 消息在不失真传输的条件下,信道所允许的最大信息传输速率称为信道容量,即 bit/码元;当单位为bit/s(bps)时,C 变换为 bit/s

信道容量和信道中传输的消息数目 N 的关系: 对无扰信道,信道传输的信息量就是信源发出的信息量,根据最大信息熵定理,所有信源符合等概率的时候信源熵最大,因此信道容量 bit / 码元; bit / s

定义5.3 基本符号时间等长的信道称为均匀编码信道,这种等长的基本符号称为码元

  • 损失熵:
  • 噪声熵:

无噪无损信道:输入与输出符号一对一

  • 损失熵 和 噪声熵 均为 0,
  • 信道容量 bit/码元

无噪有损信道:输入与输出符号多对一

  • 损失熵 ,噪声熵
  • 信道容量 bit/码元

有噪无损信道:输入与输出符号一对多

  • 损失熵 ,噪声熵
  • 信道容量 bit/码元

5-3 有扰离散信道的传输特性

信道矩阵:(给出信道特性)

为信道传输概率

对称离散信道: 信道矩阵的所有行由相同元素组成,所有列也由相同元素组成

强对称离散信道(均匀信道):信道矩阵为方阵

  • 总错误概率为p,均匀分给r-1个输出符号
  • 信道矩阵各列之和也等于1

二进制对称信道(BSC):其中为交叉传输概率

准对称离散信道

  • 信道矩阵的列可以分解为若干互不相交的子集,每个子集构成的矩阵都对应对称信道

二进制删除信道

5-3-4 有扰离散信道的信道容量

有扰离散信道的信道容量是指在不失真传输的条件下,信道所允许的最大信息传输速率(平均互信息量):

  • 信道容量 C 是信道的最大传输能力,是信道自身的特性
  • 能使平均互信息量达到信道容量C的信源称为匹配信源
  • 的函数
  • 只与具体信源有关; 只与信道特性有关,与具体信源无关,因此

几种特殊信道的信道容量

定理 5.1 对于信源符号个数和信宿符号个数分别为 r 和 s 的离散对称信道, 当信源符号消息等概分布时,达到信道容量 C ,且 比特/符号, 其中 是信道矩阵每一行的元素

二进制对称信道容量

定理 5.2 对于信源符号个数和信宿符号个数分别为 r 和 s 的离散准对称信道, 当信源符号消息等概分布时,达到信道容量 C,且 比特/符号, 其中 是信道矩阵每一行的元素,n 表示子矩阵个数, 表示第k个子矩阵行元素之和,表示第k个子矩阵列元素之和。

二进制删除信道容量

一般离散信道

凸问题一定能用拉格朗日解,否则不一定

定义 表示接收到 之后获得关于 的信息量(某个符号与信宿之间的平均互信息量)

定理 5.2:输入概率分布达到信道容量的充要条件为

  • 概率不为 0 的信源符号和 Y 的平均互信息量都等于信道容量
  • 达到信道容量的最优输入分布不唯一

信道容量的通解

对信道矩阵每行列一个方程:

若信道矩阵为方阵且可逆, 则可以求出 ; 继续求出 C 和 最后根据 得到最优输入概率分布

通常为负

K 重扩展信源的信道

对于信源 重扩展信源 , 对应的 重扩展信宿 , 且 ,

  • 当信道无记忆时, 即信道传输概率满足 ,则有
  • 当信源无记忆时, 即满足 ,则有
  • 当信源和信道都无记忆时,则有

  • 当且仅当信源无记忆且各个 达到最佳概率分布时取等
  • 对于时不变信道,即各个 经过相同信道时,

并联信道

串联信道

信道矩阵为各个子信道的信道矩阵的乘积

两个 BSC 串联后仍是 BSC

级联将使信道容量C下降,且随着 的增大变得非常明显

5-4 译码准则

定义 5.6 在一般的信息传输系统中,信宿收到的消息不一定与信源发出的消息相同, 而信宿需要知道此时信源发出的是哪一个信源消息, 故需要把信宿收到的消息 根据某种规则判决为对应于信源符号消息集合中的某一个, 例如 ,这个判决的过程称为接收译码,简称译码,译码时所用的规则称为译码准则。

  • 任何译码准则所遵循的基本要求都是要使信宿得到的判决结果中错误最少
  • 译码准则就是一种能满足 的函数关系,它使得译码结果中的错误概率达到最小

5-4-1 常用的译码准则

例:

最小错误概率准则 即 最大后验概率准则

对于所有的 i ,若 ,且 ,则

可以通过求所有的 ,对每个 取最大的后验概率,算出正确传输概率

也可以直接从信源的概率分布和条件概率来求采用最小错误概率准则时的接收错误概率:

最大似然译码准则

是信道传输概率,也称为最大似然函数

  1. 信源符号等概分布
    • 只要选取 使得 最大,则 最大
    • 此时错误概率为
    • 不论发送哪个符号,收到 的概率都相等
    • 此时只要选取 最大即可

5-5 有扰离散信道的信道编码定理

5-5-1 编码方法与平均错误译码概率

信息传输速率(码率): 比特/码元

5-5-2 汉明距与编码原则

在同样的信道条件下,所能达到的 ,与所选择许用码组的 有关

  • 许用码组:有对应信源符号的信宿符号

二元对称无记忆信道的最大似然译码

假设发送码字 经过信道后变为 ,则信道传输概率为 p为单个符号传输错误概率,通常小于0.5 因此, 越小, 越大,等价于最小距离译码

  • 发射的信源等概时,最小错误概率译码退化为最大似然译码;
  • 二元对称无记忆信道下,最大似然译码退化为最小距离译码。

编码原则

任意许用码字间的最小汉明距尽量大

5-5-3 有扰离散信道的信道编码定理

定理 5.3 抗干扰信道编码定理 香农第二定理: 设信道有 D 个输入符号,s 个输出符号,信道容量为 C,被传消息的码长为 N,信息传输速率为 R, 则当 R< C 时,只要码长 N 足够长,总可以在输入集合中,找到 M 个码字(为任意小的正数),分别代表M个等可能性的消息,组成一种信道编码, 选择相应的译码规则,使信宿端译码后的最小平均错误译码概率 达到任意小

定理 5.4香农第二定理逆定理 设信道有 D 个输入符号、s 个输入符号,信道容量为 C; 令 ε 为任意小的正数,若选择许用码组个数 (即R > C), 则无论码长 N 多大,也不可能找到一种编码,使 任意小。

5-6 信道编码定理的应用

第六章 连续消息和连续信道

6-1 连续消息的信息度量

  1. 将连续型信源变换成离散型信源,用离散信源的分析方法进行分析
  2. 再将量化单位无限缩小,在极限情况下分析离散情况得到的结果

样值量化——连续信源变为离散信源

  1. 时间抽样
  2. 量化幅度
  3. 每个样值的自信息量以及信源熵都可用离散信源理论计算,所得离散信源的熵可近似作为此连续信源的熵

量化级无限增大 ——离散信源还原成连续信源

  1. 量化幅度与原幅度间的差异会引起量化噪声
  2. 可以使用非线性压扩和减小量化单位减少量化噪声
  3. 当量化单位无限缩小时,离散信源就能还原为连续信源
  • 设样值的熵为 ,它实际上就是量化后得到的单符号离散信源的信息熵
  • 设量化前样值的幅度为 ,对应的概率密度值为 ;若量化后的样值幅度为 ,对应的概率密度值为 ,则在区间 ,其概率为
  • 量化后共有 个取值, 则离散信源的信息熵
  • 趋于 0 , 得到连续信源的熵的计算公式 第一项由且仅由 决定, 为确定值, 称为相对熵, 用 表示; 第二项当 时它趋于无限大, 称为绝对熵, 用 表示:

相对熵

  • 相对熵的形式与离散信源熵的形式相近,另外当考虑信息传输问题时,由于互信息量等于两个熵相减,所以绝对熵可以抵消,只剩下相对熵
  • 相对熵能够很好地量度连续信源的信息特性,在后面的讨论中,如无特别说明,一般所说的信源熵都是指相对熵

绝对熵

  • 之所以称为绝对熵,是因为 时它趋于无限大,且连续信源的各种熵都有这一项

输出随机序列的连续信源

  • 联合相对熵 比特 / 样值序列

输出随机信号的波形信源

  • 采样后转换为无穷维随机序列
    • 比特/样值序列
    • 比特/秒(更常用)
  • 对于带宽为 ,时长为 的信号, 等价于计算长度为 的随机序列信源的相对熵

6-1-2 几种连续信源的相对熵

均匀分布

  1. 相对熵: 比特/样值
  2. 时,相对熵为负

N维区域体积内均匀分布的连续信源: N维连续信源输出随机向量 的各个分量分别在 区域内均匀分布,

  • 该信源的相对熵为 比特/样值序列 等于 维区域体积的对数, 也等于各分量相对熵之和 (与离散无记忆信源一致)
  • 推广到带宽为 , 时长为 的波形信源, 如果每个样值 在 区间服从均匀分布, 相对熵为 比特/样值序列
  • 单位时间内的相对熵为 比特/秒

高斯分布连续信源

  • 相对熵: 奈特 / 样值
  • 当均值为 0 时,即不计高斯连续信源X中的直流部分时, 奈特 / 样值,P 为平均功率
  • 对于协方差矩阵为 C 的高斯向量 x: 奈特 / 样值;
    • 当 x 的各元素独立时,有

指数分布

  • 相对熵为: 奈特/样值

6-1-3 条件熵

离散信源条件熵 其中任意两事件 的联合概率为 连续信源经取样、量化后的样值共有 个取值, 则条件熵为

相对条件熵: 绝对条件熵: 时绝对条件熵趋于无限大

  • 对于输出随机序列的连续信源, 相对条件熵为

6-1-4 连续消息熵的性质

  • 以及 ,当且仅当x和y相互独立时取等
  • 可加性:x和y 独立时
  • 强可加性:
  • 相对熵可以是正值或0,也可以是负值,取决于概率密度函数
  • 相对熵是 的凹函数
  • 相对熵存在最大值,但是与离散信源不同,对信源不同限制条件下的最大熵不相同
  • 连续信源输出的随机变量(随机向量)通过确定的一一对应变换后,相对熵会发生变化
    1. 将随机变量 的变换关系记作 , 则有 其中 若 X、Y 为矩阵,则

6-1-5 最大相对熵定理

定理 6.1 是在 区间具有某种分布的概率密度函数,其约束条件为 为不同于 的其他分布,但约束条件和 相同,也为 。 则有 区间 在极限情况 时, 上式仍然成立。

定理 6.2 峰值功率受限条件下信源的最大熵定理 若某信源输出信号的峰值功率受限,即信号的取值被限定在某一有限范围内, 则在限定的范围内,当输出信号幅度的概率密度函数是均匀分布时该信源达到最大熵值。

,则峰值功率为 ,该信源的最大相对熵为

如果将对应的分布称为最佳分布并用 表示,则有

定理 6.3 平均功率受限条件下信源的最大熵定理 若某信源输出信号的平均功率被限定,则当其输出信号的概率密度函数 是高斯分布时, 信源达到最大熵值;对于 N 维连续信源来说,若N维随机矢量的协方差矩阵被限定, 则 N 维连续信源为 N 维高斯分布时达到最大熵值。

平均交流功率:方差

定理6.4 均值受限条件下信源的最大熵定理 若某连续信源 X 输出非负信号的均值被限定,则其输出信号幅度为指数分布时, 连续信源 X 达到最大熵值。

6-1-6 熵功率和熵功率不等式

熵功率

熵功率是给定零均值高斯分布的相对熵 ,反推出平均功率:

可以采用 衡量连续信源的冗余度

熵功率不等式

两个零均值统计独立的连续随机变量 X 和 Z,平均功率分别为 , 则随机变量 的平均功率

,当 X 和 Z 为独立高斯随机变量时等号成立

6-2 连续消息在信道上的传输问题

  • 连续消息的平均互信息量 比特 /样值
  • 连续消息序列的平均互信息量 比特 /样值
  • 波形信号的平均互信息量 比特/样值序列
    • 比特/秒
    • 对于带宽为B,时长为T的信号,等价于计算长度N=2BT的连续消息序列的平均互信息量

连续消息平均互信息量性质:

  • 非负性
  • 对称性
  • 上凸函数
  • 数据处理定理:若 形成马氏链,则
  • 一一对应的变换不改变平均互信息量关系
  • 的关系
    1. 如果多维连续信源无记忆, 则
    2. 如果多维连续信道无记忆, 则
    3. 如果信源和信道均无记忆, 则

单符号加性信道的平均互信息量:

多维加性信道的平均互信息量:

对于多维加性信道, 信道无记忆等价于噪声分量独立

加性波形信道的平均互信息量

6-3 香农信道容量公式

6-3-1 加性信道的信道容量

加性噪声:

连续加性信道的信道容量

  • 单符号信道

  • 多维信道

  • 波形信道

  • 单符号高斯加性信道:

    • 奈特 /样值
  • 单符号非高斯加性信道

    • 奈特 /样值
    • 同等噪声功率情况下高斯噪声是最坏情况噪声(使得信道容量最小)
  • 多维无记忆高斯加性信道

注水原则:应当向 噪声功率较小分量度 分配 较多的输入信号功率;若噪声各分量等功率,则输入信号等功率分配最优

  • 多维有记忆高斯加性信道

6-3-2 带限AWGN信道的信道容量

WGN采样点为服从独立同分布的高斯随机变量

WGN各样值方差均为 (即自相关函数)

(AWGN信道中)当输入信号的样值服从零均值独立高斯分布,且每个样值的功率相等时(即输入信号具有高斯白噪声特性)

带限AWGN信道的信道容量为

单位时间的信道容量(Shannon 公式):

Shannon公式成立的条件

  1. 输入信号平均功率为 (为AWGN时达到信道容量)
  2. 带宽为 的带限信道
  3. 噪声为AWGN,功率谱密度为

有色加性高斯噪声信道的信道容量

6-3-3 香农公式的意义

  1. 信道容量与所传输信号的有效带宽成正比,信号的有效带宽越宽,信道容量越大
  2. 信道容量与信道上的信号噪声比有关,信噪比越大,信道容量也越大,但其制约规律呈对数关系
  3. 信道容量 C、有效带宽 B 和信噪比 S/N 可以相互起补偿作用,即可以互换
  4. 当信噪比小于1时,信道的信道容量并不等于0,这说明此时信道仍具有传输消息的能力。也就是说,信噪比小于1时仍能进行可靠的通信
  5. 信号有效带宽无限时,信道容量
  6. 香农公式是在噪声为AWGN情况推得的,对那些不是白色高斯噪声的信道干扰而言,其信道容量应该大于按香农公式计算的结果

第八章 信息率失真理论及其应用

8-1 失真函数和平均失真度

8-1-1 失真函数

定义 8.1 对于图示系统, 对应于每一对 , 定义一个非负实值函数 表示信源发出符号 而经信道传输后再现成信道输出符号集合中的 所引起的误差或失真, 称之为 之间的失真函数。

失真函数的值可人为规定,一般定义为 时(即 )取 0

失真矩阵

输入符号集 中有 种不同的符号 ; 输出符号集 中有 种不同的符号 ; 失真函数 共有 个具体值, 按 的对应关系, 排列 成一个 阶矩阵: 称为信道 的失真矩阵。

汉明失真矩阵(只有主对角线为 0):

分类讨论并写出来,再写失真矩阵

8-1-2 平均失真度

定义 8.2:称随机变量 的联合概率 对失真函数 进行加权的统计平均值为该通信系统的平均失真度

就是加权的失真度

N次扩展信源的情况

将定义8.1进行扩展, 可得 次扩展的信源和信宿符号序列 之间的失真函数为

对应的失真矩阵为

平均失真度

对无记忆信源和信道有

式中

离散无记忆信源X的N次扩展信源通过无记忆信道传输后的平均失真度是未扩展情况的N倍:

类比扩展信源的信息熵和平均互信息量

8-2 信息率失真函数

8-2-1 保真度准则

定义 8.3 保真度准则 信道每传送一个符号所引起的平均失真,不能超过某一给定的限定值D,即要求 ,称这种对于失真的限制条件为保真度准则。

保真度准则指出,给定的失真限定值D是平均失真度 的上限值

平均失真度取决于如下几个因素

  1. 信源的统计特性,即
  2. 信道统计特性,即
  3. 失真函数,即

8-2-2 失真许可的试验信道

定义 8.4 凡是能满足保真度准则 的信道,称之为D失真许可的试验信道

所有的 D 失真许可的试验信道构成的集合表示为:

感兴趣的是 在同样的保真度准则下,能使信道的信息传输率尽可能小 的试验信道

8-2-3 信息率失真函数

定义 8.5:用给定的失真 为自变量来描述的信息传输速率, 称为信息率失真函数,用 表示

  • 信息传输速率 本质上是描述信源输出的信息速率
  • 一方面, ,是 的函数,另一方面,信道上的信息传输速率 ,因此,又可以用平均互信息量 来表示
  • 的凸函数, 故总可以在 集合中找到某 一试验信道, 使 达到最小值 , 故有

信息率失真函数的物理意义

  • 信息率失真函数是在 的前提下,信宿必须获得的平均信息量的最小值,是信源必须输出的最小信息率
  • 信息传输速率本质上是描述信源特性的,因此R(D)也仅用于描述信源
  • 若信源消息经无失真编码后的信息传输速率为R,则在保真度准则下信源编码输出的信息率就是R(D),且

R(D) 与 C

  • 信道容量仅与信道有关,是信道的最大传输能力
  • 信息率失真函数仅与信源有关,是在给定失真度下,信源至少要给信宿的信息率

N次扩展的信息率失真函数

8-2-4 信息率失真函数的性质

D必须在给定的信源X的概率分布P(X)、信宿Y的概率分布P(Y)和给定的失真函数 条件下所得的平均失真度 D 的最小值 和最大值 之间适当选择

可以求得平均失真度 的最小值, 为

的最小值 就是允许的平均失真度 的最小值, 即

  • 当失真矩阵中每行至少有一个零元素时,

  • 若某一行没有零元素,则可以让该行所有元素减去该行最小值,这样就有了零元素(毕竟失真度可以自定义)

  • 因此,总是可以认为

  • 如果失真矩阵每一列至多有一个0,则 对应的试验信道疑义熵 ,即,收到Y以后对X不存在不确定性

  • 如果失真矩阵的列有大于1个0,则 对应的试验信道疑义熵 ,即,收到Y以后对X存在不确定性

  • 是在保真度准则 下平均互信息量 最小值
  • 是非负数, 因此 最小值是 0
  • 定义最大允许失真度 为使 的最小平均失真度 (平均失真度超过 仍然等于 0 )
  • 等价于 , 此时信道的输入随机变量 和 输出随机变量 之间一定统计独立, 即有

R(D)为减函数,D越大,所需要的信息量越少,所以R也越小,直到为0。 就是 R 即便为 0 也满足 D 的要求的那个点

R(D) 函数的凸性

(下凸)

定理 8.1 在定义域内是凸函数, 即对任意

R(D)函数的单调递减性

定理 8.2 信息率失真函数R(D)在定义域内是严格单调递减的。

使得平均互信息量最小的试验信道一定在试验集合的边界取到

8-3 信息率失真函数R(D)的计算

8-3-1 几种特殊离散信源的信息率失真函数

Fano不等式 ,式中 是输入符号种数,

扰码器:让输出变为近似等概分布,必须在压缩编码之后(因为等概的时候压缩的概率很低)

8-3-2 离散信源R(D)的参量表述

8-3-3 连续信源的信息率失真函数

连续信源的失真函数一般为

将离散情况中的求和运算改为积分运算

平均失真度:

信息率失真函数:

高斯信源的信息率失真函数

概率密度函数 平方误差失真 利用参量表述结果可得

一般信源的信息率失真函数

均值为 0 , 方差为 的连续信源 , 相对熵为 , 平方 误差失真下的信息率失真函数满足

  • 当X为高斯信源时,取到等号
  • 在平方误差失真下,相同方差的信源要达到同样平均失真,高斯信源具有最大信息率失真函数,即高斯信源最难压缩

8-4 保真度准则下的信源编码定理

定理 8.3 限失真信源编码定理 或 Shannon第三定理 是某离散无记忆信源的信息率失真函数, 并且选定有限的失真函数 。 对于任意允许的平均失真度和任意小的正数 , 以及任意足够长的码字长度 , 则一定存在一种信源编码, 其码字个数为 而编码后码的平均失真度 若码字数为 则一定有

实际上就是

  • 也可以将定理8.3作如下的叙述:
    • 若R(D)为离散无记忆信源的信息率失真函数,D为允许的失真度,则只要实际的信息率R满足 ,就存在一种编码方法,使其译码的平均失真度 ; 反之,若R < R(D),则无论怎样的编码方法,都不能使
  • R(D)是保真度准则下,信源信息率压缩的下限值。无失真信源编码信息率压缩的下限值是信源熵H(X),而
  • 若给定信源 ,其信息熵 ,规定了失真函数,选定了允许的失真度 ,即可求得信息率失真函数
  • 根据Shannon第三定理,必然存在一种压缩编码方法,使其平均失真度不大于 ,且其输出信息率由 下降到,只要

联合信源信道编码定理(信源信道编码分离定理): 设离散无记忆信道的容量为 比特/秒,离散无记忆信源熵为 比特/秒,则当 时, 则总存在一种编码方案使得译码错误概率任意小;反之,如果 , 则不存在使得译码错误概率任意小的编码方案。

第九章 差错控制的基本概念

9-1-2 差错控制系统

差错控制系统根据它们的纠、检错能力;对信道的要求及适应性;编、译码器的复杂性;编、译码的实时性等性能指标可以分为如下4类

  • 自动请求重传系统
  • 前向纠错系统
  • 信息重复查询系统
  • 混合纠错系统

自动请求重传系统 ARQ

  • 通信系统在接收端检测到传输错误并自动告知发送方,请求发送方重发,称为自动请求重发,简称反馈重传

前向纠错(FEC)系统

门限:误码率开始比未编码的差错性能更好的最小

定义9.1 对于给定的误比特率, 编码增益 是指 通过编码所能实现的 的减少量, 即: 其中 分别表示末编码及编码 后所需要的

信息重复查询系统( IRQ )

  • 是指接收端将收到的消息原封不动地转发回发送端,在发送端与原发送消息相比较的系统。如果发现错误,则发送端再进行重发,直至正确为止
  • 原理和设备都较简单,但需要有双向信道,因为相当于每一消息都至少传送了两次,所以传输效率较低

混合纠错系统(HEC)

  • HEC系统将反馈重传技术与前向纠错技术相结合
  • 当出现少量错码并在接收端能够纠正时,即用前向纠错方法纠正之;当错码较多超过其纠正能力但尚能检测时,就进行自动反馈重传
  • 混合纠错结合了ARQ和FEC两者的优点

9-2 纠错编码的基本概念及其本质

9-2-1 纠错编码的分类

分组码

码长为n = k + r,其中 k是信息元个数, r是监督(校验)元个数,监督元只与本组信息元有关。 通常将分组码写成码(n , k),或称为(n , k)码

卷积码

个信息位编码为 位,校验位不仅与本组的信息位有关,还与前 m 段的信息位有关。

为卷积码的码长, 为信息元个数,m为存储级数。通常将卷积码写成码,或称为

定义 设发码 , 收码 R: , 则定义信道的错误图 样为 , 其中 由定义可知 这里的+是二进制加法(异或)

定义 9.5 在错误图样中,若“1”集中于某个长度b内,则称该种错误为长度为b的突发错误, 其中b称为突发错误长度,该图样称为突发错误图样。

定义 9.6 分组码是对每段 位长的信息组, 以一定规则增 加 个监督(校验)元, 组成长为 的序列 称这个序列为码字或码组、码矢。在二进制的情况下, 位长的信息组共 个,通过编码器后,码字还是 个,称这 个码字的集合为 分组码。

  • 长序列的可能排列共有 种, 其中只有 重构成 了 分组码, 称它们为许用码组(对应了), 其余的 重为禁用码组

定义 9.7 卷积码是对每段 长的信息组以一定的规则增加 个监督(校验) 元, 组成长为 的码段; 个校验元不仅与本段的信息元有关, 且与前 段的信息元有关; 编码约束长度 , 它表示 个信息元从输入编码器到离开时, 在码序列中影响的码元数目。

定义 9.8 将信息位在码字中所占的比例称为编码效率,也称为码字效率,通常也用R表示。

重复码

重复码是k =1的分组码 (n, 1), 它的(n –1)个校验元是信息元的重复

重复码的译码采用大数判决方法,也称为大数准则,或最大似然准则、最小距离准则

  • 若n是奇数,可以实现完全的译码,称为完备译码
  • 若n是偶数,则会出现1、0个数相等的情况,将导致译码失败,称为不完备译码,但由于检出了错,可作删除处理或结合ARQ进行译码

重复码特点

  • d = n,随着n的增大,纠错检错能力越来越强,但R = 1/n随之下降,编码效率越来越低
  • 检错能力大于或等于纠错能力

汉明距越大,纠错检错能力越强

奇偶校验码

若添加的校验位使得每个码字中1的个数为偶数,则为偶校验,反之为奇校验

奇偶校验码特点

  1. d = 2,能检所有奇数个错
  2. R = (n –1)/n,编码效率很高。随着n的增大,编码效率趋近于1,但d /n 则趋近于0,即抗干扰能力下降

9-3 纠错编码方法的性能评价

编码性能优劣可以用最小码距 的大小来表征

定理 9.1 任一 分组码,若要在码字内:

  1. 检测 个随机错误,则要求
  2. 纠正 个随机错误,则要求
  3. 检测 个并纠正 个随机错误,则要求

第十章 线性分组码

10-1 近世代数的基础知识

10-1-1 整数的有关概念

  • 最大公约数(a, b)的性质:任意正整数a, b,必存在整数A, B,使
  • 同余:
  • 剩余类:余数相同的数

10-1-2 群的基本概念

定义 10.4 设G是非空集合,并在G内定义了一种代数运算, 若满足如下四个条件,则称G为一个群:

  1. 封闭性。 对任意,恒有
  2. 结合率成立。对任意,恒有
  3. 若 G 中有一元素e,对任意的 ,满足 ,则 e 称为单位元或恒元。
  4. 若对于任意 ,G 中存在有另一元素 ,使 ,则 称为 a 的逆元。
  • 若群G的二元运算满足交换率,即若 ,有 ,则称群 G 为交换群,亦称为 Abel 群
  • 群中元素的个数,称为群的阶。根据元素个数是否有限,可以分为有限阶群和无限阶群

定理 10.1 群具有如下性质:

  1. 群 G 中恒元是唯一的;
  2. 任一个群元素的逆元是唯一的。

定义 10.5 若群G的非空子集H对于G中定义的代数运算也构成群, 则称H是G的子群

定义 10.6 设G的子群 , 但 , 将它与 中的元依次相加, 得 , 称 的一个陪集 (Coset), 称为该陪集的陪集首。

  • H的陪集可能有许多个,因此可以将H进行陪集展开。G的每一元仅在子群H的一个陪集中

10-1-3 环的基本概念

定义 10.7 非空集合 R 中, 若定义了两种代数运算加和乘, 且满足

  1. 集合R在加法运算下构成 Abel 群;
  2. 乘法有封闭性, 即对任何 , 有 ;
  3. 乘法分配率及结合率成立, 即对任何 则称 是一个环。若环 对乘法满足交换率, 即对任何 元素 , 恒有 , 则称此环为交换环或 环。

性质:对于任何

  1. 环中可以有零因子:即两个非零元素相乘得到0
    • 有零因子环中乘法消去律不成立
    • 无零因子环中乘法消去律成立
  2. 有单位元且每个非零元素有逆元、非可换的环,称为除环

10-1-4 域的基本概念

定义 10.8 非空元素集合F, 若在F中定义了加和乘两种运算, 且满足

  1. F关于加法构成Abel 群, 其加法恒元记为 0 ;
  2. F中非零元素全体对乘法构成Abel 群, 乘法恒元记为 1 ;
  3. 加法和乘法间有如下分配律:,则称 是一个域

域是一个可换的、有单位元的、非零元素有逆元的环。

定理 10.2 域具有如下的基本性质:

  1. 域中一定无零因子, 即: 若 , 则
  2. 任何 , 有
  • , 则 ;
  • , 则

3种典型的有限域:

  • 二元域 : 集合 在模2加法和模2乘法下, 是 两个元素的域
  • 元域 :令 为素数,集合 在模 加法和模 乘法下是阶为 的域, 称为素域GF
  • 扩域GF : 将素域 扩展成有 个元素的域, 即得 次扩域 。扩域GF 可用一个多 项式 来描述

特征:最小的正整数 使得

  1. 素数域 的特征是
  2. 有限域的特征是素数
  3. 的子域,有 的幂

定理 10.13 有限域的阶必为其特征之幂

域元素 a 的阶:最小的正整数 使得

    • 元素 在GF 乘法下形成群, 称为循环群
  1. , 则
  2. , 令 的阶, 则 能被 除 尽。如果 的阶是 , 则称 是本原的, 为本原元素,简称本原元。本原元素的各次幂生成GF 的所有非零元素
  3. 的特征为 , 且 , 则

10-1-5 二元域的运算

系数取自 GF(2) 的 n 次多项式:例如序列 10011:

  1. 可以按普通方法加减乘除
  2. 满足交换律、结合律、分配律
  3. 可做长除法

既约多项式

定义 10.9 若GF(2)上的m次多项式不能被GF(2)上的任何次数小于 m 但大于零的多项式除尽, 就称它是GF(2)上的既约多项式(约到头的多项式)

例如 是4次既约多项式

  • 对任意m≥1,存在有m次既约多项式
  • 能被分解因式的,都不是既约多项式
  • GF(2)上的任意m次既约多项式,除尽

本原多项式

定义 10.10 若 m 次既约多项式 p(x) 除尽的 的最小正整数 n满足 , 称p(x)为本原多项式

  1. 本原多项式一定是既约的,因为它是用既约多项式来定义的,但既约多项式不一定是本原的
  2. 对于给定的m,可能有不止一个m次本原多项式。

10-2 线性分组码的编码

10-2-1 有关概念

定义 10.12 码长为n,有 个码字的分组码,当且仅当其 个码字构成域 GF(2) 上所有n重矢量空间的一个k维子空间时,称该分组码为(n, k)线性分组码

  • n重二进制码元组成的集合 称为二进制的矢量空间
  • 矢量空间 的一个子集 S 如果满足以下两个条件,则称其为 的一个子空间
    1. 全0矢量在S中
    2. S中任意两个矢量的和也在S中(即满足封闭性)
  • 假设 二进制分组码中的两个码字(或码矢量), 当且仅当 也是一个码矢量时, 这个码才是线性的; 特别地,当 时,
  • 二元分组码是线性的充要条件是两个码字的模2和也是码字;或者说线性分组码的子集以外的矢量不能由该子集内的码字相加产生

分组码的线性只与选用的码字有关,而与消息序列怎样映射到码字无关

称满足 映射为码字 的关系为线性分组码的特殊关系

  • 只要全0的消息序列映射为全0的码字,都能满足特殊关系

定理 10.5 线性分组码的最小距离等于非零码字的最小重量

10-3-1 伴随式译码

是线性码 中重量为 的码矢数目, 是二 进制对称信道 (BSC) 的转移概率, 若在 只用 来检错, 用 表示末检出错误的概率, 即错误图样恰 好为码字的概率。对于任意重量 , 这种情况的概率 为 而重量为 的码矢数目为 , 考虑到全部 的 , 故有

10-3-2 标准阵

定义 10.14 个可能的接收矢量划分成 个不相交的子集,使每个子集只含有一个码矢,这个阵列称为标准阵

落在一个子集里的接收矢量就判给同一个码字

一行是一个陪集

  • 应该要把重量较小的码字作为陪集首(第一列),这样能译为离接收码字最接近的码字
  • 表示重量为 的陪集首的数目, 称 为陪集首的重量分布, 当且仅当错误图样不是陪集首时才出现译码错误, 故对于转移概率为 的二进制对称信道 而言, 采用标准阵译码方法所产生的译码错误概率为
  • 一个陪集的所有 个码字有同样的伴随式,不同陪集的伴随式互不相同

10-3-3 伴随式译码的一般步骤及性能

定理 10.7 按照标准阵将接收码字译为它与它所在陪集的陪集首的模2和的译码算法是最小距离译码算法

10-4 线性分组码举例

定义 10.15 距离为 3 的线性分组码 为汉明码, 其中 为任何不小于 2 的整数。 汉明码能够纠正 1 个错误, 它的码长 , 消息序 列的长度 , 一致校验部分的位数 , 故其编码效率为

定义 10.16 设C是 线性分组码,其纠错能力为t。如果用且只用不大于t个错误的全部错误图样作陪集首就能构成标准阵,那么就称这个码为完备码

第十一章 循环码

11-1 循环码的描述

11-1-1 循环码的定义

定义 11.1 一个(n, k)线性分组码C,若它一个码矢的每一循环移位都是C的一个码字,则C是一个循环码

定理 11.1 设循环码的码多项式为 , 循环移位 次后 的码多项式为 , 则 除多项式 所得之余式。

定理 11.2 循环码C中,次数最低的非零码多项式是惟一的。

定理 11.3 循环码 C中最低次数的非零码多项式, 则常数项 必为 1 。

定理 11.4 是一个 循环码 C中次数最低的非零码多项式, 一个次数等于或小于 次 的二元多项式, 当且仅当它是 的倍式时才是码多项式。

定理 11. 4 说明,一个次数等于或小于 次的二元多项式是码多项式的充要条件为它是 的倍式。

定理 11.5 循环码的生成多项式 的因式

定理 11.6 是一个 次多项式且是 的因式,则 生成一个 循环码。

任何一个码字都是

11-1-3 生成矩阵和一致校验矩阵

若待编码的消息用行矩阵表示为 则非系统循环码的编码输出为 可得非系统形式的一致校验矩阵

系统码

系统形式的循环码生成矩阵,由非系统形式的生成矩阵通过行变换而获得

对所有的 , 用生成多项式 ,有 其中 是余式,表示为 因此 的倍式,即码多项式。系统形式的生成多项式为

11-2 循环码的编码和译码

11-2-1 循环码的编码

系统循环码: 定理 设循环码的生成多项式为, 待编码的消息多项式为 的次数分别是 , 则 为码多项式, 用此方法编得的码字为系统循环码。

11-2-2 循环码的译码和错误检测

伴随多项式

定理 11.8 是接收多项式 的伴随多项式, 则用生成多项式 所得之余式 , 就是 循环移位一次 的伴随式。

推论 用生成多项式 所得的余式 , 是 的第 次循环移位 的伴随式。

英文技术写作

Unit 1 Definition of technical writing

Introduction

  1. Definition
    1. Technical writing: a form of written document providing technical information that help readers to solve complex problems
  2. Main features
    1. Reader-centeredness
    2. Clear organization and page design
    3. Readable style and effective visuals
  3. Purposes
    1. inform
    2. instruct
    3. persuade

How to meet the needs of specific audiences

  1. Who will use your document?
  2. Why they will use it?
  3. How they will use it?
Who will use the documents?At what level of technicality?How much do these readers need?
ExpertsHighly technicalJust the facts & figures
Informed personsSemitechnicalFacts & figures explained
Laypersons(外行)NontechnicalFacts & figures explained in simplest terms

Ethical issues

Ethics(伦理学): Moral beliefs and values

  • Rules or principles
  • Behaviors

How is ethics related to technical writing

  1. Reporting and analyzing data honestly
  2. Balancing between production and safety
  3. Avoiding burying bad news in paragraphs

Process for writing technical documents

The five steps are not linear

  1. Planning
    1. Analyze your audience
    2. Analyzing your purpose
    3. Generate ideas about your subject
    4. Research additional information
    5. Organize and outline your document
    6. Select a design or a delivery method
      • page layout
      • typography
      • use of color
    7. Devise a schedule and a budget
  2. Drafting
  3. Revising
  4. Editing
    • grammar
    • punctuation
    • style
    • usage
    • diction
    • mechanics
  5. Proofreading

Writing style and tone

  1. Clarity
    1. Use active voice whenever possible(主动句)
    2. Avoid overstuffed sentences(避免长难句)
  2. Conciseness
    1. Clear writing
    2. Compressed writing
  3. Fluency
  4. Appropriate tone

Unit 2 Technical document design

Design Principles

  1. To make a good impression on readers.
  2. To help readers understand the structure and hierarchy of the information.
  3. To help readers find the information they need.
  4. To help readers understand the information.
  5. To help readers remember the information.
  • Proximity(行距)
  • Alignment
  • Repetition
  • Contrast

Designing Visual Information

Types of visuals

  1. Table
    • Numerical tables
    • Prose tables(文字表格)
  2. Graph
    • Bar graphs
    • Line graphs
  3. Chart
  4. Graphic illustration

How to choose the right visuals

  1. What is the purpose for using this visual?
    • Convey facts and figures -> Table
    • Draw conclusions -> Graph
  2. Who is my audience for these visuals?
    • Expert audiences
    • General audiences

Designing Documents

  1. Shaping the page
    1. Provide page numbers, headers and footers
    2. Use a grid
    3. Use white space to create areas of emphasis
    4. Make lists for easy reading
  2. Styling the words and letters
    1. Select an appropriate typeface: Serif(衬线), Sans serif(无衬线,Sans 是 without 的法语)
    2. Use full caps sparingly
  3. Adding emphasis
    • Indention
    • Lines
    • Boldface
    • small or large type sizes
    • color
  4. Using headings for access and orientation

Unit 3 Correspondence

Presenting yourself effectively in correspondence

Steps of the writing process:

  1. Prewriting / Planning
    • purposes
    • audience
    • tone and content
    • communication channel
  2. Writing / Drafting
    • organize content logically
    • choose a method of organization
  3. Rewriting
    • revising
    • editing
    • proofreading

Principles of effective communication:

  • Use the appropriate level of formality
  • Communicate correctly
  • Project the "You Attitude" = looking at the situation from the reader's point of view
  • Communicate honestly
  • Seeking the goodwill of readers

Writing messages

Text messaging:

  • the delivery of exchange of brief written messages via mobile phones or networks.

Characteristics:

  • simple messages
  • people on the move,
  • near-instant, brief written exchanges

Benefits of text messages:

  • Increased speed of communication
  • Improved communication efficiency
  • Less intrusive communication channel
  • Low cost
  • Multitasking
  • Decreased intimidation(恐吓)
  • Easy documentation

Potential Problems:

  • Reduced professionalism
  • Security issues
  • Employee misuse and distraction
  • Lost productivity

How to avoid:

  1. Decide whether text messages are suitable for the writing situation.
  2. Consider the length and formality of the text messages.
  3. Clearly and briefly explain the context of your message
  4. Summarize decisions.
  5. Document important information.
  6. Plan for handling emotions effectively.

How to write text messages effectively:

  • the appropriate software or tool to use
  • the contact list
  • messaging policies of the employer

Ready to write

  • no format
  • informal tone
  • a limit on the number of characters
  • abbreviations and shortened spellings

Writing emails

  • short, informal
  • longer, formal
  • attachment

Advantages

  1. quick and efficient
  2. useful when people are in different time zones or have different working schedules
  3. convenient attaching
  4. paper-free and cost effective
  5. easy documentation

Parts and Format of Email

  • Heading section
    • “To”
    • “From”
    • “Subject”
  • Salutation
  • Introductory paragraph
  • Body text
  • Conclusion
  • Complimentary closing
  • Signature block: contact information of the writer

Tips of writing emails

  1. Find out your organization's email policies first.
  2. Recognize your audience.
  3. Identify yourself by name, affiliation, or title.
  4. Provide an effective Subject line.
  5. Keep your email messages brief and each paragraph short.
  6. Organize your e-mail message.
  7. Proofread your email message
  8. Be careful when sending attachment
  9. Be courteous and professional.

Writing memos

Memos are used within organizations for

  • routine correspondence
  • short reports
  • proposals
  • other internal documents

Key points included:

  • identification lines: TO, FROM, DATE, SUBJECT
  • introduction: one or two clear introductory sentences about the topic and the purpose
  • discussion: developing the content specifically making the text reader-friendly
  • conclusion: concluding the memo with "thanks" and/or directive action.
  • audience recognition: in-house audience(内部受众) -> acronyms and internal abbreviations(首字母缩写和缩写)
  • appropriate memo style and tone: one page long with simple words, short sentences, specific detail, and highlighting techniques, informal and friendly tone

A template for memos:

  • Introduction: A lead-in or overview stating why you are writing and what you writing about.
  • Discussion: Detailed development, made accessible through highlighting techniques, explaining exactly what you want to say.
  • Conclusion: State what is next, when this will occur, and why the date is important.

Unit 5 Instuctions

Designing and writing instructions

  1. audience recognition: level of readers' knowledge
    1. Don't assume anything
    2. spell it out clearly and thoroughtly
  2. language style
    1. imperative mood + active voice + present tense
    2. clarity
  3. short, simple steps in proper sequence
    1. use first, next, finally
    2. use numbers
  4. planning ahead

design instructions based on

  • audience
  • purpose
  • subject

S-S-S: short-simple-sincere

Misleading TC:

  1. false implications
  2. exaggerations
  3. legalistic constructions
  4. euphemisms(委婉)

ethics in TC:

  • 4 standards: rights, justice, utility and care

proposal

  • background
  • problem
  • proposal

presentation

clear and sturctured

no thank for time in intro

no pause after each main point

chair and host dont ask

leave a clear summary

signposting

not organized depend on title(头衔)

email

tone: approvable formality

不能指代不明,譬如只写 one of

  • BC: blind copy
  • CC: courtesy copy

得分要点:

  • 重要信息点是否全面(time,date,location, etc.)
  • Purpose (e.g., I’m writing to inform…)4
  • Opening (address, Greetings)2
  • Closure (e.g., Yours, Sincerely, etc.)2
  • Politeness (e.g., Please feel free /don’t hesitate to contact me if you have any questions,I’d appreciated it if you reply soon/should eliminate impolite words...)
  • Language (correctness, appropriateness)

格式:

  • 开头靠左 Dear xxx:
  • 没有首行缩进,段间空行即可
  • 目的 I'm writing to
  • Firstly, secondly, ...
  • 末尾 Don't hesitate... Thank you.
  • 结尾靠左 Sincerely 换行 xxx

instruction

4 elements:

  1. title
  2. intro
  3. step-by-step instructions
  4. conclusion

glossary(术语表):

  • defines unfamiliar terminology(术语)

typically limited in its subject

closely connected with process description

noun string should be avoided in the title

得分要点:

  • 步骤以时间顺序排列
  • Number the steps (以数字标注每一步骤)
  • imperative mood(使用祈使句)
  • 每一步骤包含一个信息点
  • Language (correctness, appropriateness)

user manual

大写用于 warning 或 danger(即 signal words),但要用就全部大写

resume

also called functional resume

  1. generous margins
  2. clear style
  3. balance
  4. clear organization

individual fields of competence

all / every 慎用

得分要点:

  • Identification lines
  • Career objective: precise and specific
  • Summary of qualifications: list, parallel phrases
  • Employment (job title, name of the company, location, time period, job duties, etc.)
  • Education: reverse chronological presentation
  • Professional skills: quantify

memo

diagonal communication: 不同部门上级对下级

moderately formal tones

delivered at company's in-house mail procedure

"purpose is to do sth."

往往有两份

action items / steps: placed in recommendation

得分要点:

  1. Subject line should be specific
  2. Discussion:有条理;easy on your eyes
  3. Recommendation:polite
  4. Language:appropriate and grammatically correc

生词

  • excerpt:摘录
  • intonation:语调
  • confrontation:对抗
  • rehearse:排练
  • catalyst:催化剂
  • forge:伪造
  • credibility:可信度
  • proceeding:会议论文集
  • prelude:前奏
  • customary:习惯的
  • diagonal:对角的
  • netiquette:网络礼仪
  • tailor:缝制
  • impromptu:即兴的
  • gerund:动名词
  • internship:实习
  • prominent:凸出的

cover letter

这一页为应试笔记,全是陈明灌输的狗屎毫无价值

典型题目:

  • 2.5.5
  • 4.4.1
  • 6.4.2
  • 7.LT.4,7.LT.6

第五章切入点很可能不是 而是

第七章有大问题!

6,7,8没怎么看

两个随机变量和的概率密度函数是它们各自概率密度函数的卷积,是它们联合概率密度函数的二次积分(分布函数)的导数

第一-三章

离散时间随机过程在 n 个时刻的取值一定是一个 n 维随机变量

看到正态多想想算均值和方差(前提是目标也是正态)

离散熵和连续熵定义不一样(狗屁,就是一样的)

随机过程是一个无穷维的随机向量

均方相等>处处相等>分布相等

独立一定不相关,不相关不一定独立;独立不一定正交

随机过程不能定义为样本函数的集合(因为随机过程是变函不是集合)(狗屎)

熵有负号

Poisson分布

  • 概率质量函数:
  • 概率生成函数:

指数分布

  • 概率分布函数:
  • 概率密度函数:
  • 概率特征函数:

一个多维随机变量的所有边界概率密度函数,不能推出其联合概率密度函数

第六章

随机过程在某个时间点/区间上的均方导数/积分是一个随机变量,其描述的一族样本函数在该时间点/区间上的导数/积分随机变量在均方意义上的收敛。

表示均方求导

均方收敛表示大部分样本函数收敛,但是有一小撮可以不收敛

第八章

统计推断:已知两个边界事件的联合概率函数,然后根据可观察到的一个边界事件的取值,推断另一个不可直接观察的边界事件的取值

若实随机信号的功率谱密度在 (直流)点不为零,且其支集包含于零点的一个邻域内,则为带限随机信号。

将带限随机信号输入一个线性系统,其输出只与该线性系统的传递函数在带限内的取值有关。

Hilbort 变换将信号的正频率部分相移负90度,负频率相移90度,去除直流部分。也就是通过 的线性时不变系统。

宽平稳高斯通过线性系统后变为严平稳。

功率谱密度所定义的带宽没有真实频谱意义

第十-十二章

  • 非因果:
  • 因果:
      • 的分子和分母均为 形式,
      • 的分子和分母均为 形式,
      • 形式,
      • 形式,

最小错误概率就是最大后验概率 <= 最大似然检测的错误概率

第十三-十五章

题中给的离去率是每个窗口的,故总的要乘

稳态方程:项取箭头的起点,若起点为本身,则为负

非齐次 Poisson 过程是 Markov 过程,Poisson 过程是齐次 Markov 过程

生灭过程的Q矩阵是三对角的(就是只有主对角线和旁边两条次对角线非零)

排队过程都是连续时间 Markov 过程

第一章 概率空间和随机变量

1-1 概率空间

1-1-1 样本空间

N 维样本空间:N 个一维样本空间的笛卡尔乘积。例如空间坐标分布(x,y,z)就是一个 3 维样本空间

多维和无穷维样本空间也称为乘积样本空间

此外,对于所有满足 的正整数 ,称集合 中任意 M 个集合的笛卡尔乘积为M 维边界样本空间

1-1-2 Borel 事件集

Borel 事件集

空、全、补、并 由样本空间 的一些事件组成的集合,如果事件集 A 满足下面的三个性质:

  1. ,则
  2. 若有 ,则

则称事件集 为定义于样本空间 上的 Borel 事件集。

也就是闭合:空集、全集、补集、并集都在事件集中

Borel 事件集所满足的上述三个性质规定了事件间应满足的基本逻辑事实: 第 1 条性质规定必然事件 S 和不可能事件 必须作为考察的对象,第 2 条性 质规定了一个事件的反面也构成一个事件,第 3 条性质规定了任意多个事件的 并也构成一个事件。规定事件集满足如上所述的三个 Borel 条件,是为了保证 所有需要考虑的事件在逻辑上具有相容性。

1-1-3 事件的概率

概率是事件频率稳定性的模型

事件的频率定义为,在若干次试验中某个事件出现的次数占试验总次数的比例。设有事件 A,其频率 F(A) 定义为

在不同时间或地点,针对同一种非确知系统做多次试验,当试验的次数 T 超过一定规模时,则不论 T 是多少,也不论观察哪一个事件 A,事件 A 的频率 F(A) 总是与一个固定的常数相差不远,或者说在该常数左右作微小波动,这种现象称为事件的频率稳定性。

概率是频率所遵循的绝对规律,频率是在概率这个绝对规律之 上,叠加一些小扰动之后的具体表现。

  1. 概率九事:非确知系统、试验、样本点、样本空间、事件、Borel 事件集、事件的频率、频率稳定性、概率。
  2. 概率三要:样本空间、Borel 事件集、概率集函数。三要是概率概念的略说,九事是详说。
  3. “随机”不是前一瞬间的条件固定,下一瞬间的结果可以有多种;而是前一瞬间的条件没有办法完全观察或测量到,于是就无法预测下一瞬间的试验结果。随机与非随机不是系统固有的属性,而是观察者根据自己的观察能力对系统所做的分类。
  4. 事件的频率稳定性是系统内部微观机制稳定性的一种体现。
  5. 事件的概率是事件频率的稳定值
  6. 概率的作用有两个:一是预测非确知系统事件未来的发生频率,二是根据可观察的边界事件,推断不可观察的边界事件。

1-1-4 边界

乘积样本空间的事件称为联合事件,一个联合事件在其边界样本空间上的投影称为边界事件

似乎就是说投影到低维度上。。

单满映射就是双射,也就是一一映射。

概率集函数:设 为 定义于样本空间 上的 Borel 事件集,则映射 为概率集函数

概率空间:由“样本空间 S、Borel 事件集 A、概率集函数 P”这三者组成的一个集合,记为

S 生成 A,P 度量 A

1-2 事件间的关系

1-3 随机变量

1-3-1 标准概率空间

最常见的标准样本空间有以下几类:

  1. 实数空间: ,其中 为可数无穷;
  2. 复数空间:,其中 同上;
  3. 实(复)函数空间:,其中的 是不可数无穷, 的定义如下 其中 是某个不可数的一维指标集合,如一维闭区间。此时, 表示的是由定义于区间 上的实函数或复函数组成的集合。

非标准概率空间的标准化

假设 是上面所说的三类标准样本空间, 是某个概率空间 的 样本空间。若存在 上的单射 ,则 之间就建立了一个单满映射(也即双射),于是就可以用标准样本空间的子集 来代替

非空,则可以将事件 的概率定义为零。譬如抛硬币 ,且定义 的概率为零。

若有一个函数 ,则显然这个函数对应着如下的无穷维向量:, 有时候将此向量表示为 或者 。此时,函数的定义域就是该无穷维向量的维数指标集,而函数在定义域内每个元素上的取值就是该向量在该维数上的取值。

若有一个函数 ,其中 是某个不可数的一维指标集,则这个函数对应着如下的不可数无穷维向量:。此时,函数的定义域就是该不可数无穷维向量的维数指标集,而函数在定义域内每个元素上的取值就是该向量在该维数上的取值。

随机变量

随机变量本质上是变量。

随机变量实际上是传统变量的“升级版”,它在“兼容”传统变量所有属性的同时,还增加了取值概率属性。

随机变量按照其维数可以分为有限维和无限维两种。有限维随机变量又可以分为一维随机变量多维随机变量两种,无限维随机变量又可以分为可数无限维随机变量不可数无限维随机变量两种。

多维随机变量有时候也被称为随机向量,如果多维随机向量以矩阵的形式呈现,也称为随机矩阵

因为一个无限维的向量可以看作一个函数,所以一个无限维的变量就称为一个变函,一个无限维的随机变量也称为随机变函

如果一个随机变函变化范围内的所有函数具有相同的定义域,且此定义域是时间指标集,则称该随机变函为随机过程。或者说,一个无穷维随机变量的维数指标如果具有时间的物理意义,该无穷维随机变量也被为随机过程

随机变量变化的样本空间如果是实数空间,则称为实随机变量;随机变量变化的样本空间如果是复数空间,则称为复随机变量。从维数的角度来观察,对任意 ,n 维复随机变量在本质上就是一个 2n 维的实随机变量。

第二章 一维随机变量

2-1 一维随机变量的定义

当考虑变量 的取值频率时,其就成了一个一维随机变量

2-2 概率密度函数

概率分布函数

性质:

  1. 单调递增
  2. 右连续,即

概率密度函数定义为概率分布函数的广义导数:

性质:

2-3 数字特征

  • 均值:
  • 均方:
  • 方差:
  • 阶原点矩:
  • 阶鿇对原点矩:
  • 阶中心矩:
  • 阶绝对中心矩:

2-3-3 熵

  • 事件的信息量:
  • 一维随机变量的熵:

常见分布

对数分布

Cauchy分布

  • 概率密度函数:
  • 概率特征函数:

Laplace分布

  • 概率密度函数:
  • 概率特征函数:

Poisson分布

  • 概率质量函数:
  • 概率生成函数:
  • 均值:
  • 方差:

指数分布

  • 概率分布函数:
  • 概率密度函数:
  • 概率特征函数:

概率质量函数和生成函数只能描述离散,而分布函数、密度函数和特征函数可以描述离散和连续

  • 概率质量函数,实际上是离散的概率密度函数
  • 概率生成函数,概率质量函数的 z 变换
  • 概率分布函数,离散和连续都有
  • 概率密度函数,pdf
  • 概率特征函数,概率密度函数的 Fourier 变换

第三章 多维随机变量

联合概率分布函数中令某个分量趋于无穷大,就得到边界概率分布函数

  • 概率密度函数,有
  • 联合概率密度函数:为联合概率分布函数的 n 阶导数
  • 联合概率分布函数
  • 边界概率密度函数

3-3 数字特征

  • 均值:

  • 均方

  • 方差

  • 相关矩:

  • 协方差:

  • 相关系数:

  • 联合原点矩:

  • 联合中心矩:

  • 相关性:协方差不恒为 0

  • 独立性:边界密度函数之积等于联合密度函数

3-4 多维随机变量分量间的关系

  • 条件概率密度函数
  • 条件期望

复随机变量

一维复随机变量:

  • 均值
  • 方差

第四章 离散时间随机过程

若概率空间 的样本空间 由定义在自然数集 之上的函数组成,此时 中的样本点是定义域离散的函数,称为 样本函数,可以记为 ;而在 中变化的变函,即随机变函,记为

样本函数个数:似乎对应于事件的种类,譬如随机发送全0或全1的发送端,其接收端的信号就只有两个样本函数。每次试验就会生成一个样本函数,所以只有多次试验完全一致时,它们才共用一个样本函数。

样本点可以理解为一个命运,即横轴为时间,纵轴为取值的曲线;样本函数则为一系列命运的模板

4-2 概率函数族

联合概率质量函数 称为离散时间随机过程 概率质量函数 是状态空间的样本点,称 概率质量函数族

称为 概率生成函数 称为 概率密度函数

4-3 矩函数

  • 均值函数,A 为 X 中的随机变量
  • 方差函数
  • 自相关函数
  • 自协方差函数
  • 自相关系数函数

4-4 常见离散时间随机过程

独立过程

Poisson 过程是独立增量过程

和过程

的和过程

生成函数:

概率质量函数(独立增量):

二阶矩过程

如果离散时间随机过程 对于每个 n,一维随机变量 的方差都存在,则为离散时间二阶矩过程。

严平稳与宽平稳过程

严平稳过程:若对于任意正整数 K 和任意采样时刻 ,随机过程 的 K 维概率分布函数对任意整数 n 满足: 则为严平稳过程。

宽平稳随机过程:若离散时间随机过程 的均值函数 为常数,且自相关函数 只和时移 有关,即 可以表示为 n 的函数 ,则为宽平稳随机过程。

若随机过程 都是宽平稳离散时间随机过程,且互相关函数 只和时移 n 有关,即 ,则称 联合宽平稳离散时间过程

,A、B 为两个随机变量

高斯过程的二维概率密度函数:

第五章 连续时间随机过程

随机过程不是集合

m 维概率分布函数

联合概率质量函数中,两个过程中的随机变量取值是统一的

第六章 二阶矩过程的数学分析

6-1 离散时间随机过程的均方收敛

概率分布意义上相等:概率分布函数恒等:

概率意义上相等(几乎处处相等):事件发生概率相等:

均方意义上相等:X 与 Y 的二阶矩存在且满足 (即均方收敛)

Loève准则 均方收敛 当且仅当 序列 的自相关函数 满足 ,C 为常数。

均方收敛至 ,则

6-2 连续时间随机过程的均方连续

对于设有定义于时间指标集 上的连续时间随机过程 或某个区间 ,若对 ,当 时有 则称随机过程 点均方连续; 若对 内任意一点 都在 点连续,则称 上均方连续。

性质:若 为宽平稳过程,则 上均方连续,当且仅当 点连续。

6-3 连续时间随机过程的均方导数

设有定义于连续时间指标集 上的随机过程 ,若有

则称 点均方可导,并称 点的均方导数, 有时也记为 。若对任意 都均方可导,则称 上 均方可导。

也即:

点的 阶均方导数可以递归地定义为

6-3 连续时间随机过程的均方积分

可积的证明,可以先算出 的积分为 ,然后再证明 的导数为 ,以及 即可

第七章 随机变量的变换

7-2 有限维随机变量间的变换

定理7.2.1:设一维随机变量 X 的概率密度函数为 是单调可微函数,则 Y 的概率密度函数为

定理7.2.4:同维变换时,若 ,则有

定理7.2.6:若 有一阶偏导数,则有 其中, 的 N 个实根, 为下列 Jacobi 矩阵:

无解,则

第八章 离散时间信号分析

维纳—辛钦定理:若离散时间过程 宽平稳,其自相关函数为 且满足 ,则

  • 为系统冲激响应

白噪声:功率谱密度 为常数

实~~宽平稳~~过程的功率谱密度是偶函数

输入与输出的功率谱传输特性

可以全程用 z 变换代替,其中

自回归(AR)模型

定义,W 为白噪声序列

  • 传递函数:

第九章 连续时间信号分析

维纳—辛钦定理:若连续时间过程 宽平稳,且其自相关函数 满足 ,则

传递函数计算举例:

卷积

Poisson 随机电报过程

是宽平稳过程

设信号平均传输速率为

  • 自相关函数为
  • 功率谱密度为

3dB 带宽

使功率谱密度大于 的频率范围

等效带宽

第十章 信号检测

信号的统计推断又称为统计信号处理,是指根据观察数据与待推断数据之间的先验统计关联信息 (如联合概率密度函数、条件概率密度函数等),由观察数据的情况来推断另一个阈值关联的数据情况。

所谓假设检验,就是在已知 不可直接观察的随机现象的样本空间 和 可直接观察的随机现象的样本空间 的联合概率函数的条件下,根据当前观察到的 的取值,来推断到底是 中哪一个假设导致了目前的观察值。

信号检测是假设检验的一种,当观察空间和待检验空间都是信号时,这种假设检验就是信号检测

10-2 常见判决准则

Bayes 判决准则

如果输入 “假设” 为 , 设 为将 判定为 的代价, 所谓 Bayes 䖺堆则就是观测空间的一个判决分割 , 这种判决分割使下列风险收敛达到最小, 即

为在判决分割 下将 判决为 的概率

定理 (二择一 Bayes 检测) 只有两个 “假设” 的 Bayes 检测, 代价满足 。设两个 “假设” 分别为 , 观测空间 , 设观察向量为 , 记 的 Bayes 判决区域为 的判决区域为 。这里 被称为似然比, 被称为门限似然比。

第十一章 信号参数估计

估(ū)计:连续(ù);假设检验(àn):离散(àn)

信号估计按照其待估计的对象可以分为“信号参数估计”与“信号波形估计”这两类。

参数估计:有限维;波形估计:无限维

11-2 常见估计准则

11-2-2 最大后验概率估计

最大后验概率估计就是用 使后验概率质量函数 或后验概率密度函数 达到最大值的 作为 的估计值,写成数学表达式就是

一般来说,假设后验概率函数的所有一阶偏导数存在,则最大后验概率估计 是下列线性方程组的解:

11-2-3 最大似然估计

设观测值为 ,待估参数为 ,最大似然估计就是用使条件概率密度函数 (即 )达到最大值的 作为 的估计值,写成数学表达式就是

该条件概率密度 又称为似然函数。假设似然函数的所有一阶偏导数存在,则最大似然估计 是下列线性方程组的解:

似然函数可以写为

11-2-3 最大均方误差估计

定理:使均方误差达到最小的估计字具有如下表达式: 且最小均方误差估计是无偏估计,即

11-3-3 参数估计举例

信号的频率估计

若传输信号具有形式: 式中,幅度 A 和相位 为常数; 是待估参量。假设 上的均匀分布,此问题的似然函数为

, 则

第十二章 信号波形估计

12-2-2 离散时间信号的 Wiener 滤波

最佳滤波器的系统函数为

这样决定的 ,使最小误差为

因果问题的求解

例:设 ,其中 是自相关函数为 的一阶过程; 是均值为零、自相关函数为 的白噪声,且 相互独立。 下面确定非因果和因果离散线性滤波器,使输入 的输出 的均方误差达到最小, 即 达到最小。

解:显然白噪声 的自相关函数的 变换为 ,而 变换为 另外,此时 。因此可知非因果滤波器的系统函数为 式中 因此,冲激响应为 下面来求因果解。第一步,有 因此 第二步,有 因此 第三步,有

第十三章 离散时间 Markov 链

常返状态是经过无穷多步后仍要返回的状态,而瞬过状态是经过足够大的步数后,就不会再返回来的状态(也就是有概率再也回不来的)

离散时间 Markov 过程是具有一阶记忆特性的离散时间随机过程,而 离散时间 Markov 链则是状态离散的 Markov 过程。设 为一个离散时间 Markov 链,则转移概率质量函数满足 (这是 Markov 链的充要条件)

齐次连续时间 Markov 链的状态停留时间是指数分布的随机变量

嵌入 Markov 链是离散的

13-1-2 状态方程

为 Markov 过程 在时刻 n 出现状态 i 的概率,称为 的状态概率。 称 为 Markov 过程 的状态过程矢量。显然

表示在时刻 m 时状态为 i 的条件下,到时刻 n 状态为 j 的条件概率,称为 Markov 链 的转移概率。称矩阵 为从时刻 到时刻 的状态转移矩阵。显然矩阵的每一个元素都非负且每行的和为 1 ,即 显然,由全概率公式知 ,则由

13-1-3 齐次与平稳 Markov 链

齐次 Markov 链

若有 对任意 成立,即转移概率 只和时间间隔 有关,与起点时刻 无关,则为齐次 Markov 链。

平稳 Markov 链

当齐次 Markov 链的状态概率矢量 为常矢量时,为严平稳 Markov 链,有

13-2 平稳 Markov 链的状态分类

若存在 ,使 ,则称状态 j 是从状态 i 可达的,记作 , 两个互相可达的状态 i 和 j 称为互达的,记作

互达性是一种等价关系,满足自反性,对称性和传递性。

在集合 中,所有和 等价的元素构成 的子集,称为一个等价类

若 Markov 链 的所有状态都属于同一个等价类,即所有状态都互达,则称该 Markov 链是不可约的,反之为可约的

状态空间分解定理 状态空间 必可分解为 式中, 是瞬过状态的集合; 是两两互不相交的由常返状态组成 集,且满足如下条件:

  1. 对每个 内任意两个状态是互达的。
  2. 对任意 ,以及任意 互不可达。
  • 零常返:返回自身所需的步数为无穷大(只存在于无限状态的 Markov 链中)
  • 正常返:返回自身所需的步数为有限数
  • 为首次返回状态 i 需要的步数,
  • :零常返;:正常返

常返状态的周期

对常返状态 i,使 的所有 n 的最大公约数称作状态 i 的周期,记作

  • 若对所有 ,都有 ,则约定 i 的周期为
  • ,则称状态 i 为非周期的(即任意步上都能返回)

等价类同周期

遍历:非周期的正常返状态

第十四章 连续时间 Markov 过程

齐次连续时间 Markov 过程在时间段 内保持在状态 的概率为 因此在时间段 内离开状态 的概率为 从式 (14.1.8) 可以看出, Markov 链离开状态 的概率和时间近似成正比, 比例系数 称 为状态率。 齐次连续时间 Markov 链从状态 到状态 的状态转移率定义为 上式用到了

若连续时间 Markov 链的状态数有限, 设为 , 则此时暂态方程为 式中, 矩阵 具有如下表达 而稳态概率满足下列线性方程组

第十五章 排队论初步

用 A/B/C/D 描述排队系统,其中 A 代表用户到达时间规律,B 表示用户服务时间规律,C 表示资源窗口数及其结构,D 表示排队规律。

  • 到达率(服务率):
  • 到达间隔(服务时间)的均值:
  • 比例系数:

答题要用句子,而不是抄 PPT 的 keypoint

  • 有效性
  • 可靠性
  • 通过性:固定有效性或可靠性的情况下,正确通过信道的比特数

人为增加的冗余具有很强的纠错能力,自然的冗余则没有

故意引入 ISI(其实不是故意引入,而是 ISI 很菜,均衡技术可以轻易去除它),以扩展频宽

移动通信实现了(有人烟的地方)无缝覆盖,这是其相对于 WiFi 等的最大特点。

CDMA 必须扩频

CDMA 是第一个使用同频覆盖的技术

  1. CDMA 不同径、不同用户间才会有干扰;

CDMA 是自干扰系统,址间干扰的幅度远大于白噪声和多径干扰

信干噪比:信息、干扰、噪声。信噪比主要要考虑放大器的灵敏度

OFDMA(一定要写 A)

CP:循环前缀

OFDM 不适用于上行信道多用户应用:功耗太大

BCH码:

  • 经典的纠错编码,固定码率对应固定的可纠错比特数

  • 移动:最好

  • 有线:至少

ARQ:协议层

HRQ:物理层重传,充分利用错误的帧

HARQ:HARQ ⅲ型:

  • 码字重传ⅲ型:在接收侧采用最大比或等增益合并将前面传输未正确解码帧的接收信号和重传帧合并解码
  • 递增冗余ⅲ型:重传版本中包含前面发送过的比特和新的冗余比特

同频覆盖可以提高容量,但小区发射功率受限

FDD:频分双工

通信系统仿真方法与技巧

等效基带

信道估计工作点在 以上

四个评价指标

可靠性指标

  • FER or BLER 才是终极指标,BER、Pe 只是简化调试

有效性:频带利用率

复杂度:算法复杂度

频稳度 接收机动态范围

信噪比应取低通滤波器后的,而非宽带信号的信噪比

存储复杂度:以存储器大小来描述,例如 1Mb

输入输出往往占80%的时间

量化:

  1. 最大值归一化:
    • 更好用,但在加噪声后损失不少精度,因为最大值是加了噪声的
    • 用于量化后的位数足够
  2. 功率归一化
  3. 部分功率归一化
    • 大于 2 的再限幅 或

饱和度:被削顶的数据的比例

5G

  1. 频带利用率增加 10 倍以上
    • Massive MIMO 支持 12 数据流(提高 6 倍)
    • AMC 支持 256QAM
    • 纠错码码率最高提高到 11/12
  2. 带宽由 20MHz 扩展到 400 MHz(十倍以上带宽,最高传输速率=带宽×频带利用率,百倍)
  3. 实现复杂度与能耗
    • 引入参数化定义(Numerology),支持多种子载波间隔,大带宽下实现复杂度下降
    • BWP 使得终端能耗大大下降同时支持灵活调度
  4. 低时延通过灵活的时隙结构和双工实现
  5. 高可靠由强大的纠错码、HARQ 和波束赋形提供
  • 非公网络(No=n-Public Network, NPN)
  • NR-U,非授权频段
  • 室内定位:3m

复习

蜂窝,同频覆盖,多址,双工

  • 4个用户:HARQ
  • 5个用户:多用户分集

考点

3G:扩频+码分多址+蜂窝+同频覆盖 4G: 5G: HARQ: 仿真:

  1. 每个模块的作用

  2. 调制(1-P23)

    • 如何评估一个调制的好坏?四个核心指标
      1. 有效性(频带利用率)
      2. 可靠性
      3. 复杂度
      4. 对抗信道非线性 TODO
    • 8PSK、4PSK、16QAM、GMSK
  3. 对抗信道非线性有哪些技术(1-P28)

    1. 调制方法:峰均比小,恒包络调制天然抗非线性
    2. 工作在一类放大器,非线性预失真技术,使线性范围变大
    3. 直接回退(不得已而为之),使得功放工作点往下至线性区
    4. 接收端:非线性均衡技术
  4. 预失真,预编码,预均衡

    • 相同:
    1. 都在发送端实现
    2. 通常需要发送端反馈
    • 不同:
  5. 蜂窝:概念、作用

  6. 同频覆盖

  7. 双工和多址的概念

  8. 第 3 代移动通信系统

    1. 核心技术
    2. 扩频+码分多址
  9. LTE 系统关键技术(4 个核心技术)

  10. HARQ 作用

    1. 物理层(短时延特性) 协议层区别
    2. HARQⅠ、HARQⅡ
    3. 4G、5G 中都用多线程 SW 协议部分递增冗余
  11. 仿真:

    1. 评价指标:有效,可靠,复杂度,时延,频率稳定度,定时精度
    2. 怎样 debug,如何做好通信系统仿真(结合自身)

对应课程:南京大学并发算法与理论

试图像追番一样学习

不过时间有限,就做个简短的笔记好了

0 绪论

并发存在交织性,例如以下程序虽能编译,但会断言错误:

#include <thread>
#include <assert.h>

int x = 0;

void foo() {
    while (true) {
        x = 1;
        x = 0;
        assert(x == 0);
    }
}

int main() {
    std::thread t(foo);
    std::thread t2(foo);

    t.join();
    t2.join();
}
// g++ ./main.cpp -lpthread -o main.o

1 JMM

Java Memory Model (JMM)

1-1 SC 模型

Sequential Consistency (SC) Model,顺序存储模型

这种与顺序存储模型不符的 reordering 优化在 Java 或其它编译器中存在

1-2 DRF 程序

Data-Race-Freedom (DRF),无数据竞争:读写冲突/写写冲突

DRF 程序就不用担心受 reordering 优化影响。 因此编译器也可以大肆优化:

1-3 Happens-Before

操作A happens before 操作B,就是要求 操作A 对于 操作B 可见,且本质上应先于操作B 执行。譬如:

i = 1; // 操作A
j = i; // 操作B

则如果 A hb B,则 j=1;若没有声明 hb,就不能保证这个结果。

不过,即便声明 hb,也并不一定要顺序执行,只要保证结果上一致即可。

这课好像纯 Java 啊目前

对应课程:东南大学工程矩阵理论-周建华

要会证明的定理:绝对不会考察(笑),定理只要看得懂就行

  1. 子空间、交空间、和空间的维数定理
  2. 判断两个空间的和是否为直和 的等价条件
  3. 线性空间里的线性变换的维数定理
  4. 等距变换的充要条件
  5. 一个 Hermite 矩阵的最大特征值是 Rayleigh 商的最大值
  6. 矩阵的谱半径不会超过相容范数的范数值

要记的定义:

  1. 验证子空间:(第一章)
    1. 非空
    2. 加法、乘法封闭
  2. 线性映射、线性变换:保持加法、数乘
  3. 内积:酉空间,欧式空间(第二章)
  4. 等距变换:酉变换,正交变换
    1. 四个条件
  5. 特征值,特征向量(第三章)
  6. 若当形矩阵
  7. Hermite 矩阵,正规阵,酉矩阵(第四章)
  8. 正定:半正定,负定,半负定
  9. 向量范数:(第五章)
  10. 矩阵范数:
  11. 矩阵函数
  12. M-P 方程,计算满秩分解,性质(第六章)

先从题目形式分析,再考虑重新表示

n 个矩阵相加得到 1 个矩阵的,可以考虑分块 / 分列

行列式: 取矩阵某一行/列,对该列的每个元素求其代数余子式,并与该元素相乘,最后将所有乘积相加

代数余子式: 把元素 所在的第 行和第 列划去,求得到的行列式的值,得到余子式 即为代数余子式

求逆矩阵: 先求出各元素对应的代数余子式

  1. 代数余子式转置得到伴随矩阵
  2. 求出矩阵的行列式的值(即第一行各元素与其对应的代数余子式相乘 的和)
  3. 伴随矩阵除以行列式得到逆矩阵

逆矩阵的行列式 为 原矩阵行列式的倒数

上、下三角矩阵的行列式为其主对角线元素的积

Hermite 矩阵:

酉矩阵:

正规阵:

正定阵:

迹(trace):主对角线元素之和,也是特征值之和

0 第零章

0-1 行列式

行列式在初等变换后值不变,且可以混合行/列变换

注意乘法中可能存在的数字,往往能简化计算(可交换),例如

可知 有非零解

0-2 秩

矩阵的秩 等于:

  • 其非零子式的最高阶数
  • 或等于其行/列向量的的秩
  • 或以 为基础解系的齐次线性方程组的解的秩

可逆矩阵满秩

可逆矩阵的特征值非零,行列式非零(这个是等价条件)

  • 对于方阵 可逆
  • 对于行满秩的非方阵

为幂等阵

有解等价于

第一章

维数定理: 假设,有

维数定理: 假设 ,则

极大无关组就是满秩分解里 的各列,而各列又代表对应线性映射的值域的一组基(习题1.16)

同一线性变换在不同的基偶下的矩阵是相似的 线性变换要满足 齐性,可加性

零矩阵有可能是核空间带来的,分块矩阵里的零矩阵可以考虑值域和核的直和

线性变换的值域的基下对应的矩阵为单位阵,核的基下对应的矩阵为零矩阵

的值域相同,则

子空间:

  1. 加法和数乘封闭

基:把一种矩阵用多个矩阵表示,每个矩阵仅含一个变量

的基,或 的基, 的某个矩阵:(见试卷2010b.2)

  • 对 A 做行变换得到简化阶梯形矩阵
  • 列乘以 ,每行得到一个等式
  • 利用所有等式,列出一个列向量,即所有 都用其中一个 表示
  • 若有自由的 ,则补一个单位列向量

直和:两个子空间交集为零向量

基下的矩阵:(见习题1.13)

  • 若基为 方阵而非向量,则基下的矩阵为

不变子空间:设 ,若 ,有 ,则称 W 是 的不变子空间

定理

第二章

最小值常常考虑正交补空间

等距变换:

  • 实数时称作正交变换,虚数时称作酉变换

正定阵相似于对角阵

的正投影 垂直于 的基,且 能被这些基表示

第三章

最小多项式:把 J 代入到化零多项式观察得到,或者 J 中 Jordan 块对角线为 的最大阶数为最小多项式中 的最大次数

一般对于重数不超过3的特征值 为以 为对角线元素的 Jordan 块的数量

用最小多项式求矩阵多项式:

  1. 替换矩阵多项式中的
  2. 将多项式表示为最小多项式的积+商,其中商的最高次为最小多项式最高次-1
  3. 将特征值代入其中,二重特征值则可再代入多项式的一阶导数中,以此类推

用最小多项式求

  1. 高于最小多项式最高次-1 的 的次方均可化为更低的次方项,故 的最高次项为最小多项式最高次-1
  2. 接下来做法同矩阵多项式

第四章

共轭合同可以理解为 H 阵的相似

特征值均为正实数:相似于正定阵

证明一个矩阵为正定阵,通常可以证明其共轭合同于一个显然的正定阵

第五章

范数非零时恒正,齐次,三角不等式

  • ,谱范数, 代表取最大特征值

范数相容:

第0章 复习与引申

0-1 矩阵的代数运算

相似

矩阵相似 :可以通过初等行/列变换转换

  • 约当型: 与原矩阵相似的简单矩阵
  • 范数:用于刻划矩阵大小,的差
  • 广义逆矩阵: 对方程
    1. 可逆,则
    2. 不可逆,则 ,其中为广义逆矩阵

矩阵乘法中的 非零零因子,但 ,则 为左零因子, 为右零因子

常见的类对角矩阵:

可交换

可交换

数量矩阵,其中 为实数, 为单位阵

  • 若A与任意同阶矩阵可交换,则A为数量矩阵

矩阵的乘法交换律不成立,乘法消去律也不成立,但乘法分配律成立

当矩阵AB=BA时,二项式定理成立

分块矩阵

分块矩阵 :将A、B两矩阵分块:

在A的列的分法与B的行的分法相一致时,矩阵 也可以写成分块矩阵:

:矩阵内最多呈线性无关的列向量数

,则

可由 线性表示,则

0-2 线性方程组

设方程组 ,则有

  1. 有解
  2. ,则有唯一解
  3. ,则通解中有 个自由未知量

基础解系

基础解系:若 满足:

  1. 的解
  2. 线性无关
  3. 的任一解都可被其线性表示 则其为 的基础解系

对于齐次线性方程组 ,有

  1. 有非零解 (系数矩阵的秩小于未知量个数)
  2. ,则其基础解系中含 个解向量
  3. ,则其任意 个线性无关的解向量是其基础解系

阶梯形矩阵

满足下述条件的矩阵称为阶梯形矩阵:

  1. 元素全为零的行均在矩阵的下方
  2. 非零首元所在列的下标随着行标的增大而严格增大

满足下述条件的阶梯形矩阵称为简化阶梯形矩阵:

  1. 各个非零行的非零首元均为 1
  2. 除了非零首元外,非零首元所在的列其余元素都为零

Gauss 消元法

  1. 用初等行变换将增广矩阵化为阶梯形矩阵
  2. 确定自由未知量:
    1. 找每行的非零首元
    2. 找对应未知量
  3. 通过回代法用自由未知量表示2.2中的未知量(此步可借助简化阶梯形矩阵)

共轭转置 ,即先复数上的共轭,再转置

矩阵的秩等于

  • 其非零子式的最高阶数
  • 或等于其行/列向量的的秩
  • 或以 为基础解系的齐次线性方程组的解的秩

线性⽅程组恒有解 系数矩阵的秩 = 增广矩阵的秩

若阶梯矩阵有全零行,则有无穷多个解

0-3 向量

极大线性无关组

设向量组 的部分组 满足

  1. 线性无关(可用列方程表示)

  2. 中每个向量均可由 线性表示,则称 的一个极大无关组

  3. 若一向量组的极大无关组中含 个向量,则称这个向量组的秩为

  4. 若向量组的秩为 ,则该向量组中任意 个线性无关的向量均为其极大无关组

判断是否线性相关:

  • 若有非零解,则线性相关
  • 若仅有全零解,则线性无关

矩阵的秩

有关秩的不等式1. 2. 3. 若 ,则 4. 5. 对于

3 是 4 的特殊情况

初等阵:可以由单位阵经一次初等变换得到的矩阵

幂等矩阵

可逆矩阵:又称满秩矩阵能通过初等变换得到单位阵(理由:,可知方程有唯一解,即系数矩阵相似于单位阵)

  • 可知可逆矩阵的行、列向量线性无关(初等变换后满秩)
  • 可逆矩阵行列式不为0,特征值全不为0

不可逆矩阵:若 为不可逆矩阵,则必有 ,使得

  • 可知不可逆矩阵的行、列向量线性相关(初等变换后有全零行)

线性无关=可逆,线性相关=不可逆

满秩分解:对于 的矩阵 ,取 的矩阵 的矩阵 ,使得 ,其中

  • 可取 的极大线性无关组, 则为各列用极大线性无关组表示时的对应系数
    • 也就是将 化为简化阶梯形矩阵后, 为非零首元所在的 个列的 矩阵的列 组成的 矩阵
    • 则为 非零首元所在的 个行的 简化阶梯形矩阵的行 组成的 矩阵

1-1 线性空间

1-1-1 线性空间的定义

线性空间是由下述三个要素确定的代数系统:

  1. 一个数域 ,一个非空集合 中的元素也称为向量);
  2. 两个运算:加法:;数乘:
  3. 上述运算满足如下八个公理其实只需加法、数乘封闭
    • 加法交换律:,有
    • 加法结合律:,有
    • 零元存在性:存在 ,使得,有
    • 负元存在性:,存在 ,使得
    • 幺等律:
    • 数乘结合律:,都有
    • 分配律:,有
    • 分配律:,都有

1-1-2 线性空间的例子

  1. 数域 上所有 维向量全体,按向量的加法和数乘,构成一个线性空间,记为
  2. 数域 上所有 矩阵全体,按矩阵的加法和数乘,构成一个线性空间.记为
  3. 数域 上所有一元多项式全体,按多项式的加法和数乘,构成一个线性空间.记为
  4. 数域 上所有次数小于n的一元多项式全体,按多项式的加法和数乘,构成一个线性空间,记为

1-1-3 线性空间的性质

是数域上的线性空间,,则:

  1. V中的零向量是唯一的.通常记为
  2. V中任一向量的负向量是唯一的.通常记为
  3. 加法消去律:若,则
  4. 向量方程的解:有唯一解,记为
  5. ,特别地,
  6. ,当且仅当

1-2 基和维数

1-2-1 线性相关性

,若存在不全为零的数 使得,则称向量组线性相关。否则,称线性无关

  • 相关:能表示
  • 无关:不能表示

重要性质

  1. 若s≥2,则线性相关当且仅当存在向量 ,使得可由其余向量线性表示
  2. 线性无关,但线性相关,则可由线性表示,而且,线性表示的方法是唯一的.
  3. 可由线性表示,则线性相关

可由线性表示,且线性无关,则t≤s

等价,且都线性无关,则

等价:两向量组可相互线性表示 线性空间中的向量仅代表元素,因此向量也可以是矩阵

1-2-2 基、维数和坐标

定义: 若 满足条件:

  1. 线性无关
  2. 任意的 均可由 线性表示

则称 是 V 的一组基

维数

  1. 的某一组基中含个向量,则的任一组基中都含个向量,称的维数,记为
  2. ,则中任意个向量线性相关
  3. 线性空间的基不一定存在,
    • 如:只含一个零向量的空间称为零空间,规定零子空间的维数为
    • 再如:规定

定理:若 ,则 V 中任意 个线性无关的向量均构成 的基

坐标

定义: 设 是V的一组基,,且 ,则称 是β在基下的坐标,或是β在基下的坐标(列向量)

性质:

  1. 线性空间的基是有序的
  2. 基相当于几何空间中的坐标系

定理: 假设, 在基下的坐标分别是,则

  1. 线性相关线性相关.

的秩:

  1. :线性无关
  2. :线性相关

即其阶梯矩阵非零行的数量

1-2-3 基变换和坐标变换

形式记号

,定义形式行向量

比如,若 是β在基下的坐标, 则 可形式地记成

可由 线性表示, 于是,我们可以找到一个s×t矩阵A使得

性质: 若

过渡矩阵

定义: 设 都是V的基,且 则称A是从基到基的过渡矩阵

过渡矩阵是右乘的!且顺序是反的!例如:若 则知为从基到基的过渡矩阵 但下应为

性质

  1. 过渡矩阵一定是可逆的
  2. 若从基到基的过渡矩阵是A,则从基到基的过渡矩阵是.
  3. 若从基到基的过渡矩阵是A,从基到基的过渡矩阵是B,则从基到基的过渡矩阵是.

坐标变换公式

在基下的坐标是X,在基下的坐标是Y,而从基到基的过渡矩阵是,==则,或==

1-3 子空间

1-3-1 子空间的定义

设 V 是数域 F 上的线性空间, W 是 V 的非空子集。若 W 关于 V 的运算也构成 F 上的线性空间,则称 W 是 V 的子空间.记

W的运算与V中的运算应当相同

1-3-2 充分必要条件

,则 的子空间 关于线性运算封闭

1-3-3 重要子空间

  1. ,称 V 是齐次线性方程组 的解空间.(基础解系是 V 的一组基,维数是 。)

  2. 上的线性空间,,集合 称 W 是由 生成的子空间, 称 是W的生成元。

性质

  1. ,则
  2. 等价
  3. 的极大无关组是 的基,故

1-3-4 基扩充定理

有限维线性空间 V 中任意线性无关向量组均可扩充成 V 的基

:仅有第 i 行第 j 列为 1,其它元素为 0 的方阵

1-4 子空间的交与和

并集并不是子空间

1-4-1 交与和的定义

定义

分别称为子空间的交与和

定理 都是 V 的子空间.

1-4-2 维数定理

定理: 若

维数定理: 假设,有

1-4-3 直和

定义,若唯一的 ,使得 , 则称 是直和,记为

定理,则下述条件是等价的:

  1. 直和
  2. 的表示方式是唯一的
  3. 的基合在一起就是的基

多个子空间的直和: 设 ,若
唯一的,使得
则称 是直和,记为 .

定理: 设,则下述条件是等价的:

  1. 直和
  2. 的表示方式是唯一的
  3. 的基合在一起就是的基

1-5 线性映射

1-5-1 映射的概念

定义: 设 S 和 T 是两个集合, 是一个法则,使得对 中每个元素
在 T 中必存在唯一的元素 y 与之对应,则称 是 S 到 T 的映射,
记为 如果,则称 y 为 x 的象,x 为 y 的原象
S在映射 下的全体象记为 ,称为 的值域
集合S到自身的映射 称为S上的变换
集合S到自身的映射 称为S上的恒等变换

定义: 设映射

  • .则称 是满射
  • 若由 必能推得 ,则称 是单射
  • 既是满射又是单射,则称 是双射

定理 是双射 是可逆映射 (即,存在映射,使得,fg=I_T)

线性映射设 V,U 是数域 F 上的线性空间,若映射满足条件:

  1. 齐性
  2. 可加性

则称 是从 V 到 U 的线性映射, 从 V 到 U 的线性映射全体记为 V 到 V 自身的线性映射称为 V 上的线性变换

假设是线性映射.则:

  1. 线性相关,则 线性相关
  2. ,则 的值域
  3. 是 V 的子空间,称为 的核空间,也记作

线性变换的运算

假设 ,定义 如下:

  1. 容易记错!不满足交换律

容易验证,以上运算的结果仍然都是线性映射

是线性变换

性质: 设 。则:

1-5-2 基下的矩阵

,选定基偶: 则称 A 是 在选定基偶下的矩阵 特别如果 ,且 则称 A 是线性变换 在所选基下的矩阵.

定理: 若在基偶 下的矩阵是 的坐标是 , 则 在基 下的坐标是 .

过渡矩阵 到 基 的过渡矩阵是 ,也就是

定理: 设 在选定基偶: 的一组基
的过渡矩阵是 的一组基
的过渡矩阵是
在基偶 下矩阵为A,在基偶 下矩阵为

特别是,若 在基 下的矩阵是 , 则 在新的基 下的矩阵 是

可知 A 与 B 相似,也就是说同一线性变换在不同的基偶下是相似的

定理: 假设 在 V 的基 下的矩阵分别 是A,B,设 ,则在基 下,

  1. 的矩阵是
  2. 的矩阵是
  3. 的矩阵是
  4. 可逆 矩阵 可逆,并且, 的矩阵是

1-5-3 值域和核

假设 ,则

  • 是满射。若 ,则
  • 是单射

值域的计算

在基偶 下的矩阵是 A,即 由于 的极大无关组是 的基 特别地,

1-5-4 核子空间的计算

在基偶 下的矩阵是 A, 的坐标是 X,则 在基下的坐标是 。因此, 从而,若 的基础解系, 是以 为坐标的 中的向量,则 的基

维数定理: 假设 ,则

推论: 设 ,则 可逆 是单射 是满射

对无限维空间,推论不成立

1-5-5 不变子空间

,若 ,有 ,则称 W 是 的不变子空间

2-1 内积空间的概念

内积就是点乘

2-1-1 内积空间的定义

假设 V 是数域 F上的线性空间,在 V 上定义了一个二元函数 ,若

  1. ;且等号成立当且仅当 则称 的内积。
  • 定义了内积的线性空间称为内积空间
  • 时,称 V 是欧基里德空间,简称欧氏空间
  • 时,称 V 是酉空间

欧基里德空间和酉空间统称为内积空间

迹(trace):主对角线元素之和,也是特征值之和

标准内积

  1. 在空间 上定义内积 ,则 是欧氏空间
  2. 在空间 上定义内积 ,则 是酉空间

2-1-2 内积空间的性质

  1. 对任意

度量矩阵

是 V 的基, 的坐标是 其中,,称 A 是 V 在基 下的度量矩阵

  • ,则度量矩阵是对称矩阵:
  • ,则度量矩阵是Hermite矩阵:

度量矩阵须为正定阵

2-1-3 模与正交性

定义: 设 的模(长度)定义为 ,若,则称 α 是单位向量。

性质

  1. ,且
  2. 故若 ,则称 是单位向量

柯西不等式,当且仅当 线性相关时等号成立,即两者平行

可以从夹角公式 推出柯西不等式

  • 线性相关:向量组不全两两正交。若只有两个向量,则两者平行
  • 线性无关:向量组两两正交

三角不等式

向量距离

三角不等式的距离形式

正交性:若向量 的内积为零,则称 是正交的,记

勾股定理:若 ,则

  • 由两两正交的非零向量组成的向量组称为正交向量组
  • 由两两正交的单位向量组成的向量组称为标准正交向量组
  • 由正交向量组组成的基称为是正交基
  • 由标准正交向量组组成的基称为是标准正交基

标准正交基下的内积

是 V 的标准正交基, 下的坐标是 X,Y 则

2-1-4 Schmidt 正交化方法

是线性无关的,

  1. 正交化:
  2. 单位化: 是与 等价的标准正交向量组

推导:

2-1-5 酉矩阵

定义: 若 n 阶复矩阵 A 满足 ,则称为酉矩阵

A 是酉矩阵的行/列向量组是 的标准正交基

定理 是 V 的标准正交基, 是标准正交基 是酉矩阵.

Schmidt正交化方法的应用

====

  1. 若 A,B 是同阶酉矩阵,==则 都是酉矩阵==
  2. 假设 A 是上(下)三角矩阵,若 A 是酉矩阵,则 A 是对角阵,且其主对角元的模均等于1.

如果 是 V 的基,则有标准正交基 使 其中,T是上三角矩阵,且其主对角元均大于零

2-1-6 基扩充

基扩充定理

假设 W 是 V 的子空间, 是 W 的标准正交基,则 存在 使 得 是 V 的标准正交基。

2-2 正交补空间

正交性: 设 ,若 ,称 ,对,称

定理,则

2-2-1 正交补空间

定义: 设 ,记 易证这是 V 的子空间,称是 W 在 V 中的正交补空间

定理: 设 ,则 而且,若 ,且 ,则 .

推论: 若 ,则

2-2-2

定理

2-2-3 正投影

已知 ,若 满足 则称 在 W 中的正投影

定理: 假设 ,则

  1. 在 W 中的正投影存在,则正投影必定是唯一的;
  2. 在 W 中的正投影当且仅当

定理: 如果 是有限维的,则任意 在 W 中的正投影必定存在

2-2-4 应用

最小二乘解: 设 ,线性方程组 的最佳近似解 为 的解

2-3 等距变换

定义: 设 V 是内积空间,,若 是等距变换

  • ,称 是正交变换
  • ,称 是酉变换

充要条件 设 V 是内积空间,,下述条件等价:

  1. 保持长度不变
  2. 保持内积不变
  3. 将标准正交基变为标准正交基
  4. 在标准正交基下的矩阵是酉矩阵

镜像变换

假设 V 是一个欧氏空间, 是一个单位向量,映射 则是 V 上的等距变换(正交变换)

镜像变换在任意一组基下的矩阵都相似于

3-1 特征值与特征向量

3-1-1 定义和计算

矩阵的特征值与特征向量

定义: 假设 A 是 n 阶方阵, 是数,若存在 n 维列向量 ,使得 ,且 则称 是 A 的特征值, 是 A 的属于特征值 的特征向量。

定理: 假设 A 是 n 阶方阵,则 A 相似于对角阵的充分必要条件是 A 有 n 个线性无关的特征向量。

线性变换的特征值与特征向量

定义: 设 是线性空间上的线性变换,假设 , 若存在使得 ,且 则称 是线性变换 的特征值, 是相应于 的特征向量。

线性变换的可对角化问题: 设 V 是 n 维线性空间, 是线性空间 V 上的线性变换, 则存在 V 的基使得 的矩阵是对角阵当且仅当 有个线性无关的特征向量。

线性变换的特征值、特征向量的计算

在 V 的基 下的矩阵是 A 若 在基 下的坐标是 , 则 在基 下的坐标是 ,故 即: 的属于特征值 的特征向量当且仅当 是 A 的属于特征值 的特征向量。

行列式: 取行列式某一行/列,对该列的每个元素求其代数余子式,并与该元素相乘,最后将所有乘积相加

代数余子式: 把元素 所在的第 行和第 列划去,得到余子式 即为代数余子式

的行列式 的行列式的平方

定理: 若 是相似的,则

注意:

  1. 定理的逆命题不成立
  2. 可定义线性变换的特征多项式

相似矩阵特征值相同。

3-1-2 特征多项式

特征多项式的计算

定义: 假设矩阵 ,则 A 的第 行, 第 列交叉处的元素构成的 k 阶子式称为 A 的 k 阶主子式

Cauchy-Binet公式

定理: 设 ,则 其中, 为 A 的所有 j 阶主子式之和,特别地

矩阵的迹

定义: 设 ,称 为 A 的迹,记为

  1. 的特征值为 ,则
  2. 相似,则

== 的阶数大于 m 的子行列式应全为零,主子式应全为零==

不一定等于 ,但 一定等于

的特征值,则 的特征值

等于特征值的和

化零多项式

引理: 设 是多项式,若 ,则 A 的特征值均是 的根,称 为 A 的化零多项式

3-1-3 Hamilton-Cayley 定理

Schur 引理: 对 ,存在酉矩阵 U 使得 是上三角矩阵。

定理: 设 ,则

定理: 设 的特征多项式,则

3-1-4 最小多项式

矩阵的最小多项式

根据 Hamilton-Cayley 定理,一定存在最小多项式

定义: 矩阵 A 的次数最低的、最高次项系数为一的化零多项式称为 A 的最小多项式

性质

  1. 分别是矩阵 A 的最小多项式、化零多项式,则
  2. 任意矩阵的最小多项式是唯一的,
  3. 如果矩阵 相似,则 有相同的最小多项式

线性变换的最小多项式

定义: 设线性变换 在 V 的一组基下的矩阵为 的最小多项式称为 的最小多项式

等价定义: 线性变换 的次数最低的、最高次项系数为一的化零多项式称为 的最小多项式

,有

定理: 设 分别是矩阵 A 的最小多项式和特征多项式, 则 ,并且,对

3-2 可对角化问题

  1. 矩阵 A 相似于对角阵 有 n 个线性无关的特征向量
  2. 矩阵的属于不同特征值的特征向量线性无关
  3. 是矩阵 A 的互不相同的特征值, 是 A 相应于特征值 的线性无关的特征向量,则 线性无关

线性变换的可对角化问题

定理: 假设 V 是 n 维线性空间,。则

  1. 可对角化当且仅当 有 n 个线性无关的特征向量
  2. 的属于不同特征值的特征向量线性无关
  3. 是矩阵 A 的互不相同的特征值, 相应于特征值 的线性无关的特征向量,则 线性无关

3-2-1 特征子空间

定义: 设 的特征值,称 的相应于特征值 的特征子空间

相应于特征值 刚好有 个线性无关的特征向量

定理: 设 的相异特征值,则 是直和。

定理: 假设 的特征多项式为 则存在 V 的基使得 的矩阵是对角阵的充分必要条件是

3-2-2 几何重数

定理: 设 的特征多项式是 ,则 。 其中 称为几何重数, 称为代数重数

定理: 设 的特征多项式是 ,则下述条件是等价的:

  1. 是可对角化的

3-2-3 最小多项式与可对角化

引理: 若 n 阶矩阵 满足 ,则

定理 矩阵 A 相似于对角阵当且仅当 A 的最小多项式无重根

对角阵的行列式等于其主对角线元素之积

3-3 若当标准形

3-3-1 Jordan 形矩阵

定义

  1. 形如 的矩阵称为 Jordan 块
  2. 形如 (其中 均为 Jordan 块)的矩阵称为 Jordan 形矩阵

若当块一定可以被开方

3-3-2 Jordan 标准形

对角阵是一种若当形矩阵

定义: 若 是若当形矩阵,且矩阵 相似,则称 的若当标准形

,则 的各列 为 对应列的特征值对应的特征向量

3-3-3 唯一性

是矩阵 的 Jordan 标准形, 其中, 的一个排列,则 K 也是 A 的 Jordan 标准形。

下面的定理表明:在承认存在性的前提下,除了相差 Jordan 块的次序外,每个矩阵的 Jordan 标准形是唯一的

定理: (假设矩阵的Jordan标准形是存在的)设 是 n 阶方阵 A 的特征值, 则对任意一正整数 k,A 的 Jordan 标准形中主对角元为 且阶数为 k 的 Jordan 块的块数等于 其中,

,并约定

中阶数为 的 Jordan 阵块数:

可逆矩阵的 k 次方后的秩不变

仅有 Jordan 阵顺序不同的 Jordan 标准形算作同一个

一般对于重数不超过3的特征值 为以 为对角线元素的 Jordan 块的数量

Jordan标准形与最小多项式

定理: 若 则矩阵 的最小多项式间有关系:

定理: 假设矩阵 A 的最小多项式是 , 则 即是 A 的 Jordan 标准形中以 为主对角元的 Jordan 块的最高阶数。 特别地,A 相似于对角阵 的最小多项式无重根

相似矩阵有相同的迹,相同的秩

3-4 特征值的分布

3-4-1 谱半径和盖尔圆

定义: 设 ,称 A 的特征值的集合为 A 的谱, 称 A 的特征值的模的最大值为 A 的谱半径,记为 。记 称之为 A 的第 i 个盖尔圆; 称 为 A 的盖尔圆系

3-4-2 第一圆盘定理

定理: 矩阵 A 的特征值必定在 A 的盖尔圆系中

注意:并不是每个盖尔圆上都有特征值,但是在盖尔圆之外没有特征值.

3-4-3 第二圆盘定理

定义: 设 ,在 A 的 n 个盖尔圆中,有 k 个圆构成一连通区域, 但与其余 个圆不相交,则称这个连通区域为

定理: A 的盖尔圆的 区中有且仅有 A 的 k 个特征值

推论: 如果 A 的 n 个盖尔圆互不相交,则 A 有 n 个互不相等的特征值

3-4-4 谱半径的估计

4-1 H 阵和正规阵

4-1-1 Hermite二次型与H阵

定义: 设 ,若有 ,则称矩阵为 Hermite 矩阵,简称为H阵,这时的 称为是 Hermite 二次型。

H 阵主对角线一定都是实数

4-1-2 H 阵的性质

实对称矩阵的性质

  1. 实对称矩阵的特征值都是实数
  2. 实对称矩阵的属于不同特征值的特征向量相互正交
  3. 对任意实对称矩阵 ,存在正交矩阵 ,使得 是对角阵

H阵的性质

  1. H 阵的特征值均是实数
  2. H 阵的属于不同特征值的特征向量相互正交
  3. 若 A 是 H 阵,则必存在酉矩阵 U,使得 是对角阵

可知

4-1-3 正规阵

定义: 设 ,若 ,则称 A 是正规阵

H阵,酉矩阵,反H阵均是正规阵

定理: 若 A 既是上三角的,又是正规的,则 A 必是对角阵

定理 是正规阵 酉相似于对角阵

定理 是正规阵 有 n 个两两正交的单位特征向量

幂等阵的特征值非 0 即 1

4-2 标准形

4-2-1 共轭合同关系

可逆线性变换

若 A,B 都是 H 阵,且对 ,则

是可逆矩阵, 若在 下,,则

定义: 设 A,B 是 H 阵,若有可逆阵 C,使得 ,则称 A 与 B 是共轭合同的

共轭合同关系满足:反身性,对称性,传递性

4-2-2 Hermite二次型的标准形

标准形

定义: 假设 Hermite 二次型 在可逆线性变换下 变成只含“平方”项的形式 则称 的标准型

标准形的计算:

  1. 配方法(初等变换法)
  2. 酉变换法

4-2-3 酉变换下的标准形

假设 Hermite 二次型 ,A 是相应的 Hermite 矩阵,酉矩阵 U 满足 ,则

4-3 惯性定理

4-3-1 Hermite二次型的惯性定理

唯一性

定理: 若 在可逆线性变换 下变成标准形 在可逆线性变换 下变成标准形: 其中, 均大于零。则

定义: Hermite 二次型标准形中的正项个数称为其正惯性指数,负项个数称为其负惯性指数

两者之和为秩

4-3-2 关于 H 阵的惯性定理规范形

贯性定理的矩阵形式

若 H 阵 A 与 共轭合同,则 中正、负项个数相同

定义: 与 H 阵 A 共轭合同的对角阵中的正项个数称为 A 的正惯性指数,负项个数称为 A 的负惯性指数

4-3-3 规范形

如果 Hermite 矩阵 A 的正、负惯性指数分别是 , 则 A 必定与矩阵 共轭合同。称此矩阵为A的规范形

定理矩阵 A,B 共合同 有相同的正、负惯性指数 相同的秩和正惯性指数

4-4 有定性

4-4-1 正定性

定义: 设 阵,,若对 , 则称 是正定的, 是正定的

如何建立判别方法:

  1. 则D是正定的
  2. 若 H 阵 A,B 共轭合同,则 A 正定 正定
  3. 若 H 阵 A 与 共轭合同,则 A 正定

正定的充要条件

定理: 设 A 是 阵,则下述条件等价:

  1. A 是正定的
  2. A 的特征值均大于零
  3. A 与 I 共轭合同
  4. 存在可逆阵 P 使得
  5. A 的各顺序主子式均大于零

各主对角线元素即 A 的各一阶主子式,因此主对角线元素为正

正定阵隐含为 Hermite 阵

正定阵可逆,其逆矩阵为

4-4-2 其它有定性

定义: 设 A 是 H 阵,

  1. 若对 ,则称 是负定的, 是负定的 H 阵
  2. 若对 ,则称 是半正定的, 是半正定的 H 阵
  3. 若对 ,则称 是半负定的, 是半负定的 H 阵

负定 正定

负定 正定 的偶数阶顺序主子式 > 0 的奇数阶顺序主子式 < 0

正定矩阵与半正定矩阵的和一定是正定矩阵

如何建立判别方法:

  1. 则D是半正定的
  2. 若 H 阵 A,B 共轭合同,则 A 半正定 半正定
  3. 若 H 阵 A 与 共轭合同,则 A 半正定

半正定的充要条件

定理: 设 A 是 阵,则下述条件等价:

  1. A是半正定的,即
  2. A的特征值均大于或等于零
  3. A 与 共轭合同;
  4. 存在矩阵 P 使得
  5. A的各主子式均大于或等于零

4-5 Rayleigh商

4-5-1 Rayleigh商

设 A 是 n 阶 H 阵,则 ,于是,可以定义一复变量的实值函数 称此函数为 A 的 Rayleigh 商

4-5-2 第一定理

假设 H 阵 ,A 的特征值 ,则

酉矩阵为正规阵

5-1 向量范数

5-1-1 定义

是数域 上线性空间, 是定义在 上的实值函数。如果 满足:

  1. 对任意 (正定性,恒正性)
  2. 对任意 (齐次性)
  3. 对任意 (三角不等式) 则称 上的范数。 定义了范数的线性空间称为赋范线性空间

5-1-2 长度与范数

是内积空间,则 上内积下的长度 上的一个范数

因此,从现在起,在不致于引起混淆的情况下,任意线性空间上的范数就记为

5-1-3 中的范数

对任意

  1. 向量 1-范数:
  2. 向量 2-范数:
  3. 向量 范数:

中更多的范数对任意

  1. 时,有向量 p-范数:
  2. 如果 是已知的范数,A 是一可逆矩阵向量,则 也是 上的一种范数

5-1-4 V上的范数

是数域 维线性空间, 是V的一组 基, 上已知的范数,据此可以定义 上的范数: 若 在基 下的坐标是 ,规定

5-1-5 序列的收敛性

向量序列的收敛性

是 V 上的范数, 是 V 中的一个向量序列,。如果 则称向量序列 在范数 下收敛到 ,记为

范数的可比较性

假设 都是线性空间 上的范数。若存在大于零的数 , 使得对任意 ,不等式 成立, 则称 上的范数 是可比较的

定理: 有限维线性空间 V 上任意两个范数都是可比较的

5-2 矩阵范数

5-2-1 矩阵 p 范数

矩阵p-范数: 设矩阵 ,则有下列矩阵范数: 又记为 ,称为 Frobenius 范数,简称 F 范数

性质: F 范数是酉不变的:若 U,V 是酉矩阵,则

5-2-2 相容性

定义: 设 中定义了范数 , 若对 则称范数 是相容的

定理 是相容的, 是不相容的

相容矩阵范数的定义域可以覆盖所有尺寸的矩阵

5-2-3 算子范数

分别是 上的范数,定义 上的实值函数 称是由 是由 诱导的算子范数

定理: 算子范数一定是相容的矩阵范数

5-2-4三个重要的算子范数

诱导的 A 的算子范数分别被称为 A 的算子 1-范数,算子 2-范数,算子 范数,分别记为

定理: 设 ,则

  • ,列模和范数
  • ,谱范数, 代表取最大特征值
  • ,行模和范数

5-3 收敛定理

5-3-1 矩阵序列的收敛性

定义: 设矩阵序列 , 如果 ,且 , 则称

可以证明:若 是一矩阵范数,则

5-3-2 幂序列

对给定的方阵 A ,考虑方阵序列

定理: 若有相容矩阵范数 ,使得 ,则

定理

5-3-3 谱半径

定理: 若 是相容矩阵范数,则

定理: 对任意矩阵 ,若 ,则一定存在 上相容矩阵 范数 ,使得

5-3-4 矩阵幂级数

设 A 是方阵,对于幂级数 若矩阵序列 收敛于矩阵 M,则称矩阵幂级数 收敛于 M

定理: 若幂级数 的收敛半径为 ,则

  • 时,矩阵幂级数 收敛
  • 时,矩阵幂级数 发散

5-4 矩阵函数

5-4-1 定义

设函数 可以展开成幂级数 ,且 ,定义

几个重要的函数

5-4-2 Jordan 形矩阵

Jordan 形矩阵的函数

假设 其中

,得

Jordan 块的函数

若当块 ,则

利用Jordan 标准形计算

定理 设矩阵 A 的 Jordan 标准形是

定理 己知 矩阵 A 的特征值为 ,则 的特征 值为

5-4-3 待定系数法

设矩阵 A 的 Jordan 标准形是 其中,

定理: 若 A 的最小多项式为 ,则 对每个特征值

若最小多项式最高次为 ,则任何 都能化为次数不超过 的多项式, 因此可以设 ,或

性质

定理: 设 零矩阵,则

  1. ,则

6-1 Moore-Penrose 方程

定义:设 ,若 满足下述四个条件,则称 的广义逆矩阵:

这四个方程也称为 M-P 方程

  1. 为可逆阵,则 的广义逆

定理:设 ,则 的广义逆矩阵是存在的,且是唯一的。 的广义逆记为

由广义逆存在性的证明可知,如果矩阵 的满秩分解为 ,则

6-2 广义逆矩阵的性质

6-2-1 分块矩阵的广义逆

  1. , 其中,

6-2-2 运算性质

注意: 一般不相等!除非

定理:设 , 则:

  1. 为实数, 则
  2. 是酉矩阵, 则

为 Hermite 矩阵,则 也为 Hermite 矩阵

为正规阵,则

6-2-3 广义逆的值域与核

定理

助记:

  1. 在涉及到值域和核空间的时候, 的性质类似
  2. 只要记助记,定理就会证明了

6-3 广义逆矩阵的应用:最小二乘解

当线性方程组 无解时, 如何求最好的近似解, 即求 使 得 最小?

定义: 设 , 若 则称 是线性方程组 的最小二乘解, 长度最小的最小二乘解称为极小最小二乘解

定理 的最小二乘解 的解

定理 的最小二乘解的通解 为: , 其中, 是唯一的极小最小二乘解

1 绪论

VLSI 的设计思想

VLSI 设计思想

  • 分层分级
  • 每层、级间均有严格的接口定义

VLSI 的主要设计方法

  • 自底向上:根据现有的简单功能块或积木块单元,逐级向上组合,直至实现 VLSI 的总体功能。每一级的功能及尺寸以及与上下级接口均有严格定义。
  • 自顶向下:层次性设计。将要设计的 VLSI 系统逐级分解成较简单的功能,直至达到可进行高效设计的、足够简单的功能块。同样,每一级将要完成的功能以及上一级和下一级的接口均有严格的规定;
    • 系统级 算法
    • 寄存器级 有限状态机
    • 门级 布尔方程
    • 网表 连接关系
    • 版图 器件布局

CAD 软件内容

  • 逻辑设计阶段:逻辑综合、逻辑模拟、逻辑图的自动输入
  • 电路设计阶段:电路分析、时域分析
  • 版图设计阶段:逻辑划分、自动布局布线
  • 工艺设计阶段:工艺模拟、器件分析

EDIF、CIF 等格式

  1. EDIF 是电路级规范,在电路图绘制,电路行为及结构文本描述、逻辑描述、PCB 设计、ASIC版图设计和其它分析综合工具间建立起一个公共标准
  2. CIF 是版图级规范,采用层次式结构的图形描述,便于设计师进行阅读、修改、组合和跟踪;同时,CIF 文件描述了一个完整芯片的设计

两者的关键特征是实现了共享和继承,是实现并行设计和设计升级的框架协议。

VLSI 设计流程及各设计阶段的内容

  1. 逻辑设计:
    1. 逻辑处理(S-EDIT):将组合逻辑化归为 与非 和 或非,用 宏结构 连接所要实现的数字系统, 最后将高层次的系统描述转化为硬件
    2. 逻辑模拟(T-SPICE):验证逻辑设计的正确性,并进行故障模拟
  2. 电路分析
    1. 主要目的是确定电路性能的电路结构和元件参数,同时考虑环境影响,来辅助完善设计
  3. 版图设计(L-EDIT)
    1. 根据前期设计确定 掩膜版图
  4. 工艺模拟
    1. 对制造中的各流程的工艺参数进行模拟,针对不同情况进行优化

可靠性和可测性设计

可测性设计的目标是实现设计的可控性和可观测性。

可控性是指用一个有限位长的输入码可以使所设计的芯片置于任何一种可能的状态。

可观测性是指所设计芯片的任何一种可能状态均可通过观测一个测试码的输出结果来得到,即在外部可测量芯片内部的状态。

可测性 DFT(design for testability)

  • 直流特性测试:检验芯片好坏和可靠性。包括输入特性、输出特性、转移特性和功能项目。
  • 交流特性测试:又称动态特性测试,测试脉冲的传输特性。
  • 逻辑功能测试:通过设计生成测试图形、测试码、测试矢量,得到实际测试结果

可靠性 DFR(design for reliability)

定义:IC 在规定的条件和时间内完成规定任务的概率

目的:提高和保证电路正常工作的概率

包括:

  • 元件和数值留有冗余度
  • Memory 电路的坏块处理
  • 增加 ESD 保护电路
  • 合理布局的热设计
  • 合理布线避免串扰和电迁移

2 专用集成电路 CAD 设计基础

全定制、半定制电路的区别

  • 全定制电路的全套集成电路研制过程都是为用­户定制的,其设计方法是全套掩膜版,有标准单元法,功能块法,优化阵列法等。
  • 半定制电路的大部分设计和制备过程并非定制,而是已事先完成大部分,只需根据用户要求进行最终的制备烧­结,有固定门阵列、可编程逻辑器件和现场可编程门阵列等。

ASIC 的主要结构

  1. 全定制 ASIC
    1. 行式结构
    2. 积木块结构
    3. 规则阵列结构
  2. 半定制 ASIC
    1. 固定门阵列
    2. 可编程逻辑器件
    3. 现场可编程门阵列

用固定门阵列实现

用 E/D NMOS PLA 实现

先化成最小项

3 CAD 电路分析基础

对图示电路做综合分析

1 直流工作点分析

先用节点电压法(即对每个节点列电流等式),再以电压的系数合并同类项

2 瞬态分析

瞬态就是电感电容伴随模型

  • 电容的伴随模型:
    • h 为时间步长
  • 电感的伴随模型:(电流不能突变
  • 各类元件都可以用诺顿等效模型:电导和电流源并联

交流

交流就是电流为 ,电容阻抗 ,电感阻抗

本课中计算时都用电导表示,最后再展开

4 CAD 逻辑模拟基础

对图示电路进行延迟分析,并按要求画出波形图。分析延迟:

  1. 传输延迟 :信号通过元件和导线传播引起的延时
  2. 上升、下降延迟 :器件输出从0到1的时延 / 从1到0。两者宽度不等时会改变脉冲宽度
  3. 模糊延迟 :最大延迟 和最小延迟 之间的信号值不是精确可测的
  4. 惯性延迟 :为使器件转换状态,对于输入的一个变化所必须维持的最小持续时间称为元件的惯性延迟。若输入脉冲宽度不到 则会被门过滤;若大于等于 ,则器件表现出不小于 的传输延迟

惯性延迟优先级最高(不然就没法解释答案了!)

逻辑模拟

三值模拟

用0,1,μ表示一个信号状态的逻辑模拟

故障

s-a-0:stack at 0,卡在了 0。

路径敏化法

路径敏化法步骤:

  1. 反映故障:确定输入,在故障部位产生需要的值(s-a-1故障时为0,s-a-0故障时为1)。
  2. 传播故障:选择一条从故障部位到达输出的路径,并且确定这条路经的另一些信号值,以便将故障传播到输出。
  3. 确定输入:使得产生 2 中规定的信号值。

D 算法

  • D表示正常电路值为1而故障电路值为0的信号;
  • 表示正常电路值为0而故障电路值为1的信号。
  • D立方代数运算与布尔代数相同,不过此时门的输入为4值(0,1,D ,)。

有:,,, ,,

传播立方:无关故障,要考虑各路出错的可能(不过似乎只考虑 D,不考虑 D反

D 驱动操作:先选取故障原始 D 立方,然后先与传播立方相交,再与原始立方相交

5 CAD 版图设计基础

布线

垂直约束图

  1. 列出约束关系
  2. 从没有下边的端子开始,绘制垂直约束图(VCG)

水平带图

自左向右扫描,当某列上有线网结束时,做个记号。 如在后面的第j列上有新的线网开始时,则新的重迭区从第j列开始,而前一个重迭区在j-1列结束。 也有一些特殊情况,若同一列既有线网结束又有线网开始,则可以划分为一个独立的区; 若此时前面的分区没有划分,则合并为一个分区。

自动布图包含哪些内容,分别涉及哪些常用的算法?

  • 自动布图包含:逻辑划分,电路排列,连线。
  • 涉及的算法:结群,布图规划和布局,总体布线,总体压缩,无网格的通道布线和通孔,线长优化。

如何处理总体布线和通道在线的关系,李氏算法主要解决什么问题

  • 总体布线是划分通道,是线网在各通道的分配
  • 通道布线是在通道中排列线网,进行线网的走线

李氏算法是最小路径算法的一个应用,用于将线网分配到各 通道。

集成电路CAD的主要内容:

  • 电路分析
  • 逻辑模拟
  • 版图设计
  • 工艺模拟

EDA:电子设计自动化(Electronic Design Automation)

VLSI:Very Large Scale Integration,超大规模集成电路

VLSI 设计思想

  • 分层分级
  • 每层、级间均有严格的接口定义

VLSI 的主要设计方法

  • 自底向上:根据现有的简单功能块或积木块单元,逐级向上组合,直至实现 VLSI 的总体功能。同样,每一级的功能及尺寸以及与上下级接口均有严格定义。
  • 自顶向下:层次性设计。将要设计的 VLSI 系统逐级分解成较简单的功能,直至达到可进行高效设计的、足够简单的功能块,每一级将要完成的功能以及上一级和下一级的接口均有严格的规定;
    • 系统级 算法
    • 寄存器级 有限状态机
    • 门级 布尔方程
    • 网表 连接关系
    • 版图 器件布局

VLSI 由 LSI 组成,LSI 由 MSL 组成,MSL 由 LSL 组成。

复杂电路总可以分解为较简单的电路。

1-2 IC 设计中的方法

1-2-1 Framework

Framework 是一种规范,由国际 CAD 框架协会制定:

  • EDIF 网表(电子设计自动化中介格式)
  • CIF 网表(加州理工中介格式)

关键特征:实现了共享和继承,是实现并行设计和设计升级的框架协议。

2 并行工程

一种系统化、集成化、并行的产品及相关过程的开发模式

3 逻辑综合优化

逻辑综合功能将高层次的系统行为设计自动翻译成几级逻辑电路描述,使设计与工艺相对独立。

优化则是对于上述综合生成的网表,根据布尔方程式功能等效的原则用更小更快的综合结果替代一些复杂的单元,与指定的库映射生成新的网表。

1-3 VLSI 设计流程

1-3-1 逻辑设计阶段

  1. 逻辑处理
    1. 将所要实现的数字系统中的组合逻辑部分最小化为 与非或非
    2. 将所要实现的数字系统用一些宏结构经过连接来实现;
    3. 将高层次的系统描述逐步转换成与实现技术相关的硬件。
  2. 逻辑模拟
    1. 验证逻辑设计的正确性;
    2. 进行故障模拟,产生故障诊断的测试码。
    • 分为门级、功能级、寄存器级三类

1-3-2 电路分析

定义:根据电路给定的元件参数进行性能模拟和分析,并给出模拟结果,为设计者提供修改建议

目的:确定电路性能的电路结构和元件参数,考虑环境、工艺偏差导致的性能变化。

常用软件:SPICE :

  • 主要功能:
    • 直流分析
    • 交流小信号分析
    • 瞬态分析
    • 不同温度下分析

1-3-3 版图设计

定义:根据逻辑和电路功能要求以及工艺制造的约束条件来设计掩膜版图

常用软件:LEDIT, VIRTUOSO

1-3-4 工艺模拟

定义:对制造中的各流程工艺参数进行模拟,根据具体情况对不合格的设计进行修正

1-4 SOC 的设计方法

主要使用自顶向下设计方法,分为

  • 高层综合:行为级设计和结构级设计
  • 逻辑综合:逻辑设计和电路设计
  • 物理综合:版图级设计

也可分为

  • 前端设计:系统、功能、结构和电路设计
  • 后端设计:版图设计

1-5 可测性和可靠性

可测性设计的目标是实现设计的可控性和可观测性。

可控性是指用一个有限位长的输入码可以使所设计的芯片置于任何一种可能的状态。

可观测性是指所设计芯片的任何一种可能状态均可通过观测一个测试码的输出结果来得到,即在外部可测量芯片内部的状态。

1-5-1 可测性 DFT(design for testability)

  • 直流特性测试:检验芯片好坏和可靠性。包括输入特性、输出特性、转移特性和功能项目。
  • 交流特性测试:又称动态特性测试,测试脉冲的传输特性。
  • 逻辑功能测试:通过设计生成测试图形、测试码、测试矢量,得到实际测试结果

1-5-2 可靠性 DFR(design for reliability)

定义:IC 在规定的条件和时间内完成规定任务的概率

目的:提高和保证电路正常工作的概率

包括:

  • 元件和数值留有冗余度
  • Memory 电路的坏块处理
  • 增加 ESD 保护电路
  • 合理布局的热设计
  • 合理布线避免串扰和电迁移

2-1 IC 分类

  • 按工艺分类:双极(Bipolar) 、金属氧化物半导体CMOS):
  • 按功能分类:模拟(Analog) 、数字(Digital) 、数/模混合(Mix);
  • 按用途分类:通用(GSIC) 、专用(ASIC):
  • 按设计方式分类: 半定制(Semi-Custom) 、全定制(Full-Custom) 。
  • 按结构形式分类:单片集成电路(Chip) 、膜集成电路(Hybird Circuits);
  • 按规模分类:小规模(SSI) 、中规模(MSI) 、大规模(LSI) 、超大规模(VLSI), ULSI 、GLSI 均认为是VLSI:
  • 按制造方法分类:掩膜(MASK) 、电可编程(e-Programmable) 。

2-1-1 工艺分类

  • 常规工艺电路:
    • 双极(BJT): 多子器件,电流大,驱动大;
    • MOS: 少子器件,面积小,速度快。
  • 特殊工艺电路:
    • BiMOS: 速度和功率的平衡;
    • DMOS: 双扩散MOS, 高压大功率;
    • BCD: 现在流行的工艺,综合了双极、CMOS 、DMOS 工艺特点。

PN 结

PN结的形成:参见 1-2 PN结

扩散运动(正偏)电流较大,漂移运动(反偏)电流较小,是以为半导体

两种载流子:电子 和 空穴

BJT

饱和区、放大区、截止区

常用公式:

  • 放大模式:发射结加正向电压,集电结加反向电压,
  • 饱和模式:均正偏,(掺杂浓度不同)
  • 截止模式:均反偏
  • 集电结正偏:集电极高于基极
  • 发射结正偏:基极高于发射极

在晶圆上制作(一般是 P 型衬底)

  1. P 型衬底(P-sub)
  2. N+ 埋层(buried layer)
  3. N 型外延

MOS

N沟道P沟道
非饱和区

饱和区