fbpx
维基百科

频率分析

频率分析数学物理学信号处理中是一种分解函数波形、或者信号的频率组成,以获取频谱的方法。

英语文本中典型的字母分布情况。较弱的密码会显示出这个分布,从而被密码专家所破译。
條目維基百科的字詞分布情况,字型越大,代表該字詞出現的機率就越大。

密码学中,频率分析是指研究字母或者字母组合在文本中出现的频率。应用频率分析可以破解古典密码

频率分析基于如下原理:在任何一种书面语言中,不同的字母或字母组合出现的频率各不相同。而且,对于以这种语言书写的任意一段文本,都具有大致相同的特征字母分布。比如,在英语中,字母E出现的频率很高,而X则出现得较少。类似地,STNGTH,以及QU等双字母组合出现的频率非常高,NZQJ组合则极少。英语中出现频率最高的12个字母可以简记为“ETAOIN SHRDLU”。

简单替换密码的频率分析

在一个简单的替换密码中,明文中的每一个字母都被另一个字母替换,而且明文中相同的字母在转换为密文时总是被同一个字母所替换。比如,所有的e都会被替换成 X.一个含有大量X的密文消息会向密码破译者暗示X替换e.

一个例子

現假設愛麗絲與鮑伯中的伊夫截獲了一段密碼(列於下方),它使用了一個簡單替換密碼進行加密:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIM WQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJ GSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXV IZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLE PPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPP XLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX 

在這個例子中,大寫字母表示密文,小寫字母則表示明文(或猜測在這樣),而X~t用來代表一個關於:密文X 代表明文t的猜測。

伊夫可以使用頻率分析,以下面的消息來幫助解決密文大意:單字母中I最為常見;XL是最為常見的雙字母組;而XLI則為最為常見的三字母組,且密文中找不到D。根據英文的字母分布,e是最常見的單字母,th是最為常見的雙字母組,而the則為最為常見的三字母組。因些她猜測X~tL~hI~e。第二個密文中最常見的字母是E;t是英文中第二常見的字母,因此應該是E~t,但由於已假設X~t,所以伊夫暫且假設E~a。姑且讓這些假設進行解碼,獲得以下的(部分)已解密消息。

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReM WQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJ GSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtV eZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMtha PPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPP thMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt 

使用這些初始的猜測,伊夫發現了某些規律,來讓她可以確認其猜測,例如"that"。此外,其他規律則建議了進一步的猜測:"Rtate"可能是"state",即R~s。同樣,"atthattMZe"可以是"atthattime",寫出M~iZ~m。而且,"heVe"可能是"here",給出V~r。再填入本來的密文,獲得:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGasei WQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJ GSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtr emitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQitha PPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPP thiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit 

反過來,這些猜測還建議一些例子(例如"remarA"可能是"remark",即A~k)。接著,相對簡單地就可推斷出其餘字母,最終產生明文:

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscasei nwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsof courseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextr emityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywitha lltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingall thingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit 

到了此時,伊夫便可以加上空格及標點符號:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetle from a glass case in which it was enclosed. It was a beautiful scarabaeus, and, at that time, unknown to naturalists—of course a great prize in a scientific point of view. There were two round black spots near one extremity of the back, and a long one near the other. The scales were exceedingly hard and glossy, with all the appearance of burnished gold. The weight of the insect was very remarkable, and, taking all things into consideration, I could hardly blame Jupiter for his opinion respecting it. 

其實這個例子是來自金甲蟲,正好伊夫的猜測全部正確。這並非總是如此,個別明文中的統計資料變化可能意味著最初的猜測並不正確。這樣可能就要做回溯法來更正錯誤或進一步推測。

明文中沒有表現出預期的字母頻率分佈也有可能。越短的消息越會表現出其更多的變化。明文本來就是經過人為扭曲的文本,例如整篇明文沒有了一些字母,通常會是最常見的「e」,這樣就稱為漏字文

历史和应用

 
肯迪第九世紀所著的《手稿上破譯加密消息》
 
阿拉伯字母頻率分布英语Arabic_Letter_Frequency

第一個已知頻率分析(事實上,是任何一種密碼分析)的解釋是在9世紀時,阿拉伯博學家肯迪所著的《手稿上破譯加密消息》之上。[1] 它對於古蘭經的文本研究發現阿拉伯文有一個特別的字母頻率。其使用快速蔓延,類似的系統在文藝復興時期的歐洲國家十分流行。1474年,Cicco Simonetta 寫了一本手冊,上有關於破譯已加密的拉丁語意大利語文本。[2]

密碼學家為加強簡單替換加密,使用了數項措施,包括:

所有這些抵禦頻率分析攻擊的嘗試都有一個缺點:它增加了加密和解密的難度,可能導致使用失誤。而最著名的的事件如下:最初英國外交部拒絕使用波雷費密碼,認為它太複雜。當惠斯登證明鄰近學校的四個男孩中,有三個可以在15分鐘內學會這種方法,外交部副秘書長的回應是:「這是有可能的,可惜你不能教曉那些高層人員。」

20世紀首50年,旋轉盤的使用興起(例如,恩尼格瑪密碼機),其基本上不會受到直接頻率分析攻擊。然而,其他種類的分析成功解譯了其中一些信息(其中最著名為Ultra計劃)。

 
西班牙字母頻率

頻率分析只需基本了解明文字母的統計,以及一些解決問題的能力,而且此方法可用人手解譯。在第二次世界大戰期間,英國美國同時使用各大報紙上字謎和密碼比賽來招募解碼專家。軸心國中使用了某些很容易遭頻率分析破解的密碼(例如日本第二次世界大戰時的領事密碼)。機械替換加密或解密亦於第二次世界大戰之時開始使用。現時,頻率分析基本上全由電腦來完成,因此,現時替換式密碼很容易就被破解。

小说中的频率分析

柯南‧道爾所寫的偵探小說福爾摩斯‧歸來記》中《跳舞的人》篇中,福爾摩斯就在牆上看到五個跳舞人的畫,他從英語用語對答的常用性與英語使用頻率最高的字母E猜出了其中一次跳舞人畫所代表的字為Never,從而破解了字謎。

爱伦坡的《金甲蟲》亦是一小說有密文的例子。

参考文献

引用

  1. ^ Ibrahim A. Al-Kadi‧《密碼學的起源:阿拉伯國家的貢獻》,Cryptologia, 16(2) (1992年4月) pp. 97–126.
  2. ^ Kahn, David L. 密碼破譯者:加密的故事. 紐約: Scribner. 1996. ISBN 0-684-83130-9. 

书籍

  • Helen Fouché Gaines, "Cryptanalysis", 1939, Dover. ISBN 978-0-486-20097-2
  • Ibraham A. “Al-Kindi: The origins of cryptology: The Arab contributions”, Cryptologia, 16(2) (April 1992) pp. 97–126.
  • Abraham Sinkov, "Elementary Cryptanalysis : A Mathematical Approach", The Mathematical Association of America, 1966. ISBN 978-0-88385-622-2.

参见

外部链接

频率分析, 在数学, 物理学和信号处理中是一种分解函数, 波形, 或者信号的频率组成, 以获取频谱的方法, 英语文本中典型的字母分布情况, 较弱的密码会显示出这个分布, 从而被密码专家所破译, 條目維基百科的字詞分布情况, 字型越大, 代表該字詞出現的機率就越大, 在密码学中, 是指研究字母或者字母组合在文本中出现的频率, 应用可以破解古典密码, 基于如下原理, 在任何一种书面语言中, 不同的字母或字母组合出现的频率各不相同, 而且, 对于以这种语言书写的任意一段文本, 都具有大致相同的特征字母分布, 比如, 在英. 频率分析在数学 物理学和信号处理中是一种分解函数 波形 或者信号的频率组成 以获取频谱的方法 英语文本中典型的字母分布情况 较弱的密码会显示出这个分布 从而被密码专家所破译 條目維基百科的字詞分布情况 字型越大 代表該字詞出現的機率就越大 在密码学中 频率分析是指研究字母或者字母组合在文本中出现的频率 应用频率分析可以破解古典密码 频率分析基于如下原理 在任何一种书面语言中 不同的字母或字母组合出现的频率各不相同 而且 对于以这种语言书写的任意一段文本 都具有大致相同的特征字母分布 比如 在英语中 字母E 出现的频率很高 而X 则出现得较少 类似地 ST NG TH 以及QU 等双字母组合出现的频率非常高 NZ QJ 组合则极少 英语中出现频率最高的12个字母可以简记为 ETAOIN SHRDLU 目录 1 简单替换密码的频率分析 1 1 一个例子 2 历史和应用 3 小说中的频率分析 4 参考文献 4 1 引用 4 2 书籍 5 参见 6 外部链接简单替换密码的频率分析 编辑在一个简单的替换密码中 明文中的每一个字母都被另一个字母替换 而且明文中相同的字母在转换为密文时总是被同一个字母所替换 比如 所有的e都会被替换成 X 一个含有大量X的密文消息会向密码破译者暗示X替换e 一个例子 编辑 現假設愛麗絲與鮑伯中的伊夫截獲了一段密碼 列於下方 它使用了一個簡單替換密碼進行加密 LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIM WQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJ GSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXV IZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLE PPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPP XLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX 在這個例子中 大寫字母表示密文 小寫字母則表示明文 或猜測在這樣 而X t用來代表一個關於 密文X 代表明文t的猜測 伊夫可以使用頻率分析 以下面的消息來幫助解決密文大意 單字母中I最為常見 XL是最為常見的雙字母組 而XLI則為最為常見的三字母組 且密文中找不到D 根據英文的字母分布 e是最常見的單字母 th是最為常見的雙字母組 而the則為最為常見的三字母組 因些她猜測X t L h及I e 第二個密文中最常見的字母是E t是英文中第二常見的字母 因此應該是E t 但由於已假設X t 所以伊夫暫且假設E a 姑且讓這些假設進行解碼 獲得以下的 部分 已解密消息 heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReM WQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJ GSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtV eZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMtha PPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPP thMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt 使用這些初始的猜測 伊夫發現了某些規律 來讓她可以確認其猜測 例如 that 此外 其他規律則建議了進一步的猜測 Rtate 可能是 state 即R s 同樣 atthattMZe 可以是 atthattime 寫出M i及Z m 而且 heVe 可能是 here 給出V r 再填入本來的密文 獲得 hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGasei WQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJ GSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtr emitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQitha PPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPP thiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit 反過來 這些猜測還建議一些例子 例如 remarA 可能是 remark 即A k 接著 相對簡單地就可推斷出其餘字母 最終產生明文 hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscasei nwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsof courseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextr emityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywitha lltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingall thingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit 到了此時 伊夫便可以加上空格及標點符號 Hereupon Legrand arose with a grave and stately air and brought me the beetle from a glass case in which it was enclosed It was a beautiful scarabaeus and at that time unknown to naturalists of course a great prize in a scientific point of view There were two round black spots near one extremity of the back and a long one near the other The scales were exceedingly hard and glossy with all the appearance of burnished gold The weight of the insect was very remarkable and taking all things into consideration I could hardly blame Jupiter for his opinion respecting it 其實這個例子是來自金甲蟲 正好伊夫的猜測全部正確 這並非總是如此 個別明文中的統計資料變化可能意味著最初的猜測並不正確 這樣可能就要做回溯法來更正錯誤或進一步推測 明文中沒有表現出預期的字母頻率分佈也有可能 越短的消息越會表現出其更多的變化 明文本來就是經過人為扭曲的文本 例如整篇明文沒有了一些字母 通常會是最常見的 e 這樣就稱為漏字文 历史和应用 编辑 肯迪第九世紀所著的 手稿上破譯加密消息 阿拉伯字母頻率分布 英语 Arabic Letter Frequency 第一個已知頻率分析 事實上 是任何一種密碼分析 的解釋是在9世紀時 阿拉伯博學家 肯迪所著的 手稿上破譯加密消息 之上 1 它對於古蘭經的文本研究發現阿拉伯文有一個特別的字母頻率 其使用快速蔓延 類似的系統在文藝復興時期的歐洲國家十分流行 1474年 Cicco Simonetta 寫了一本手冊 上有關於破譯已加密的拉丁語和意大利語文本 2 密碼學家為加強簡單替換加密 使用了數項措施 包括 使用 諧音替換法 使用某幾個不太常用的字母替代最常見的字母 例如 在英語密文中 X和Y都可以代表明文E 使用 多字母替換加密 使用另一組文字作密錢來加密密鑰 參見多字母替換加密 萊昂 巴蒂斯塔 阿爾伯蒂可能是第一個這樣做的人 及 使用 表格式替換加密 為每對字母進行加密 而非每個字母 例子為波雷費密碼 所有這些抵禦頻率分析攻擊的嘗試都有一個缺點 它增加了加密和解密的難度 可能導致使用失誤 而最著名的的事件如下 最初英國外交部拒絕使用波雷費密碼 認為它太複雜 當惠斯登證明鄰近學校的四個男孩中 有三個可以在15分鐘內學會這種方法 外交部副秘書長的回應是 這是有可能的 可惜你不能教曉那些高層人員 20世紀首50年 旋轉盤的使用興起 例如 恩尼格瑪密碼機 其基本上不會受到直接頻率分析攻擊 然而 其他種類的分析成功解譯了其中一些信息 其中最著名為Ultra計劃 西班牙字母頻率 頻率分析只需基本了解明文字母的統計 以及一些解決問題的能力 而且此方法可用人手解譯 在第二次世界大戰期間 英國與美國同時使用各大報紙上字謎和密碼比賽來招募解碼專家 軸心國中使用了某些很容易遭頻率分析破解的密碼 例如日本第二次世界大戰時的領事密碼 機械替換加密或解密亦於第二次世界大戰之時開始使用 現時 頻率分析基本上全由電腦來完成 因此 現時替換式密碼很容易就被破解 小说中的频率分析 编辑柯南 道爾所寫的偵探小說 福爾摩斯 歸來記 中 跳舞的人 篇中 福爾摩斯就在牆上看到五個跳舞人的畫 他從英語用語對答的常用性與英語使用頻率最高的字母E猜出了其中一次跳舞人畫所代表的字為Never 從而破解了字謎 爱伦坡的 金甲蟲 亦是一小說有密文的例子 参考文献 编辑引用 编辑 Ibrahim A Al Kadi 密碼學的起源 阿拉伯國家的貢獻 Cryptologia 16 2 1992年4月 pp 97 126 Kahn David L 密碼破譯者 加密的故事 紐約 Scribner 1996 ISBN 0 684 83130 9 书籍 编辑 Helen Fouche Gaines Cryptanalysis 1939 Dover ISBN 978 0 486 20097 2 Ibraham A Al Kindi The origins of cryptology The Arab contributions Cryptologia 16 2 April 1992 pp 97 126 Abraham Sinkov Elementary Cryptanalysis A Mathematical Approach The Mathematical Association of America 1966 ISBN 978 0 88385 622 2 参见 编辑密码分析 字母频率 齊夫定律外部链接 编辑单词频率分析工具 英语Text统计分布 更多的统计信息 取自 https zh wikipedia org w index php title 频率分析 amp oldid 58901767, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。