世界七大数学难题之NP完全问题
数学大师大卫·希尔伯特在1900年8月8日于巴黎召开的第二届世界数学家大会上的著名演讲中提出了23个数学难题。希尔伯特问题在过去百年中激发数学家的智慧,指引数学前进的方向,其对数学发展的影响和推动是巨大的,无法估量的。
20世纪是数学大发展的一个世纪。数学的许多重大难题得到完满解决, 如费马大定理的证明,有限单群分类工作的完成等, 从而使数学的基本理论得到空前发展。
2000年初美国克雷数学研究所的科学顾问委员会选定了七个“千年大奖问题”,克雷数学研究所的董事会决定建立七百万美元的大奖基金,每个“千年大奖问题”的解决都可获得一百万美元的奖励。
克雷数学研究所“千年大奖问题”的选定,其目的不是为了形成新世纪数学发展的新方向, 而是集中在对数学发展具有中心意义、数学家们梦寐以求而期待解决的重大难题。
2000年5月24日,千年数学会议在著名的法兰西学院举行。会上,97年菲尔兹奖获得者伽沃斯以“数学的重要性”为题作了演讲,其后,塔特和阿啼亚公布和介绍了这七个“千年大奖问题”。克雷数学研究所还邀请有关研究领域的专家对每一个问题进行了较详细的详述。克雷数学研究所对“千年大奖问题”的解决与获奖作了严格规定。每一个“千年大奖问题”获得解决并不能立即得奖。任何解决答案必须在具有世界声誉的数学杂志上发表两年后且得到数学界的认可,才有可能由克雷数学研究所的科学顾问委员会审查决定是否值得获得百万美元大奖。
其中有一个已被解决(庞加莱猜想,由俄罗斯数学家格里戈里·佩雷尔曼破解),还剩六个。
“千年大奖问题”公布以来, 在世界数学界产生了强烈反响。这些问题都是关于数学基本理论的,但这些问题的解决将对数学理论的发展和应用的深化产生巨大推动。认识和研究“千年大奖问题”已成为世界数学界的热点。不少国家的数学家正在组织联合攻关。 “千年大奖问题” 将会改变新世纪数学发展的历史进程。
NP完全问题:
NP完全问题(NP-C问题),是世界七大数学难题之一。 NP的英文全称是Non-deterministic Polynomial的问题,即多项式复杂程度的非确定性问题。简单的写法是 NP=P?,问题就在这个问号上,到底是NP等于P,还是NP不等于P。
在一个周六的晚上,你参加了一个盛大的晚会。由于感到局促不安,你想知道这一大厅中是否有你已经认识的人。你的主人向你提议说,你一定认识那位正在甜点盘附近角落的女士罗丝。不费一秒钟,你就能向那里扫视,并且发现你的主人是正确的。然而,如果没有这样的暗示,你就必须环顾整个大厅,一个个地审视每一个人,看是否有你认识的人。
生成问题的一个解通常比验证一个给定的解时间花费要多得多。这是这种一般现象的一个例子。与此类似的是,如果某人告诉你,数13,717,421可以写成两个较小的数的乘积,你可能不知道是否应该相信他,但是如果他告诉你他可以因式分解为3607乘上3803,那么你就可以用一个袖珍计算器容易验证这是对的。人们发现,所有的完全多项式非确定性问题,都可以转换为一类叫做满足性问题的逻辑运算问题。既然这类问题的所有可能答案,都可以在多项式时间内计算,人们于是就猜想,是否这类问题,存在一个确定性算法,可以在多项式时间内,直接算出或是搜寻出正确的答案呢?这就是著名的NP=P?的猜想。 不管我们编写程序是否灵巧,判定一个答案是可以很快利用内部知识来验证,还是没有这样的提示而需要花费大量时间来求解,被看作逻辑和计算机科学中最突出的问题之一。它是斯蒂文·考克于1971年陈述的。
美国麻州的克雷(Clay)数学研究所于2000年5月24日在巴黎法兰西学院宣布了一件被媒体炒得火热的大事:对七个“千僖年数学难题”的每一个悬赏一百万美元。
内容
“千僖难题”之一:P (确定性多项式算法)对NP (非确定性多项式算法)
“千僖难题”之首
“千僖难题”之二:霍奇(Hodge)猜想
“千僖难题”之三:庞加莱(Poincare)猜想
“千僖难题”之四:黎曼(Riemann)假设
“千僖难题”之五:杨-米尔斯(Yang-Mills)存在性和质量缺口
“千僖难题”之六:纳维叶-斯托克斯(Navier-Stokes)方程的存在性与光滑性
“千僖难题”之七:贝赫(Birch)和斯维讷通-戴尔(Swinnerton-Dyer)猜想
评价
NP完全问题排在百万美元大奖的首位,足见他的显赫地位和无穷魅力。
简介
NP就是Non-deterministic Polynomial的问题,也即是多项式复杂程度的非确定性问题。
假设P ≠ NP的图解。若P = NP则三类相同。
而如果任何一个NP问题都能通过一个多项式时间算法转换为某个NP问题,那么这个NP问题就称为NP完全问题(Non-deterministic Polynomial complete problem)。NP完全问题也叫做NPC问题。
有些计算问题是确定性的,比如加减
乘除之类,你只要按照公式推导,按部就班一步步来,就可以得到结果。但是,有些问题是无法按部就班直接地计算出来。比如,找大质数的问题。有没有一个公式,你一套公式,就可以一步步推算出来,下一个质数应该是多少呢?这样的公式是没有的。再比如,大的合数分解质因数的问题,有没有一个公式,把合数代进去,就直接可以算出,它的因子各自是多少?也没有这样的公式。
这种问题的答案,是无法直接计算得到的,只能通过间接的“猜算”来得到结果。这就是非确定性问题。而这些问题的通常有个算法,它不能直接告诉你答案是什么,但可以告诉你,某个可能的结果是正确的答案还是错误的。这个可以告诉你“猜算”的答案正确与否的算法,假如可以在多项式时间内算出来,就叫做多项式非确定性问题。而如果这个问题的所有可能答案,都是可以在多项式时间
多流水线调度实际上是一个NP完全问题
内进行正确与否的验算的话,就叫完全多项式非确定问题。
完全多项式非确定性问题可以用穷举法得到答案,一个个检验下去,最终便能得到结果。但是这样算法的复杂程度,是指数关系,因此计算的时间随问题的复杂程度成指数的增长,很快便变得不可计算了。
人们发现,所有的完全多项式非确定性问题,都可以转换为一类叫做满足性问题的逻辑运算问题。既然这类问题的所有可能答案,都可以在多项式时间内计算,人们于是就猜想,是否这类问题存在一个确定性算法,可以在多项式时间内直接算出或是搜寻出正确的答案呢?这就是著名的NP=P?的猜想。
解决这个猜想,无非两种可能,一种是找到一个这样的算法,只要针对某个特定NP完全问题找到一个算法,所有这类问题都可以迎刃而解了,因为他们可以转化为同一个问题。另外的一种可能,就是这样的算法是不存在的。那么就要从数学理论上证明它为什么不存在。
搜索方法
近邻法
近邻法(nearest neighbor) 推销员从某个城镇出发,永远选择前往最近且尚未去过的城镇,最后再返回原先的出发点。这方法简单,也许是多数人的直觉做法,但是近邻法的短视使其表现非常不好,通常后段的路程会非常痛苦。
插入法
插入法(insertion) 先产生连接部分点的子路线,再根据某种法则将其它的点逐一加入路线。比如最近插入法(nearest insertion),先针对外围的点建构子路线,然后从剩余的点里面评估何者加入后路线总长度增加的幅度最小,再将这个点加入路线。又比如最远插入法(farthest insertion),是从剩余的点里面选择距离子路线最远的点,有点先苦后甜的滋味。
模拟退火算法
模拟退火算法(Recuit Algorithm) 来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e-ΔE/(kT),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。
遗传算法
遗传算法是仿真生物遗传学和自然选择机理,通过人工方式所构造的一类搜索算法
遗传算法是解决NP问题的一种较理想的方法
,从某种程度上说遗传算法是对生物进化过程进行的数学方式仿真。生物种群的生存过程普遍遵循达尔文进化准则,群体中的个体根据对环境的适应能力而被大自然所选择或淘汰。进化过程的结果反映在个体的结构上,其染色体包含若干基因,相应的表现型和基因型的联系体现了个体的外部特性与内部机理间逻辑关系。通过个体之间的交叉、变异来适应大自然环境。生物染色体用数学方式或计算机方式来体现就是一串数码,仍叫染色体,有时也叫个体;适应能力是对应着一个染色体的一个数值来衡量;染色体的选择或淘汰则按所面对的问题是求最大还是最小来进行。
神经网络算法
根据一个简化的统计,人脑由百亿条神经组成 — 每条神经平均连结到其它几千条神经。通过这种连结方式,神经可以收发不同数量的能量。神经的一个非常重要的功能是它们对能量的接受并不是立即作出响应,而是将它们累加起来,当这个累加的总和达到某个临界阈值时,它们将它们自己的那部分能量发送给其它的神经。大脑通过调节这些连结的数目和强度进行学习。尽管这是个生物行为的简化描述。但同样可以充分有力地被看作是神经网络的模型。
填字游戏
填字游戏是一种最常见的益智纸上游戏,也是NP完全问题之一,游戏一般给出一个矩形的表格。这个表格被分割为若干个大小相同的方格,方格的颜色有白色与黑色两种。白色的方格组成一些交叉的行与列,行列的长度不等。玩家根据题目所提供的有关信息,将答案填入这些行与列之中,每个白色方格中只能填入一个字。一般地说,题目给出的每一条信息就是对应的一行或一列的解题线索。在行与列交叉的地方,玩家必须保证在交叉的方格中填入的字同时满足题目中对行与列的要求。
填字游戏
(详见填字游戏)
相关
最常被引用的结果之一设计神喻。假想你有一个魔法机器可以解决单个问题,例如决定一个给定的数字是否为质数,但可以瞬间解决这个问题。我们的新问题是,若我们被允许任意利用这个机器,是否存在我们可以在多项式时间内验证但无法在多项式时间内解决的问题?结果是,依赖于机器能解决的问题,P = NP和P ≠ NP二者都可以证明。这个结论的后果是,任何可以修改来证明该机器的存在性的结果不能解决问题。不幸的是,几乎所有经典的方法和大部分已知的方法可以这样修改(我们称它们在相对化)。
如果这还不算太糟的话,1993年Razborov和Rudich证明的一个结果表明,给定一个特定的可信的假设,在某种意义下“自然”的证明不能解决P = NP问题。这表明一些现在似乎最有希望的方法不太可能成功。随着更多这类的定理得到证明,该定理的可能证明有越来越多的陷阱要规避。这实际上也是为什么NP完全问题有用的原因:若有一个多项式时间算法,或者没有一个这样的算法,对于NP完全问题存在,这将用一种相信不被上述结果排除在外的方法来解决P = NP问题。P=NP问题可以用逻辑命题的特定类的可表达性的术语来重新表述。所有P中的语言可以用一阶逻辑加上最小不动点操作(实际上,这允许了递归函数的定义)来表达。类似地,NP是可以用存在性二阶逻辑来表达—也就是,在关系、函数、和子集上排除了全域量词的二阶逻辑。多项式等级,PH中的语言对应与所有的二阶逻辑。这样,“P是NP的真子集吗”这样的问题可以表述为“是否存在性二阶逻辑能够表达带最小不动点操作的一阶逻辑的所不能表达的语言?”
普林斯顿大学计算机系楼将二进制代码表述的“P=NP?”问题刻进顶楼西面的砖头上。如果证明了P=NP,砖头可以很方便的换成表示“P=NP!”。康奈尔大学的Hubert Chen博士提供了这个玩笑式的P不等于NP的证明:“反证法。设P = NP。令y为一个P = NP的证明。证明y可以用一个合格的计算机科学家在多项式时间内验证,我们认定这样的科学家的存在性为真。但是,因为P = NP,该证明y可以在多项式时间内由这样的科学家发现。但是这样的发现还没有发生(虽然这样的科学家试图发现这样的一个证明),我们得到矛盾。
最新情况
2010年8月6日,HP LAB的 Vinay Deolalikar 教授宣布证明了P!=NP,证明文章已经发送到该问题各相关领域专家手中,等待检验,在他的主页上,证明过程已经公布(PDF格式共103页),但在8月15日,人们关于论文的看法——即证明不能成立——已经趋于稳定(当然这不能排除大家都同时犯了错误的可能性),随后的发言越来越多地集中于更抽象的层面,并且至今仍在继续。
论NP=P
NP=P,概括的说就是3句话:
1.任意简单无向图的最大团问题等于其对应的“任意两个顶点的距离不大于2的图”——可
以称之为理想图的最大团问题;
2.任意理想图的图着色问题是多项式时间问题;
3.任意理想图,其图着色问题可在多项式时间内转换为它的最大团问题。
证明大纲:
定理1.设G=(V,E)是简单无向图,va、vb是G中距离大于2的两个顶点,
E'=E∪{(va,vb)},则G'=(V,E')与G有相同的最大团。
证明:显然。
推论:对任意简单无向图G=(V,E),存在简单无向图G'=(V,E'),满足:
(1)E⊆E';
(2)G'中任意两个顶点的距离不大于2;
(3)G'与G有相同的最大团。
定理2.设G=(V,E)是n阶简单无向图,n≥3,G中任意两个顶点的距离不大
于2,则存在n的多项式时间算法,可在该算法下,解决G的图着色问题,即确
定G的顶点色数。
证明思路与算法:易知G是k-部图(不一定、也无须是完全k-部图)。
算法:设v是G中度最大的顶点,显然v的邻点应该与v着色不同。在距离v为2的
顶点中,依次选取G中度最大且互不相邻的顶点,得到包含v的一个极大独立集V1,
设V=V1∪V2,V1∩V2=Ø,G去掉V1中所有顶点(及其关联边)得到图
G2=(V2,E2)。则可以证明G2的顶点色数比G的顶点色数小1;且G2去掉度
小于2的顶点(若这样的顶点存在)后,任意两个顶点的距离也是不大于2的。
由递归关系可知G的顶点色数可以在n的多项式时间内确定。
定理3.设G=(V,E)是n阶简单无向图,n≥3,G中任意两个顶点的距离不大
于2,则G的图着色问题(顶点色数问题)可以在n的多项式时间内转换为G的
最大团问题。
证明思路:已知图着色问题≤pSAT(“≤p”表示多项式时间归约)
SAT≤p 3-SAT
3-SAT≤p 团问题
只需注意细节,就可证明定理2。
前景
当今时代,在纯粹科学研究,通信、交通运输、工业设计和企事业管理部门,在社会军事、政治和商业的斗争中涌现出大量的NP问题。若按经典的纯粹数学家们所熟悉的穷举方法求解,则计算时间动辄达到天文数字,根本没有实用价值。数学界许多有经验的人认为对于这些问题根本上就不存在完整、精确、而又不是太慢的求解算法。NP=P?可能是这个世纪最重要的数学问题了。