Archive for the ‘AI小组’ Category

集智AI小组第五次活动纪要

星期三, 五月 6th, 2009

Herbert Simon & Allen Newell 
By: 默默地抽

时间:2009.5.3

地点:三号会所

内容:

    一 关于这两个人

    赫尔伯特·西蒙(Herbert A. Simon, 1916-2001)
    艾伦·纽厄尔(Allen Newell, 1927-1992

      理论:物理符号系统和启发式搜索

    (一)物理符号系统
    1 定性结构定律(Laws of Qualitative Structure
    2 物理符号系统的定义
    3 物理符号系统假设:物理符号系统是智能活动的充要条件

    (二)启发式搜索
   
1 启发式搜索假设
   
2 几个启发式搜索的实例这部分参考《人工科学——复杂性面面观》,司马贺著,武夷山译
   
http://www.douban.com/subject/1195595/
   
例一 通用解题者(General Problem SolverGPSP113-114
   
例二理解understandP88
   
例三 培根(BACONP99

    总结

    顺便多说几句:首先,非常非常感谢Miner提供资料!其次,经验总结:当看书死活看不懂的时候,先别质疑自己的智商,先质疑一下译者的翻译水平吧。必要的时候当然也可以质疑作者的表达能力。还有,本总结若有不完整和出错的地方,欢迎大家补充和指证! 

    活动总结文件完全版下载

集智AI小组第四次活动纪要

星期四, 四月 9th, 2009

时间:200945

地点:三号会所

讨论内容:本次活动正值清明节,我们深切缅怀了两位天才图灵和哥德尔

 

图灵是真正的“人工智能之父”,我们从《The Essential Turing》一书中选择了部分章节进行讨论,该书是2004年出版的图灵的论文集,其中包括图灵的著名论文《Computing Machinery and Intelligence》,图灵的介绍参见http://www.douban.com/group/topic/5960962/

本来没打算这么早讨论哥德尔,但由于前几次讨论总是提到哥德尔不完备性定理并且大家有争议,所以这次就简单介绍了一下,主要目的是给出哥德尔定理的结论,以及把我搜集的一些关于哥德尔的资料和大家分享一下。我们没有深入讨论哥德尔定理的证明,有兴趣的可以阅读相应书籍(在slides的最后一页)。

    http://groups.google.com/group/swarmagents_ai/
attach/5093c395c917c3e4/note_Godel.ppt?part=2

大家对哥德尔和图灵有什么问题可以继续在网上讨论和补充。

 

####################Alan M. Turing########################

The Essential Turing: Seminal Writings in Computing, Logic, Philosophy, Artificial Intelligence, and Artificial Life: Plus The Secrets of Enigma B. Jack Copeland主编,Oxford university press, 2004

The Essential TuringTET)介绍了图灵的生平,收集了图灵的重要著作,Copeland做了很多采访,添加了很多总结和背景性的文字,是一本值得仔细读来的书。

全书分为四部分,基本上按时间顺序,收集和讨论了图灵在不同时期的思想和著作。

第一部分:Computable Numbers: A Guide。包括图灵1937年发表的《论可计算数机器在判定问题中的应用》及其修正,1939年发表的《序数基础上的逻辑系统》,还收集了这个时期图灵的一些信件。

第二部分:Enigma1941-1945)。这部分介绍了二战期间图灵在外交部Code and Cypher School的工作。在此期间,图灵和同事研制了解密机器Bombe,用来对付德国军队用的加密机器Wehrmacht Enigma。这个工作可能使欧洲的战程缩短了两年。这个期间的工作,也对图灵后来的人工智能和人工生命的思想的形成有较大影响。

第三部分:Artificial Intelligence1947-1952)。这部分介绍图灵在人工智能方面的先驱性的工作。包括第第九到十四章。

9. Lecture on the Automatic Computing Engine (1947 )

10. Intelligent Machinery (1948 )

11. Computing Machinery and Intelligence (1950 )

12. Intelligent Machinery, A Heretical Theory (c.1951)

13. Can Digital Computers Think? (1951)

14. Can Automatic Calculating Machines Be Said to Think? (1952)

第四部分:Artificial Life。这部分介绍了图灵在用计算来模拟生命行为的一些尝试。morphogenesis:形态发生, 形态形成, 器官发生, 器官形成。

15. The Chemical Basis of Morphogenesis (1952)

16. Chess (1953)

17. Solvable and Unsolvable Problems (1954)

~~~~

注一:以下提到的ACE都是指Automatic Computing Engine,是图灵在 National Physical Laboratory(NPL)主持设计的计算机。图灵在设计中使用精简指令(类似现在的RISC),通用计算的观点,尽量使用计算来实现各种功能,而不是使用各种硬件来完成计算(类似加速卡的东西)。现在做图形加速卡厂商好像也都在朝通用计算方向发展,像NVIDIATeslaATIFirestreamIntellarrabee

注二:以下所标页码为TET书中的实际页码。“~~~~”标记的是大家讨论时提到的内容。

 

##################################################

page 354

Modern AI researchers speak of the method of ‘generate-and-test’. Potential solutions to a given problem are generated by means of a guided search. These potential solutions are then tested by an auxiliary method in order to find out if any actually is a solution. The bombe mechanized the first process. The testing of the stops, or potential solutions, was then carried out manually…”

In 1948 Turing boldly hypothesized that ‘intellectual activity consists mainly of various kinds of search’ (Chapter 10, p. 431). His readers would no doubt have been astonished to learn of his wartime experience with mechanized search (still secret at that time). Some eight years later the same hypothesis was put forward independently by Herbert Simon and Allen Newell in the USA; through their influential work, it became one of the central tenets of AI.”

“产生-检验”法:先搜索一个可能的解,然后验证这个解。二战期间图灵研制解密机器Bombe就是这么工作的。现在流行的叫法是启发式搜索。图灵大胆假设智能活动主要就是搜索。因为军方保密的原因,图灵当时这些思想没有被继承下来,后来SimonNewell独立提出相同的假设。

 

##################################################

page 374

. . .The disciplined action (of ACE) carries with it the disagreeable feature, which you mentioned, that it will be entirely uncritical when anything goes wrong. It will also be necessarily devoid of anything that could be called originality.

There is, however, no reason why the machine should always be used in such a manner: there is nothing in its construction which obliges us to do so. It would be quite possible for the machine to try out variations of behaviour and accept or reject them in the manner you describe and I have been hoping to make the machine do this. This is possible because, without altering the design of the machine itself, it can, in theory at any rate, be used as a model of any other machine, by making it remember a suitable set of instructions.

…Thus, although the brain may in fact operate by changing its neuron circuits by the growth of axons and dendrites, we could nevertheless make a model, within the ACE, in which this possibility was allowed for, but in which the actual construction of the ACE did not alter, but only the remembered data, describing the mode of behaviour applicable at any time…

完全按规则工作的机器,没有什么容错能力,也不会有什么创新性。可以试着改变机器的工作方式,让它尝试各种变化,然后接受或者拒绝变化产生的后果。这么做并不需要改变机器的设计,理论上只要机器能保存一组合适的指令,它就可以模拟任何其它机器。我们不用ACE的结构做任何改变,只要改变它保存的数据,就可以用它来模拟人脑。

图灵认为人脑和图灵机的原理是一样的,图灵机可以模拟人脑,也就能模拟各种智能行为。

 

##################################################

page 392

I expect that digital computing machines will eventually stimulate a considerable interest in symbolic logic and mathematical philosophy. The language in which one communicates with these machines, i.e. the language of instruction tables, forms a sort of symbolic logic. … Actually one could communicate with these machines in any language provided it was an exact language… Some attempts will probably be made to get the machines to do actual manipulations of mathematical formulae. To do so will require the development of a special logical system for the purpose. This system should resemble normal mathematical procedure closely, but at the same time should be as unambiguous as possible. As regards mathematical philosophy, since the machines will be doing more and more mathematics themselves, the centre of gravity of the human interest will be driven further and further into philosophical questions of what can in principle be done etc.

这里图灵预言,数字计算机可以用于符号逻辑和数学公式推导。和计算机交流,需要一种精确的语言,它的指令集形成一个代数系统。机器可能替人做越来越多的事情,人类的兴趣可能越来越转移到哲学问题

 

##################################################

page 400

to extend his work on the machine [the ACE] still further towards the biological side. I can best describe it by saying that hitherto the machine has been planned for work equivalent to that of the lower parts of the brain, and he [Turing] wants to see how much a machine can do for the higher ones; for example, could a machine be made that could learn by experience? This will be theoretical work, and better done away from here.”

At Manchester, Turing designed the input mechanism and programming system for an expanded version of Kilburn and William’s ‘Baby’ and wrote a programming manual for the new machine. At last Turing had his hands on a functioning stored-programme computer. He was soon using it to model biological growth—pioneering work in the field now known as Artificial Life .

1947年图灵从NPL离开,逐渐把工作扩展到生物方面。ACE实现了人脑底层的功能,图灵想看到在更高的层面上,机器能做到哪些,比如机器能否从经验中学习。在曼彻斯特,图灵开始人工生命方面的先驱性工作。第一个可以运行的象棋程序,就是在图灵的指导下,这里诞生的。

 

##################################################

page 419

If we now consider interference, we should say that each time interference occurs the machine is probably changed. It is in this sense that interference ‘modifies’ a machine. The sense in which a machine can modify itself is even more remote. We may if we wish divide the operations of the machine into two classes, normal and self-modifying operations. So long as only normal operations are performed we regard the machine as unaltered. Clearly the idea of ‘self-modification’ will not be of much interest except where the division of operations into the two classes is very carefully made. The sort of case I have in mind is a computing machine like the ACE where large parts of the storage are normally occupied in holding instruction tables. Whenever the content of this storage was altered by the internal operations of the machine, one would naturally speak of the machine ‘modifying itself ’.

对机器的操作可以分成两部分:正常的操作和自修改操作。只有对这两种操作的区分恰当时,自修改这个概念才有意义。ACE内部存贮着指令表,如果机器的内部操作能够修改自己的指令表,就可以认为机器在修改自己。

这里的自修改,讨论了机器通过内部操作,修改自身指令的可能性,没有讨论到到自复制问题。

 

##################################################

page 420

One way of setting about our task of building a ‘thinking machine’ would be to take a man as a whole and to try to replace all the parts of him by machinery. He would include television cameras, microphones, loudspeakers, wheels and ‘handling servo-mechanisms’ as well as some sort of ‘electronic brain’. … Thus although this method is probably the ‘sure’ way of producing a thinking machine it seems to be altogether too slow and impracticable.

Instead we propose to try and see what can be done with a ‘brain’ which is more or less without a body, providing at most organs of sight, speech and hearing. We are then faced with the problem of finding suitable branches of thought for the machine to exercise its powers in. The following fields appear to me to have advantages:

(i) Various games e.g. chess, noughts and crosses, bridge, poker;

(ii) The learning of languages;

(iii) Translation of languages;

(iv) Cryptography;

(v) Mathematics.

制造会思考的机器的一个途径是:把人的各部分都用相应的机械装置替换,用摄像机,装上扬声器,轮子,用事务处理机器做电子脑。但当时那种办法不切实际。作出来的机器人太大了。

现在的技术倒是可以做。

另一个途径是:做一个几乎没有身体的脑,至多只装上视觉、听觉和发声器官。这样的脑不能像机器人一样在现实世界中巡游,需要给它寻找一个适合的生存领域,比如游戏、语言学习,机器翻译、密码学和数学。

~~~~

边界问题

大脑就像浸泡在汤中,同时处理的输入输出都是不确定的,几乎无限多。像是从一堆神经元中随便圈出一片来,然后发现,某种智能是来自这里。如果给出确定的边界,用确定个数的输入输出来模拟,可能丢失了很多信息。不确定的输入输出就像是扰动和涨落,实际可能是智能中不可忽视的因素。工程可实现的模型是尽量简单的,都具有确定的输入和输出。

~~~~

知识与进化

对人类来说,知识独立于人的生物进化之外,但大家都能站在已有知识的基础上。文字的发明,可能是智能发展的一个里程碑。

~~~~

“裸脑”的存在性

哥德尔认为独立于身体的思维是存在的。

 

##################################################

page 421

… we should be wise to sometimes compare the circumstances of our machine with those of a man. It would be quite unfair to expect a machine straight from the factory to compete on equal terms with a university graduate. The graduate has had contact with human beings for twenty years or more. This contact has throughout that period been modifying his behaviour pattern. His

teachers have been intentionally trying to modify it. At the end of the period a large number of standard routines will have been superimposed on the original pattern of his brain. These routines will be known to the community as a whole. He is then in a position to try out new combinations of these routines, to make slight variations on them, and to apply them in new ways.

这一段通过比较一个研究生和工厂里的机器所处的环境的差异,寻找智能行为的起源。学生已经其它的人接触了二十多年,这些接触都会对他的行为模式产生影响。老师还会可以地去改变他。最终的结果是,他脑中形成一系列的标准规则(routine)。然后他就可以通过组合或者稍稍改变这些规则来处理新的情况。

We may say then that in so far as a man is a machine he is one that is subject to very much interference. In fact interference will be the rule rather than the exception. He is in frequent communication with other men, and is continually receiving visual and other stimuli which themselves constitute a form of interference. It will only be when the man is ‘concentrating’ with a view to eliminating these stimuli or ‘distractions’ that he approximates a machine without interference. … but it is important to remember that although a man when concentrating may behave like a machine without interference, his behaviour when concentrating is largely determined by the way he has been conditioned by previous interference.

从这个过程来看,他就像是一个机器,总是处于外界的干预之中。只有在他集中注意力有意识减少外来干预的时候,才近似是一个不受干预的机器。即便在这时,他集中注意时的所做的事情,仍然是由先前的外界干预决定的。

~~~~

忘了怎么说到这个的:互联网就是一个巨大的智能体。生态系统也表现出一定的智能行为。

 

##################################################

page 448

… It was suggested tentatively that the question, ‘Can machines think?’ should be replaced by ‘Are there imaginable digital computers which would do well in the imitation game?’ If we wish we can make this superficially more general and ask ‘Are there discrete state machines which would do well?’ But in view of the universality property we see that either of these questions is equivalent to this, ‘Let us fix our attention on one particular digital computer C. Is it true that by modifying this computer to have an adequate storage, suitably increasing its speed of action, and providing it with an appropriate programme, C can be made to play satisfactorily the part of A in the imitation game, the part of B being taken by a man?’

“机器能思考吗?”这个问题可以换成“数字计算机能在模拟游戏中表现的足够好吗?”如果机器有足够的存储容量,响应速度,配上合适的程序,它能很好地扮演A的角色吗?这一段在说机器有没有智能的判据,就是图灵测试。思考并不是一个可以看到得的过程,这里图灵用了行为来测试。如果在测试中,机器的表现和人一样好,那我们就认为机器能够思考。

测试的具体做法:

有一个男人A,一个女人B,一个提问者C。测试过程中,C看不到AB,需要通过提问来判断AB中哪个是男的。A尽力误导C让它做出错误判断。用机器来代替A时,C做出错误判断的次数和A是人的时候相比,一样多吗?

~~~~

人和图灵测试

我们不需要通过图灵测试去判断一个人有没有智能。人和人的组织结构都差不多,一个人有智能,可以推测那另一个人也有。但人和机器差太多,所以要测试一下。

~~~~

还有一个图灵测试的奖: Loebner Prize

这个奖基本是非专业人士搞的伪图灵测试,很不科学,通不通过确实和AI不大相关,但图灵测试本身是很重要的。

We have just discussed the main reasons why MGonz, and Jenny18, perform well on the Turing Test, and none of them seem to involve Artificial Intelligence (AI). So the time has come to ask: Is the Turing Test, and passing it, actually important for the field of AI? It may surprise the reader that my answer is “No”.

以上文字节选自 Mark HumphrysHow My Program Passed the Turing Test?他自己都觉得通过这个测试和AI没什么关系。

一本讲图灵测试的书:Parsing the Turing Test , Springer Netherlands, 2008

http://dx.doi.org/10.1007/978-1-4020-6710-5

 

##################################################

page 451

The short answer to this argument is that although it is established that there are limitations to the powers of any particular machine, it has only been stated, without any sort of proof, that no such limitations apply to the human intellect.

… We too often give wrong answers to questions ourselves to be justified in being very pleased at such evidence of fallibility on the part of the machines. Further, our superiority can only be felt on such an occasion in relation to the one machine over which we have scored our petty triumph. There  would be no question of triumphing simultaneously over all machines. In short, then, there might be men cleverer than any given machine, but then again there might be other machines cleverer again, and so on.

有人认为计算机受哥德尔不完备定理限制,不可能在机器上实现智能。这一段是图灵的反驳。所有的机器都有这样的局限,那人为什么就一定没有?就算人比机器优越,也没什么问题。有比机器人聪明的人,就有比人聪明的机器。

哥德尔定理说会有机器没法证明的真命题,但这并不能构成多大的限制,知道它的就行了,不证明也没什么问题,人不是也常常把结论直接拿来用。而且机器遇到解决不了的问题可以停下来找人来解决。所以这个限制不是问题。

~~~~

相关的书:彭罗斯的《皇帝新脑》

图灵认为存在人脑就是机器,因此也存在人脑无法证明的问题。哥德尔和彭罗斯都同意机器可以模拟人脑的功能,他们认可“人脑是机器”的说法。但他们同时认为人还有其他的特质,原则上不存在人脑无法证明的数学问题。比如哥德尔说的“和物质分离的心”。这实际涉及到强AI之争的终极问题:机器能否有自由意志/自我意识//灵魂?或人是否真的有自由意志/自我意识//灵魂?

~~~~

霍金&哥德尔

霍金认为物理公理体系可能也会遭遇哥德尔的定理,所以物理学没有终极理论,物理学家不会失业。物理学的公理体系只是我们对认识到的那部分自然界的一种拟合,自然界自身是否自洽是没法知道的。

霍金怎么突然感兴趣起这个来的? 可能是他年纪大了,开始寻求自身的各种思想自洽性。年轻人通常不会考虑这个,前后矛盾一点也没觉得有什么。好像人老了都喜欢干这种事情,总想追求内心的和谐。年轻的时候不考虑这些也活得好好的不是,所以不自洽不是问题~

 

##################################################

page 455

Our most detailed information of Babbage’s Analytical Engine comes from a memoir by Lady Lovelace. In it she states, ‘‘The Analytical Engine has no pretensions to originate anything. It can do whatever we know how to order it to perform’’ (her italics). This statement is quoted by Hartree who adds:‘This does not imply that it may not be possible to construct electronic equipment which will ‘think for itself ’, or in which, in biological terms, one could set up a conditioned reflex, which would serve as a basis for ‘learning’. Whether this is possible in principle or not is a stimulating and exciting question, suggested by some of these recent developments. But it did not seem that the machines constructed or projected at the time had this

property.’’

“分析机不会产生新的东西,它只会执行人的指令”,但这并不说明电子设备就一定不会自己思考。只是巴贝奇那个时代的技术水平限制,不大可能制造出的会思考的机器。

A variant of Lady Lovelace’s objection states that a machine can ‘never do anything really new’. This may be parried for a moment with the saw, ‘There is nothing new under the sun’. Who can be certain that ‘original work’ that he has done was not simply the growth of the seed planted in him by teaching, or the effect of following well-known general principles. A better variant of the objection says that a machine can never ‘take us by surprise’. This statement is a more direct challenge and can be met directly. Machines take me by surprise with great frequency. This is largely because I do not do suffcient calculation to decide what to expect them to do, or rather because,although I do a calculation, I do it in a hurried, slipshod fashion, taking risks.

另一种说法是“机器不会做真正是新的事情”,这个和说“阳光下没有新事物”差不多。一个好点的说法是“机器永远不会让我们出乎意料”。实际上机器让我出乎意料的时候相当多, 因为我事先没有做足够的计算,也不知道它们会是多少,也可能匆忙中就算错了。

…I believe, to a fallacy to which philosophers and mathematicians are particularly subject. This is the assumption that as soon as a fact is presented to a mind all consequences of that fact spring into the mind simultaneously with it. It is a very useful assumption under many circumstances, but one too easily forgets that it is false. A natural consequence of doing so is that one then assumes that there is no virtue in the mere working out of consequences from data and general principles.

这可能来源于哲学家和数学家持有的一个错误观念:当一个事实出现在脑子里的时候,它的全部后果也同时出现在了脑子里面。如果这么想的话,那从数据和一般原理得出结论,也不是什么智能行为。实际上,即使我们已经知道怎样从数据得出结论,这个过程仍然涉及到思考。结论即使是确定的,它也不会自动浮现到我们的大脑中。为了得到结论,必须付出代价,要么自己算,要么让机器来算。这个工作机器往往做得比人还要好。

 

##################################################

page 460

We have thus divided our problem into two parts. The child-programme and the education process. These two remain very closely connected. We cannot expect to find a good child-machine at the first attempt. One must experiment with teaching one such machine and see how well it learns. One can then try another and see if it is better or worse. There is an obvious connection between this process and evolution, by the identifications:

Structure of the child machine –> Hereditary material

Changes of the child machine —> Mutations

Natural selection –> Judgment of the experimenter

为了得到一个能模拟人脑的程序,可以用类似进化的办法,训练婴儿机器,然后做出选择。婴儿机器的结构可以看成是遗传因素,把机器的程序的变化当成是变异,然后实验者来做自然选择,挑出最合适的个体。

~~~~~~

结构与功能

人脑中存在固化的智能行为,生下来就会的。

小孩能区分123,但不能区分4以上的数,说明人类感知(而不是去数)数字的能力仅限于1~3的数字。面对更多的数字时就要把它化成感知能力范围内的数字来数,也就是“时间换空间”,而小孩还不具备“时间换空间”的能力,所以会把4以上的数都看成“很多”,而不再加以区分。从进化角度解释对数字的感知能力:这是与其它能力相适应的。面对1~3个敌人,也许能打得过,这时候需要弄清楚到底有几个,以采取不同的策略;如果

面对4个以上的敌人,那根本不用数了,基本上打不过,逃跑就是了。这种感知数目的本领,和挨个数的机制不一样,可以迅速做出反应。

智能是一种涌现现象,必须在神经元足够多时才出现。对牛弹琴显然不会有效果的。

线虫只几百个神经元,怎么教都不会有智能,果蝇就好很多,几十万个神经元,

就可以教它们识别图案。

 

##################################################

TET中第四部分介绍图灵在人工生命方面的工作。其中The chemical basis of mophogenesis一文中,图灵试图阐述,从均匀的空间中,如何产生出形状和图案来。他提出了一个动力学模型,包含了两种基本过程:“反应”和“扩散”,扩散速度的不同,会导致对称性的破缺,从而产生空间不均匀的图案。图案可能是动态的振荡,也可能是静态的,就像美洲豹的斑纹。

~~~~~~~~

page 525

The situation is very similar to that which arises in connexion with electrical oscillators. It is usually easy to understand how an oscillator keeps going when once it has started, but on a first acquaintance it is not obvious how the oscillation begins. The explanation is that there are random disturbances always present in the circuit. Any disturbance whose frequency is the natural frequency of the oscillator will tend to set it going. The ultimate fate of the system will be a state of oscillation at its appropriate frequency, and with an amplitude (and a wave form) which are also determined by the circuit. The phase of the oscillation alone is determined by the disturbance.

图灵斑图的产生机制和振荡器类似。振荡器开始工作后,就可以一直震的下去,但振荡是如何开始的?因为电路中存在随机噪声,当噪声的频率等于系统的本征频率时,振荡就会被触发。当有噪声存在时,系统最终必然会以自己的特征频率振荡起来。这里的振荡状态是系统内在的本征模式,但它的出现却必须由涨落和耗散过程引起。

If chemical reactions and difusion are the only forms of physical change which are taken into account the argument above can take a slightly different form. For if the system originally has no sort of geometrical symmetry but is a perfectly homogeneous and possibly irregularly shaped mass of tissue, it will continue indefinitely to be homogeneous. In practice, however, the presence of irregularities, including statistical fluctuations in the numbers of molecules undergoing the various reactions, will, if the system has an appropriate kind of instability, result in this homogeneity disappearing.

如果一个系统本来就是完全均匀的,那它终将归于均匀。而发生着各种反应,分子数目有统计涨落的系统,系统的均匀性就可能会被破坏。图案的出现就是不均匀性的体现。

 

讨论时提到的那篇图灵斑图的文章,“Two-stage Turing model for generating pigment patternson the leopard and the jaguar” Phys. Rev. E 74, 011914 (2006)此处可以下载http://people.maths.ox.ac.uk/~maini/PKM%20publications/212.pdfNature曾经Hightlight过这个工作:Nature 422 , Research Highlights p.604 (August10, 2006). 但原来的网页链接已经失效了内容如下

Spot the difference,Phys. Rev. E 74, 011914 (2006). Jungle cats only have true spots when they are kittens. As they grow, the spots become rosettes — broken rings in leopards (pictured) and polygons in jaguars. This changing pattern is the latest to be successfully described using Turing models.

Alan Turing suggested in 1952 that biological patterns could be generated by two chemicals diffusing between cells and interacting under the animal’s coat. Sy-Sang Liaw of National Chung-Hsing University in Taichung, Taiwan, and his team adjusted parameters in Turing’s reaction-diffusion equations to create spots. They then tweaked the parameters so that the patterns resembled the coats of middleaged big cats. However, no one has found the chemicals, which Turing called morphogens, that might make this model work in mammals.

关于图灵斑图可以参考以下这篇文章:生命的另一个奥秘——浅谈生物数学与斑图生成www.math.wm.edu/~shij/mathbio.pdf

 

######################EOF##########################

集智AI小组第三次活动纪要

星期一, 三月 30th, 2009

    时间:2009322

地点:三号会所

真实太怀念这个人了,下面是我们AI小组在上周日的讨论总结,贴过来晾一晾,希望更多的人能读到它。

Von Neumann 冯·诺依曼

1) Von Neumann 1903-1957)其人

Von Neumann出生于奥匈帝国布达佩斯,犹太人,从小就被誉为神童。之后由于战争原因,移居美国,就职普林斯顿高等研究院,与爱因斯坦、哥德尔等人相邻。Von Neumann早期从事纯数学理论的研究,领域涵盖了集合论与数理逻辑、量子力学的数学基础等领域。后来从事应用方面的研究,包括计算机科学(第一台电子计算机ENIAC)、自动机理论、计算流体力学、经济学与博弈论

  Von Neumann喜欢与政客和商界人士打交道,曾先后参与了迈哈顿计划,美国向日本投放原子弹的地点的决策,后成为美国军方的顾问。他还曾为IBMRAND公司等商业机构作过兼职顾问。

Von Neumann经常穿着一身灰色的西服(甚至在打网球的时候),给人一种圆滑、事故的感觉。他喜欢社会交往,平均每周都有1~2次各界人士参与的家庭聚会。Von Neumann是着名的马路杀手,经常一年就要换一部车,因为他经常在开车的时候思考问题。

2)《计算机与人脑》

这本书是von Neumann留给我们的为数不多的着作之一(似乎是仅有的中文译作),这是他讲演稿的总结,主要比较了当时的计算机和人脑之间的共性与差异,其中很多观点对于现在的复杂性科学、人工智能研究仍然具有重要意义。

下面概述一下von Neumann在本书中做出的结论。

  对比计算机和人脑,我们发现:

  1、在同样的时间内,人脑要比电脑完成更多的操作(这个结论对于目前的计算机来说已经不适用了)。

  2、计算机比人脑具有更快的计算单元,但是整体性能却不如人脑。

  3、计算机更多的采用串行的方法计算,而人脑更多采用并行的方式。

  4、在记忆方面,计算机与人脑有很大不同。计算机的记忆相当于是局部、静态记忆的。而人脑的记忆则产生于通过神经元之间的连接构成的系统和信息传递的动态过程中。

  5、从计算精度的角度来看,由于计算机实行的串行操作模式,因此误差就会在一系列串行操作的过程中累加,这就要求每个计算单元的计算精度必须特别小才能保证整体的精度。而人脑更多的采用并行的模式,因此,误差会在大量计算中抵消,从而导致即使每个部件的精度可能很低也能保证整体的计算精度较高。

  6、计算机的技术系统是数字化的,而人脑使用的计数系统本质是统计的。

  人脑传递消息的统计性质之一,就是频率。人脑采用频率编码,而不是直接的波形编码。这种编码的好处就是鲁棒性。试想一个波动信号传递,假如编码在波形之中,则一点小的改变就可能导致编码信息的丢失;而如果编码在频率中,则一次波形的小改变并不导致频率的整体畸变。

  7、关于语言,计算机是使用数学语言为基础的。而人脑则是一种构建在“第一语言”之上的数学语言。也就是说人脑的语言基础可能不是数学语言。

总结来看,计算机系统是一个用相当可靠、精确的部件构造而成的一个不可靠的系统,而人脑则是一个用不可靠、不精确的部件构造成的一个相当可靠的系统!

  3)《Theory of Self-reproducing Automata

  关于本书:该书源自von Neumann1940年代于Illinois大学做的一系列讲座。之后由von Neumann的助手密西根大学的Arthur BurkJohn Holland的老师)整理、编辑出版。该书可分为两部分,第一部分是von Neumann的讲座,说明了von Neumann为什么要研究自复制自动机,以及他的理论根据。第二部分则是von Neumann设计的自复制自动机细节部分。

个人以为,第一步非常经典,von Neumann当时思考的很多问题已经抓住了复杂性科学的本质,而且这些问题甚至对于现在来说仍极具指导意义。下面,我将摘录一些书中的原话,并展开一定的讨论。

Editor’s Introduction Arthur Burk写的几段对本书的简短介绍)

Finally, He (von Neumann) formulated and partially answered two basic questions of automata theory: How can reliable systems be constructed from unreliable components? What kind of logical organization is sufficient for an automaton to be able to reproduce itself?

这段话概括出来von Neumann当年设计自复制自动机的本质目的并不是想模拟或者理解生物体的自我复制,也并不是简单想制造自我复制的计算机病毒,他的最终目的是想回答一个理论问题:我们如何用一些不可靠的部件来构造出一个可靠的系统。而自复制自动机恰好就是一个最好的用不可靠部件构造的可靠的系统。这里,不可靠部件可以理解为构成生命的大量分子,由于热力学干扰,这些分子很不可靠。但是生命系统之所以可靠的本质,恰是因为它可以完成精确的自我复制。所以,自复制就是一个实例。

He thought, for example, that below a certain level, complexity is degenerative, and self-reproduction is impossible. He suggested that, generally speaking, in the case of simple automata a symbolic description of the behavior of an automaton is simpler than the automaton itself, but that in the case of exceedingly complex automata the automaton is simpler than a symbolic description of its behavior.

Von Neumann mentioned two further connections between thermodynamics and automata theory. First, he found an analog of thermodynamic degeneration in the theory of self-reproducing automata: below a certain minimum level, complexity and degree of organization are degenerative, but above that level they are not degenerative and may even increase.

这两段话概括了von Neumann关于进化论、热力学第二定律、复杂度和自复制自动机方面的想法。他说,任何一个系统(无论是人工的还是自然的),只要它的复杂性级别不够,那么由于热力学第二定律的作用,这个系统就会退化(degenerative)。对于这种简单自动机(Turing机),我们说这个自动机行为的符号描述(该Turing机的编码)要比这个自动机自身简单。但是,一旦系统的复杂度超过了一定级别之后,我们就能看到进化的现象了。对于自动机来说,这意味着描述该自动机的代码(Turing机的编码)要比这个自动机本身的行为更复杂。那么,这个复杂性的阈值是什么呢?这就是自复制自动机,我们后面会看到,自复制自动机恰恰由于一个叫做“递归定理”的数学原理,使得它的行为表现和它的编码结构刚好形成了一个镜像对称(我们通俗来说,这就叫自指,即图灵机的编码刚好在描述它自己!)。也就是说,自复制自动机刚好是一个时间箭头的分水岭,系统的复杂度小于自复制自动机,热力学时间箭头就会引起系统的衰退,而超过了这个复杂度,那么热力学时间箭头就会导致进化。

Everybody who has worked in formal logic will confirm that it is one of the technically most refractory parts of mathematics. The reason for this is that it deals with rigid, all-or-one concepts, and has very little contact with the continuous concept of the real or of the complex number, that is, with mathematical analysis. Yet analysis is the technically most successful and best elaborated part of mathematics. Thus formal logic is, by the nature of its approach, cut off from the best cultivated portions of mathematics, and forced onto the most difficult part of the mathematical terrain, into combinatorics.

这段话是Arthur Burk摘录的von Neumann的原话。他的意思是说,现在大部分研究逻辑或计算机的科学家对连续性的数学(例如实数、复数)即数学分析的分支都不闻不问。然而,数学分析才是数学中的大宝藏,数理逻辑这部分仅仅是一个角落而已。所以,von Neumann是非常强调把连续性数学的结论引入到自动机理论中的,即强调将计算机的逻辑部分和热力学及其信息论(连续数学)联系起来。

Second, he discussed the thermodynamic aspect of the concept of balance in computing machine design. The efficiency of a computer depends on the proper balance of its different parts with respect to speed and size. For example, in the memory hierarchy the different kinds of memory (e.g. transistor, core, tape) should be matched to one another in size and speed. A computer in which the arithmetic unit is too fast for the memory, or the memory is too small, is like a heat engine which is inefficient because large temperature differences exist between two parts of it. The efficiency of a computer must be defined relative to its environment (i.e., the problems it is to solve), just as the efficiency of a heat engine depends on its environment. These problems of balance and matching are handled empirically by engineers. Von Neumann wanted a quantitative theory of balance akin to thermodynamics.

这段话表达了von Neumann理解的复杂的计算系统和热力学系统之间的类比。计算系统需要协调各个计算单元之间的尺寸和速度,这就像热机需要协调各个部分的温度梯度使得机械效率增高一样。另外,热机的效率必须根据它与外界环境的协调性来定义,同样,计算系统的效率也需要外界沟通。这就说明了计算系统的开放性其实与热力学系统的开放性有着一定深刻的联系。因此,von Neumann很想构造一套类似热力学的关于计算系统各个部件平衡方面的理论。接下来就进入了von Neumann讲稿的正题,综述了von Neumann当时的关于自动机理论、信息论等理论的进展情况,一步一步引出了自复制自动机方面的研究。我仍然摘抄一些经典语句。

在叙述到关于TuringGodel等人的工作的时候,他提到:

I am twisting a logical theorem a little, but its a perfectly good logical theorem. Its a theorem of Godel that the next logical step, the description of an object is one class type higher than the object and its absolutely necessary; its just a matter of complication when you get to this point. … They may easily be in this condition already, where doing a thing is quicker than describing it, where the circuit is more quickly enumerated than a total description of all its functions in all conceivable conditions.

这段话谈到了哥德尔的工作中蕴含的关于复杂性方面的研究。哥德尔和图灵等人研究的最大贡献在于他们开发了一套将机器和代码混合在一起的方法。这样,哥德尔就能采用这种具有“二义性”的语言来构造自指命题,从而提出了哥德尔定理。然而,除了如此应用哥德尔德的发明以外,我们还可以讨论它的复杂度和执行速度快慢。即把每个图灵机或者图灵机的编码赋予一个执行速度值,或者复杂度值。这样我们就讨论两件事情,一个是图灵机行为的复杂度,一个是图灵机代码的复杂度。所以,针对类似大脑这样的复杂系统来说,让它执行运算远比对它的运作机制进行描述来得要快。

在回顾关于热力学和信息论的时候,他提到:

Now this inclines one to view probability as a branch of logics, or rather, to view logics affected with probability as an extension of ordinary rigorous logics. In more recent times the distinction was emphasized strongly and made the basis of a system by the economist Keynes, who wrote his thesis on probability. There are undeniable weaknesses of the logical position. In some ways of looking at probability it is opportune not to identify zero probability with absurdity. Also, it is not quite clear in what sense a low probability means that one might expect that the thing will not happen. Anyway, one is also tempted in the case of quantum mechanics to modify one’s outlook on logics and to view probability as intrinsically tied to logics

这段话谈到了von Neumann对概率论的看法,他认为我们可以把概率论理解为逻辑的一个分支,或者反过来,概率论是严格逻辑的一种延伸。这种观点与传统的对概率论的频率理解有很大的不同。着名的经济学家凯尔斯写过一本书叫做《A Treatise on Probability》,就是从逻辑的观点看待概率的。这种观点似乎能描述我们主观对概率事件的感受,例如,我们并不能接受:小概率事件就一定不能发生。这种情况与在量子力学中的情景很相似,在那里,人们正试图修改对概率的理解,使得它可以和逻辑学相连。文中引了一本书《The logic of quantum mechanics》,作者是Von Neumann

In other words, living organisms are very complicated aggregations of elementary parts, and by any reasonable theory of probability or thermodynamics highly improbable. That they should occur in the world at all is a miracle of the first magnitude; the only thing which removes, or mitigates, this miracle is that they reproduce themselves. Therefore, if by any peculiar accident there should ever be one of them, from there on the rules of probability do not apply, and there will be many of them, at least if the milieu is reasonable. But a reasonable milieu is already a thermodynamically much less improbable thing. So, the operations of probability somehow leave a loophole at this point, and it is by the process of self-reproduction that they are pierced.

从概率论的角度来理解自我繁殖生命体自发涌现的问题是一个奇迹,它就仿佛是概率论中的一个漏洞。生命正是利用了这种漏洞的。因为任何一个有机体都是由大量部件构成的,从概率论的意义上来看,任何一种构型都是那么的不可能。然而,一旦生命这种构型具备了自繁殖的功能之后,它就能够钻进概率论留下的空隙中去。因为生命的自复制使得这种不可能的构型变成了必然发生的大概率事件了。

进一步,von Neumann指出了,这种自复制自动机不仅仅戳穿了概率论的阴谋诡计,而且还利用了概率论而实现进化!

You can do one more thing. Let X be A+B+C+D, where D is any automaton. The (A+B+C)+d(A+B+C+D) produces (A+B+C+D)+d(A+B+C+D). The system (A+B+C+D) can undergo processes similar to the process of mutation. Self-reproduction includes the ability to undergo inheritable mutations as well as the ability to make another organism like the original.

Von Neumann指出了一个机器A+B+C+d(A+B+C),(其中A是通用构造器、B是通用拷贝器,C是控制部件,d(A+B+C)A,B,C这三个机器的源代码)是可以完成自我复制功能的,这个机器是根据计算理论中着名的递归定理构建的(递归定理就是自指的基础,也是哥德尔用来构造自我毁灭性的哥德尔定理的工具)。之后,对这个机器稍加改造就能创造出可进化的机器来。即假设由于热力学第二定律的作用,整个系统受到干扰产生变异。

如果变异发生在A,B,C身上,那么变异就是有害的,因为系统不能完成自复制。但如果变异发生在源代码部分,即d(A+B+C)变异为d(A+B+C+D),那么这种变异就不会摧毁整个机器,而是创造出了一个新的机器A+B+C+D+d(A+B+C+D)。这个新的机器不仅仅由于变异获得了新功能D,而且他仍然具有自我复制的功能。也就是说,这为一种可遗传的变异提供了可能,也就是达尔文的进化方式。回顾一下,变异的出现恰是因为底层由概率论支配的热力学涨落,而自我繁殖机器恰恰是巧妙地利用了这种热力学涨落,而创造出了进化!

4) 总结:

  虽然在1930~50年代涌现出了很多科学大师,例如维纳、von Neumann等人,但是,相比较其他大师来说,von Neumann由于自己丰富的社会和工程经验,而能够提出一些更具体的问题出来。然而,很可惜的是,这些大师的思想并没有被后来的人们所继承,由于后人们的哲学高度没有达到von NeumannWiener等人的水平。而且,这些人的猜想过于超前,没有任何技术、数据的支持,所以人们根本不能理解这些大师们思考问题的出发点。于是,他们的徒子徒孙们继承的就全部是技术细节方面的东西,例如von NeumannUlam发明的元胞自动机受到了人们的欢迎。

  WienerCybernetics也变成了Control theory

  然而,随着近年来的研究,情况已经稍微改变。近年来,人们对复杂系统的研究已经上到了一个新台阶,大量数据的积累使得我们可以很确定的谈论复杂性现象。

  因此,von Neumann当年的目标部分已经实现,例如他提倡构造一套可以描述自动机的概率理论。目前,复杂系统研究中,统计物理已经越来越显得重要。但是,由于现代的复杂性理论研究没有哲学思想的指导,使得人们虽然拥有大量的数据,却仍然是盲人摸象,不知道下一步会走向何方。例如,现在的复杂网络研究虽然很热,但是这么研究来研究去,我们究竟要得出一个什么结论呢?尽管有少数科学家已经开始思考构建复杂网络的热力学理论(例如Newman),但是这些目标离早期von Neumann的宏伟目标还差得挺远。我个人以为,沿着von Neumann设计的大致步骤,复杂系统理论的发展首先是在概率论上突破,借用量子力学的工具,重新给概率的主观、客观两种观点赋予含义。其次,人们就将利用新的概率论工具结合早年对计算理论的研究(哥德尔、图灵等人的工作),把概率论中的漏洞:自复制逻辑发现出来。到达这一天,人们对复杂系统,对生命和智能的本质将有全新的认识。

集智AI小组第二次活动纪要

星期四, 三月 12th, 2009

    时间:3月8日下午2点
    地点:三号会所
    讨论主题:维纳和Cybernetics

    以下是大家的总结  

A. ===== by Miner (主要是背景介绍) =====

  一、关于书:维纳1948年出了《Cybernetics:Or Control and Communication in Animal and the Machine》(中文版译为《控制论:或关于在动物和机器中控制和通信的科学》);为了向大众普及,1950年出了号称《Cybernetics》的科普版的《The Human Use Of Human Beings: Cybernetics And Society》(中文版译为《人有人的用处:控制论与社会》),随后在1954年出了修订版;1961年,出了《Cybernetics》第二版,比前版有所修改,并增加了后面两章。(维纳1964年去世)
  我们这次读的就是《Cybernetics》的第二版,想买书的建议购买新版(http://www.douban.com/subject/2356843/),比旧版多了详细的导读和维纳的生平介绍,很适合对Cybernetics历史不了解的人。
  
  二、Cybernetics和控制论:Cybernetics这个词源于希腊文,有“舵手”之意,上个世纪五六十年代我国翻译该书时将其译为 “控制论”,结果给后人带来了很大的误解。许多人把其等同于“工程控制论”而忽略了其思想意义。“工程控制论”同Cybernetics在同一时期发展出来,维纳本人也做了很多“工程控制论”的工作,但“工程控制论”主要讨论受控工程系统的分析、设计和运行,是一门应用工程科学。而Cybernetics 的含义要广得多,有人认为其实质是一种思想方法,而非特定学科。据说钱学森曾支持将Cybernetics翻译为“事理学”,不过我个人认为这个翻译不恰当,在没有合适的翻译之前,还是直接用Cybernetics好了。
  
  三、什么是Cybernetics:我的理解是“研究如何收集和利用反馈信息对系统加以调节控制使之达到或保持稳态(目的)的科学”,更多定义参见
  http://www.asc-cybernetics.org/foundations/definitions.htm
  
  四、Cybernetics的主要思想:
  –目的论 teleology (不关注“what is this thing”,而关注“what does it do”)
  –强调反馈的作用(和环境交互)
  –功能模拟:黑箱方法(把要研究的系统当作未知结构的黑箱,定义一个已知结构的白箱,利用反馈信息调整白箱的参数,使之在功能上逼近黑箱,然后基于白箱进行控制。黑箱方法的好处是不需要知道系统的具体细节就可以进行控制,从而使得研究复杂系统成为可能)
  –…………
  
  五、Cybernetics和AI:
  Cybernetics对AI首要的贡献在于Cybernetics首先讨论了机器与人的统一性,揭示了用机器模拟人的可能。
  AI的本质是目的论和功能模拟的,但为什么没在cybernetics的框架下发展起来?《AI:A Modern Approach》一书中给出的答案是使用的数学工具不同,也就是白箱不同,cybernetics使用的是微分方程,而这无法用来研究AI所关心的推理、规划、语言等问题,因此早期的AI研究者发展出了符号逻辑等白箱工具。
  cybernetics的思想在AI的行为主义学派得到了体现。
  机器学习中也可以看到很多cybernetics的思想,尤其是增强式学习(reinforcement learning)
  
  六、Macy会议与Cybernetics:
  上个世纪四五十年代Macy基金会资助了一系列会议,该会议的主席是Warren McCulloch,会议最初的目的是 to explore questions “at the junction between psychology and brain science”,参加者有当时顶尖的生理学家、计算机设计者、数学家、心理学家、社会学家、人类学家等等,其中包括维纳和冯诺依曼。香农也参加过几次。这些顶尖高手的互相交流促使了Cybernetics和后来认知科学的形成(也就是AI研究的两大主题)。
  关于Macy会议的讨论内容,参见http://en.wikipedia.org/wiki/Macy_Conferences,其深度和广度让人叹为观止!

B. ===== by pem =====

    1.目的论
  
  —系统自己没有目的,为了研究和理解方便,我们设定一个目的。
  —像小球自由往下掉这个事情,牛顿力学可以由初始状态,得到它的轨迹,每一点的速度等等。
  —用分析力学作用量最小化,也可以解释。像哈密顿量,不仅适用于经典系统,量子系统也可以用。
  —还提到什么二次控制论,让系统自己形成目的。这些人提出了一些概念,做出的具体东西很少。
  —jake举了个滑冰场的例子:一堆人滑冰,开始都乱滑,后来逐渐形成大致统一地顺时针或者逆时针。新来的,就会沿着这个已经形成的方向。系统存在慢变量和快变量,慢的类似系统自身的目的,快的受慢的控制。社会舆论之类的有类似行为。
  —机器学习里面有类似的行为,自动从已有数据集中得到某种模式。
  
  
  2. 控制论为什么不适用社会问题
  —维纳不感兴趣这个,不想用于社会问题
    【注by Miner:我认为不是维纳不想,而是他觉得一则难度很大,二则他担心社会学方面的研究被不恰当地使用,正如他在《Cybernetics》中所说:
   “我们这些对于控制论这个新的科学有所贡献的人,因此都处在一个道义的位置上,这个位置,至少是不很安适的。我们促进了一个新的科学的发轫,这门新科学,我已经说过,其技术发展具有为善和作恶的巨大可能性。我们只能把它交给我们生存其中的这个世界,也就是德国贝尔森集中营和广岛的世界。我们甚至无法制止这些新技术的发展。它们属于这个时代。我们之中任何人所能做的最高限度的努力,是制止把这方面的发展交到那些最不负责和最唯利是图的工程师的手中。我们最多只能指望广大公众了解目前这项工作的趋势和方向,把我们个人的努力限制在诸如生理学和心理学这样的远离战争和剥削的领域里。我们已经看到,有这样一些人,他们希望,从控制论得到的对人和社会更深刻的理解的这一好处,将能预测并胜过控制论对权力集中方面所起的偶然的作用(权力,由于其存在条件本身,常常集中在最鲁莽的人手里)。我是在1947年写这些话的,我不得不说,这是一个非常微小的希望。”   
  维纳希望“把我们个人的努力限制在诸如生理学和心理学这样的远离战争和剥削的领域里”,我想,这也许是Cybernetics没有发展起来的原因之一吧。无论他的希望多么不现实,还是非常钦佩他的道义感和责任感。】

  —标度问题。我们能比较独立地研究很大的和很小的东西,因为标度相差很大。社会在人自身标度范围内,对社会的研究会引起社会的变化。
  
  3. 任一非线性输出(黑盒),都可以用线性项的来分解,可以使用反馈,自动调整线性项的系数,使之始终能准确模拟黑盒的行为。这个过程与基因的自复制有类似之处。基因从环境中吸取氨基酸,核酸,用把它们组成和自己相同的另一基因。
  
  4. 时间问题。
  —我们只能认识那些时间方向和我们一致的世界。
  
  5. 控制论为什么没发展起来
  —没经费,钱都给做AI的了
  —这个东西是个很大的框架,比较虚,难驾驭
  —八卦,维纳和某某及其他一堆人断绝来往 

C. ===== by Wu Lingfei =====

Topic1:反馈与控制:目的论的算法?
  1. 维纳是如何把机械控制系统与人的神经系统相比的:通过不断地吸收反馈的信息进行校调,实现目的,所以我们不用管系统每一刻的状态,只需要用一个白箱来拟合这种黑箱的功能即可——这两个可比吗?要知道,人的大脑意识可以设置一个目的,但机械控制系统是没有目的的——控制论是不是要赋予机械系统一个目的?—— 一阶控制论是赋予目的的,二阶控制论则试图让系统自己搜寻目的。
  2. 基于目的论的算法比经典的牛顿力学算法简便:以在碗中滚动的小球为例,我们不用分析小球每一秒的受力情况就可以预测小球最后一定要落在最低点,因为我们知道小球要把所有能转化为动能的势能消耗干净——目的论只是一种算法,我们可以用目的论的方法,也可以用经典力学的方法,只不过有些时候前者比较有效而已 ——目的论真的只是单纯的算法么?我们如果习惯于认为系统是有目的的,最后会不会也认为宇宙有自己的演化目的,正如牛顿力学其实也是一种世界观:时间可逆的,钟表般严谨的,未来可确定地被预测的世界观。

Topic2:信息的计量,时间序列的预测
  1. 维纳所提出的预测未来的方法与老方法有何不同?——老方法是建立在确定性的宇宙观基础上,所以拼命拟合历史数据,去寻找非常光滑的曲线,但这种方法对旧数据拟合得越是精细,对新数据的不一致和振荡就越是无能为力,在机器学习里,这就叫过拟合——在维纳看来,过去的历史数据当然有用,但那并不是过去的唯一可能,而是过去的无数种可能中的一种,如果我们考虑到业已发生的事件不过是一种可能性,正如掷出和为7的筛子并不是唯一的可能而只是最大的可能的话,那我们就可以给未来一个预测值的同时把置信区间,或者说标准误SE考虑在内,这就是“把预测理论中原来认为困难的东西变成解决实际预测问题的有力工具”,也是“ 把原来具有经验性和偶然性的过程,变为透彻的科学判断的过程”,从而我们也能理解维纳所说的“电话机和电报机只有在他们所传递的消息以不完全决定于过去的方式连续变化的时候才能发挥他们的功能,也只有在这些消息的变化符合某种统计规律的时候才能被有效地设计出来”。一句话,维纳“把通信工程变成统计力学的一个分支”
  2. 维纳是在解决什么具体问题的时候走向信息的呢,是滤波问题,就是如何使用统计规律去除白噪声之类的问题——为什么三个人:费希尔,申农和维纳从不同的方面都殊出同归地使用“二择一”的方式来表达信息。有其他种表达信息的方式么?一种可能性是,这是我们人类认识世界的自动对应算法,就好像一观察复杂系统就自动调用log律一样。    信息是什么?我们不断问这个世界我们猜得对不对。我们问一次问题,世界回答一次问题,就是一次观察,就是miner所谓的一次概率修正,就是 jake所谓的一次波函数坍缩••• Holland设计的echo系统的信息处理系统也是这样一个“十万个是不是”的系统。问题在于,世界可以以这种方式被询问么?事件总是连续不可切割的,我们不断观察,不断修正,无限小地切割事件,然后加以微积分运算,以为得到了平滑曲线 •••举一个例子,一个人带河蟹上飞机的可能性是1%,所以两个人同时带河蟹上飞机的可能性是万分之一,所以带河蟹上分飞机可以使我们更安全?——既然你已经带河蟹上飞机,那就不是1%的概率,而是现实了,所以新的概率还是1%——在这个例子里,什么时候变成现实呢?“现实”,或者一个河蟹和另一个河蟹是在什么地方被切割为先后关系的?如果是考虑同时带上去(要求同时上飞机),那么还怎么切割先验概率和后验概率呢?
  3. 在我们讨论过去的时候,如何进行统计分析?我们永远想机器学习那样,从一个样本到另一个样本,这样可以直接地判断统计方程的有效性,却不能从根本上解决置信度的问题,因为我们永远不知道总体:过去的所有可能性的组合是什么状态——除非我们预设一种分布,把过去所发生的事看过是最大熵的结果—
  
Topic3:维纳反对把控制论过快地应用于社会科学领域
   1. 为什么控制论不能应用到社会科学领域?——首先人的标度具有独特性,因此我们在自然界的观察对象和我们的标度相差巨大(有个人大喊:维纳居然会用这个词!),所以“耦合”的可能性比较低,也就是我们的观察不会太大程度上影响到被观察对象,但社会科学领域就不一样了,我们的观察和研究会很明显地改变社会事实。——其次统计游程太短,也就是我们很难从历史数据中推导出什么,这些数据可以说明的东西太少了。可重复性也不具备。
  
附注讨论Topic4:牛顿时间与伯格森时间
   因主题与AI直接关系不大,且内容十分天才,整理者准备另行专题总结。
===============================

另,Jake录了部分内容,在 http://www.namipan.com/d/5ecbd0cf8fb8726
174f4d71f7d112d6690b5430200faf000

注:愿意浪费时间听录音的,请注意口头讨论很不严谨,有很大的随意性,不必较真

集智AI小组第一次活动纪要

星期六, 二月 28th, 2009

  时间:2009年2月21日下午
  地点:三号会所小厅
  参加人数:7
  参加人员背景:计算机、物理、生物、社会学~~ (还是很多样化的:)
  
  讨论总结:
  1)本次讨论John McCarthy的”What is AI(http://www-formal.stanford.edu/jmc/whatisai.html)”的第一部分,主要内容包括“什么是AI”、“AI和人类智能的关系”、“AI和计算机的关系”、“计算机象棋和围棋”、“关于AI的一些争论(如图灵测试、赛尔的中文屋、哥德尔不完备性定理和计算复杂性理论对AI的影响等等)”。这次主要是对AI的一些基本问题达成共识,以后将着重讨论AI的各个领域的问题。
  2)McCarthy这篇文章的二、三部分简单介绍了AI的各个分支和应用,由于概括的不是很全面,没做讨论。想了解的话建议阅读《Artifical Intelligence: A modern approach(人工智能:一种现代方法)》[中文版 http://www.douban.com/subject/1230487/,英文影印版 http://www.douban.com/subject/1809089/,英文网站 http://aima.cs.berkeley.edu/]……的目录
  
  鉴于AI涵盖的内容太多,也为了体现读书会人人参与的精神,我们以后的活动采取各人轮流担当主持人的方式.
  主持人的职责:
  1)选择要阅读的论文并至少提前一周通知大家(尽量附送电子版)
  2)撰写所负责人物的介绍(从网上搜集到的资料及自己的评论都可以),在豆瓣发布(同时在google小组的主页上创建一个页面做备份)。这样做是为了资源共建和共享,避免重复劳动。注意:不必等到讨论时再写,现在就可以发布,随时补充。
  3)多了解一些所负责人物的工作,讨论时向大家介绍(因为读书会只能读有限的文章,主持人可以相应扩展一下)
  
  最近几次的计划(暂定两周一次,可能顺序会有变动):
  主持人 - 负责人物
  Jake - John Von Neumann
  Wu Lingfei - Norbert Wiener
  Ren Yan - Alan Turing
  Liu Qingqing - Herbert Simon & Allen Newell
  Wu bin - David Courtnay Marr