簡介
一般來說,人工智能語言應(yīng)具備如下特點:
具有符號處理能力;
適合于結(jié)構(gòu)化程序設(shè)計,編程容易;
具有遞歸功能和回溯功能;
具有人機交互能力;
適合于推理。
發(fā)展
許多對信息技術(shù)劃代的標(biāo)準(zhǔn)都是硬件,如電子管為第一代,晶體管為第二代,集成電路為第三代,等等,對用戶來說,與計算機打交道要通過計算機語言,一般把機器語言稱為第一代,第二代是匯編語言,第三代是ALGOL、COBOL、FORTRAN等語言,第三代語言延續(xù)時間較長,從六十年代開始,在七十年代得到進(jìn)一步發(fā)展,但是隨著計算機應(yīng)用的普及,到七十年代末出現(xiàn)一些第四代語言的產(chǎn)品。
第四代語言這個術(shù)語是由J.Martin首先創(chuàng)立并積極推廣,他和P.Mimn下的簡單定義是:
用戶得結(jié)果的時間只需第三代語言的十分之一,
系統(tǒng)與用戶比較友好,易于學(xué)習(xí)和記憶,
既適合于最終用戶又適合于數(shù)據(jù)處理專業(yè)人員使用。
根據(jù)J.Martin定義,依應(yīng)用生成的類型而區(qū)分為集成的個人計算機工具,查詢語言和報表生成器,圖象語言,決策支持和財會模型系統(tǒng),面向最終用戶的應(yīng)用生成器,面向數(shù)據(jù)處理專業(yè)人員的應(yīng)用生成器,等等。有人說,前三代語言應(yīng)用于工業(yè)時代,而第四代語言則標(biāo)志著信息時代的開始。
現(xiàn)在,計算機語言仍是計算機科學(xué)和計算機軟件中的活躍分支,其研究領(lǐng)域可分為:語言理論、設(shè)計、處理實現(xiàn)和環(huán)境。語言種類也大大擴充,包括:需求、設(shè)計、實現(xiàn)語言,函數(shù)、邏輯和關(guān)系語言;分布式、并行和實時語言;面向?qū)ο蟮恼Z言,硬件描述語言;數(shù)據(jù)庫語言;視覺圖形語言;協(xié)議語言原型語言,自然語言。
在人工智能的研究發(fā)展過程中,從一開始就注意到了人工智能語言問題。實際上四十多年來有一百來種人工智能語言先后出現(xiàn)過,但很多都被淘汰了。它們大抵有三個來源。第一個來源是計算機科學(xué)家們對可計算性理論的研究。例如,LISP語言是為處理人工智能中大量出現(xiàn)符號編程問題而設(shè)計的,它的理論基礎(chǔ)是符號集上的遞歸函數(shù)論。已經(jīng)證明,用LISP可以編出符號集上的任何可計算函數(shù)。Prolog語言是為處理人工智能中也是大量出現(xiàn)的邏輯推理問題(首先是為解決自然語言理解問題)而設(shè)計的。它的理論基礎(chǔ)是一階謂詞演算(首先是它子集Horn子句演算)的消解法定理證明,其計算能力等價于LISP。OPS5面對的問題也是邏輯推理。不過PROLOG是向后推理,OPS5是向前推理。OPS5的理論基礎(chǔ)是Post的產(chǎn)生式系統(tǒng),其計算能力也等價于LISP。第二個來源是認(rèn)知科學(xué)的研究成果。人們研究出各種各樣的認(rèn)知模型,并為這些模型設(shè)計相應(yīng)的知識表示語言。例如產(chǎn)生式表示、框架表示、語義網(wǎng)絡(luò)表示等實際上都有其認(rèn)知模型作為背景。如上所述的OPS5是產(chǎn)生式表示的語言,SRL、FRL、FEST等是框架語言,概念圖和SNetI都是語義網(wǎng)絡(luò)表示語言。面向?qū)ο蟮某绦蛟O(shè)計是在SIMULA中的類程和Minsky的框架表示兩種思想融合的基礎(chǔ)上發(fā)展起來的(它適用于計算機軟件的所有領(lǐng)域,不只是人工智能)。
人工智能語言系統(tǒng)理論研究
在這個問題上,國外一些卓有成就的語言學(xué)家、邏輯學(xué)家和心理學(xué)家都在自然語言理解中的語法、句法及語義分析方面提出了一系列較為系統(tǒng)的理論方法。比較有影響的理論有:
轉(zhuǎn)換生成語法
1957年美國的喬姆斯基(N.Chomsky)創(chuàng)建了轉(zhuǎn)換生成語法(Transformational Generative Grammar)。喬姆斯基用數(shù)字方法定義的人工語言(形式語言)來研究語言學(xué)同題,用他的語言生成方法去研究形式語言。喬姆斯基將句子的結(jié)構(gòu)分為深層結(jié)構(gòu)和表層結(jié)構(gòu)兩個層次,一些表達(dá)相同意義的句子盡管表層結(jié)構(gòu)不同,但其深層結(jié)構(gòu)卻是相同的。轉(zhuǎn)換生成語法的原理是,通過上下文無關(guān)語法生成句子的深層結(jié)構(gòu),然后應(yīng)用轉(zhuǎn)換規(guī)則再將深層結(jié)構(gòu)轉(zhuǎn)換為表層結(jié)構(gòu)。在喬姆斯基的語法中基本上完全拋開了語義、語用和語境(廣義)方面的知識,只局限在一個形式化的機制上,因此很難完整確切地描述自然語言。
依存語法
1959年法國的語言學(xué)家特思尼耶爾(Lucien Tesniere)提出了依存語法(Dependency Grammar)。依存語法描述的是句子中詞與詞之間直接的句法關(guān)系。特思尼耶爾認(rèn)為詞與詞之間存在著一種“依存”關(guān)系。這種關(guān)系原則上將一個上項詞與一個下項詞聯(lián)系起來,上項叫支配詞,下項叫從屬詞。一個詞可以同時是某個上項的從屬詞和另一個下項的支配詞,這樣句子里的所有詞便構(gòu)成一個“分層次體系”。動詞是句子的中心,支配句中的其他成分。依存語法由于依存關(guān)系的數(shù)目不宜過多或過少。過少的依存關(guān)系使得語言描寫的深度和精度不夠,而太多的依存關(guān)系又會使語言分析和處理的過程太繁雜,代價太高,從而影響它的可操作性。
語義網(wǎng)絡(luò)
1968年美國奎廉(Quilian)首次提出了一種知識表示工具——語義網(wǎng)絡(luò)(Semantie Network)??ㄗh用語義網(wǎng)絡(luò)來描述人對事物的認(rèn)識,實際上是對人腦功能的模擬,并希望這種語義網(wǎng)絡(luò)能用于進(jìn)行知識推導(dǎo)。在這個網(wǎng)絡(luò)中,代替概念的單位是節(jié)點,代替概念之間關(guān)系的則是節(jié)點間的連接弧,稱為聯(lián)想弧。因此這種網(wǎng)絡(luò)又稱為聯(lián)想網(wǎng)絡(luò)。
蒙塔鳩語法
1970年美國蒙塔鳩(R.Montague)創(chuàng)建了一個完備的自然語言體系(U—niversalGrammar)——蒙塔鳩語法。蒙塔鳩語法由三部分組成:第一部分是用喬姆斯基的轉(zhuǎn)換生成語法推導(dǎo)出成立的句子,第二部分是把成立的句子轉(zhuǎn)化為內(nèi)涵邏輯表達(dá)式,第三部分是內(nèi)涵邏輯學(xué)的語義理論。這是一套集轉(zhuǎn)換生成語法、內(nèi)涵邏輯和語義理論為一體、形式化程度較高的語法體系,較好地解決了語形與語義的關(guān)系問題,但它還是一種以句法為目標(biāo)的分析器,無法解決句子所包含的深層意義以及與其他心智能力的關(guān)系等問題。
擴展轉(zhuǎn)換網(wǎng)絡(luò)
1970年美國伍茲(W.A.Woods)根據(jù)喬姆斯基創(chuàng)建的轉(zhuǎn)換生成語法,設(shè)計了擴展轉(zhuǎn)換網(wǎng)絡(luò)(Augmented Transitional Network,簡稱ATN),并于1972年建成了LU—NAR模型[1引。擴展轉(zhuǎn)換網(wǎng)絡(luò)既可以看成是一種語法描述工具。在ATN中,文法被表示為一組圖(或稱為網(wǎng)絡(luò)),這些網(wǎng)絡(luò)表示了句子成分的可能順序以及在處理過程中分析器可能進(jìn)行的各種選擇。LUNAR是把ATN語法應(yīng)用于實際問題的一個范例,由于系統(tǒng)只要求有限的性能目標(biāo),所以自然語言對話中的某些常見的復(fù)雜問題被回避了。
系統(tǒng)語法
1972年美國維諾格拉德(T.Winograd)根據(jù)韓禮德(Halliday)的系統(tǒng)語法提出SCHRRDLU模型。系統(tǒng)語法把語言看成是一種社會現(xiàn)象,采用描述和歸納的方法進(jìn)行研究。維諾格拉德認(rèn)為語義理論必須在三個平面上描述關(guān)系:確定詞的意義;確定詞組在句法結(jié)構(gòu)中的意義;一個自然語言的句子決不應(yīng)該被孤立解釋,一種語義理論必須描述一個句子的意義如何依賴于它的上下文,語義理論必須涉及語言學(xué)背景(說話的上下文)和現(xiàn)實社會(世界)背景(即同非語言學(xué)事實的知識的相互作用),語義理論必須同句法和語言的邏輯方面(演繹推理)相聯(lián)系SCHRRDLU是一個在“積木世界”中進(jìn)行英語對話的自然語言理解系統(tǒng)。同樣由于系統(tǒng)只在一個簡單的限定領(lǐng)域(積木世界),所以自然語言對話中的某些常見的復(fù)雜問題被回避了。
格語法和語義網(wǎng)絡(luò)理論
1973年美國西蒙RFSimmons(R.F.Simmons)在伍茲的ATN的基礎(chǔ)上,采用菲爾摩(Fillmore)的格語法(CaseGrammar)建立了語義網(wǎng)絡(luò)理論。格語法將自然語言理解中的語法和語義分析結(jié)合起來,它的語法規(guī)則是用于描述語法規(guī)律而不是語義規(guī)律的,但規(guī)律所產(chǎn)生的最終結(jié)構(gòu)不是嚴(yán)格表示語法結(jié)構(gòu)而是描述語義關(guān)系。語義網(wǎng)絡(luò)表示描述了知識的分層分類結(jié)構(gòu)下的概念關(guān)系,主要推理形式是概念(結(jié)點)間屬性的繼承。這種分層的繼承關(guān)系刻畫了客觀知識與人類常識。語義網(wǎng)絡(luò)表示有實現(xiàn)系統(tǒng),但一直缺乏理論基礎(chǔ)。
概念依存理論
1972年美國杉克(C.Sehank)提出了概念依存理論(ConceptualDependencyTheory),建立了MARGI系統(tǒng),1977年又建立SAM系統(tǒng)。杉克認(rèn)為句子的句法分析對語言理解的幫助不大,句法結(jié)構(gòu)無法提供必要的信息來理解語義,人類在理解語句時全靠生活知識。在理解時,語法只起到一個指引的作用,即根據(jù)某些輸人詞語找到所需的概念結(jié)構(gòu)。任何兩段話,只要意思相同,無論是否屬于同一種語言,都有同一個概念內(nèi)容。概念內(nèi)容應(yīng)具有中性的結(jié)構(gòu)形式,超脫于特定的語言文法,超脫于一切表層結(jié)構(gòu)。概念內(nèi)容由概念及其相互之間的從屬關(guān)系構(gòu)成。由于用概念依存理論來理解自然語言時,大量使用到語義知識,使得對純粹語法分析有二義性的句子亦能賦以唯一的解釋。但另一方面,要很好地完成分析工作又需要龐大的語義知識庫。
境況語義學(xué)
1983年美國的巴杯士(John Barwise)和佩里(John Perry)建立了系統(tǒng)的語義學(xué)——境況語義學(xué)(situation semantics),發(fā)表了他們的代表性著作《境況與態(tài)度》。巴杯士和佩里認(rèn)為他們的語義理論可以克服傳統(tǒng)的真值條件語義學(xué)遇到的一些困難,特別是如何處理態(tài)度動詞等問題。境況語義學(xué)是一種語義與語用相結(jié)合的語義分析理論。廣義的境況包括客觀世界中所有動態(tài)和靜態(tài)的事件,它是連續(xù)時間和連續(xù)空間中呈現(xiàn)的連續(xù)畫面;狹義的境況是指與某個言語活動相聯(lián)系的動態(tài)或靜態(tài)事件,即包括該言語活動所涉及的事件。境況理論認(rèn)為,語言表達(dá)式的含義是兩個境況之間的關(guān)系:一個是話語發(fā)生時的境況,另一個則是該話語所描述的境況,這兩個境況之間的關(guān)系要受人們對語言使用規(guī)則的約束,正是這種約束決定了語言表達(dá)式的含義。語言之所以具有交流信息的功能,是因為對語言使用規(guī)則的約束要為整個社會所遵從。境況理論的任務(wù),就是要從客觀世界存在的大量真實境況中,抽象出所有境況共有的內(nèi)部結(jié)構(gòu),在此基礎(chǔ)上探討境況之間的約束關(guān)系,揭示出語言表達(dá)式的含義,從而為基于境況的自然語言理解提供一個具有可計算的數(shù)學(xué)模型。
語料庫語言學(xué)
近幾年來,在國際范圍內(nèi)掀起了語料庫語言學(xué)(CorpusLinguistics)的研究熱潮。語料庫語言學(xué)研究機器可讀的自然語言文本的采集、存儲、檢索、統(tǒng)計、語法標(biāo)注、句法——語義分析以及具有上述功能的語料庫在語言定量分析、詞(字)典編撰、作品風(fēng)格分析、自然語言理解和機器翻譯等領(lǐng)域的應(yīng)用。
人工智能語言與傳統(tǒng)語言的區(qū)別
傳統(tǒng)方法
通常把問題的全部知識以各種的模型表達(dá)在固定程序中,問題的求解完全在程序制導(dǎo)下按著預(yù)先安排好的步驟一步一步(逐條)執(zhí)行。解決問題的思路與馮·諾依曼式計算機結(jié)構(gòu)相吻合。當(dāng)前大型數(shù)據(jù)庫法、數(shù)學(xué)模型法、統(tǒng)計方法等都是嚴(yán)格結(jié)構(gòu)化的方法。
把問題的全部知識以各種的模型表達(dá)在固定程序中,問題的求解完全在程序制導(dǎo)下按著預(yù)先安排好的步驟一步一步(逐條)執(zhí)行。這種方法解決嚴(yán)格結(jié)構(gòu)(Well Structured)問題非常有效。如果把這類問題形式化為三元組(x,->,y),“x”是給定的信息,“->”為求解途徑,“y”是目標(biāo)。傳統(tǒng)方法的特點:“x”、“y”是明確的、完備的;“->”有著固定的明確的程式。這個方法之所以有效,主要是因為這個思路與馮.諾依曼式計算機結(jié)構(gòu)相吻合。當(dāng)前大型數(shù)據(jù)庫法、數(shù)學(xué)模型法、統(tǒng)計方法等都是嚴(yán)格結(jié)構(gòu)化的方法。
人工智能方法
對于人工智能技術(shù)要解決的問題,通常需要建立一個知識庫,程序根據(jù)環(huán)境和所給的輸入信息以及所要解決的問題來決定自己的行動,所以它是在環(huán)境模式的制導(dǎo)下的推理過程。這種方法有極大的靈活性、對話能力、有自我解釋能力和學(xué)習(xí)能力。這種方法對解決一些條件和目標(biāo)不大明確或不完備,的非結(jié)構(gòu)化問題比傳統(tǒng)方法好。它采用用試探法來解決問題。人工智能也尚未發(fā)展到完全能解決這類問題的全部問題。這類問題是人工智能研究要解決的問題。
人工智能要解決的問題,無法把全部知識都體現(xiàn)在固定的程序中。它要建立一個知識庫(包含事實和推理規(guī)則),程序根據(jù)環(huán)境和所給的輸入信息以及所要解決的問題來決定自己的行動,所以它是在環(huán)境模式的制導(dǎo)下的推理過程。這種方法有極大的靈活性、對話能力、有自我解釋能力和學(xué)習(xí)能力。這種方法對解決一些弱結(jié)構(gòu)(ill structured)問題比傳統(tǒng)方法好。弱結(jié)構(gòu)指“x”、“y”不大明確或不完備,即不能很好地形式化,不好描述。“->”用試探法。AI也尚未發(fā)展到完全能解決這類問題的全部問題。這類問題是AI研究要解決的問題。隨之而來也希望計算機硬件結(jié)構(gòu)也來一個革命,突破馮.諾依曼體系結(jié)構(gòu)。
面向主體(Agent,亦稱活體)程序設(shè)計
近年來出現(xiàn)了具有人工智能特色面向?qū)ο蟪绦蛟O(shè)計,稱為面向主體(Agent,亦稱活體)程序設(shè)計。往一個對象中增加更多的智能,使它能根據(jù)環(huán)境的變化進(jìn)行推理并規(guī)劃自己的行為,就得到主體(Agent)。主體概念符合Minsky提出的“意念社會”認(rèn)知模型,特別適用于分布環(huán)境。經(jīng)典的面向?qū)ο蟪绦蛟O(shè)計語言是Smalltalk,面向主體的程序設(shè)計語言也已經(jīng)有了一些,如OZ等,但還沒被大家公認(rèn)和普遍采用。也有基于PDP認(rèn)知模型(Parallel Distributed Processing)的神經(jīng)網(wǎng)絡(luò)語言。第三來源是知識工程的實際需要。例如,為了開發(fā)各種領(lǐng)域的專家系統(tǒng)而設(shè)計的包含不精確推理或不確定推理功能,甚至包含多種不同推理機制的AI語言,例如Loops和TUILI。還有的是看到某一個專家系統(tǒng)做得比較成功,干脆抽去它的領(lǐng)域知識,留下它的表示方法,也成為一種語言,俗稱專家系統(tǒng)外殼。例如,抽去醫(yī)學(xué)專家系統(tǒng)MYSIN的領(lǐng)域知識就得到一個外殼語言Emycin。
人工智能語言的特點
由于人工智能研究的問題的特點和解決問題的方法的特殊性,為了能方便而有效地建立人工智能系統(tǒng),需要發(fā)展專門的人工智能語言。人工智能語言的特點是什么,亦即人工智能語言應(yīng)具備的特征是什么?
一般來說,人工智能語言應(yīng)具備如下特點:
1.要有符號處理能力(即非數(shù)值處理能力);
2.適合于結(jié)構(gòu)化程序設(shè)計,編程容易;(要把系統(tǒng)分解成若干易于理解和處理的小單位的能力,從而既能較為容易地改變系統(tǒng)的某一部分,而又不破壞整個系統(tǒng)。)
3.要有遞歸功能和回溯功能;
4.要有人機交互能力;
5.適合于推理;
6.要有把過程與說明式數(shù)據(jù)結(jié)構(gòu)混合起來的能力,又要有辨別數(shù)據(jù)、確定控制的模式匹配機制。
名家名言
編輯
談到LISP和PROLOG兩種AI語言的重要性,我們可以從美國AI界的權(quán)威學(xué)者、麻省理工學(xué)院教授P.H.Winston(溫斯頓)所說的三段話來體會:
(1)溫斯頓認(rèn)為,LISP 語言是AI的數(shù)學(xué),不僅對AI的機器實現(xiàn)有重要意義,而且是AI理論研究的重要工具。
(2)“在中世紀(jì),拉丁文和希臘文的知識對所有學(xué)者來說,都是必不可少的。只懂一種語言的學(xué)者必然是一個殘缺不全的學(xué)者,他缺乏從兩個方面來觀察世界所獲得的那種理解力。同樣地,現(xiàn)代的AI專業(yè)人員如果不能同時大致通曉LISP和Prolog,也猶如一個殘疾人,因為就廣義來說,這兩種人工智能的主要語言的知識都是必不可少的。”
“我一直熱衷于Lisp,Lisp是在MIT被制造并且在那兒成長起來的。”
(3)概括地說,計算機語言的發(fā)展正是一個從HOW型低級語言向WHAT型高級語言進(jìn)化的過程.在HOW型語言中,程序編制者必須詳細(xì)說明運算是怎樣(HOW)一步一步進(jìn)行的;而在WHAT型語言中,程序編制者只需簡單說明要做的事情是什么(WHAT) 。 …現(xiàn)代的LISP語言是這些語言的佼佼者,因為采用Common Lisp格式的Lisp具有非凡的表現(xiàn)力,但是如何做某件事情仍然是有待于Lisp程序編制者來表達(dá)的東西.相反,Prolog是一種明顯地沖破了HOW型語言陳規(guī)的語言, 它鼓勵程序編制者去描述情況和問題,而不是那些用來解決問題的詳細(xì)步驟。”
由以上論述可以看出LISP語言和Prolog語言對人工智能學(xué)科和人工智能學(xué)者的重要性。
一般來說,LISP可以稱為人工智能的匯編語言, Prolog是人工智能更高級的語言。
內(nèi)容來自百科網(wǎng)