人工智慧區塊鏈圖靈測試
⑴ 圖靈測試是人工智慧的標准嗎
是標志人工智慧開始的具有時代意義的思想實驗。
1950年,阿蘭·圖靈在論文 《計算機制與智能》提到這個著名的實驗。
有人認為到2020年這個實驗,人工智慧可以在五分鍾實驗中騙過30%的人類。
實際的應用中因為領域的不同和應用場景的不同,標准也不相同。但都會受圖靈測試的影響。
⑵ 圖靈測試反映怎麼樣的人工智慧的思想
什麼是圖靈測試?
在一篇1950年發表的著名論文《Computing Machinery and Intelligence》中,數學家阿蘭·圖靈詳細討論了「機器能否擁有智能?」的問題。有趣的是,作為計算機科學與人工智慧領域共同的先驅,圖靈成功定義了什麼是機器,但卻不能定義什麼是智能。正因如此,圖靈設計了一個後人稱為圖靈測試的實驗。圖靈測試的核心想法是要求計算機在沒有直接物理接觸的情況下接受人類的詢問,並盡可能把自己偽裝成人類。如果「足夠多」的詢問者在「足夠長」的時間里無法以「足夠高」的正確率辨別被詢問者是機器還是人類,我們就認為這個計算機通過了圖靈測試。圖靈把他設計的測試看作人工智慧的一個充分條件,主張認為通過圖靈測試的計算機應該被看作是擁有智能的。
具體就操作層面來說,圖靈在他的論文原文中是這樣定義圖靈測試的[2]:
「我們稱下面這個問題為「模仿游戲」。游戲參與者包括一個男人,一個女人,以及一個任意性別的詢問者。詢問者與另兩個人待在不同的房間里,並通過打字的方式與他們交流,以確保詢問者不能通過聲音和筆跡區分二者。兩位被詢問者分別用X和Y表示,詢問者事先只知道X和Y中有且僅有一位女性,而詢問的目標是正確分辨X和Y中哪一位是女性。另一方面,兩位被詢問者X和Y的目標都是試圖讓詢問者認為自己是女性。也就是說,男性被詢問者需要把自己偽裝成女性,而女性被詢問者需要努力自證。現在我們問:如果我們把「模仿游戲」中的男性被詢問者換成計算機,結果會怎樣?相比人類男性,計算機能否使詢問者更容易產生誤判?」
這里有幾個細節值得注意,它們在很大程度上決定了圖靈測試的有效性。
(1)首先,圖靈測試中詢問者與被詢問者之間進行的並不是普通的日常聊天,詢問者的問題是以身份辨別為目的。這種情況下詢問者通常不會花費時間寒暄和拉家常,而是會開門見山地說「為了證明你的身份,請配合我回答下面問題…」。事實上,目前網路上聊天機器人有時能夠以假亂真,往往是採用了在用戶在不知情的情況下盡量把談話引到沒有鑒別力的話題上的策略(例如「談談你自己吧」)。
(2)其次,圖靈測試中人類被詢問者的參與是必不可少的,她的存在是為了防止計算機採取「消極自證」的策略,例如拒絕正面回答問題,或者答非所問閃爍其詞,就像一個真正的不合作的人所做的一樣。在這種情況下,另一個積極自證的人類被詢問者可以保證詢問者總是有足夠的信息做出判斷。類似的情況也適用於當計算機試圖模仿正在牙牙學語的幼童或頭腦不清的病人等「特殊人類」時。
(3)另外,圖靈測試的原則是要求詢問的交互方式本身不能泄露被詢問者的物理特徵。在圖靈所處的年代這幾乎只能全部通過基於文本的自然語言來完成,因此圖靈限定測試雙方基於打字進行交流。但在多媒體技術發達的今天,視頻、音頻、圖片等等「虛擬內容」都可以通過計算機以非物理接觸的形式呈現(這當然是60年前的圖靈不能預知的!)。因此,允許詢問者在圖靈測試中使用多媒體內容作為輔助材料進行提問(例如「請告訴我這個視頻的笑點在哪兒」)似乎是對原始圖靈測試定義的一個自然合理的補充[3]。
(4)最後,今天一般意義上理解的圖靈測試不再嚴格區分人類參與者的性別。通常我們允許人類被詢問者是任意性別,而詢問者的目標也隨之變成辨別哪一位被詢問者是人類。
除此之外,完成一次具體的圖靈測試還要注意很多操作細節,例如多少人參與測試算「足夠多」,多長的訊問時間算「足夠長」,多高的辨別正確率算「足夠高」,如何挑選人類詢問者和被詢問者才能代表「人類」的辨別和自證能力,等等。由於圖靈測試的巨大影響力,幾十年來一直有人嘗試挑戰它,不時就會傳出「某某計算機程序成功通過圖靈測試」的消息。我想,正是對於意義深遠的實驗,我們才理應格外審慎。只有在仔細檢查上面所列和其他一些重要細節之後,我們才能對其結果的有效性做出正確判斷。類似幾年前「超光速實驗」那樣的鬧劇應該盡量避免。
圖靈測試與人工智慧是什麼關系?
如果有一天機器真的通過了圖靈測試,這到底意味著什麼?這個問題涉及到圖靈測試與人工智慧的關系。的確,幾乎所有有關人工智慧的書籍都會談到圖靈測試,但一個經常被誤解的地方是,圖靈測試是作為一個人工智慧的充分條件被提出的,它本身並沒有,也從未試圖定義智能的范疇。這一點圖靈在他的論文里寫的很清楚:
「機器能否擁有智能,為了回答這個問題我們應該首先定義『機器』和『智能』。一種可能性是根據大多數普通人的日常理解去定義這兩個概念,但這樣做是危險的。… … 在這里我並不打算定義這兩個概念,而是轉而考慮另一個問題,它與原問題密切相關,同時可以被更清楚無疑地表達。… …(圖靈測試的描述)… …可能有人會說這項測試對機器而言過於嚴格——畢竟人類也無法反過來成功偽裝成機器,這只需檢查算術的速度和正確度即可辨別。難道被認為擁有智能的機器就不能表現出和人類不同的行為么?這是一個很有力的反對意見,但至少不管怎樣,假如我們有能力製造出一個可以成功通過測試的機器的話,也就無需為這個反對意見煩惱了。」
圖1:智能行為與人類行為的關系
藉助集合的概念我們可以更容易地理解圖靈測試與人工智慧的關系。如圖1所示,「所有智能行為」對應的集合和「所有人類行為」對應的集合既有交集又互有不同。在全部智能行為中有一些是人類靠自身無法做到的(比如計算出國際象棋中白棋是否必勝),但無論如何人類都被認為是有智能的,因此,在各方面都能達到「人類水平」— 也就是完成兩個集合的交集部分—就應該被認作是「擁有智能」的。[4]另一方面,人類行為並不總是和智能相關。圖靈測試要求機器全面模擬「所有人類行為」,其中既包括了兩個集合的交集,也包括了人類的「非智能」行為,因此通過圖靈測試是 「擁有智能」的一個有效的充分條件。
圖靈本人對機器能夠通過他的測試相當樂觀,他大膽預測「到2000年左右時,一台擁有1GB內存或類似規模的計算機可以在接受普通人5分鍾的詢問之後,使他們的判斷正確率不超過70%」。然而直到2014年的今天,仍然沒有任何機器被公認為已經通過圖靈測試。有趣的是,這一失敗事實反而還帶來了一個我們再熟悉不過的應用 - 圖形驗證碼。(每一次輸入驗證碼都是一次圖靈測試!)
圖靈測試問題的進展緩慢與目前人工智慧學界對圖靈測試這個「充分條件」的研究熱情不高有關。[5]這一部分上由於主流人工智慧研究與圖靈測試所追求的目標之間存在差異,同時也因為圖靈測試本身難度巨大。下面我們通過人工智慧研究的三個重要特徵來進一步討論圖靈測試與人工智慧之間的異同,以及為什麼圖靈測試不大可能在短時間內解決。
一、主流人工智慧研究關注智能體的外部行為,而不是產生該行為的內部過程
在這方面圖靈測試的思想和人工智慧學界是完全一致的。只關注外部行為是一個典型的功能主義/行為主義風格的做法,事實上這也是一個人工智慧經常被外界所指摘的地方。嚴格的「主觀思考」定義要求智能體具有自我意識。但一方面,從嚴格的科學方法講,我們甚至並不真的確定是否有客觀證據證實 「意識」的存在。更重要的是,人們發現智能行為和主觀思考完全可以被看作是兩個獨立的問題來考慮,二者並不必要糾纏在一起。具體來說,可以從數學上證明任何一台數字計算機的行為都可以用查表的方式機械地模擬。假設我們真的製造了一台具有「意識」的機器A,我們總可以製造另一台機器B以查表的方式來機械地模擬A的內部運行,問題是B是否具有意識?如果每一台「擁有」意識的機器都能被一台B這樣的「機械查表式」的機器所模擬,那麼我們就無法通過外部行為來斷定一個機器在內部上是真的在「思考」還是只是在模擬「思考」的過程,[6] 因此「是否擁有意識」從行為主義的角度也就成了相對獨立的「另外一個問題」。同時,「擁有意識的機器總可以被沒有意識的機器模擬」也說明「擁有意識」並不能給機器帶來額外的「行為能力」,這進一步降低了「擁有意識」在行為主義者眼中的重要性。
基於外部行為與主觀思考之間的獨立性,主流人工智慧研究和圖靈測試把實現外部行為作為唯一目標,這樣的觀點被稱為弱人工智慧觀點。我們知道每個學科的研究都基於一個「基本假設」展開。比如支撐物理研究的基本假設是「萬物運轉都受一套普適的、永恆的規律所約束」,而物理研究的目的「只是」找出這套規律是什麼。類似的,「弱人工智慧假設」(weak AI hypothesis) 認為經過良好設計的計算機可以表現出不低於人類智能水平的外部智能行為。可以說主流人工智慧研究是以弱人工智慧假設為出發點,研究如何實現這樣一個計算機。
圖3:「機械查表式」的機器 – 西爾勒的「中文屋子」實驗
二、主流人工智慧研究關注如何模擬人類的純粹智能活動,而不是全部腦力活動
就像前面提到的,人類的腦力活動 (mental process) 不僅包括智能,同時具有情感、審美能力、性格缺陷、社會文化習慣等等一系列「非智力特徵」。因為圖靈測試的模仿對象是普通人,事實上它對這些非智力特徵的要求甚至可能還高過對純粹智力的要求——作為一個普通人,他/她完全有可能對國際象棋一竅不通,但卻不大可能從照片分辨不出美女/帥哥來。
當然,「非智力特徵」的引入本身並不妨礙圖靈測試成為一個有效的充分條件,但除非我們假設所有這些「非智力特徵」都是擁有智能之後的必然產物,否則不得不承認圖靈測試確實在機器智能這個核心問題之外加入了過多充滿挑戰卻又顯得不那麼相關的因素。就像《人工智慧》這本經典教科書里寫到的,「航空領域試圖製造性能良好的飛機,而不是使飛機飛得如此像鴿子以至於可以騙過其他鴿子。」人工智慧研究確實應該更多關注與智力活動相關的抽象功能和一般原則。
三、人工智慧的最終目標是能夠綜合適應「人類所在環境」的單一智能體,而不是專門解決特定數學問題的演算法
在這一點上圖靈測試與人工智慧研究的最終目標也是一致的,只不過現有的人工智慧水平離這一目標還相去甚遠。事實上「綜合模擬人類的智力活動」正是人工智慧區別於其他計算機科學分支的地方。我們通過比較人工智慧軟體與傳統軟體來說明這一點。首先從最廣義的角度看,傳統軟體也應屬於人工智慧的范疇:實際上很多早期的計算機科學家,比如圖靈,就是以人工智慧為動力展開對計算機科學的研究。所謂「計算」本來就是諸多人類智能活動中的一種。一個從未接觸過計算機的人也許很難說清 「從一個數列中找出所有素數」 和「從一張照片中找出一隻狗」哪個更有資格代表「智能」(前者屬於傳統軟體范疇,後者屬於傳統人工智慧范疇)。但另一方面,傳統軟體並不代表人工智慧的全部內涵。粗略講,我們可以認為傳統軟體對應了這樣一類「計算問題」,它們的共同特點是,問題本身是用一個演算法(或非構造性的數學描述)來描述的,而對它們的研究主要關注在如何找到更好的演算法。[7]而我們稱之為「人工智慧問題」的問題可以理解為另一類「計算問題」,它們的共同特點是無法用演算法或從數學上對問題進行精確定義,這些問題的「正確答案」從本質上取決於我們人在面對這類問題時如何反應。對於人工智慧問題,我們可以基於數學模型或計算模型來設計演算法,但問題的本質並不是數學的。
通用人工智慧(Artificial General Intelligence)基於弱人工智慧假設,以全面模擬人類的所有智力行為為目標。注意到圖靈測試作為一個充分條件,是不可能在通用人工智慧真正實現之前得到解決的。另一方面,可以說現有每一個AI分支的成功都是通過圖靈測試的必要條件,而它們中的大部分還沒有達到「人類水平」。因為我們不可能窮盡所有人類智能行為,必須依賴有限個具有通用性的模型和演算法來實現通用智能。目前人們仍然只能基於一些簡單初等的模型來設計學習、推理、和規劃演算法。這些AI分支的研究都默認基於針對自己領域問題的弱人工智慧假設,而支撐這些子領域研究的動力往往是其巨大的社會實用價值。它們固然已經在很多具體應用領域成績斐然,但看起來離圖靈測試所要求的水平仍然相差甚遠。
⑶ 高難度問題:在理論上,遙遠未來時代的人工智慧可以通過圖靈測試嗎為什麼
完全有可能,但是時間可能無限遙遠。人腦的運行原則和電腦的原理差不多,差的只是現在電腦的知識組裝能力很差,當電腦有足夠的知識且運用上科學的隨機法則,完全有可能通過圖靈測試。但是要和人腦比確實還有差距。
⑷ 通過圖靈測試的機器就是人工智慧的了嗎
圖靈測試是人工智慧的一種基礎檢測標准,檢測的是智能的交流能力,交流能力背後代表著的是分析,總結,推論等等能力也就是說圖靈測試只是人工智慧鑒定的基礎中的基礎。更高級的智能還包括創造的能力,情感的能力,自我反思的能力。。。等等很多這些能力不是單純靠文字聊天能反應出來的。另外:我個人認為如果什麼時候一個AI自殺了,這說明AI已經跟人類沒有差別了。。。
採納哦
⑸ 語音AI在特定領域通過圖靈測試意味著什麼
剛剛,達摩院發布了「2019十大科技趨勢」,涵蓋了智能城市、數字身份、自動駕駛、圖神經網路系統、AI晶元、區塊鏈、5G等領域。阿里達摩院認為,2019年,AI依然將是科技界最熱的方向。如果說2018年AI從實驗室走入了現實,那麼2019年將開啟人類和AI全面合作的新起點。
隨著5G時代的來臨,網路將向雲化、軟體化演進,也將會催生全新應用場景,例如車路協同、工業互聯網等領域將獲得全新的技術賦能。2018年,曾經炙手可熱的自動駕駛經歷冰火兩重天,從資本企業一擁而上再到普遍看衰,自動駕駛寒冬論一度甚囂塵上。達摩院認為,單純依靠「單車智能」的方式革新汽車,確實在很長一段時間內將無法實現終極的無人駕駛,但並不意味著自動駕駛完全進入寒冬。
車路協同技術路線,會加快無人駕駛的到來。在未來2-3年內,以物流、運輸等限定場景為代表的自動駕駛商業化應用會迎來新的進展,例如固定線路公交、無人配送、園區微循環等商用場景將快速落地。
⑹ 關於圖靈測試判斷人工智慧的一大隱患(見問題說明),是否正確望指點
圖靈測試是一個主觀的實驗手段,並不是智能的可靠標准。圖靈當年提出這種方式,是為了迴避一些哲學障礙。該方法的種種缺陷,幾十年來已有無數學者提出過,它主要的意義是在哲學層面,而非技術層面。
⑺ 人工智慧與區塊鏈的關系
人工智慧和區塊鏈的共同點
區塊鏈關注的是保持准確的記錄、認證和執行,而人工智慧則助力於決策、評估和理解某些模式和數據集,最終產生自主交互。人工智慧和區塊鏈共同擁有幾個特點,可以確保在不久的將來能夠實現無縫互動。下面列出了三個主要特點。
1. 人工智慧和區塊鏈需要數據共享
分布式資料庫強調了在特定網路上的多個客戶端之間共享數據的重要性。同樣,人工智慧依靠大數據,特別是數據共享。可供分析的開放數據越多,機器的預測和評估則會更加正確,生成的演算法也更加可靠。
2. 安全
處理區塊鏈網路上進行高價值交易時,這對網路的安全性有很大的要求。這可通過現有協議實施。對於人工智慧來說,機器的自主性也需要很高的安全性,以降低發生災難性事件的可能性。
3. 信任是必要條件
對於任何廣泛接受的技術的進步,沒有比缺乏信任具有更大的威脅,也不排除人工智慧和區塊鏈。為了使機器間的通信更加方便,則需要有一個預期的信任級別。想要在區塊鏈網路上執行某些交易,信任則是一個必要條件。
區塊鏈和人工智慧對普通人的影響
簡單來說,區塊鏈是一個基於社區的技術,它能讓價值交換變得更安全,區塊鏈就像它的名字一樣。是一串由很多數據區塊連在一起的不斷延長的鏈條,每一個區塊都包含了一個加密的交易記錄,區塊按時間順序排列,並用密碼系統保障安全。區塊鏈是一項能改變規則的技術,它的出現是革命性的創新。
區塊鏈的作用也很多,具體應用也很廣泛。舉個例子吧:如果將區塊鏈用於食品行業,百姓就再也不擔心吃到有害食品了。如果將區塊鏈用於鑽石生產,那麼消費者再也不用擔心買到假的鑽石了。如果將區塊鏈用於到教育行業,可以加強知識產權保護。如果將區塊鏈用於保險行業,可以緩解保險業務的信息不對稱和有助於提升保險業務的安全性等等。
區塊鏈與人工智慧對普通人的影響可謂是巨大的。試想一下,若將區塊鏈和人工智慧結合在一起,那麼它們的作用會擴大嗎?是的,二者的結合,確實可以產生更多的影響來改變普通人的生活。
區塊鏈和人工智慧是技術領域的兩個極為重要的角色,各自為我們的生產生活帶來方便。如果我們找到一種智能的方法來使它們一起工作,那麼它們之間交互後產生的影響是不可想像的。這也是OMT的核心所在,這兩種技術結合後,未來的應用場景都是革命性的並且激動人心,在新的生態建構中,數據存儲、共享機制、平台問題、安全性問題等,都可以利用彼此的技術實現攻堅克難。OMT將通過區塊鏈+人工智慧技術為全球用戶、企業創造最大化價值,為普通百姓帶來更多方便。
回答完畢,望採納,謝謝!
⑻ 在人工智慧領域,圖靈測試是一種用於判斷計算機是否具有人類思維
不是人類思維!而是一種自我的思維,比如慾望、憤怒、開心。如果人工智慧自己產生了這些情感那麼圖靈測試就過關了
⑼ 什麼叫做:人工智慧通過圖靈測試
圖靈測試是一種測試機器是不是具備人類智能的方法。
人工智慧的始祖阿蘭·圖靈提出了一種稱作圖靈試驗的方法。此原則說:被測試的有一個人,另一個是聲稱自己有人類智力的機器。測試時,測試人與被測試人是分開的,測試人只有通過一些裝置(如鍵盤)向被測試人問一些問題,這些問題隨便是什麼問題都可以。問過一些問題後,如果測試人能夠正確地分出誰是人誰是機器,那機器就沒有通過圖靈測試,如果測試人沒有分出誰是機器誰是人,那這個機器就是有人類智能的。
目前還沒有一台機器能夠通過圖靈測試,也就是說,計算機的智力與人類相比還差得遠呢。
⑽ 「圖靈測試」和「中文屋子」是如何從哲學的角度反映人工智慧本質特徵的
「圖靈測試」試圖給出一個確定人工智慧與人類智能同一性的方法.
「中文屋子」則說明即使人工智慧與人類智能有著完全相同的外在性質,也不能說明二者有內在的同一性,更不能將二者等同.
確定人工智慧與人類智能的同一性的重要性,充分反映了人工智慧的本質是對人類智能的模仿.
這問題問的本身就有問題.
補充問題的補充回答:
人腦的運算和存儲單元是天文數字的,但還是有限的,不可擴容的.
而計算機的運算和存儲單元是隨著技術和設備可以不斷擴充的.
所以……